מאמר מחקר חדש של גוגל מתאר אלגוריתם חכם שיכול לזהות דפי אינטרנט
באיכות נמוכה, על מנת למצוא בעיקר את התוכן
המועיל
מאמר מחקר של גוגל מתאר אלגוריתם שמזהה דפים באיכות נמוכה, תוכן
ספאם, אתרי תוכן בעלי תוכן ירוד , ותוכן
שנוצר על ידי מחוללי תכנים אוטמאטיים.
לא צריך לאמן ולכוונן את האלגוריתם
החדשני המתואר במחקר על מנת למצוא סוגים
ספציפיים של תוכן באיכות נמוכה, הוא יכול ללמוד בעצמו ולצבור ידע על תוכן ירוד באינטרנט
.
המודל
המחקרי החדשני נקרא large language models (LLM)
החוקרים
של גוגל כתבו במאמר :
"We conduct extensive
qualitative and quantitative analysis over 500 million web articles, making
this the largest-scale study ever conducted on the topic.”
סביר להניח כי האלגוריתם החדש יצטרף האלגוריתמים השונים של גוגל כגון האלגוריתמים Penguin,
Panda או SpamBrain.
ראו גם :
אין תגובות:
הוסף רשומת תגובה