חפש בבלוג זה

יום שבת, 7 בינואר 2023

האם מנוע החיפוש של גוגל לקראת פיתוח אלגוריתם חכם שיתווסף לעדכוני האלגוריתמים לאיחזור מידע

 

מאמר מחקר חדש של גוגל מתאר אלגוריתם  חכם שיכול לזהות דפי אינטרנט באיכות נמוכה, על מנת למצוא  בעיקר את התוכן המועיל

מאמר מחקר של גוגל מתאר אלגוריתם שמזהה דפים באיכות נמוכה, תוכן ספאם, אתרי תוכן בעלי תוכן ירוד ,  ותוכן שנוצר על ידי מחוללי תכנים אוטמאטיים.

לא צריך לאמן ולכוונן  את האלגוריתם החדשני  המתואר במחקר על מנת  למצוא סוגים ספציפיים של תוכן באיכות נמוכה, הוא יכול ללמוד בעצמו ולצבור ידע על תוכן ירוד באינטרנט .

המודל המחקרי החדשני נקרא  large language models (LLM)

החוקרים של גוגל כתבו במאמר :

"We conduct extensive qualitative and quantitative analysis over 500 million web articles, making this the largest-scale study ever conducted on the topic.”

 בעקרון , גוגל לא מזהה טכנולוגיות אלגוריתמים מראש ולכן אף אחד מחוץ לגוגל לא יכול לומר בוודאות שמאמר המחקר הזה הוא הבסיס לאלגוריתם איחזור המידע הבא , אבל ההערכה היא כי המחקר החדשני יסייע רבות לגוגל באיחזור מידע יותר מועיל בכל שאילתא .  

סביר להניח כי האלגוריתם החדש יצטרף האלגוריתמים השונים של גוגל  כגון האלגוריתמים Penguin, Panda או SpamBrain.

מקור

ראו גם : 

האם באמת העדכון החדש של אלגוריתם החיפוש בגוגל (BERT) הוא פריצת דרך ? (2019)



 

 


אין תגובות:

הוסף רשומת תגובה

לקט nידעני מס' 18 , 27 למרץ 2024

הלקט המידעני ה-18, כמו קודמיו, נועד להקנות לכם תמונת מצב מעודכנת של תחומי המידענות , ניהול התוכן , מנועי החיפוש והספריות והוא מבוסס על איסוף...