חפש בבלוג זה

יום שלישי, 29 באוקטובר 2019

השנה אמור העולם לחגוג 25 שנה להופעת הבלוגים אך הרשתות החברתיות מעיבות כרגע על האירוע : כמה הרהורים של בלוגר


העולם הדיגיטלי חוגג החודש 25 שנים להולדת הבלוג הראשון . הבלוגר הראשון שפיתח את המהות, העקרונות והרעיון של בלוג באוקטובר 1994 היה דיוויד וינר  (Dave Winer ), מומחה תוכנה ומחשבים שאהב מאוד לכתוב ועל כן פיתח לעצמו בלוג באינטרנט כאשר עבד באתר Scripting News .

יום שני, 28 באוקטובר 2019

האם באמת העדכון החדש של אלגוריתם החיפוש בגוגל (BERT) הוא פריצת דרך ?



גוגל הכריזה בסוף השבוע על עדכון חדש לאלגוריתם החיפוש שלה, שאמור לשפר את ההבנה והפענוח של שאילתות במנוע החיפוש. בחברה מגדירים זאת כ"זינוק הגדול ביותר קדימה" בתחום החיפוש המקוון בחמש השנים האחרונות, ואף כאחד מהזינוקים קדימה הגדולים ביותר בהיסטוריה של החיפוש המקוון כולו.
בפוסט שפירסמה גוגל, הוסבר כי הטכנולוגיה החדשה מכונה BERT, והיא טכניקה חדשה לעיבוד שפה טבעית המשמשת בעיקר ליכולת להבין טוב יותר את כוונתו של הגולש שהקליד את מונח החיפוש. מדובר במודלים ממוחשבים שמעבדים מלים ביחס למלים האחרות שבאות לפניהן ואחריהן במשפט – מה שמאפשר להתייחס לשאילתות כמשפטים שלמים בעלי משמעות ולא סתם כאסופת מילים בודדות.

בפועל, גוגל תהיה מסוגלת להבין טוב יותר מונחי חיפוש ללא קשר לצורת הניסוח שלהם. בכך, בין השאר, גוגל מנסה להתמודד טוב יותר עם התופעה שבה  אנשים מחפשים במנוע החיפוש שלה באמצעות רצף של מלים, ולא בהכרח מנסחים משפטים ושאלות בשפה טבעית.

גוגל נותנת לדוגמה את משפט החיפוש "2019 מטייל ברזיל לארה"ב צריך ויזה" (2019 brazil traveler to USA need a visa). לפני השינוי, גוגל היתה מתייחסת לכך כאסופת מילים - ומציגה תוצאות לא רלוונטיות לגבי אזרחי ארה"ב שזקוקים לוויזה לברזיל. עם האלגוריתם החדש, גוגל תבין את משמעות המלה to ביחס למלים האחרות, וכך תדע שמדובר בברזילאי שטס לארה"ב וזקוק לוויזה – ובהתאם תציג את המידע הרלוונטי.

דוגמה נוספת היא השאילתא "האם אפשר לקנות למישהו תרופה בבית מרקחת" (Can you get medicine for someone pharmacy) היתה מובילה בעבר לתוצאות חיפוש לגבי מילוי מרשמים, בשל החמצת המשמעות האמיתית שנובעת מהמלה "למישהו". אחרי החידוש, גוגל תציג תוצאת חיפוש שעונה על הכוונה האמיתית של השאלה: "האם אפשר לקנות בבית מרקחת תרופת מרשם עבור חבר או בן משפחה".


בגוגל אומרים ש-BERT יעזור לגוגל להבין טוב יותר כ-10% משאילתות החיפוש באנגלית בארה"ב, אך השינוי אינו רלוונטי כרגע לחיפושים בישראל ובעברית. בגוגל מבטיחים להביא זאת לאזורים ולשפות נוספות בעתיד.

גוגל מסבירה כי החידוש אמור לשפר את היכולת שלה להתמודד גם עם שאילתות חיפוש חדשות ו"בלתי צפויות", כלומר כאלה שגוגל מעולם לא נתקלה בהן בעבר. 15% מהשאילתות שנשלחות לגוגל בכל יום נופלות תחת ההגדרה הזו.

השינוי יבוא לידי ביטוי גם ברשימת תוצאות החיפוש וגם ב-Snippets - אותם קטעי טקסט קצרים שלפעמים מופיעים בראש רשימת תוצאות החיפוש, ונותנים תשובה טקסטואלית מלאה לשאילתא שלכם ללא צורך להיכנס לאתר אחר.


ברט הוא לא האלגוריתם הראשון בגוגל המיועד להבנת השפה. אחד מהשינויים הגדולים ביותר בנושא זה היה אלגוריתם יונק הדבש (Hummingbird), שהושק ב- 2013 במטרה להבין חיפושים בשפה טבעית (Conversational Search).

לפני 4 שנים בדיוק, באוקטובר 2015, גוגל הכריזה על בינה מלאכותית חדשה בשם Rank Brain. מטרתה העיקרית היא לפעול בזמן אמת, בהתאם להתנהגות המשתמש ולפרמטרים אחרים, ולשפר את תוצאות החיפוש. לדוגמה, אם משתמשים רבים מגיבים בצורה מסוימת לסניפט X בתוצאות החיפוש, ראנק בריין יסיק את המסקנות ויבצע שינויים בהתאם.
גם ראנק בריין מיועד (בין שאר תפקידיו) להבנה טובה יותר של השפה, ובעיקר לטיפול בחיפושים חדשים שמעולם לא בוצעו (המהווים בערך 15% מסך החיפושים בגוגל).


מנקודת המבט של המידען הספקן
כמה הערות שלי (עמי סלנט )

למשתמש רגיל, שאינו בקי בתורת איחזור המידע,  הטכנולוגיה הסמנטית החדשה של גוגל עשויה בהחלט לעזור , אבל מידענים מפרקים מראש את השאילתא למילות חיפוש עם חיבורים לוגיים שהם מציבים בעצמם ולוגיקה בוליאנית , ולכן  מבחינתם הטכנולוגיה החדשה של גוגל תביא פחות תועלת.

הטכנולוגיה המקבילה של BERT כבר נוסתה עקרונית  בעבר במנוע החיפוש BING  של מיקרוסופט ולא גרמה שם לפריצת דרך. נקווה שגוגל ימשיכו לשפר את האלגוריתם החדש

ראו גם :




השבוע בהיסטוריה 2012: אנציקלופדיה בריטניקה מודיעה על הפסקת פרסום גרסאות מודפסות

    הערה : בסקירה גם השוואות בין אנציקלופדיה בריטניקה ולאנציקלופדיית וויקיפדיה בסקירה גם התייחסות לאנציקלופדיה בריטניקה מבחינת התאמה חי...