חפש בבלוג זה

יום רביעי, 25 בינואר 2023

מנקודת המבט של מידען : האם ChatGPT אכן מסוגל להחליף את מנוע החיפוש של גוגל ? ( גרסה מס' 3)

 


למד , חקר וערך : עמי סלנט , מידען

 

רקע ומבוא

סינתזה בין מקורות מידע שונים

צ'אטבוט הוא תוכנת מחשב המדמה שיחה אנושית. זאת יכולה להיות שיחה בעל פה או שיחה כתובה, שיחה פשוטה של שאלה ותשובה או דרישה לניתוח מורכב יותר. ChatGPT הוא צ'אטבוט מבוסס בינה מלאכותית שפותח על ידי חברת הבינה המלאכותית OpenAI והושק בגרסתו האחרונה בנובמבר האחרון.

"זאת מערכת שסקרה את הרשת ויכולה לנהל דיאלוג של שאלות ותשובות בשפה פשוטה וטבעית", מסביר ד"ר יובל דרור , "ההבדל בינה לגוגל, למשל, הוא שאם תשאלי את גוגל שאלה, תקבלי הפניה לעשרה לינקים, ואילו בצ'אטבוט תקבלי תשובה אחת, מסודרת. אם תשאלי בגוגל מה הרצל היה אומר לביאליק לו היה פוגש אותו היום, תקבלי לינקים של זה ושל זה ותיאלצי לעשות את החיבור בעצמך ChatGPT . יכול לעשות עבורך את הסינתזה הנדרשת".

מקור



ChatGPT
הוא מודל שפה, לא מנוע חיפוש. מנועי חיפוש כמו גוגל, בינג או יאהו נועדו לחפש ולאחזר מידע באינטרנט. הם משתמשים באלגוריתמים מורכבים כדי לדרג ולאינדקס דפי אינטרנט, תמונות וסוגים אחרים של תוכן. מצד שני, ChatGPT הוא מודל שמשתמש ברשת עצבית מלאכותית  ( neural network)  כדי להבין ולייצר טקסט. הוא מבין ויוצר טקסט הנראה , לכאורה,  הגיוני על סמך הקלט שניתן ל-ChatGPT

 מודל שפה  במערכות   AIהיא שיטה ברוחב פס נמוך להעברת מידע, ולעתים קרובות היא מעורפלת עקב צירופי מילים וכינויים. בני אדם אינם זקוקים לכלי מושלם לתקשורת מכיוון שאנו חולקים הבנה לא לשונית. מודלים של שפה (LLMs)  כמו בפלטפורמת  CHATGPT   מאומנים לאסוף את הידע הקשור עבור כל משפט, תוך הסתכלות על המילים והמשפטים שמסביב כדי לחבר מה קורה, אך הבנה זו מוגבלת ואינה כוללת את הידע לשיחות מורכבות יותר. כתוצאה מכך, יש בהם חוסר עקביות ולעתים גם חוסר קוהרנטית של עולם הדעת .

מקור


ד"ר יפה אהרוני , מידענית מומחית  (הדוקטורט שלה היה על מנועי חיפוש ואיחזור מידע) כתבה בבלוג שלה  סקירה מעניינת בשם האם הצ'טבוט  ChatGPT  יחליף את גוגל ? ועוד

יכולות

ניתן להשתמש ב-ChatGPT ליצירת תוכן, מכיוון שהוא יכול בקלות לכתוב תוכן על סמך הנחיה. לדוגמה, כלי בינה מלאכותית יכולים לכתוב שיר על סמך פקודה של משתמש. יתר על כן, ChatGPT יכול גם לעזור למשתמשים להוסיף נופך של אלגנטיות לסגנון הכתיבה שלהם ולהשיג את המטרות הספרותיות שלהם.

מגבלות:

 

 ChatGPT רגיש לשינויים בניסוח הקלט. לדוגמה, בהינתן ניסוח אחד של שאלה, המודל יכול לטעון שאינו יודע את התשובה, אך בהינתן ניסוח מחדש קל, יכול לענות נכון.

לפעמים הוא כותב תשובות סבירות אך לא נכונות או שגויות עובדתית. באופן אידיאלי, המודל ישאל שאלות הבהרה כאשר המשתמש סיפק שאילתה לא ברורה. במקום זאת, הדגמים הנוכחיים בדרך כלל מנחשים למה התכוון המשתמש

לסקירה של ד"ר יפה אהרוני בבלוג שלה

 

אבל מהו מקור המידע בתשובה של  ChatGPT

השטף והיכולת של ChatGPT במתן מענה לשאלות מכל הסוגים גרמו לרבים להסיק שהוא עלול להוות איום רציני על גוגל (ובהרחבה, מנועי החיפוש באופן כללי יותר, כאשר גוגל הוא מנוע החיפוש הדומיננטי בעולם), כאשר משתמש אחד בטוויטר הצהיר, "גוגל גמורה."

בעוד שפרסומים ופרשנים אחרים נקטו עמדה מתונה יותר, כמה מהם הציעו שזה עדיין יכול להכיל את חלקה של גוגל בחיפוש: אלכס קנטרוביץ, מייסד ביג טכנולוגיה, אמר לפודקאסט What Next: TBD, "זה לא יחליף את החיפוש. אבל גם אם זה ייקח 5% מנתח השוק של גוגל, זה מספר עצום".

אזכור המקורות מרמז על חולשה מרכזית נוספת של ChatGPT: הוא אף פעם לא מספק מקור לתשובות המנוסחות שלו (כנראה כי אלה מסונתזות משילוב של פיסות מידע שונות), מה שהופך אותן למאתגרות לאימות המידע .

בכתבה עבור Fortune, סטיב מולמן ציין כי "[ChatGPT] לפעמים טועה באופן מוחלט תוך שהוא נשמע בטוח לחלוטין לגבי התשובה שלו. אבל כל עוד אתה מודע לכך, ChatGPT יכול להיות כלי שימושי - בדומה שוויקיפדיה יכולה להיות שימושית כל עוד אתה לוקח את הערכים שלה כמקור המונים עם קמצוץ  של מלח." עם זאת, ההבדל המכריע בין ChatGPT לוויקיפדיה הוא שוויקיפדיה עושה שימוש מוצק במקורות מידע  (או מסמנת חוסר במקורות עם "[צריך ציטוט]"), ובכך מאפשרת לקוראים לזהות מהיכן הגיע המידע ולבדוק בעצמם את מקורותיו.

 


תשובה נחרצת

משתמשים רבים של ChatGPT ציינו את החוויה של קבלת תגובה חד-משמעית לשאילתה שלהם עדיפה על החוויה של סינון וליקוט מידע ממספר תוצאות אפשריות, במיוחד כאשר חלק מהתוצאות הללו הן מודעות בפרסום.

מתן תשובה סופית לשאלה שעשויה להכיל הרבה משתנים אינה קלה, כמובן, ומנועי החיפוש הגדולים עדיין לא יכולים לעשות זאת עבור רוב השאילתות. ChatGPT  יוצא דופן ביכולת שלו לסנתז מידע כדי לייצר קטע אחד, ולעתים קרובות מציג צדדים מרובים של בעיה מורכבת.

עם זאת, ישנם חסרונות לתוצאת החיפוש "תשובה אחת", מכיוון שהיא מונעת מהמחפשים להסיק מסקנות משלהם מהמידע הזמין, תוך הצגת פרשנות של  ChatGPT  למה ש"נכון". בינה מלאכותית ואלגוריתמים רגישים ביותר להטיה, גם אם הם נתפסים כאובייקטיביים ורציונליים, ולכן קיימת סכנה ש-ChatGPT או פלטפורמה דומה יציגו נרטיב שגוי בתגובה לשאלה מורכבת, או רגישה, ללא כל מקום לשיקול דעת למחפש המידע להסיק את המסקנות שלו.

 מקור


ChatGPT  טוב מאוד במתן מענה לשאלות. זה כמעט כמו שאתה מדבר עם אדם שבילה מאות שנים בספיגת ידע. הפלט שלו קולח ונכון מבחינה דקדוקית, והוא יכול אפילו לחקות סגנונות דיבור שונים.

עם זאת, הבעיה היא שהתשובות של ChatGPT לא תמיד נכונות. למעשה, לעתים קרובות הוא הוזה וקובע עובדות שגויות לחלוטין. מאחורי מעטה  האוריינות של , ChatGPT  יש מנוע השלמה אוטומטית מתקדם מאוד היודע לצרף פיסות מידע, אך לא יודע כיצד להתמודד עם אמיתותם.  

טיפול באמיתות הפלט של ChatGPT יהיה אתגר גדול. למרבה הצער, כרגע אין דרך להבחין בין הזיות לבין אמיתות בפלט של ChatGPT אלא אם הצלבת את התשובות שלו עם מקור אחר ( ככל הנראה, באמצעות גוגל). אבל זו כבר "יריה ברגל"  מבחינת המשתמש אם המטרה היא להשתמש במודל השפה המורכב של ChatGPT כתחליף למנועי חיפוש

מקור

 

אתגר נוסף שניצב בפני ChatGPT ו-LLMs אחרים הוא עדכון בסיס הידע שלהם. למנועי החיפוש יש את הכלים והתוכנה לאנדקס ( ליצור אינדקס) כל הזמן דפים חדשים באינטרנט. עדכון מסד הנתונים של מנוע החיפוש הוא גם פעולה חסכונית מאוד.

אבל עבור מודלים של שפות מסוג  LLM, הוספת ידע חדש מחייבת אימון מחדש של המודל. אולי לא כל עדכון ידרוש אימון מלא, אבל הוא בכל זאת יהיה הרבה יותר יקר מהוספה ושינוי של רשומות במסד נתונים של מנוע חיפוש. ויש לעשות זאת מספר פעמים ביום כדי להישאר מעודכן בחדשות האחרונות.

מקור

 

החולשה העיקרית של ChatGPT : חיפוש מורכב

 לChatGPT אין יכולת של לוגיקה בוליאנית

המתמטיקאי האנגלי ג'ורג' בול (George Boole) פיתח אלגברה של לוגיקה, שהפכה לבסיס החיפוש במאגרי מידע ממוחשביםהלוגיקה הבוליאנית (המכונה כך על שמו של בול) משתמשת באופרטורים בוליאניים כדי לקבוע אם משפט הוא נכון או לא נכון. הפעולות השכיחות ביותר הן OR, AND ו-NOT, והשימוש בהן יכול להועיל במידה רבה בזמן חיפוש מקוון.

 

כשאנו מדברים על חיפוש מורכב בגוגל , הכוונה היא לאותו מנגנון של חיפוש טבלאי המאפשר לנו להציב בו-זמנית  כמה וכמה מאפיינים בחיפוש במנוע החיפוש של גוגל.

המנגנון הטבלאי של גוגל , שהוסר מהדף החיפוש הרגיל שלהם ( מוסתר היטב)  מקל עלינו מאד ביצירת שאילתת חיפוש מורכבת , כלומר בקשת חיפוש שיש בה כמה וכמה מאפיינים שונים ,

לדוגמא :

"מה נכתב בשבוע האחרון על איראן רק בהקשר של התקציב האיראני והשפעתו על המהומות שם? "  ברצוני לקבל רק מאמרים הממוקדים רק בנושא החיפוש

 

בטבלת החיפוש ( מנגנון החיפוש הטבלאי של גוגל) מציבים את המאפיינים השונים של בקשת החיפוש האחרונה , כאשר הטבלה יוצרת , למעשה, חיתוך בין המאפיינים שהצבנו וכך נוצרת מסננת יעילה.

תוצאות הסינון ( שיצר מנגנון החיפוש הטבלאי) מתבטאות ברשימת מאמרים/ידיעות בעלי רלבנטיות גבוהה יחסית העונים על בקשת החיפוש המקורית שלנו . כך, למעשה, אנו מצמצים את סט החיפוש בהתאום למאפיינים שהצבנו בשאילתא המורכבת.

 

מקור

כמה דוגמאות לחיפוש מורכב  באמצעות ChatGPT

"כשביקשתי נתונים היסטוריים, התשובה השתנתה אם דרשתי להסתמך על מקורות שאינם כוללים את ויקיפדיה. כשרציתי נתונים כלכליים עם הפניה, הקישור היה שבור ולא הצלחתי להגיע למקור. כשהצקתי ל–ChatGPT3 בשאלות פילוסופיות ("האם אתה חי?" "האם ניתן לפגוע בך?"), הוא התחיל יפה. אבל כשהגעתי לשאלות מסדר שני, התשובות נהפכו למעגליות או חזרתיות. כשהטחתי בו שהוא (אצלי זה "הוא") סתר את עצמו, או הניח את המבוקש, הוא הודה בלשון רפה ונמלט לניסוח דיפלומטי."

מקור וקרדיט : פרופסור צחי זמיר




אבחנות וכלים שנוספו בגרסה מס' 2

פודקאסט של עזרא קליין שנוגע לנק' התורפה של הכלי בדגש על אמינות.

https://tinyurl.com/nnp433am

תוסף לכרום שמוסיף לצאט גם תוצאות חיפוש רלוונטיות

 תוספת לגרסה מס' 3 

 Liat Bonen

"אני קבלתי תשובות מצוצות מהאצבע. כולל שמות של כביכול מאמרים בנושא מסוים שלא קיימים או שם של אדם שאכן קיים אבל עוסק בכלל בנושא אחר מזה שעליו בקשתי מידע. במבט ראשון זו נראתה תשובה מדוגמת, בדיקה שלה העלתה הרבה מאד המצאות חסרות בסיס. וזה לא היה מדע טילים, אבל מצד שני גם לא משהו שאפשר למצוא בוויקיפדיה."



אז מה באמת צופן העתיד ?

ככל הנראה, בוטים בסגנון ChatGPT יוצמדו למנועי חיפוש קיימים כדי להציע ממשק משתמש המשרת הן שאילתות מסורתיות של מנועי החיפוש והן הנחיות צ'אטבוט. זה המודל שאומץ על ידי You.com, מנוע חיפוש ייחודי ( בו אני משתמש לא מעט ) שהשיק צ'אטבוט משלו דמוי GPT בדצמבר. במקום להחליף את חוויית החיפוש המסורתית של You.com, התכונה החדשה "YouChat" מופיעה רק כקישור מתחת לסרגל החיפוש. החידוש כאן הוא הצבת שתי אפליקציות המופעלות בבינה מלאכותית על אותו עמוד. סביר להניח שניתן להניח שמיקרוסופט תעשה משהו דומה כאשר היא תשלב את ChatGPT ב-Bing באביב הקרוב.

 




עמי סלנט , 25 לינואר 2023 , גרסה מס' 1

 



2 תגובות:

אגרגטורים (צוברי מידע) על כלים של בינה מלאכותית

    מאגר המק"ש ( מאגר קישורים שימושי ) " חיפוש מידע : שיטות " התעדכן היום ונוספו קישורים  מומלצים בתחומי האגרגטורים של כלים מ...