חפש בבלוג זה

יום ראשון, 7 ביולי 2024

כמה פרספקטיבות לגבי חיפוש מידעני באמצעות צ'אטובטים של AI

 



מבוא

הצ'אטובטים  של AI כגון CHATGPT או ג'ימיני  מבוססים  על מודל שפה:  מערכת ליצירת טקסט, שעיקרון הפעולה שלה נשען על חישוב טבלת סיכויים גדולה בעזרת ניתוח כמות אדירה של טקסטים, ועל יצירת טקסטים חדשים בעזרת תהליך אקראי שבחירת המילים שלו מבוססת על טבלת הסיכויים

מודלים של שפה (LLMs)   כמו בפלטפורמת  CHATGPT  מאומנים לאסוף את הידע הקשור עבור כל משפט, תוך הסתכלות על המילים והמשפטים שמסביב כדי לחבר מה קורה, אך הבנה זו מוגבלת ואינה כוללת את הידע לשיחות מורכבות יותר. כתוצאה מכך, יש בהם חוסר עקביות ולעתים גם חוסר קוהרנטיות של עולם הדעת.

 

מ.ד. ( השם המלא שמור במערכת)

"הניסיון שלי הוא עם הצ'אטבוטים למיניהם : המידע שמתקבל סובל משתי בעיות חמורות-א. כיוון שהצאטים מייצרים תשובות על סמך ההקשר המילולי של השאלה , קשה עד בלתי אפשרי לזהות את הנקודות שהוא הוזה, זו לא בעיה טכנית, זו בעיה מהותית!! הצאטים האלו מתמחים בלייצר תשובות שמילולית נשמעות נכון , ככל שהוא טוב יותר ומשוכלל יותר הבעיה הולכת ומחמירה: נסו לשאול את  claude  על ספרי ילדים בנושא מסוים בישראל,  לדוג',  תקבלו שמות של ספרים וסופרים מומצאים, שנראים מאוד מאוד אותנטיים...

הנקודה השנייה היא שקשה מאוד להוציא ממנו תוכן לא גנרי:  אם אני מחפשת לדוגמה ספרי ילדים בשנות השמונים זה נישה שהצ'אטבוט של הAI לא מצליח להבין. השימוש שלי היום בצ'אטים הוא לבקש מהם שיעצבו לי שאילתות חיפוש שאעתיק ואדביק בגוגל ,באופן כזה שאתגבר על "בועות חיפוש".  הטענה שלי היא שחיפוש מידע ברשת מתחלק בין אנשים המתעניינים במידע שימושי והם כנראה הרוב, לבין אנשים בעלי התעניינות מעמיקה בתחום מסוים בדרך כלל "נישתי" ביחס למה שמעניין את הרוב. ככל שהמערכת עובדת עם llm הסיכויים להגבלת תוצאות איכותיות יורד. חיפוש בגוגל פעם היה מחזיר תוצאה של 40 עמודים, היום לא יותר מחמש.

אני זוכרת בעבר שנברתי בין עשרות דפי התוצאות , רובם חזרו על עצמם, אבל בינות לדברים חיפוש מילולי היה נותן תוצאות לאחר השקעה ואסטרטגיה של חיפוש , כיום לא

דוגמא עכשווית -אני מתעניינת כתחביב בנושא של ספרות ילדים ישראלית (ע"ע אלי אשד וכדו') זכורה לי כתבה שפורסמה באתר Nrg, מעריב בין 2005-2010 אין לי שום דרך לקבל תוצאות שבעבר קיבלתי (כמובן באמצעות בניית אסטרטגיה טובה של חיפוש) . זה דוגמא למידע שבאופן מהותי חסר עכשיו.

לדעתי הסיבה היא תוצאות חיפוש מותאמות אישית על ידי בינה מלאכותית באופן מהותי יעלימו מידע "נישתי " כיוון שהם בנויות על סטטיסטיקה .

מעבר לעניין המהותי, כלכלית חיפוש כזה מניב  הרבה פחות....."

 

 ד"ר אברום רותם

Avrum Rotem




דווקא חיפוש עם AI למטיבי לכת הרבה פחות מתאים. לא ברור על מה התוצאה מסתמכת, והיא די יחידנית, ללא היכולת לראות בזה קצה חוט שניתן ללכת ממנו הלאה בנושא. עצם העניין שהיא מציעה בנוסף לחיפוש בקונקרטי עוד ניסים ונפלאות לא קשורים לחיפוש עצמו- בעיתית יותר מאשר עוזר.

אין ספק שזה ישתפר וכן יציע בעתיד יותר הצעות ופחות קביעות יחידניות בנושאים, אך עדיין" זה לא זה", 

 מגבלות ה AI מתבררות יותר ויותר  .  בתכלס צריך לצאת נגד אלו שמצפים שהAI  תחליף אינטליגנציה אנושית. זה פשוט חוסר הבנה של התחום

ה AI לא מייצרת מידע חדש אלא מלקטת מהרשת רסיסי מידע ללא הרשאה ועושה מזה עוגה כלשהי.

 הבעיה מתחילה כשיש צורך באימות המידע. המכונה לא מציינת מקורות, בד"כ משתמשת במקור אחד שאתרה, ואין לך- לצרכן המידע- מושג אמינות המידע. הגרוע יותר- שתוצאות איתור המידע נכנסות עתה למאגרי מידע שימצא בו שימוש בעתיד. כך מידע לא נכון, שלא לדבר על כוזב, מאפיל במהירות על מידע אמין. כבר עתה כמות שמן הדגים ( זיופים ובולשיט) ממלא את הזירה, והופך את המידע הזמין לבלתי שמיש באמת. בקיצור- להרגע קצת, ולהבין שאיתור מידע הוא עניין מורכב 

 

 עמי סלנט , מידען

יש הבדל בין צ'אטבוט AI ובין מנוע חיפוש AI 

 מערכת חיפוש  מבוססת  AI  מיישמת אלגוריתמים שונים כדי לקבוע את הרלוונטיות של כל פריט באינדקס לשאילתת המשתמש. זה יכול לכלול גורמים כמו התאמת מילות מפתח, ניתוח סמנטי, ניקוד רלוונטיות ומודלים של למידת מכונה שאומנו  על פי נתונים מצטברים. מערכות חיפוש  AI  מקצות ציון רלוונטיות לכל פריט מידע , מה שעוזר בדירוג סדר תוצאות החיפוש.

 בראש הנבחרת של מנועי החיפוש מבוססי AI נמצא Perplexity . 

הפלטפורמה של  Perplexity נותנת תוצאות יחד עם הקישורים למקור. התוצאות של Perplexity AI בהשוואה ל-ChatGPT Plus נמצאו מסוננות ( refined)  יותר וכללו גם תוכן רלוונטי בכמה וכמה הקשרים עם קישורים נוספים  בתשובה . 

עם Perplexity אתם יכולים לאמת את המידע ולציין את מקורות המידע בעבודתכם.

 

 

 


אין תגובות:

הוסף רשומת תגובה

התעדכן מאגר הקישורים השימושי "חיפוש מידע : שיטות "

  בסדרת מאגרי המק"ש ( מאגר קישורים שימושי)  שאני בונה באינטרנט מזה שנתיים , התעדכן היום מאגר המק"ש חיפוש מידע : שיטות . נוספו כ40...