חפש בבלוג זה

יום שני, 10 ביוני 2024

איזה מודל שפה של הבינה המלאכותית הכי טוב?

 


מומחי עיתון  "וולט סטריט ג'ורנל"  (WSJ ) החליטו לבדוק את הסוגייה הזו על מספר נושאים שונים. חלק מקצועיים כמו תחום הפיננסים, הבריאות וכו' וחלק יותר "פשוטים" כמו סיכום תוכן, כתיבת מאמרים וכו'. לשם כך הם בחרו את 5 יישומי  הAI הכי פופולאריים בקטגוריה והריצו להם מספר בחינות ומבדקים מעין תחרות "אולימפית" . 

התוצאות אולי הפתיעו, אבל  הצ'אטבוט בו אני משתמש רבות לא אכזב.

בכל המבדקים השתמשו מומחי עיתון וולט סטריט ג'ורנל  (WSJ ) בגרסאות בתשלום של הצ'אטבוטים מבוססי AI

תודה לאורי אליבאייב, מומחה בתחום ה AI, על ההפניה למאמר

 

מבוא

 

מודל שפה גדול הוא מערכת ליצירת טקסט, שעיקרון הפעולה שלה נשען על חישוב טבלת סיכויים גדולה בעזרת ניתוח כמות אדירה של טקסטים, ועל יצירת טקסטים חדשים בעזרת תהליך אקראי שבחירת המילים שלו מבוססת על טבלת הסיכויים. השלב הראשון דורש משאבים עצומים וזמן רב. הפקת הטקסט אחרי שהטבלה כבר מוכנה, פשוטה וזולה הרבה יותר מבחינה חישובית (ד"ר דוד פייטלסון).

מודל שפה  במערכות   AIהיא שיטה ברוחב פס נמוך להעברת מידע, ולעתים קרובות היא מעורפלת עקב צירופי מילים וכינויים. בני אדם אינם זקוקים לכלי מושלם לתקשורת מכיוון שאנו חולקים הבנה לא לשוניתמודלים של שפה (LLMs)   כמו בפלטפורמת  CHATGPT  מאומנים לאסוף את הידע הקשור עבור כל משפט, תוך הסתכלות על המילים והמשפטים שמסביב כדי לחבר מה קורה, אך הבנה זו מוגבלת ואינה כוללת את הידע לשיחות מורכבות יותר. כתוצאה מכך, יש בהם חוסר עקביות ולעתים גם חוסר קוהרנטית של עולם הדעת .

 

יישומי הבינה מלאכותית שהתמודדו  בתחרות " האולימפית " ?


OpenAI’s ChatGPT

Microsoft’s Copilot

Google’s Gemini

Perplexity

Anthropic’s Claude

 

מה  ניתן ללמוד  מהאתגרים "האולימפיים"  שהציבו מומחי עיתון WSJ  



לכל צ'אטבוט של AIיש חוזקות וחולשות ייחודיות,. ראינו מעט שגיאות מוחלטות ו"הזיות", שבהן בוטים  של הבינה המלאכותית  מפיקים מרגליות  בלתי צפויות וממציאים  לעתים דברים. הבוטים סיפקו בעיקר תשובות מועילות ונמנעו ממחלוקות.

ההפתעה הכי גדולה? ChatGPT, למרות העדכון המסיבי הגדול והתהילה שלו, לא הוביל את החבורה בתחרות האולימפית" . במקום זאת, ברוב המבדקים האלופה הייתה  Perplexity AI . "אנחנו מבצעים אופטימיזציה לתמציתיות", אומר דמיטרי שבלנקו, מחברת -Perplexity AI. "כיוונו את המודל שלנו לתמציתיות, מה שמאלץ אותו לזהות את המרכיבים החיוניים ביותר."

 

למאמר באנגלית  בעיתון " וולט סטריט ג'ורנל" ( קישור)

The Great AI Challenge: We Test Five Top Bots on Useful, Everyday Skills


ראו גם : סקירה שכתבתי לפני 7 חודשים:


אין תגובות:

הוסף רשומת תגובה

ניהול ידע ארגוני באמצעות Claude.ai

  מאת: Uri Eliabayev   עוד פיצ'ר חשוב מאוד נחת עכשיו בקלוד: פרויקטים. אתם יכולים עכשיו לעבוד על פרויקט מוגדר ולהכניס לשם קבצים, יד...