חפש בבלוג זה

יום ראשון, 29 בינואר 2023

במבט אינטגרטיבי : בינה מלאכותית - כמה התפתחויות וכמה פיתוחים חדשניים, ינואר 2023

 


ליקט , תִּמְצֵת וערך : עמי סלנט , מידען

תמצית של מקורות מידע שהתפרסמו בשבועיים האחרונים על בינה מלאכותית

הנושאים העיקריים בסקירה :

·       מתפתחים  כלים שיוכלו לזהות טקסטים שנכתבו באמצעות בינה מלאכותית.

·       אפליקציה בשם GPTZero יכולה לפענח אם טקסט נכתב על ידי אדם או תוכנת ChatGPT. "

·       סטארט־אפים מגייסים בימים אלה מיליוני דולרים לשירותים המאפשרים להקים אתרים משוכללים בלחיצת כפתור

·       הפתעה במערכת וויקס, בינה מלאכותית שתסייע ביצירת טקסטים לאתר בתוך העורך עצמו בלי צורך בתוכנות חיצוניות!

·       הצפת הרשתות החברתיות בעוד ועוד תוכן אוטומטי ע"י AI עלולה להשבית את השרתים, או לכל הפחות לגרום לתקלות

·       מתי הבינה המלאכותית תִּלְמַד עברית ?

·       מחוללי תמונות מבוססי AI  בחינוך

·       יישום הבינה המלאכותית החדש של חברת פיגי מתאים גם לחינוך

·        בינה מלאכותית ביישומי  אופיס כנגד גוגל דוקס

הסקירה המלאה


ChatGPT  בגרסה מתקדמת יותר יוצע בקרוב בתשלום

הצ'טבוט של OpenAI הפך ללהיט היסטרי, אך משתמשים נתקלו בו בהודעות על עומס חריג, שלא מאפשר לשרתם ● כעת כלי מתקדם יותר כבר נמצא בפיילוט והמתעניינים בו - בעבור 42 דולר בחודש - מוזמנים להיכנס לרשימת המתנה

גרסה זו תשודרג בגישה לתכונות חדשות אחרות, בקצב תגובה מהיר יותר וללא ויסות קצב השימוש (Throttling) וכן היא תעבוד בלי מגבלות מוגברות של בקשות API. התכונות והתמחור המדויקים של תוכנית ChatGPT Professional  יכולים להשתנות בהתאם לצרכים הספציפיים של המשתמש, ולהסכמים שנעשו עם OpenAI.

יצוין כי לעת עתה הכלי המתקדם אינו נגיש לכלל הציבור באופן עצמאי, והחברה פרסמה קישור לרשימת המתנה בשרת הדיסקורד שלה בעבור המתעניינים. ( גלי פיאלקוב, 24 לינואר 2023 )

מנכ"ל OpenAI, סם אלטמן, חשף בראיונות עיתונאיים שבחברה כבר עומלים על המוצר החדש שלהם, שיוכל לייצר סרטוני וידאו מושקעים ומקוריים באמצעות פקודות טקסט בלבד. התחזיות הן שנוכל לראות את הכלי החדש כבר במהלך השנה הנוכחית.

לבסוף, החברה עומלת על מנת לפתח כלים שיוכלו לזהות טקסטים שנכתבו באמצעות בינה מלאכותית. בעבר פרסמה החברה את GPT-0, שיכול לזהות טקסטים שכאלו, אך הוא היה ברמה נמוכה יחסית וניתן היה לתמרן אותו באמצעות מניפולציות פשוטות. הפרסומים על הכלים החדשים החלו לצוץ בעיקר בעקבות ביקורת על כך שתלמידים בבתי ספר וסטודנטים באוניברסיטאות משתמשים בצ'אט המתקדם על מנת לרמות במשימותיהם. (יפתח מנדלבאום, גלובס , 27 לינואר 2023 )

יצליח לעצור רמאויות? כלי חדש מזהה אם טקסט נכתב על-ידי AI או אדם

 אדוארד טיאן, סטודנט בן 22, לא חיכה לצעד הרשמי של החברה. טיאן, שנמצא לקראת סיום לימודיו בתואר במדעי המחשב ועיתונות באוניברסיטת פרינסטון יצר אפליקציה בשם GPTZero, שלדבריו יכולה לפענח אם טקסט נכתב על ידי אדם או תוכנת ChatGPT. "לבני אדם מגיע לדעת מתי הכתיבה היא לא אנושית", אמר טיאן לאתר Daily Beast. הוא אף הבהיר כי אינו מתנגד לשימוש ב-AI באופן גורף, אך שיש לעשות זאת בצורה אתית ובהסכמה. "אני לא מתנגד לשימוש ב-AI בכתיבה כשיש בזה היגיון", אמר, והוסיף כי הוא מודאג מההיבטים האתיים של השימוש בצ'אטבוטים, ומאופן הפעולה הלא שקוף של מודלים גדולים של שפה כמו ChatGPT. בראיון ל-CBS הסביר כי יש לאמץ את המודלים החדשים באופן אחראי, ולכן נחוצים גם כלים כמו האפליקציה שפיתח ( אושרית גן-אל , 8 לינואר 2023 )

התוכנה שפיתח פועלת מתוך ההנחה כי בני אדם כותבים באופן פחות צפוי מבוטים. לכן, היא בודקת שני מדדים כשמזינים אליה טקסט. הראשון בוחן משפטים בודדים, ועד כמה נעשה בהם שימוש במילים באופן מפתיע ולא צפוי. השני משווה בין המשפטים בטקסט, ובודקת את השונות ביניהם, שכן בוטים יהיו עקביים יותר בסגנון הכתיבה. למשל, בני אדם משלבים גם משפטים מורכבים וגם משפטים פשוטים כשהם כותבים טקסט, אך בוטים נוטים להשתמש במשפטים פחות מורכבים לאורך כל הטקסט. אחרי בחינת שני הפרמטרים, התוכנה מעניקה ציון לטקסט, וככל שהוא נמוך יותר, הסיכוי שנוצר על ידי בוט - גבוה יותר (( אושרית גן-אל , 8 לינואר 2023 )

 


גוגל, מהצד השני, נוקטת באסטרטגיה שונה. היא מגייסת כבר יותר מעשור אלפי מומחי בינה מלאכותית מהאקדמיה, שלפי כל ההערכות צפויים להביא להשקת טכנולוגיה מתחרה, ויש שאומרים מפותחת יותר, מהדור הבא של Chat GPT אבל האתגר שלה הוא בעיקר מול המשקיעים ובעלי המניות. הבינה היוצרת עשויה לשבש את ממשק הצגת הפרסומות שלה - במקום עמוד עם עשר תוצאות חיפוש ולינקים ממומנים, פיסקה או יותר של טקסט מובנה (אסף גלעד גלובס, 27 לינואר 2023 ).

הפיתוחים החדשים מציבים גם את הרשתות החברתיות, כמו טוויטר, אינסטגרם או טיקטוק, בפני איום קיומי. חברות וגופי מודיעין עשויים לנצל את צ'אט הבינה המלאכותית ודומיו על מנת להפיץ מידע שקרי או להדהד תכנים לפי רצונם באמצעות רשת של ציוצים, שיתופים, תגובות ולייקים. זאת, באמצעות הקמת בוטים חכמים שכותבים כבני אדם בקצבים שאינם אנושיים למגוון פרופילים.

מעבר להצפת תוכן, הדבר מהווה גם איום כלכלי על טוויטר פייסבוק ורשתות חברתיות אחרות. הצפת הרשת בעוד ועוד תוכן אוטומטי עלולה להשבית את השרתים, או לכל הפחות לגרום לתקלות. (אסף גלעד גלובס, 27 לינואר 2023 ).

גם בוויקס הישראלית, המאפשרת לעסקים קטנים ובינוניים להקים אתרים בעצמם ולמכור דרכם מוצרים, חושבים זמן רב כיצד לעכל את הבשורות הטכנולוגיות החדשות. לכאורה, החברה נמצאת תחת איום: סטארט־אפים מגייסים בימים אלה מיליוני דולרים לשירותים המאפשרים להקים אתרים משוכללים בלחיצת כפתור. Durable, למשל, מסן פרנסיסקו גייס לאחרונה 6.5 מיליון דולר ל"שירות להקמת אתרים בתוך 30 שניות". מנוע הבינה המלאכותית מאתר מילות מפתח רלוונטיות, מנסח פסקאות, מאתר תמונות חופשיות לשימוש ומשלב טפסים לרישום לקוחות פוטנציאליים. גם SPIRITT הישראלית, שמאפשר לחברות להקים אפליקציה בתוך שבוע, נוגסת לכאורה בשוק של וויקס, אם כי היא מאתגרת בעיקר בתי תוכנה (אסף גלעד, גלובס, 27 לינואר 2023 ).

בינה מלאכותית בוויקס?!? הכירו את ההפתעה החדשה בעורך! 

הפתעה במערכת וויקס, בינה מלאכותית שתסייע ביצירת טקסטים לאתר בתוך העורך עצמו בלי צורך בתוכנות חיצוניות! הכירו את הדרך הפשוטה והיעילה ביותר לייצר תכנים לאתר שלכם! CHAT GPT חדש בתוך עורך ויקס - צפו בסרטון ולמדו איך עובדים איתו:)

לסרטון הוידאו של עדי ליניאל

https://www.youtube.com/watch?v=swRYB2op-kQ

 


מתי הבינה המלאכותית תִּלְמַד עברית ?

הבעיות: מעט מידע, מעט תמריצים

פרופ' אביב גאון, מבית ספר הארי רדזינר למשפטים באוניברסיטת רייכמן, אומר בשיחה עם גלובס: "למה בינה מלאכותית אינה פועלת בעברית? זו נקודה כואבת. הרי איך מערכות בינה מלאכותית עובדות? באמצעות מסדי נתונים שהמערכת מאומנת עליהם. היא מאומנת על מערכי מידע שכוללים גם עברית, ולכן ישנם כלים עם יכולות בעברית. הבעיה היא שהמערכות הללו לומדות על בסיס מידע קיים או על בסיס אינטראקציות ומעורבות. משמע, שפות עם מעט דוברים, כמה מיליונים בודדים, יהיו חלשות יותר משפות כמו אנגלית או סינית" ( נבו טרבלסי , גלובס , 27 לינואר 2022 ) .

לחברת AI21 Labs הישראלית יש שני מוצרים, אחד לכתיבה (שמציע פיצ'רים כמו שכתוב הטקסט והצעת חלופות), ואחד לקריאה (שמסכם טקסט ארוך לקטעים קצרים). אורי גושן, מנכ"ל משותף בחברה, מודה שגם במוצרים שלהם יש בעיה בשפה העברית. "מדובר בתכונה אינהרנטית של מודלי שפה ובדרך בה מאמנים אותם", הוא מסביר. "לוקחים את כל הקורפוס האינטרנטי (מאגר טקסטים המשמש לניתוחים ומחקר, נ"ט) ונותנים למערכת לחזות את המילה או רצף המילים הבאות. אנחנו חברה מסחרית, כך שרוב השוק בשפות אחרות ובלבד בשפה האנגלית".( נבו טרבלסי , גלובס , 27 לינואר 2022 ) .

 AI21 Labs הישראלית של פרופ' יואב שוהם, אמנון שעשוע ואורי גושן, שכאמור גייסה לאחרונה 65 מיליון דולר, בונה מודל שפה שמתחרה במודלים כמו של OpenAI. מודל זה מאפשר למפתחים ולחברות לבנות יישומי הבנת שפה טבעית. AI21 Labs גם מפתחת כלים כאלה בעצמה: Wordtune, כלי שעוזר בתהליך הכתיבה, מתקן טעויות ומשפר את הדקדוק (ומתחרה בגרמרלי הפופולארי). ( שגיא כהן , דה-מרקר )

ביקור באתרים You.com ו–perplexity.ai נותנים מושג לפוטנציאל: אלה מנועי חיפוש מבוססי צ'אט טבעי, שאפשר לשאול אותם שאלות ולקבל תשובות מלאות — ומתחת לתשובה מופיעה רשימת לינקים למקורות המידע. ( שגיא כהן , דה מרקר )

לפי הפרסום ב"ניו יורק טיימס" החברה הכריזה לאחרונה על סוג של "מצב חירום". היא נערכת להשיק בשנה הקרובה 20 מוצרי בינה מלאכותית, כולל הדגמה של שילוב יכולות צ'אטבוט במנוע החיפוש. דיפמיינד, זרוע הבינה המלאכותית של אלפבית, תשיק גם היא גרסה ראשונה של הצ'אטבוט שלה, בשם Sparrow.

לכולם ברור שטכנולוגית, גוגל לא נופלת מ–OpenAIבזכות השקעות רבות שביצעה בבינה מלאכותית בשנים האחרונות. יש לה צ'אטבוט משלה בשם LaMDA,  שעדיין בשלב הבדיקה, אך הציג ביצועים מרשימים ביותר ואף גרם לאחד ממהנדסיה להאמין שהוא פיתח תודעה. ( שגיא כהן , דה מרקר )

הניו יורק טיימס מדווח כי גוגל צפויה להוציא כ-20 כלים המבוססים בינה מלאכותית בשנה הקרובה. מדובר בכלים אשר חלק יונגשו רק למפתחים וחלק למשתמשי קצה. דוגמאות לכך הן פלטפורמה חכמה וקלה יותר לבניית אפליקציות אנדרואיד בשם Colab Plus Android Studio, כלי ייעודי ליצירת סיכום של סרטונים ארוכים בדמות סרטון קצר ותמציתי וייתכן גם צ׳ט בוט חכם לשירות החיפוש המוכר של החברה.

יש מכשול משמעותי נוסף, שלא מדברים עליו מספיק, ומרחיק מאוד את היישום הנרחב של צ'אט מבוסס בינה מלאכותי כמנוע חיפוש: עלויות הענן העצומות, שכרוכות במשימות בינה מלאכותית. סאם אלטמן, מנכ"ל OpenAI, צייץ כי כל שאילתא ב–ChatGPT עולה כמה סנטים לחברה. הסכום הפעוט הזה יכול להצטבר במהירות לסכומי עתק שיעיקו גם על כיסיה העמוקים של גוגל. העלות הזו גם יכולה אולי להסביר למה לאחרונה הצ'אט אינו זמין במשך שעות ארוכות, ולמה החברה משיקה גרסה של הצ'אט שלה בתשלום. עניין העלות עשוי להקשות גם על סטארט־אפים שמתחרים, ואכן אין הרבה חברות קטנות שכיום מפעילות כלים כאלה בסדרי גודל רחבים מאוד, ואילו OpenAI משתמשת בשירותי הענן של מיקרוסופט בעלות מסובסדת מאוד ( שגיא כהן , דה מרקר )

אתר הטכנולוגיה הגדול בעולם נתפס מפרסם כתבות שנכתבו על ידי AI

גוגל חשפה את מה שהאתר ניסה להצניע

על פי הערכות SimilarWeb, זוכה אתר CNET האמריקאי ל-55 מיליון ביקורים בחודש בממוצע (המספר המדויק צריך להילקח בערבון מוגבל, לאור העובדה שלא מדובר בנתונים רשמיים) – והוא מפרסם מדי יום כמות מרשימה של כתבות בנושאי טכנולוגיה וצרכנות – מזה שנים רבות. תחקיר של futurism חושף כי אי שם בחודש נובמבר האחרון, החלו לעלות כתבות לאתר תחת החותמת "מערכת CNET Money", מדור הכלכלה של האתר. רק שאינדוקס של מנוע החיפוש של גוגל חשף שהוא ממש לא נכתב על ידי אף אחד במערכת.

חיטוט בתוצאות של גוגל העלה כי לכתבות רבות באתר צורפה החתימה: "הכתבה הזאת נוצרה על ידי טכנולוגיית אוטומציה ונערכה ונבדקה על ידי עורך מצוות העורכים שלנו", אבל בכתבה עצמה לא היה זכר לכך, כך שקוראים לא ידעו שהם קוראים טקסט שג'ונרט על ידי AI. רק מי שהקליק על "מערכת CNET Money" נחשף לכיתוב החבוי. על פי התחקיר, עשרות כתבות כאלו עלו לאוויר, כשמטרתן היא להיות מותאמות למנוע החיפוש של גוגל (מה שנקרא בשפה המקצועית SEO Optimized) לצרכים מסחריים ( עידן בן טובים , 23 לינואר 2023 ) .

ב-The Verge עשו פולואפ, כלומר תחקיר המשך, על התחקיר הראשוני, וחשפו כי CNET מפרסמים בכל יום בבוקר את אותה הכתבה על משכנתאות ומחזור משכנתאות, רק עם שינויים קלים מאוד. הפעם החתום הוא העורך בפועל של מדור הכלכלה, אבל הכתבות הללו לא מופיעות בעמוד הייעודי שלו באתר. באתר שוחחו עם כמה עובדים ב-CNET, ולטענתם אפילו הם לא יודעים האם כלי בינה מלאכותית כותבים את הסיפורים שמפורסמים באתר, או חברי צוות אמיתיים. לטענתם, כשיידעו אותם על השימוש בבינה מלאכותית, כבר היו מספר כתבות שנכתבו על ידי AI באוויר – כלומר, התהליך התבצע מתחת לאף לכאורה של העובדים, ונחשף רק לאחר שקוראים שמו לב לאותה שורה חשודה בגוגל (

מחוללי תמונות AI הטובים ביותר ליצירת אומנות מטקסט 

מחוללי תמונות AI הופכים לנושא החם עכשיו, אבל הם רחוקים מלהיות חדשים. הטכנולוגיה של הכלים האלו קיימת כבר זמן מה. עכשיו זה רק מגיע לנקודה שבה הם נגישים יותר למשתמש היומיומי.

חלק ממחוללי הטקסט הללו הם בחינם, בעוד שחלקם בתשלום, ואחרים מאפשרים ניסיון. ישנם גם סגנונות רבים של אומנות שאתם יכולים ליצור ממחוללים שונים

לרשימת מחוללי תמונות מבוססי AI

קישור 2

חינוך
מחפשים דרך לחשוף את הילדים לבינה מלאכותית ועל הדרך לעשות קצת כיף?

הכירו את DALL-E, האתר שמייצר עבורכם יצירות אומנות מרהיבות בקלות ופשטות. כל מה שצריך לעשות זה רק להקליד תיאור קצר, והאתר יפיק עבורכם תמונה חדשה.

לכתבה של הילי זוורו (קישור)

Dalle- E תמונות ובינה מלאכותית בשיעורים - זינוק לחינוך עם הילי זוורו


יישום הבינה המלאכותית החדש של חברת פיגי מתאים גם לחינוך

 השבוע השקנו בחברת פיגי את מוצר הבינה המלאכותית שלנו, שעושה שימוש בפרוטוקולים פומביים דוגמת ChatGPT ו-Stable Diffusion ובטכנולוגיה שפותחה על ידינו כדי להשלים אותם, על מנת לאפשר לאנשים לייצר בקלות ובמהירות תכנים מעוצבים בפורמט מעניין.

אם יצרתם מסמך בפיגי סביר שהוא יהיה מעוצב, מאורגן ומנוסח היטב, אבל אין ספק שהוא ייעדר את הממד האישי. וכאן אתם נכנסים לתמונה: אתם מוזמנים למחוק, להוסיף, להחליף חלק מהתמונות והטקסטים, לשכפל חלק מהעמודים, ולהוסיף שאלונים, קבצי אודיו, אנימציות ועוד ועוד. התקווה שלנו היא שכשתלמיד בוחר להגיש עבודה לבית הספר, למשל, הוא ייעזר במערכת האוטומטית שלנו כדי לייצר את הגרסה הראשונה של העבודה, אבל אחר כך יערוך אותה, יתקן אותה, ותוך כדי התהליך יעבור חוויה לימודית משמעותית עד לקבלת תוצר שהוא שלם איתו. באותה מידה, אם מישהו רוצה לערוך מצגת לצוות שלו, לבנות פעולה לקבוצה בתנועת הנוער או לכתוב מאמר בנושא מסוים אין פסול בלהיעזר באמצעים טכנולוגיים כדי לייצר את התשתית, בתנאי שלאחר מכן מתבצעת עריכה והתאמה ידנית.

טכנולוגיית מנוע החיפוש, למשל, שהומצאה במאגרי מידע מקוונים עוד טרם המצאת האינטרנט, חוסכת לנו הרבה שעות של נבירה בספריות, חיפוש באינדקסים וקריאה, ומביאה אותנו ישר אל המידע שאנחנו מחפשים. זה בא על חשבון ההעמקה, במידה מסוימת, אבל מייעל את התהליך ומאפשר לנו לרכז את רוב האנרגיה שלנו במה שחשוב באמת - עיבוד המידע, הסקת מסקנות וניסוחן. הטכנולוגיה החדשה לוקחת את זה צעד קדימה ולא רק מאתרת מידע אלא גם מעבדת אותו ומנגישה אותו בצורה קריאה וקלה להבנה, אבל כשם שהאינטרנט ומהפכת החיפוש היוו זרז לחשיפה למידע רב יותר, כך אני מקווה שגם השימוש בבינה מלאכותית יהיה מקפצה לאנשים להביא לידי ביטוי את היצירתיות ואת שיקול הדעת שלהם לטיוב התוצרים האוטומטיים, ולא להחליפם בפתרון טכנולוגי.

אין ספק שהטמעת טכנולוגיה בחיי היומיום שלנו באה על חשבון פעולות אחרות ומכחידה במידה רבה כישורים שפותחו עד היום, כשהפעולות שהיא מחליפה נעשו בצורה ידנית. זה נכון לגבי רכבים ממונעים, מחשבון, מיקרוגל, טלפון נייד, מקלדת/מדפסת ועוד אינספור טכנולוגיות אחרות. כשהגשתי למורה שלי בכיתה י׳ עבודה מודפסת היא דרשה ממני להגיש אותה שנית בכתב יד בטענה ש״אנחנו לא רובוטים״. כיום, ברוב מוסדות החינוך הדפסת עבודות להגשה היא דרישת חובה. תהליך האימוץ של כל טכנולוגיה כרוך גם בהתגברות על החשש שהיא תחליף לחלוטין ותעלים התנהגות אנושית שיש בצדה ערכים חיוביים וכמובן שתיפול בידם של אנשים שיעשו בה שימוש זדוני ויעיל כדי לפגוע באחרים. החששות טבעיים, מובנים ובמידה מסוימת גם מוצדקים. האתגר שלנו כבני אדם הוא לא להימנע מהקידמה, אלא לעשות בה שימוש פרודוקטיבי, מוסכל ומוסרי ( שאול אולמרט, ינואר 2023 ).


גוגל דוקס פופולרית יותר ממיקרוסופט וורד – כאן ChatGPT נכנסת לתמונה

 

מיקרוסופט מתכננת להפוך את טכנולוגיית הבינה המלאכותית של OpenAI לזמינה עבור מיליארדי משתמשים על ידי שילובה בכל מוצריה, אמר השבוע מנכ"ל החברהסאטיה נאדלה. המשמעות היא שהיכולת של ChatGPT לייצר טקסט באמצעות הנחיות פשוטות תיכלל בחבילת המוצרים של Office 365, כולל Microsoft Word, PowerPoint ו-Outlook.

באמצעות המודלים של OpenAI, אפשרויות ההשלמה האוטומטית והתיקון האוטומטי של מיקרוסופט וורד יבצעו משימות מתקדמות יותר מאשר תיקון סגנון ודקדוק, ותהיה אפשרות ליצר טקסט ארוך יותר על סמך כמה מילות מפתח. למרות שהחברה עדיין לא הכריזה על יישומים ספציפיים, כנראה שמשתמשים יהיו מסוגלים להזין הנחיות וליצור מצגות PowerPoint ומיילים באורך מלא.

אפשרויות מסוג זה עשויות לעזור למיקרוסופט למשוך משתמשים צעירים יותר. בעוד ש-Microsoft Office 365 היה תקן דה פקטו עבור מיליוני ארגונים, אנליסטים אומרים שענקית הטכנולוגיה נמצאת בפיגור במשיכת צעירים המעדיפים מוצרים שיתופיים כמו Google Docs ו-Sheets.

"מיקרוסופט איבדה אחיזה משמעותית מול גוגל, במיוחד בתחום החינוך והדמוגרפיה הצעירה יותר באוניברסיטאות, ויש דור שלם שמשתמש בגוגל דוקס כברירת מחדל. מיקרוסופט צריכה לשנות את זה", אמר לפורבס דן איבס, אנליסט טכנולוגי ב-Wedbush Securities. "אני חושב ש-ChatGPT יהיה קלף שעשוי לשנות את הפרדיגמה בין גוגל דוקס למיקרוסופט וורד" (רשי שריבסטבה, 23 בינואר 2023 )

 

 


יום רביעי, 25 בינואר 2023

מנקודת המבט של מידען : האם ChatGPT אכן מסוגל להחליף את מנוע החיפוש של גוגל ? ( גרסה מס' 3)

 


למד , חקר וערך : עמי סלנט , מידען

 

רקע ומבוא

סינתזה בין מקורות מידע שונים

צ'אטבוט הוא תוכנת מחשב המדמה שיחה אנושית. זאת יכולה להיות שיחה בעל פה או שיחה כתובה, שיחה פשוטה של שאלה ותשובה או דרישה לניתוח מורכב יותר. ChatGPT הוא צ'אטבוט מבוסס בינה מלאכותית שפותח על ידי חברת הבינה המלאכותית OpenAI והושק בגרסתו האחרונה בנובמבר האחרון.

"זאת מערכת שסקרה את הרשת ויכולה לנהל דיאלוג של שאלות ותשובות בשפה פשוטה וטבעית", מסביר ד"ר יובל דרור , "ההבדל בינה לגוגל, למשל, הוא שאם תשאלי את גוגל שאלה, תקבלי הפניה לעשרה לינקים, ואילו בצ'אטבוט תקבלי תשובה אחת, מסודרת. אם תשאלי בגוגל מה הרצל היה אומר לביאליק לו היה פוגש אותו היום, תקבלי לינקים של זה ושל זה ותיאלצי לעשות את החיבור בעצמך ChatGPT . יכול לעשות עבורך את הסינתזה הנדרשת".

מקור



ChatGPT
הוא מודל שפה, לא מנוע חיפוש. מנועי חיפוש כמו גוגל, בינג או יאהו נועדו לחפש ולאחזר מידע באינטרנט. הם משתמשים באלגוריתמים מורכבים כדי לדרג ולאינדקס דפי אינטרנט, תמונות וסוגים אחרים של תוכן. מצד שני, ChatGPT הוא מודל שמשתמש ברשת עצבית מלאכותית  ( neural network)  כדי להבין ולייצר טקסט. הוא מבין ויוצר טקסט הנראה , לכאורה,  הגיוני על סמך הקלט שניתן ל-ChatGPT

 מודל שפה  במערכות   AIהיא שיטה ברוחב פס נמוך להעברת מידע, ולעתים קרובות היא מעורפלת עקב צירופי מילים וכינויים. בני אדם אינם זקוקים לכלי מושלם לתקשורת מכיוון שאנו חולקים הבנה לא לשונית. מודלים של שפה (LLMs)  כמו בפלטפורמת  CHATGPT   מאומנים לאסוף את הידע הקשור עבור כל משפט, תוך הסתכלות על המילים והמשפטים שמסביב כדי לחבר מה קורה, אך הבנה זו מוגבלת ואינה כוללת את הידע לשיחות מורכבות יותר. כתוצאה מכך, יש בהם חוסר עקביות ולעתים גם חוסר קוהרנטית של עולם הדעת .

מקור


ד"ר יפה אהרוני , מידענית מומחית  (הדוקטורט שלה היה על מנועי חיפוש ואיחזור מידע) כתבה בבלוג שלה  סקירה מעניינת בשם האם הצ'טבוט  ChatGPT  יחליף את גוגל ? ועוד

יכולות

ניתן להשתמש ב-ChatGPT ליצירת תוכן, מכיוון שהוא יכול בקלות לכתוב תוכן על סמך הנחיה. לדוגמה, כלי בינה מלאכותית יכולים לכתוב שיר על סמך פקודה של משתמש. יתר על כן, ChatGPT יכול גם לעזור למשתמשים להוסיף נופך של אלגנטיות לסגנון הכתיבה שלהם ולהשיג את המטרות הספרותיות שלהם.

מגבלות:

 

 ChatGPT רגיש לשינויים בניסוח הקלט. לדוגמה, בהינתן ניסוח אחד של שאלה, המודל יכול לטעון שאינו יודע את התשובה, אך בהינתן ניסוח מחדש קל, יכול לענות נכון.

לפעמים הוא כותב תשובות סבירות אך לא נכונות או שגויות עובדתית. באופן אידיאלי, המודל ישאל שאלות הבהרה כאשר המשתמש סיפק שאילתה לא ברורה. במקום זאת, הדגמים הנוכחיים בדרך כלל מנחשים למה התכוון המשתמש

לסקירה של ד"ר יפה אהרוני בבלוג שלה

 

אבל מהו מקור המידע בתשובה של  ChatGPT

השטף והיכולת של ChatGPT במתן מענה לשאלות מכל הסוגים גרמו לרבים להסיק שהוא עלול להוות איום רציני על גוגל (ובהרחבה, מנועי החיפוש באופן כללי יותר, כאשר גוגל הוא מנוע החיפוש הדומיננטי בעולם), כאשר משתמש אחד בטוויטר הצהיר, "גוגל גמורה."

בעוד שפרסומים ופרשנים אחרים נקטו עמדה מתונה יותר, כמה מהם הציעו שזה עדיין יכול להכיל את חלקה של גוגל בחיפוש: אלכס קנטרוביץ, מייסד ביג טכנולוגיה, אמר לפודקאסט What Next: TBD, "זה לא יחליף את החיפוש. אבל גם אם זה ייקח 5% מנתח השוק של גוגל, זה מספר עצום".

אזכור המקורות מרמז על חולשה מרכזית נוספת של ChatGPT: הוא אף פעם לא מספק מקור לתשובות המנוסחות שלו (כנראה כי אלה מסונתזות משילוב של פיסות מידע שונות), מה שהופך אותן למאתגרות לאימות המידע .

בכתבה עבור Fortune, סטיב מולמן ציין כי "[ChatGPT] לפעמים טועה באופן מוחלט תוך שהוא נשמע בטוח לחלוטין לגבי התשובה שלו. אבל כל עוד אתה מודע לכך, ChatGPT יכול להיות כלי שימושי - בדומה שוויקיפדיה יכולה להיות שימושית כל עוד אתה לוקח את הערכים שלה כמקור המונים עם קמצוץ  של מלח." עם זאת, ההבדל המכריע בין ChatGPT לוויקיפדיה הוא שוויקיפדיה עושה שימוש מוצק במקורות מידע  (או מסמנת חוסר במקורות עם "[צריך ציטוט]"), ובכך מאפשרת לקוראים לזהות מהיכן הגיע המידע ולבדוק בעצמם את מקורותיו.

 


תשובה נחרצת

משתמשים רבים של ChatGPT ציינו את החוויה של קבלת תגובה חד-משמעית לשאילתה שלהם עדיפה על החוויה של סינון וליקוט מידע ממספר תוצאות אפשריות, במיוחד כאשר חלק מהתוצאות הללו הן מודעות בפרסום.

מתן תשובה סופית לשאלה שעשויה להכיל הרבה משתנים אינה קלה, כמובן, ומנועי החיפוש הגדולים עדיין לא יכולים לעשות זאת עבור רוב השאילתות. ChatGPT  יוצא דופן ביכולת שלו לסנתז מידע כדי לייצר קטע אחד, ולעתים קרובות מציג צדדים מרובים של בעיה מורכבת.

עם זאת, ישנם חסרונות לתוצאת החיפוש "תשובה אחת", מכיוון שהיא מונעת מהמחפשים להסיק מסקנות משלהם מהמידע הזמין, תוך הצגת פרשנות של  ChatGPT  למה ש"נכון". בינה מלאכותית ואלגוריתמים רגישים ביותר להטיה, גם אם הם נתפסים כאובייקטיביים ורציונליים, ולכן קיימת סכנה ש-ChatGPT או פלטפורמה דומה יציגו נרטיב שגוי בתגובה לשאלה מורכבת, או רגישה, ללא כל מקום לשיקול דעת למחפש המידע להסיק את המסקנות שלו.

 מקור


ChatGPT  טוב מאוד במתן מענה לשאלות. זה כמעט כמו שאתה מדבר עם אדם שבילה מאות שנים בספיגת ידע. הפלט שלו קולח ונכון מבחינה דקדוקית, והוא יכול אפילו לחקות סגנונות דיבור שונים.

עם זאת, הבעיה היא שהתשובות של ChatGPT לא תמיד נכונות. למעשה, לעתים קרובות הוא הוזה וקובע עובדות שגויות לחלוטין. מאחורי מעטה  האוריינות של , ChatGPT  יש מנוע השלמה אוטומטית מתקדם מאוד היודע לצרף פיסות מידע, אך לא יודע כיצד להתמודד עם אמיתותם.  

טיפול באמיתות הפלט של ChatGPT יהיה אתגר גדול. למרבה הצער, כרגע אין דרך להבחין בין הזיות לבין אמיתות בפלט של ChatGPT אלא אם הצלבת את התשובות שלו עם מקור אחר ( ככל הנראה, באמצעות גוגל). אבל זו כבר "יריה ברגל"  מבחינת המשתמש אם המטרה היא להשתמש במודל השפה המורכב של ChatGPT כתחליף למנועי חיפוש

מקור

 

אתגר נוסף שניצב בפני ChatGPT ו-LLMs אחרים הוא עדכון בסיס הידע שלהם. למנועי החיפוש יש את הכלים והתוכנה לאנדקס ( ליצור אינדקס) כל הזמן דפים חדשים באינטרנט. עדכון מסד הנתונים של מנוע החיפוש הוא גם פעולה חסכונית מאוד.

אבל עבור מודלים של שפות מסוג  LLM, הוספת ידע חדש מחייבת אימון מחדש של המודל. אולי לא כל עדכון ידרוש אימון מלא, אבל הוא בכל זאת יהיה הרבה יותר יקר מהוספה ושינוי של רשומות במסד נתונים של מנוע חיפוש. ויש לעשות זאת מספר פעמים ביום כדי להישאר מעודכן בחדשות האחרונות.

מקור

 

החולשה העיקרית של ChatGPT : חיפוש מורכב

 לChatGPT אין יכולת של לוגיקה בוליאנית

המתמטיקאי האנגלי ג'ורג' בול (George Boole) פיתח אלגברה של לוגיקה, שהפכה לבסיס החיפוש במאגרי מידע ממוחשביםהלוגיקה הבוליאנית (המכונה כך על שמו של בול) משתמשת באופרטורים בוליאניים כדי לקבוע אם משפט הוא נכון או לא נכון. הפעולות השכיחות ביותר הן OR, AND ו-NOT, והשימוש בהן יכול להועיל במידה רבה בזמן חיפוש מקוון.

 

כשאנו מדברים על חיפוש מורכב בגוגל , הכוונה היא לאותו מנגנון של חיפוש טבלאי המאפשר לנו להציב בו-זמנית  כמה וכמה מאפיינים בחיפוש במנוע החיפוש של גוגל.

המנגנון הטבלאי של גוגל , שהוסר מהדף החיפוש הרגיל שלהם ( מוסתר היטב)  מקל עלינו מאד ביצירת שאילתת חיפוש מורכבת , כלומר בקשת חיפוש שיש בה כמה וכמה מאפיינים שונים ,

לדוגמא :

"מה נכתב בשבוע האחרון על איראן רק בהקשר של התקציב האיראני והשפעתו על המהומות שם? "  ברצוני לקבל רק מאמרים הממוקדים רק בנושא החיפוש

 

בטבלת החיפוש ( מנגנון החיפוש הטבלאי של גוגל) מציבים את המאפיינים השונים של בקשת החיפוש האחרונה , כאשר הטבלה יוצרת , למעשה, חיתוך בין המאפיינים שהצבנו וכך נוצרת מסננת יעילה.

תוצאות הסינון ( שיצר מנגנון החיפוש הטבלאי) מתבטאות ברשימת מאמרים/ידיעות בעלי רלבנטיות גבוהה יחסית העונים על בקשת החיפוש המקורית שלנו . כך, למעשה, אנו מצמצים את סט החיפוש בהתאום למאפיינים שהצבנו בשאילתא המורכבת.

 

מקור

כמה דוגמאות לחיפוש מורכב  באמצעות ChatGPT

"כשביקשתי נתונים היסטוריים, התשובה השתנתה אם דרשתי להסתמך על מקורות שאינם כוללים את ויקיפדיה. כשרציתי נתונים כלכליים עם הפניה, הקישור היה שבור ולא הצלחתי להגיע למקור. כשהצקתי ל–ChatGPT3 בשאלות פילוסופיות ("האם אתה חי?" "האם ניתן לפגוע בך?"), הוא התחיל יפה. אבל כשהגעתי לשאלות מסדר שני, התשובות נהפכו למעגליות או חזרתיות. כשהטחתי בו שהוא (אצלי זה "הוא") סתר את עצמו, או הניח את המבוקש, הוא הודה בלשון רפה ונמלט לניסוח דיפלומטי."

מקור וקרדיט : פרופסור צחי זמיר




אבחנות וכלים שנוספו בגרסה מס' 2

פודקאסט של עזרא קליין שנוגע לנק' התורפה של הכלי בדגש על אמינות.

https://tinyurl.com/nnp433am

תוסף לכרום שמוסיף לצאט גם תוצאות חיפוש רלוונטיות

 תוספת לגרסה מס' 3 

 Liat Bonen

"אני קבלתי תשובות מצוצות מהאצבע. כולל שמות של כביכול מאמרים בנושא מסוים שלא קיימים או שם של אדם שאכן קיים אבל עוסק בכלל בנושא אחר מזה שעליו בקשתי מידע. במבט ראשון זו נראתה תשובה מדוגמת, בדיקה שלה העלתה הרבה מאד המצאות חסרות בסיס. וזה לא היה מדע טילים, אבל מצד שני גם לא משהו שאפשר למצוא בוויקיפדיה."



אז מה באמת צופן העתיד ?

ככל הנראה, בוטים בסגנון ChatGPT יוצמדו למנועי חיפוש קיימים כדי להציע ממשק משתמש המשרת הן שאילתות מסורתיות של מנועי החיפוש והן הנחיות צ'אטבוט. זה המודל שאומץ על ידי You.com, מנוע חיפוש ייחודי ( בו אני משתמש לא מעט ) שהשיק צ'אטבוט משלו דמוי GPT בדצמבר. במקום להחליף את חוויית החיפוש המסורתית של You.com, התכונה החדשה "YouChat" מופיעה רק כקישור מתחת לסרגל החיפוש. החידוש כאן הוא הצבת שתי אפליקציות המופעלות בבינה מלאכותית על אותו עמוד. סביר להניח שניתן להניח שמיקרוסופט תעשה משהו דומה כאשר היא תשלב את ChatGPT ב-Bing באביב הקרוב.

 




עמי סלנט , 25 לינואר 2023 , גרסה מס' 1

 



התעדכן מאגר הקישורים השימושי "חיפוש מידע : שיטות "

  בסדרת מאגרי המק"ש ( מאגר קישורים שימושי)  שאני בונה באינטרנט מזה שנתיים , התעדכן היום מאגר המק"ש חיפוש מידע : שיטות . נוספו כ40...