חפש בבלוג זה

יום שני, 27 באוקטובר 2025

מאיפה CHATGPT שואב את המידע ?

  

 מאת: נדן פלדמן , מגזין דה-מרקר החודשי, אוקטובר 2025

לפי הערכותCHATGPT  מחזיק כיום בנתח שוק של יותר  מ80% לעומת ג'ימיני של גוגל האדירה עם נתח שוק של  פחות מ5%.

 מחקר חדש שערכה חברת  מחקרי AI  מבוסטון  SEMRUSH , מראה שחלק משמעותי  מהתשובות  שמספק  CHATGPT  מגיע ממקורות  שהמידע  בהם מוטל בספק , ונוצר בעיקר ע"י חובבים ובראשם פלטפורמות מובילות להפצת פייקניוז:  פייסבוק ,  יוטיוב ,  ואתר הפורומים רדיט . אלה בולטים בתוצאות  לצד ויקיפדיה, שאמנם מהווה מקור מידע מרכזי אבל נכתבת על ידי  מתנדבים , והיא עתירת  אי-דיוקים  ומידע כוזב בערכים השונים מאחר שהממשק שלה  מאפשר לכל אחד  לערוך  ולייצור תוכן .

המקרה של הפורומים רדיט בולט מיוחד , הן משום שביחס לגודלו הצנוע יחסית באינטרנט הוא תופס נתח משמעותי בתשובות שמפיק CHATGPT .

המחקר   How  AI search really works ניתח  את החיפושים בCHATGPT בחמש קטגוריות : פיננסים , טכנולוגיה דיגיטלית , שירותים עסקיים, מוצרי אלקטרוניקה ואופנה.

המחקר בחן  150 אלף  תשובות לשאילתות , ונערך ביוני  2025. שיטת הבדיקה מתייחסת למספר הפעמים הממוצע שמקור מוזכר בתשובה לכל שאילתא ( פרומפט).

אם המקור  מופיע  פעם אחת  בכל תשובה לשאילתא, השיעור הוא  100% , כשהוא מופיע בממוצע יותר מפעם אחת בכל שאילתא, הנתון  גבוה מ100%.

לפי ממצאי המחקר, רדיט ( פורומים )  גובר על מידע מאתרים מומחים בציטוטי חיפוש מקצועיים, ושולט  בתוצאות בפער גדול  מהשאר . כך,  למשל ,  הוא מופיע כמקור  ב176.9%  משאילתות  הפיננסים  של משתמשים בCHATGPT , כלומר , אזכור  של כמעט פעמיים  בכל שאילתא , וזאת אף שזהו תחום בו הדיוק קריטי.

זאת לא גזירת גורל : בהשוואה  שערך המחקר מול גוגל AI MODE , נמצא  כי בעוד CHATGPT  מעניק לרדיט עדיפות  כסמכות ראשונה  בייעוץ פיננסי , כלי הבינה המלאכותית  של גוגל מעניק עדיפות לאתרי פיננסים מקצועיים כגון BANKRATE ועוד. כלומר , אפשר גם אחרת .

רדיט כמקור מידע שולט בציטוטי  CHATGPT  בתחומים נוספים , ובראשם שירותים עסקיים ( 141% ) , טכנולוגיה ( 122% ) ומוצרי אלקטרוניקה ( 127% ) .

"כל זה סותר הנחות מסורתיות לגבי סמכות  המקורות  של בינה מלאכותית" , מציין ראש צוות המחקר , קרלוס סילבה. " זה קורה מאחר שמודלים של בינה מלאכותית  עשויים  לתעדף  חוכמה קולקטיבית  על פני מקורות מקצועיים" . " תוכן שנוצר ע"י קהילה ( כגון הפורומים של רדיט)  נושא סמכות  משמעותית  מבחינת  הבינה מלאכותית , ובמיוחד  בCHATGPT " , לעתים קרובות אפילו  יותר מאשר  הסמכות של מומחים" .

במקרים מסוימים ההטיה  מגיעה עד לכדי אבסורד. כך למשל , הבלוג הרשמי של מיקרוסופט מקבל פחות ציטוטים  בCHATGPT מאשר שרשורים  בפורומים של רדיט על מוצרי מיקרוסופט.

לסיכום,  מודלים של בינה מלאכותית זקוקים למידע סמכותי .

ראו  למטה קישור למחקר

Author:Carlos Silva

Sep 03, 2025

Contributor: Alex Lindley

המחקר   How  AI search really works

 

תגובה 1:

  1. תודה רבה.
    בעברית ולשאילתות שלי משום מה אין כמעט נראות ל- רדיט או ל-פייסבוק. יש נראות רבה לויקיפדיה וכן, לא להאמין, כשהוא נדרש לתת מקורות תקפים ואמינים לאינציקלופדיות נחשבות [בריטניקה למשל] למחקרים אקדמיים שכנראה מאפשרים הפצתם ברבים.
    עם זאת, חובה תמיד לבדוק את המקורות. לפעמים הוא ממציא מקור, או מסתפק בשם של מאמר כאיזו תקפות לתוכן.

    השבמחק

רשת המחקר למדעי החברה (SSRN - Social Science Research Network): תמונת מצב - נובמבר 2025

  https://papers.ssrn.com / SSRN   היא מאגר מקוון עולמי למאמרים מדעיים ול "working papers" כלומר, טיוטות או גרסאות מוקדמות של מח...