תמונת הַיֶּדַע המידעני : מִכָּאן וּמִשָּׁם: מאיפה CHATGPT שואב את המידע ?

יום שני, 27 באוקטובר 2025

מאיפה CHATGPT שואב את המידע ?

מאת: נדן פלדמן , מגזין דה-מרקר החודשי, אוקטובר 2025

לפי הערכות, CHATGPT מחזיק כיום בנתח שוק של יותר מ80% לעומת ג'ימיני של גוגל האדירה עם נתח שוק של פחות מ5%.

מחקר חדש שערכה חברת מחקרי AI מבוסטון SEMRUSH , מראה שחלק משמעותי מהתשובות שמספק CHATGPT מגיע ממקורות שהמידע בהם מוטל בספק , ונוצר בעיקר ע"י חובבים ובראשם פלטפורמות מובילות להפצת פייקניוז: פייסבוק , יוטיוב , ואתר הפורומים רדיט . אלה בולטים בתוצאות לצד ויקיפדיה, שאמנם מהווה מקור מידע מרכזי אבל נכתבת על ידי מתנדבים , והיא עתירת אי-דיוקים ומידע כוזב בערכים השונים מאחר שהממשק שלה מאפשר לכל אחד לערוך ולייצור תוכן .

המקרה של הפורומים רדיט בולט מיוחד , הן משום שביחס לגודלו הצנוע יחסית באינטרנט הוא תופס נתח משמעותי בתשובות שמפיק CHATGPT .

המחקר How AI search really works ניתח את החיפושים בCHATGPT בחמש קטגוריות : פיננסים , טכנולוגיה דיגיטלית , שירותים עסקיים, מוצרי אלקטרוניקה ואופנה.

המחקר בחן 150 אלף תשובות לשאילתות , ונערך ביוני 2025. שיטת הבדיקה מתייחסת למספר הפעמים הממוצע שמקור מוזכר בתשובה לכל שאילתא ( פרומפט).

אם המקור מופיע פעם אחת בכל תשובה לשאילתא, השיעור הוא 100% , כשהוא מופיע בממוצע יותר מפעם אחת בכל שאילתא, הנתון גבוה מ100%.

לפי ממצאי המחקר, רדיט ( פורומים ) גובר על מידע מאתרים מומחים בציטוטי חיפוש מקצועיים, ושולט בתוצאות בפער גדול מהשאר . כך, למשל , הוא מופיע כמקור ב176.9% משאילתות הפיננסים של משתמשים בCHATGPT , כלומר , אזכור של כמעט פעמיים בכל שאילתא , וזאת אף שזהו תחום בו הדיוק קריטי.

זאת לא גזירת גורל : בהשוואה שערך המחקר מול גוגל AI MODE , נמצא כי בעוד CHATGPT מעניק לרדיט עדיפות כסמכות ראשונה בייעוץ פיננסי , כלי הבינה המלאכותית של גוגל מעניק עדיפות לאתרי פיננסים מקצועיים כגון BANKRATE ועוד. כלומר , אפשר גם אחרת .

רדיט כמקור מידע שולט בציטוטי CHATGPT בתחומים נוספים , ובראשם שירותים עסקיים ( 141% ) , טכנולוגיה ( 122% ) ומוצרי אלקטרוניקה ( 127% ) .

"כל זה סותר הנחות מסורתיות לגבי סמכות המקורות של בינה מלאכותית" , מציין ראש צוות המחקר , קרלוס סילבה. " זה קורה מאחר שמודלים של בינה מלאכותית עשויים לתעדף חוכמה קולקטיבית על פני מקורות מקצועיים" . " תוכן שנוצר ע"י קהילה ( כגון הפורומים של רדיט) נושא סמכות משמעותית מבחינת הבינה מלאכותית , ובמיוחד בCHATGPT " , לעתים קרובות אפילו יותר מאשר הסמכות של מומחים" .

במקרים מסוימים ההטיה מגיעה עד לכדי אבסורד. כך למשל , הבלוג הרשמי של מיקרוסופט מקבל פחות ציטוטים בCHATGPT מאשר שרשורים בפורומים של רדיט על מוצרי מיקרוסופט.

לסיכום, מודלים של בינה מלאכותית זקוקים למידע סמכותי .

ראו למטה קישור למחקר

Author:Carlos Silva

Sep 03, 2025

Contributor: Alex Lindley

המחקר How AI search really works

תגובה 1:

arik benedek chaviv28 באוקטובר 2025 בשעה 21:03
תודה רבה.
בעברית ולשאילתות שלי משום מה אין כמעט נראות ל- רדיט או ל-פייסבוק. יש נראות רבה לויקיפדיה וכן, לא להאמין, כשהוא נדרש לתת מקורות תקפים ואמינים לאינציקלופדיות נחשבות [בריטניקה למשל] למחקרים אקדמיים שכנראה מאפשרים הפצתם ברבים.
עם זאת, חובה תמיד לבדוק את המקורות. לפעמים הוא ממציא מקור, או מסתפק בשם של מאמר כאיזו תקפות לתוכן.
השבמחק
תשובות

הוסף תגובה

חפש בבלוג זה

יום שני, 27 באוקטובר 2025

מאיפה CHATGPT שואב את המידע ?

תגובה 1:

צובר חדשות מבוסס AI אודות האירועים הביטחוניים

חפש בבלוג זה

חפש בבלוג זה