תמונת הַיֶּדַע המידעני : מִכָּאן וּמִשָּׁם: צ'אטבוטים של AI

‏הצגת רשומות עם תוויות צ'אטבוטים של AI. הצג את כל הרשומות

יום שלישי, 24 בספטמבר 2024

על יכולות ההערכה של מקורות מידע ע"י צ'אטבוטים מבוססי AI כגון CHATGPT

אחת השאלות החשובות כיום היא עד כמה הצ'אטבוטים מבוססי AI יכולים להעריך נכוןמקורות מידע באינטרנט ובמאגרי מידע . זו סוגיה משמעותית, כי שאלת הערכת מקורות מידע היא רכיב מרכזי בכל קורס אקדמי המשלב גם אוריינות מידע בעיקר באוניברסיטאות . זו גם יכולת שמידענים וחוקרים ניחנים בה והיא נרכשה במשך שנים לא מעטות.

ליקטתי בסקירה שלפניכם כמה מקורות מידע מהארץ ומהעולם שגם הם מתחבטים בסוגיית הערכת מקורות מידע ע"י כלי AI . חלקם מציעים מתודולוגיה שיטתית להערכת מידע שמופק ע"י כלי AI .

Netali Hernandez-Shaya

"אולי שאלה טיפשית אבל אני לא מומחית AI ותמיד רציתי לשאול- אם CHATGPT מוצא תשובות דרך כל המידע שקיים באינטרנט אבל האינטרנט מלא בשטויות של כל מי שאי פעם העלה תוכן (ורוב האנשים מעלים תכנים לא מבוססים וחסרי סימוכין ובסיס) אז איך הוא יודע להפריד בין מה שנכון לשטויות?"

Ravid Goren

זו בכלל לא שאלה טיפשית! למעשה, זו שאלה חשובה מאוד.

ל-ChatGPT אין גישה ישירה לאינטרנט בזמן אמת, אלא הוא מבוסס על מאגר מידע עצום שנלמד על תוכן מאתרי אינטרנט, ספרים, מחקרים, מאמרים ועוד, עד לנקודת הידע האחרונה שלו (שבסיס הידע שלו מסתיים ב-2021, למשל). הוא אומן על כמויות אדירות של מידע, כולל מקורות אמינים ולא אמינים. כדי "להבין" מה נכון יותר ומה פחות, המודל משתמש בכמה שיטות:

1. סטטיסטיקה ושכיחות: המודל לומד על פי דפוסים שכיחים של טקסטים. אם הרבה מקורות אמינים מכילים מידע מסוים, המודל נוטה להציג את המידע הזה על פני מידע פחות שכיח או לא נכון.

2. מקורות אמינים: באימון של המודל נכללו מאגרי מידע אמינים כמו אנציקלופדיות, מחקרים מדעיים ומקורות נוספים הנחשבים לאמינים. כך שהסבירות גבוהה שהמודל יטה לשחזר מידע מדויק מבוסס יותר.

3. סגנון השפה: לפעמים, המודל מזהה סגנונות כתיבה שמעידים על כך שהתוכן פחות אמין, כמו למשל כתיבה שמכילה שגיאות, טענות מוגזמות או תיאוריות קונספירציה.

חשוב לזכור שאמנם המודל מיומן לשחזר מידע מדויק, אך הוא גם עלול לספק תשובות שאינן לגמרי נכונות, ולכן תמיד כדאי לבדוק את המידע במקורות מהימנים, במיוחד כשמדובר על מידע רגיש או חשוב.

מקור וקרדיט

תוצאות שגויות או מוטות: צ'אטבוטים של בינה מלאכותית עלולים לגרום לשימוש מכוון או לא מכוון או להפצת מידע שקרי או מוטה העלול להטעות משתמשים. מכיוון שצ'אטבוטים של AI מסתמכים על מאגר עצום של נתונים זמין באינטרנט, יש סיכוי גבוה שהנתונים האלה מיושנים, לא מדויקים או לא רלוונטיים.

צ'אטבוטים, בין אם הם משמשים לשירות מידע, אחזור מידע או סתם שיחה סתמית, מסתמכים במידה רבה על הנתונים שהם מאומנים עליהם. הנתונים כוללים טקסט, קול וקלט חזותי, כמו גם אינטראקציות עם משתמשים אנושיים. ככל שיש יותר נתונים ב-A.I. לצ'אטבוט יש גישה, כך הוא יכול להבין טוב יותר ולהגיב לשאילתות וצרכים אנושיים. תהליך למידה מונע נתונים זה, הנקרא למידת מכונה, מהווה את עמוד השדרה של הצ'אטבוטים מבוססי A.I

בעיית מִצּוּי נתונים

אחד הסיכונים המובנים של A.I. השימוש בצ'אטבוט הוא מִצּוּי נתונים. כאשר צ'אטבוטים מקיימים אינטראקציה עם משתמשים, הם צורכים נתונים משיחות, מיילים והודעות טקסט. ככל שצ'אטבוט הופך פופולרי ומתקדם יותר, כך הוא צריך יותר נתונים כדי להמשיך ללמוד ביעילות. לרוע המזל, A.I. צ'אטבוטים לא רק צורכים נתונים; הם גם תורמים לדלדול/ מִצּוּי מקורות הנתונים שלהם.

מקור

אי-נגישות למאגרי מידע אקדמאיים בתשלום

הצ'אטבוטים מבוססי AI אינו יכולים לכסות מאגרי מידע בתשלום כגון Academic Search Complete של EBSCO ובוודאי לא להגיע לטקסטים המלאים של המאמרים .

Current Limitations

Chatbots do not possess actual knowledge or understanding
Training data may not be up to date
Information may reflect biases, misinformation, or subjective viewpoints
Users will need to evaluate the response, and cross-reference information with reliable sources

מקור

Evaluating Information: Artificial Intelligence (AI) Chatbots

ראו גם :

Evaluating Information from Generative AI

The same principles for evaluating information sources apply to generative AI. Tests such as the SIFT and RADAR tests can be helpful in determining if the information you’ve found is reliable.

However, some of the questions we typically ask ourselves about sources may be more difficult to answer when consulting generative AI, because the process it takes to arrive at answers is not public.

So how can you assess the information generative AI gives you?

Compare:

Look for other reliable sources to corroborate the AI’s claims. Try to find alternative sources that cover the same topic, or even the original context that a claim came from (these are principles F and T of the SIFT test).

Check citations for hallucinations:

You can ask a generative AI tool to cite its sources, but it is known to create very convincing fake citations.

It can even create citations that have the names of real researchers who study the topic you've asked about. However, the article named in the citation might not exist or may not be from the journal it cites. These invented citations are referred to as “hallucinations.”

You’ll need to search to confirm these articles actually exist. For information on finding sources from their citations, see:

Confirm:

Look up the source article and check the information the generative AI tool claims to have found in it. AI is not built specifically to cite truthfully and accurately, so it may name an article that does not actually contain the information.

Check currency:

Currency (when a document was created, edited, updated, or revised) is an important factor in evaluating any information source. If you need recent information on a world event or a new development in research, generative AI may not have that information in its dataset. As of October 2023, if you ask ChatGPT (GPT-3.5) how recent the data it’s trained on is, it will tell you that its information comes from 2021 and it does not have the ability to pull current information from the internet.

The Curse of Recursion

As more text is published that has been created by generative AI, eventually this AI-generated content will enter the training datasets for new generations of AI. This may lead to a decrease in the quality of the data, as errors in early generations of AI may compound themselves over time.

This idea was proposed and tested by Shumailov et al. (2023) in their paper “The Curse of Recursion: Training on Generated Data Makes Models Forget.” They found that the inclusion of AI-generated content in training datasets led to what they call model collapse - "a degenerative process whereby, over time, models forget the true underlying data distribution, even in the absence of a shift in the distribution over time" (p. 2).

Further reading:

Shumailov, I., Shumaylov, Z., Zhao, Y., Gal, Y., Papernot, N., & Anderson, R. (2023). The Curse of Recursion: Training on Generated Data Makes Models Forget. ArXiv, bs/2305.17493.

מקור

ראו גם:

Artificial Hallucinations in ChatGPT: Implications in Scientific Writing

by Alkaissi, H., & McFarlane, S. I. (2023). in Cureus, 15(2), e35179

 AI Hallucination: A Misnomer worth clarifying

Maleki, N., Padmanabhan, B., & Dutta, K. (2024). In arXiv preprint, arXiv:2401.06796.

ההשלכות מבחינת המידענות הרפואית

What is the impact of artificial intelligence-based chatbots on infodemic management?

למידה וחינוך

ד"ר חני שלטון

מחווני הערכה בשילוב בינה מלאכותית

קישור

קישור למצגת

כיווני הפיתוח האקדמיים , יוני 2024

אוניברסיטת קיימברידג' , אנגליה

Researchers have developed a platform for the interactive evaluation of AI-

לתיאור הפתרון החדשני

יום חמישי, 22 באוגוסט 2024

מנקודת מבטו של מידען : חיפוש בצ'אטבוטים של AI : השוואה , אוגוסט 2024

כחייל מילואים ששירת במילואים בגדוד קרבי (הרבה שנים ולא מעט חודשים) במלחמת יום הכיפורים ומלחמת לבנון הראשונה רציתי לבדוק האם הצ'אטבוטים מבוססי AI יכולים לסייע לי לתחקיר שאני עורך בנושא הבא : כמה ישראלים באמת משרתים בצבא המילואים מתוך האוכלוסייה ?

כנגד הצ'אטבוטים של AI בדקתי גם 2 מנועי חיפוש מבוססי AI וגם חיפוש מתקדם שערכתי בעצמי בגוגל

הצ'אטבוטים מבוססי AI שנבדקו :

Claude 3.5 Sonnet (גרסת PRO במינוי חודשי)

Gemini 1.5 Flash

ChatGPT

מנועי חיפוש מבוססי AI

Perplexity PRO

https://you.com

גרסת החיפוש במנוע החיפוש של גוגל ,

גרסת Advanced (קיימת משנת 2010)

המנצחים במבחן הדרכים

המנצח מבין הצ'טבוטים הוא ChatGPT של חברת OpenAI

ChatGPT

כמה ישראלים באמת משרתים בצבא המילואים מתוך האוכלוסייה ?

ChatGPT said:

נכון לשנת 2023, ההערכה היא שכ-450,000 אנשים רשומים במאגר המילואים של צה"ל, אבל לא כולם משרתים בפועל. כ-120,000-140,000 איש פעילים ומשרתים במילואים באופן קבוע בשנה. זה מייצג כ-1.5% עד 2% מאוכלוסיית ישראל, שהיא כ-9.7 מיליון איש.

כמות המילואימניקים הפעילים תלויה בגורמים כמו גיל, מצב בריאותי, סוג היחידה שבה שירתו בשירות החובה, ושינויים במדיניות הצבא לאורך השנים.

לקחים 1 : התאכזבתי מחוסר הדיוק בגרסת Claude 3.5 Sonnet שעליה אני משלם 20$ בחודש ועכשיו המינוי יעבור ל ChatGPT

הנה תשובת Claude 3.5 Sonne :

תבדוק בבקשה עוד מקורות מידע בנושא ?

בשמחה אבדוק עבורך מקורות מידע נוספים בנושא שיעור המשרתים במילואים בישראל. עם זאת, חשוב שאבהיר שאין לי גישה למאגרי מידע או יכולת לבצע חיפוש אינטרנטי בזמן אמת. אני מסתמך על המידע שהיה זמין בעת העדכון האחרון של מאגר הידע שלי.

מהמידע הקיים אצלי, אוכל להוסיף את הנקודות הבאות: לפי דו"ח של מרכז המחקר והמידע של הכנסת משנת 2019, מספר המשרתים במילואים עמד על כ-470,000 איש.

1. נתון זה מהווה כ-5.5% מכלל האוכלוסייה בישראל באותה שנה (כ-8.5 מיליון תושבים).

2. חשוב לציין שישנה הבחנה בין "משרתי מילואים פעילים" לבין כלל אנשי המילואים. משרתים פעילים הם אלו שביצעו שירות מילואים בפועל בשנה האחרונה.

3. מספר המשרתים הפעילים נמוך יותר ועמד על כ-265,000 איש בשנת 2018, לפי אותו דו"ח.

4. יש לקחת בחשבון שמאז 2019 ייתכנו שינויים משמעותיים במספרים אלה, במיוחד לאור אירועים ביטחוניים ושינויים במדיניות גיוס המילואים.

מכיוון שנתונים אלה עשויים להשתנות, אני ממליץ לפנות למקורות רשמיים כמו צה"ל, משרד הביטחון או הלשכה המרכזית לסטטיסטיקה לקבלת הנתונים העדכניים ביותר.

המנצח מבין מנועי החיפוש מבוססי AI הוא Perplexity PRO

Perplexity search results

אחוז המשרתים במילואים בישראל משתנה בהתאם להגדרות שונות של שירות מילואים פעיל. על פי הנתונים הקיימים, כ-6% מאוכלוסיית המדינה רשומים במערך המילואים, אך רק כ-1.5% מהאוכלוסייה הם אנשי מילואים פעילים, המשרתים יותר מ-20 ימים בשלוש השנים האחרונות...

שכבת הגיל המגוייסת ביותר היא כמובן הצעירה ביותר: כ-50% הם בשנות ה-20 לחייהם. בקרב בני 50 עד 59 מדובר על 5% ובני 60 עד 69 - כאחוז. יש לציין שגיל הפטור עומד על 40 למי שאינם קצינים ו-45 לקצינים

מקור המידע אותו הציע Perplexity ( קישור)

התוצאות שהניב מנוע החיפוש you.com (קישור)

מה גיליתי בעצמי בעזרת גרסת מנוע החיפוש המורכב של גוגל?

רקע על מנוע החיפוש המורכב של גוגל (קיים כבר משנת 2010 )

כשאנו מדברים על חיפוש מורכב בגוגל , הכוונה היא לאותו מנגנון של חיפוש טבלאי המאפשר לנו להציב בו-זמנית כמה וכמה מאפיינים בחיפוש במנוע החיפוש של גוגל.

המנגנון הטבלאי של גוגל , מקל עלינו מאד ביצירת שאילתת חיפוש מורכבת , כלומר בקשת חיפוש שיש בה כמה וכמה מאפיינים שונים ,

בטבלת החיפוש ( מנגנון החיפוש הטבלאי של גוגל) מציבים את המאפיינים השונים של בקשת החיפוש האחרונה , כאשר הטבלה יוצרת , למעשה, חיתוך בין המאפיינים שהצבנו וכך נוצרת מסננת יעילה.

תוצאות הסינון ( שיצר מנגנון החיפוש הטבלאי) מתבטאות ברשימת מאמרים/ידיעות בעלי רלבנטיות גבוהה יחסית העונים על בקשת החיפוש המקורית שלנו . כך, למעשה, אנו מצמצים את סט החיפוש בהתאום למאפיינים שהצבנו בשאילתא המורכבת.

קישור

התוצאות במנוע החיפוש המורכב של גוגל

כמה אחוז משרתים במילואים בישראל ?

 אחוז נמוך יחסית: בהשוואה למדינות אחרות בעלות צבא מילואים משמעותי, אחוז המשרתים במילואים בישראל הוא נמוך יחסית.

 ירידה במספרים: בשנים האחרונות ישנה מגמה של ירידה במספר המשרתים במילואים.

בפועל כ-6% בלבד מאוכלוסיית המדינה רשומים במערך המילואים, ורק כ-1.5% מהאוכלוסייה הם אנשי מילואים פעילים, המשרתים למעלה מעשרים ימים בכל שלוש שנים

כאן מדובר לפי הנתונים שהוצגו ב־64 אלף איש בלבד, שמהווים 2.2% מן האוכלוסייה הרלוונטית

על פי הנתונים הרשמיים של צה"ל, שהוצגו ב־2022, מספר "משרתי המילואים הפעילים" עמד על כ־120 אלף איש, שמהווים כ־4% מקבוצת הגיל הרלוונטית, וכאחוז אחד בלבד מאוכלוסיית המדינה.

תחקיר: אביה שקלאר־חמו

מקור

רציתי גם לערוך השוואה של אחוז אנשי המילואים ביחס לאוכלוסייה בישראל במלחמת יום הכיפורים ובמלחמת לבנון הראשונה , לא מצאתי באינטרנט וגם לא בספריות שבהם ביקרתי נתונים על כך , אך ממקור ששירת אז במטכ"ל הבנתי שמדובר בסדרי גודל של 8-10 אחוז מתוך האוכלוסייה דאז בישראל .. כיום, נכון לאוגוסט 2024, מדובר על פחות מ2% !!

מסקנות

מבחינת העבודה המידענית וגם מהבחינה העבודה המחקרית לא ניתן להסתמך רק על צ'אטבוטים של AI ועדיף לעשות שימוש במנוע חיפוש מבוסס AI כגון Perplexity PRO עם חיפוש משלים במנוע החיפוש המורכב של גוגל .

חפש בבלוג זה

יום שלישי, 24 בספטמבר 2024

על יכולות ההערכה של מקורות מידע ע"י צ'אטבוטים מבוססי AI כגון CHATGPT

יום חמישי, 22 באוגוסט 2024

מנקודת מבטו של מידען : חיפוש בצ'אטבוטים של AI : השוואה , אוגוסט 2024

עם איזה כלי בינה מלאכותית נכון לעבוד?

חפש בבלוג זה

חפש בבלוג זה