חפש בבלוג זה

יום שני, 31 במרץ 2025

התנסות עם מודל הבינה המלאכותית החדש של גוגל Gemini 2.5 : כמה מסקנות

 


התנסות עם Gemini 2.5 Pro Experimental

רקע 

ג'מיני 2.5 של גוגל הוא מודל היסקי, שמסוגל לשקול את תשובתו, לבחון את דרך המחשבה שלו בשלבים, להשתמש בשיקולים לוגיים, הקשרים ודקויות, ולהציג תוצאות משופרות ומדויקות יותר. הוא יודע להתמודד עם קלט רב-מודאלי מטקסט, אודיו, תמונות, סרטונים ומערכי נתונים גדולים,

המדען הראשי של Google DeepMind הסביר בבלוג החברה כי "בתחום הבינה המלאכותית, היכולת של מערכת ל'חשיבה' מתייחסת ליותר מסתם סיווג וחיזוי. היא מתייחסת ליכולת שלה לנתח מידע, להסיק מסקנות לוגיות, לשלב הקשר וניואנסים ולקבל החלטות מושכלות".

לפי החברה, אחד היתרונות המשמעותיים של Gemini 2.5 Pro הוא יכולת עיבוד המידע הנרחבת שלו. המודל מגיע עם יכולת לעבד מיליון "טוקנים"  (יחידות מידע בסיסיות שמודל ה-AI מעבד בבת אחת) המאפשר לו לקלוט בערך 750 אלף מילים - אורך גדול יותר מסדרת הספרים המלאה של "שר הטבעות". גוגל הודיעה כי בקרוב Gemini   2.5 Pro יתמוך באורך קלט כפול (שני מיליון טוקנים).

ההתנסות והמסקנות


האתגר :

 חוקר ישראלי , מומחה  מוביל באחד מתחומי הרפואה , פנה אלי לאחרונה בבקשה לסייע לו להקים פורטל תוכן בינלאומי בתחום ההתמחות שלו . 

הוא ראה בעולם מודלים של פורטלים משוכללים בתחומי מדע אחרים וביקש לבנות משהו דומה אבל בתקציב הרבה יותר נמוך . 

לצורך כך, כתבתי שאילתא במודל של Gemini 2.5 Pro וביקשתי למצוא תבניות וורדפרס המסוגלות לאפשר הקמת פורטל תוכן מקצועי ומתקדם באנגלית על בסיס האיפיונים של אותם פורטלים הבינלאומיים שניתנו למודל Gemini 2.5 Pro כדוגמא . 

לאחר תהליך היסק שיטתי , המודל של Gemini 2.5 Pro ניתח היטב את המאפיינים והמליץ לי על כמה תבניות וורדפרס בינלאומיות שנותנות מענה מלא בדומה לאותם פורטלים בינלאומיים שעלו סכומי עתק . 

הפתרון שהוצע היה , כאמור הרבה יותר זול ולכן גם יותר מעשי . 

על סמך ההמלצות , פניתי למפתח אתרים ישראלי עם ההמלצות של Gemini 2.5 Pro ובכך הוזלתי את כל תהליך הפיתוח בצורה מאד משמעותית. 



יום ראשון, 23 במרץ 2025

מחקר חדש מוכיח כי עדיין לא ניתן לוותר על חיפוש במאגרי מידע

 


בעוד שמנועי חיפוש מסורתיים פועלים בדרך כלל כתווך ישיר לאיחזור מידע של תוכן  מקצועי ואיכותי אחר,  כלי חיפוש גנרטיביים  מבוססי  בינה מלאכותית מנתחים ואורזים מחדש מידע בעצמם, ומנתקים , מבחינת המשתמש , את זרימת התנועה  והקשר הישיר למקורות מידע מקוריים. תפוקות השיחה של צ'אטבוטים  מבוססי בינה מלאכותית אלה מטשטשות לעתים קרובות בעיות בסיסיות רציניות עם איכות המידע.

יש צורך כיום להעריך כיצד מערכות בינה מלאכותית  ניגשות, מציגות ומצטטות תוכן מקצועי וחדשותי.

ב-במרץ 2025 , קלאודיה יאז'ווינסקה ואייסוואריה צ'נדרסקאר, חוקרים במרכז לעיתונות דיגיטלית באוניברסיטת קולומביה,  חקרו את דיוק הציטטים של צ'אטבוטים מבוססי AI  עבור המחקר שלהם "חיפוש AI ודיוק ציטוטים", הם ערכו 200 בדיקות בשמונה מנועי חיפוש שונים  מבוססי בינה מלאכותית AI: ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search ו-Copilot.

כל שאילתת בדיקה סיפקה ציטוט ממאמר, ולאחר מכן הניעה את הצ'אטבוט להגיב עם כותרת המאמר, תאריך הפרסום, שם הפרסום וכתובת URL.

מתוך 1600 שאילתות הבדיקה, הצ'אטבוטים מבוססי AI לא הצליחו לאחזר את המידע הנכון ביותר מ-60% מהמקרים.

AI Search Has A Citation Problem

We Compared Eight AI Search Engines. They’re All Bad at Citing News.

Columbia Journalism Review

March 2025

מקור המידע ( קישור)

 

יום שלישי, 18 במרץ 2025

רשימת הסקירות שפורסמו בשנה האחרונה באתר ספריות דיגיטליות – מרכז הידע

 


אם אתם מידענים או חוקרים באקדמיה אז הרשימה הזו תועיל לכם מאד ! כי המידע במאגרים אלו אינו מכוסה ע"י הבינה המלאכותית כגון CHATGPT ודומיו

 התרחבות הספרייה הדיגיטלית JSTOR

https://tinyurl.com/nhazr9mp

חיפוש מתקדם באתר העיתונות ההיסטורית של הספרייה הלאומית

https://tinyurl.com/2v3ay5vu

רשת המחקר למדעי החברה (SSRN) הוא מאגר אינטרנט של מחקרים אקדמיים במדעי החברה

https://tinyurl.com/jabb2e4u

מאגר Ebook Central ממשיך להתרחב

https://tinyurl.com/5bvd8y58

שדרוג הספרייה הדיגיטלית Hathitrust

https://tinyurl.com/3wrf6zyu

הרב-מנוע של Creative Commons השתפר מאד

https://tinyurl.com/4h6c9uk4

מאגר CORE  : האוסף הגדול בעולם של מחקרים בגישה פתוחה (כל הנושאים)

https://tinyurl.com/449m9u8w


 כתובת האתר ספריות דיגיטליות – מרכז הידע

https://www.digital-library-guide.com/knowledge-center




יום שלישי, 11 במרץ 2025

מחקר השוואתי של מנגנוני Deep Research בכלי הבינה המלאכותית

 



 מאת: שרון גונן

מה גיליתי כשביקשתי מ-3 מודלי שפה של AI לעשות Deep   Research, לנתח ולסכם את אותו נושא?

אודות הכותבת:

שרון גונן עוסקת בטרנספורמציה דיגיטלית ויצירת ערך בחברות באמצעות בינה מלאכותית.

מיישמת כלי בינה מלאכותית מותאמים לצרכי הארגון ומטרותיו, מובילה פרויקטים מאסטרטגיה ועד ביצוע ומייצרת ערך עסקי ומענה לאתגרים, באמצעות פתרונות טכנולוגיים, נוחים ליישום והטמעה מהירה.

תקציר

איך בוחרים מודל שפה למחקרי עומק ומעריכים את התוצאות שהוא מספק? ביקשתי משלושה מודלי בינה מלאכותית (Perplexity Pro Deep Research, GPT-4 Deep Research ו-Grok-3) לסכם ולנתח את הנושא: "דיפ סטייט בישראל". בעזרת Claude (Anthropic) יצרתי ניתוח השוואתי מקיף שחושף הטיות סמויות.

התוצאות? מפתיעות ומלמדות.

כל מודל הציג את הנושא באופן שונה. מה שהפתיע אותי במיוחד, הוא כיצד כל מודל "דוחף" את הקורא לכיוון חשיבה מסוים - לעתים באופן סמוי ותחת מעטה של אובייקטיביות.

ההשוואה מתמקדת באספקטים שונים של הסיכומים, כגון מבנה, תוכן, סגנון, נקודת מבט ושימוש במקורות.

Perplexity מספק מודל תיאורטי מובנה ונתונים כמותיים מרשימים

GPT מצטיין בעושר הדוגמאות, באיזון וברוחב היריעה ההיסטורית

Grok מצטיין בהצגת מורכבות הנושא ובפתיחות לפרשנויות שונות

 למאמר המעמיק של שרון גונן ( קישור)

חלק שני

מה גיליתי כשביקשתי גם מ-Gemini 2.0 DeepResearch, לנתח ולסכם את אותו נושא שנתתי ל-Perplexity Pro Deep Research, GPT-4 Deep Research ו-Grok-3?

בעוד GPT-4 בלט בעושר דוגמאות ספציפיות וציטוטים, ו-Perplexity בלט בנתונים כמותיים, סיכום Gemini נשאר ברמה כללית יותר.

איכות המקורות נמוכה יחסית לכל הסיכומים האחרים, עם הסתמכות יתר על ויקיפדיה. מספר המקורות (23) גבוה מ-GPT-4 ו-Grok אך נמוך מ-Perplexity (63).

למאמר  השני של שרון גונן ( קישור2)







יום ראשון, 9 במרץ 2025

מבוא לעולם סוכני AI, גרסה מס' 2

 


גרסה מס' 2 , תאריך העדכון : 11 לאפריל 2025 , נוספו דוגמאות של סוכני AI חדשניים שפותחו ממש לאחרונה

תוכן העניינים 

ההבדלים בין צ'אטבוטים של AI  לבין סוכני AI 

דוגמא של סוכן AI 

ההבדל בין סוכני AI לבוט AI רגיל

Genspark משיקה סופר אייג’נט אוטונומי

פיתוח סוכני הAI של גוגל לארגונים

סרטוני וידאו להדרכה ( בעברית)  ע"י מיטב המדריכים בארץ 


בעוד GenAI היא בינה מלאכותית שעונה על השאלות שלנו או יוצרת טקסטים ותמונות לפי הנחייתנו, לסוכן AI יש משימה שלשמה הוא נוצר: הוא זה ששואל אותנו לפרטים המדויקים ואז מבצע את המשימה עד תום. זו יכולה להיות משימה קטנה כמו הפקת דו"ח על מנייה, או משימה מסובכת כמו הזמנת חופשה בחו"ל כולל כרטיסי טיסה, מלונות, הופעות וארוחות ערב. אלו יכולים להיות גם דברים הרבה יותר שאפתניים.

יש עוד הבדל משמעותי: הצ'אטבוטים מעידן ה-GenAI נבנים על ידי ענקיות ה-AI, וניתן למנות את אלה על אצבעות יד אחת או שתיים. לעומת זה, כולם רוצים לפתח סוכני AI: מחברות ענק, דרך סטארטאפים בני יומם, מפתחי קוד מקצועיים ועד למשתמשי פלטפורמות לפיתוח סוכני AI (טל שחף, פברואר 2025 , קישור)

סוכני AI בנויים מסביב למודל שפה גדול (LLM) כמו אבותיהם הצ'אטבוטים. זה מקנה להם יכולת לתקשר עם בני אדם וגם לשפר ביצועים ולהשיג את המטרה טוב יותר בכל פעם. 

לכל סוכן AI יש מומחיות שמאפשרת לו לבצע משימה, כאשר יש סוכני-על שמסוגלים לבצע משימות מורכבות על ידי הפעלת סוכנים זוטרים. יש סוכנים שיכולים לתקשר עם סוכנים אחרים, למשל כדי לקבוע פגישות עבור הבוסים שלהם, וזו רק ההתחלה ( טל שחף, פברואר 2025 , קישור)

 אסף אלוביק AI Director בחברת מאנדיי אומר: "הסיבה שסוכני  AI מעניינים ומרתקים היא שאנחנו רואים שיש להם כבר יכולות לבצע משימות ברמה אנושית מאוד גבוהה - מכתיבת מסמכים ועד עיבוד מידע בצורה אוטונומית והסקת מסקנות, משימות מקצה לקצה".

 

דוגמא של סוכן AI  

   הסוכן החדש ליצירת מצגות – פיתוח של אסף בנדור.

הכנת מצגות יכולה להיות משימה מתישה, במיוחד כשקשה לנסח תוכן ברור וקולע. הסוכן החדש שפותח על ידי אסף בנדור מציע פתרון פשוט: הזינו נושא, כותרת או מספר מילים, והסוכן ייצור עבורכם טקסט לשקופית – ברור, מדויק וללא בזבוז זמן. Asaf Bendor 🎗 אסף בנדור



 

דוגמה מעשית: סוכן AI במרכז שירות לקוחות

כדי להמחיש את פעולתו של סוכן AI, נבחן דוגמה של סוכן במרכז שירות לקוחות:

1.   קבלת פנייה: הסוכן מקבל שאילתה מלקוח.

2.   איסוף מידע: הוא שואל שאלות רלוונטיות כדי להבין את הבעיה לעומק.

3.   חיפוש פתרון: הסוכן מחפש מידע במאגרי הנתונים של החברה.

4.   קבלת החלטה: בהתבסס על המידע שנאסף, הסוכן מחליט אם הוא יכול לפתור את הבעיה או שיש להעביר אותה לנציג אנושי.

5.   מתן מענה: הסוכן מספק פתרון ללקוח או מעביר את הפנייה לטיפול אנושי.

6.   למידה: הסוכן לומד מהאינטראקציה כדי לשפר את ביצועיו בעתיד.

ההבדל בין סוכני AI לבוט AI רגיל

בעוד שמערכות AI רגילות פועלות על פי כללים קבועים מראש, כך למשל צ'אט בוט AI עונה לשאלות המשתמש עם תשובות מוכנות מראש, סוכני AI מתאפיינים ב:

  • גמישות: יכולת להתמודד עם מצבים לא צפויים.
  • יוזמה: נקיטת פעולות פרואקטיביות להשגת מטרות.
  • הבנת הקשר: יכולת לפרש מצבים מורכבים ולהגיב בהתאם.

סוכני AI מייצגים צעד משמעותי קדימה בתחום הבינה המלאכותית, מאפשרים אוטומציה מתקדמת של משימות מורכבות ומציעים פוטנציאל עצום לשיפור תהליכים בתחומים רבים.

 מקור המידע

  

Genspark משיקה סופר אייג’נט אוטונומי

השקת “סופר אייג’נט” (Super Agent) מבית ג’נספארק (Genspark). חברת הטכנולוגיה מקליפורניה חוללה מהפכה של ממש בעולם הבינה המלאכותית עם פיתוח סוכן אוטונומי שמציב רף חדש לגמרי בתחום, ומסמן את תחילתו של עידן חדש ביחסים בין בני אדם לטכנולוגיה.

מערכת ייחודית

סופר אייג’נט הוא שילוב מתקדם של מודלים וכלים. הסוד מאחורי העוצמה שלו טמון בארכיטקטורה הייחודית שלו, המכונה “Mixture-of-Agents”. זוהי מערכת חדשנית המשלבת שמונה מודלי שפה גדולים (LLMs) בגדלים שונים, למעלה מ-80 ערכות כלים ייעודיות, ויותר מ-10 מאגרי נתונים קנייניים שפותחו במיוחד עבורו. שילוב מתוחכם זה מאפשר לסוכן לבחור בחוכמה את המודל והכלים המתאימים ביותר לכל משימה ספציפית – מודלים קטנים וזריזים למשימות פשוטות, ומודלים גדולים ועוצמתיים למשימות מורכבות. הגישה המהפכנית הזו מאפשרת לסופר אייג’נט להציג ביצועים מרשימים במגוון רחב של תחומים תוך שמירה על יעילות ודיוק יוצאי דופן.

יישומים בעולם האמיתי 

סופר אייג’נט של ג’נספארק אינו רק הדגמה טכנולוגית מרשימה, אלא כלי פרקטי שמשנה את האופן שבו אנחנו מתמודדים עם משימות יומיומיות:

שיחות טלפון אוטונומיות

הסוכן מסוגל לבצע שיחות טלפון אמיתיות בקול אנושי טבעי, תוך הבנת הקשר השיחה והתמודדות עם תרחישים לא צפויים. הוא יכול להזמין מקומות במסעדות, לתאם פגישות, ולהתמודד עם בקשות מיוחדות.

תכנון מסלולים מורכבים

המערכת מתכננת מסלולי טיול שלמים תוך שקלול מרחקים, אפשרויות תחבורה ציבורית, שעות פתיחה, והעדפות אישיות. היא משלבת מידע ממקורות שונים ליצירת תוכנית קוהרנטית ומעשית.

יצירת תוכן מולטימדיה

סופר אייג’נט יוצר סרטוני הדרכה שלמים, כולל הנחיות קוליות, קטעי וידאו, ושכבות אודיו. יכולת מרשימה במיוחד היא הפקת פרקים מונפשים המבוססים על אירועים אקטואליים.

אינטגרציה דינמית של מידע

הסוכן מפיק “Sparkpages” – דפי מידע דינמיים המאחדים נתונים ממקורות מגוונים לכדי דוח מובנה ונוח לקריאה, עם אפשרות להרחיב נושאים לתובנות מעמיקות יותר.

למאמר המלא של רון גולד

https://letsai.co.il/genspark-super-agent/

פיתוח סוכני הAI של גוגל לארגונים 

Agentspace  של גוגל מחבר את אפליקציות העבודה שלך לחיפוש מולטי-מודאלי תוך ניצול  כוחם של סוכני AI בארגון . 

ניתן למצוא במהירות מידע  בכל שכבות המידע של החברה/עסק , כאשר סוכני הAI  יודעים לסכם ולסנתז בין מקורות, ולנקוט פעולה עם סוכנים  מותאמים אישית - הכול עם אבטחה, פרטיות ותאימות ברמה ארגונית.

למידע נוסף 

גוגל לקחה את רעיון סוכן ה-AI כעובד חברה, והפכה אותו לממשי הרבה יותר. היא הציגה "מערכת אקולוגית מרובת סוכנים" – פלטפורמה שלמה שבה סוכני AI עובדים זה עם זה, מעבירים מידע ביניהם, ומתקבצים לצוותים כדי לטפל במשימות מורכבות. "2025 תהיה השנה בה הבינה המלאכותית היוצרת תעבור ממתן תשובות לשאלות בודדות - לפתרון בעיות מורכבות באמצעות מערכות סוכנים", אמר אמין ואהדת, סגן נשיא גוגל למחשוב ענן ו-ML.

ובגוגל מדגישים כי זה כבר קורה - כך למשל מערכת ההזמנות לרכבים (drive-through) של רשת המזון המהיר "וונדי'ז" (Wendy's) נעשית באמצעות סוכני AI שמטפלים ב-60,000 הזמנות מדי יום וברשת Home Depot מופעל סוכן בשם Magic Apron שמציע הדרכה לשיפוצים ותיקונים בבית.


עד שנת 2028 כשליש מהאפליקציות הארגוניות (33%) יכילו מרכיבים של בינה מלאכותית "סוכנית" (Agentic AI). גם חברת המחקר IDC פרסמה לאחרונה סקר שביצעה בקרב מובילים טכנולוגיים בארגונים, שמצא כי 84% מהם מגדיר שימוש ארגוני ב-AI, המתבסס לרוב על Agentic AI, כהשקעה מרכזית בטכנולוגיה ארגונית.

ראו גם :

סוכני AI: מה זה? איך זה עובד? ו-3 כלים מומלצים ליצירת סוכן AI

 ראו גם :

קלוד פרוג'קטס (Claude Projects) - כלי פשוט ועוצמתי ליצירת סוכני AI יעילים | דיגימייט



https://www.youtube.com/watch?v=8mWR1r28ia4

 ראו גם:

איך ליצור סוכן בינה מלאכותית משלך תוך דקות


https://www.youtube.com/watch?v=iKRDa-I_CFo

 


 מדריך מקיף לג'נספרק: הכלי המתקדם ביותר לבינה מלאכותית ב-2025 Genspark AI


מבחן דרכים : NotebookLM של גוגל מול Perplexity Pages

  בשבוע האחרון עבדתי במשימות איסוף מידע והבניית ידע עם שני כלים דיגיטליים מבוססי AI :  1. NotebookLM של גוגל  2. perplexity.ai – המנגנון...