חפש בבלוג זה

יום שני, 25 באוקטובר 2021

מדוע חברות בינלאומיות מוכנות לשלם יותר מ40 מיליארד דולר על פינטרסט ?

 



הסיבה הראשונה לבחירה של פייפאל בפינטרסט קשורה לכך שמדובר ברשת חברתית שנחשבת אולי קטנה ביחס לפייסבוק, אינסטגרם וטיק טוק, אבל עדיין יש לה 400 מיליון משתמשים פעילים בחודש.

פינטרסט (Pinterest) היא רשת חברתית ויזואלית המשמשת כמנוע חיפוש המבוסס על תמונות. אותן תמונות שהמשתמשים מעלים נקראות סיכות (Pins) שניתן ללכד אותן ללוחות (Boards) המרכזות את תמונות לפי נושאים משותפים.

פינטרסט היא בעצם הכלאה בין מנוע חיפוש תמונות לאתר מדיה חברתית (אפשר לחשוב קצת שזה שילוב בין גוגל לאינסטגרם). משתמשים מעלים ומשתפים תמונות וסרטונים באופן מקוון, ההבדל בין פינטרסט לאינסטגרם הוא שהדגש בפינטרסט הוא על התוכן (התמונות והסרטונים) לעומת אינסטגרם המתרכזת יותר במשתמשים עצמם.

פינטרסט מאפשרת ליצור ולהבנות בקלות תהליך של איסוף, מיון ושיוך פריטי מידע על פי קטגוריות.

פינטרסט מאפשרת לאתרים שיש בהם הרבה תוכן, לסדר את התוכן הזה על פי קטגוריות באמצעות הלוחות של פינטרסט; וכך, לאפשר לקוראים לגשת ישירות לקטגוריה המועדפת עליהם במקום לחפש אותה באתר. כמובן שברוב אתרי התוכן יש תפריט שמאפשר לעשות זאת – אך פינטרסט מרחיבה את מספר הקטגוריות האפשריות למספר אינסופי, ומאפשרת ליצור אותן באופן אינטואיטיבי ויצירתי יותר.

 

 

מנוע גילוי חזותי Visual discovery engine

 

למרות שפינטרסט מסווגת כאתר מדיה חברתית, החברה לא רואה את עצמה כך. במקום זאת, פינטרסט מגדירה את עצמה בצדק  כ"מנוע גילוי חזותי "  “visual discovery engine”   שבו משתמשים יכולים למצוא תמונות בכל ההקשרים האפשריים וגם רעיונות חזותיים מעוררי השראה בכל נושא אפשרי .

 

בפינטרסט יש 80 מיליארד פריטי מידע , אשר נבחרו וסווגו לקטגוריות של לוחות מידע ע"י אנשים הנוטלים חלק ברשת החברתית של פינטרסט . במידה מסויימת ניתן לתאר תופעה זו כחכמת ההמונים . שום אלגוריתם של גוגל אינו יודע לסווג ביעילות מאות מיליוני פריטי מידע לקטגוריות ברורות וגם ויזואליות .

 

מנוע החיפוש של פינטרסט מסוג Guided Search מבוסס על חיפוש הקשרי ולא בהכרח רק על תשובות בעלות רלבנטיות גבוהה. פינטרס מציג רעיונות בהקשרים שונים סביב החיפוש ובכל מעשיר את תהליך החשיבה של מבצע החיפוש. החיפוש המודרך Guided Search’ מציע רעיונות שונות ומעניינים סביב הנושא .  אנו מקבלים בתוצאות החיפוש מגוון  מסתעף של related terms היוצרים אצלנו סיעור מוחין תוך כדי החיפוש .

 

כך לדוגמא, כל פעם שאני גולש באתר פינטרסט, המערכת מציעה לי פריטי מידע ויזואליים מעניינים  ( מתוך אוספי פינטרסט העצומים ) שמתאימים לתחום העניין שלי ולאוספי המידע ( הלוחות ) שאני אוצר.



ההצלחה של מנוע הגילוי החזותי של פינטרסט  נובעת מהפעלה מושכלת ומתוחכמת של מערכות המלצה מתוקשבות הפועלות כל הזמן בתוך האתר ומסתייעות באלגוריתם חכם.

מערכות המלצה מציעות למשתמש תמונות שעשויות לעניין אותו, בהתבסס על מידע שהמערכת אספה על המשתמש ועל הפריטים המתאימים  לו.

 

אני משתמש בפינטרסט כבר מיום הקמתה בשנת 2010 , והיו גם תקופות שהייתי יועץ מידעני שלהם .

 

הנה קישור ללוחות הפינטרסט שלי  ( 2 מיליון משתמשים לחודש !!)

 



יום רביעי, 20 באוקטובר 2021

מנוע החיפוש FamilySearch : כמה שיפורים

 


מנוע החיפוש   FamilySearch הגדיל משמעותית את היקף הרשומות שלו (קרוב ל500 מיליון רשומות אודות קרובי משפחה ובני משפחה) וגם פיתח יכולות גילוי משופרות לאיתור בני משפחה וקרובי משפחה בכל העולם . ממצאי החיפוש מוצגים עם קשרים בין המשפחות .וזיכרונות שלהם אם נמצאו.    

 דבר הנסיין : הרצתי כמה חיפושים/שאילתות לאחרונה ואיתרתי לא מעט מידע שלא ידעתי אודות קרובי משפחה בארה"ב וגם ברוסיה .

 מומלץ

קישור למנוע החיפוש

FamilySearch: Find Your Ancestors Quickly Using FamilySearch’s New Discovery Search Experience

 




האם פודקסטים יקבלו עדיפות יותר גבוהה בתוצאות החיפוש של גוגל ?

 


נוכח החשיבות שהולכת וגדלה של פודקסטים גם בישראל וגם בעולם , החלו בגוגל להתייחס לכך ברצינות ובקרוב יופיעו בתוצאות החיפוש שלכם פודקסטים נבחרים הקשורים לשאילתא/בקשת החיפוש .

נראה שגוגל כבר מפעילה באופן ניסיוני פנל/לוח מידע בצד ימין או שמאל של מסך תוצאות החיפוש ובו מידע על הפודקסט שהכי רלבנטי בחיפוש Google.

 למידע נוסף

 

ראו גם :

ההתרחבות האדירה של עולם הפודקאסטים להאזנה/השמעה באינטרנט הביא להתפתחות מנועי חיפוש ייעודים ויעילים לאיתור פודקסטים על פי נושאים או קטעי האזנה/רצועות שמיעה של פודקסטים .

מנוע החיפוש של גוגל לא נתן עד כה מענה טוב לאיתור פודקסטים ועל כן התפתח לפני שלוש שנים מנוע חיפוש יעודי לפודקסטים בשם   LISTEN NOTES

 

לסקירה המלאה בבלוג המידעני של עמי סלנט

 

מנוע החיפוש הטוב ביותר לפודקסטים - Listen Notes

 

דרך נוספת היא לגשת לאתר הפודקאסטים של ישראל, פודקאסטר, ולחפש שם פודקאסטים מעניינים לפי מנוע חיפוש מתקדם או לפי קטגוריות מחולקות בצורה נוחה



יום שלישי, 19 באוקטובר 2021

רשתות חברתיות באינטרנט , תמונת מצב 2021 : האם הן עדיין יעילות ? גרסה מס' 8 , אוקטובר 2021

 



 
עודכנה הסקירה האינטגרטיבית הנ"ל , גרסה מס' 8 , 19 באוקטובר 2021

מה חדש בסקירה ?

קהילות טוויטר , אנחנו כבר משתמשים בקבוצות פייסבוק ולינקדאין, במה זה שונה?

 

הנחת המוצא של קהילות טוויטר המתוכננות היא לאחד אנשים לגבי זרמי שיחות ומידע מקצועי שכבר מתרחשים. מה שאומר שקהילות וזרמים של  אנשי מקצוע ניתנים לזיהוי תחת האשטאגים רלוונטיים בטוויטר . בשימוש נכון, קהילות טוויטר עשויות להיות אינטגרליות לגילוי חברים מקצועים  חדשים ברשת ולהפגין סמכות מקצועית ודעה בנושאי עניין שמעניינים אותך .

טוויטר מנסה כעת את התכונות החדשות של קהילות טוויטר בכמה מדינות תחילה  לפני שהיישום ייכנס לתוקף בכל טוויטר  ברחבי העולם .

טוויטר מבטיחה שילוב של נושאים מתויגים עם אינטראקציה קבוצתית סגורה, יישום ממוקד דיון הפתוח לדעות ולידע בסביבת מומחים. ואנשי מקצוע ,  זה עשוי להיות בעל ערך רב עבור מגזר החברות/תאגידים ככלי לאחד אנשי מקצוע במרחב 'בטוח' לחלוק דעות וידע מקצועי ולספק תובנות  לגבי האופן בו החברים רואים את  ענפי התעשייה והעולם המקצועי  אליו הם שייכים ובכך לתרום לידע המקצועי של חברי הקבוצה .

אנשי הפיתוח של טוויטר משפרים עם כיוונון נכון  את האלגוריתם החדש לקהילות  טוויטר על מנת שיוכל להפיץ את המידע בקבוצה לכל חבר קבוצה בהתאם לפרופיל המקצועי שלו .  

 

לסקירה המלאה באתר "ידע וסקרנות דיגיטלית "


יום ראשון, 17 באוקטובר 2021

ארגון תוכן רשתי : שיפורים בפלפורמת Wakelet

 


לאחרונה , השימוש בפלטפורמת Wakelet נעשה קל ואינטואיטיבי יותר גם תודות לכפתור העיצוב החדש ובעיקר תודות לפריסה בתצורת עמודות המשופרת

 מדובר ביישום מקוון מועיל ביותר (וגם חופשי)  לארגון תוכן רשתי . הוא מאפשר לשמור ולארגן את פריט המידע הדיגיטלי בצורה ויזואלית לאוספים מקוונים . כך לדוגמא , תוכלו להעתיק את הכתובת של סרט וידאו ספיציפי מיוטיוב לתוך אוסף מקוון  נושאי של Wakelet, כאשר הוא מוטמע ומאפשר לתלמידים או הסטודנטים לצפות בסרט הוידאו מבלי לעזוב את האתר של האוסף המקוון הנושאי שבניתם .

 אפשר להוסיף לאוסף המקוון שאצרתם  את כל סוגי הפריטים הדיגיטליים (מאמרים , מסמכים וגם תמונות) .

 

הWakelet  מאפשר פריסה של כל הפריטים הדיגטליים שצברתם בתצורות שונות ( מבנה רשת , מבנה עמודות ועוד)

  

 Column Layout: Available now on Wakelet!



WAKELET היא חברת סטארט-אפ באנגליה שהוקמה על ידי Jamil Khalil,

 

למידע נוסף אצל מפתחי הפלטפורמה:

קישור 1

קישור 2

 

דגמים ודוגמאות

 

האוסף המקוון שלי בנושא ארגון תוכן רשתי  למשתלמים

 

 דוגמא מס' 2 בהיסטוריה



פרקי הדרכה 




 


יום חמישי, 14 באוקטובר 2021

כמה דברים שלא ידעתם על האלגוריתם להפצת התכנים של פייסבוק

 


בהמשך לסקירה שלנו  רשתות חברתיות באינטרנט , תמונת מצב 2021 : האם הן עדיין יעילות ? ( קישור) , הנה מידע מעניין נוסף אודות השינויים לאורך השינויים באלגוריתם הפצת המידע של פייסבוק והבעיות שנגרמו מכך .

 שינוי האלגוריתם מ־2018  בפייסבוק השפיע על המאפיין העיקרי של פייסבוק, פיד החדשות, שמותאם באופן אישי ומתעדכן ללא הרף בצילומים של בני משפחה וחברים וקישורים לכתבות חדשות. התוכן שמוצג בפיד, אחראי לרוב הזמן שכמעט 3 מיליארד משתמשי פייסבוק מבלים בפלטפורמה. החברה מוכרת את תשומת הלב של המשתמשים למפרסמים, גם על גבי הרשת של פייסבוק וגם ברשת הקשורה אינסטגרם, וזה המקור לכמעט כל ההכנסות של החברה, שהגיעו בשנה שעברה ל־86 מיליארד דולר.

אלגוריתם יחודי שולט בתוכן שיופיע בפיד החדשות של כל משתמש בנפרד. הוא לוקח בחשבון מי הם החברים של המשתמש, לאיזה קבוצות הצטרף, לאיזה עמודים עשה לייק, איזה מפרסמים שילמו כדי לפנות אליו ואיזה סוגי סיפורים פופולריים אצלו בפיד או מניעים שיחות שהוא מתעניין בהם.

מטרת השינוי באלגוריתם הייתה להפוך את מגמת הירידה בכמות התגובות, להעלות צורות אחרות של מעורבות ולעודד יותר תוכן מקורי בפוסטים. האלגוריתם היה מעלה פוסטים שגררו יותר תגובות ואמוג'ים של רגשות, שבעיני החברה יש להם משקל רב יותר מלייקים פשוטים, כך ניתן ללמוד מהמסמכים.

דירוג של שיתופים מחדש

הפתרון של פייסבוק היה ליצור נוסחה שתמדוד כמה אינטראקציות "בעלות משמעות" נוצרות על ידי כל פוסט, ואז לארגן את פיד החדשות כך שיעודד כמה שיותר כאלה. במסגרת מערכת ניקוד פנימית, שנועדה למדוד את ההצלחה, "לייק" היה שווה נקודה אחת; תגובה, שיתוף מחדש בלי טקסט או תגובה להזמנה היו שוות חמש נקודות; ותגובה משמעותית, מסר, שיתוף מחדש או סימון הגעה לאיוונט היו שווים 30 נקודות. מכפילים נוספים נוספו בהתחשב בכמות האינטראקציות בין חברים בקבוצה אחת, חברים בפייסבוק או זרים.

מנקודת מבט עסקית, זה עבד. כפי שחזתה פייסבוק, כמות הזמן שמשתמשים היו בפלטפורמה ירדה, אבל המאמץ להרבות באינטראקציות בין משתמשים האט את הצניחה בכמות התגובות, ובעיקר שיקף את המדד החשוב מאוד של "שימוש יומי" של אנשים בפייסבוק, על פי בדיקות שנעשו באוגוסט 2018, כך כתוב במזכרים של החברה.

לשינוי היו השפעות חיוביות מסוימות. תוכן ששותף על ידי אנשי קשר קרובים היה יותר אמין, והמשתמשים מצאו שיש בו יותר משמעות לעומת חומר ממכרים רחוקים יותר - כך נכתב באחד המסמכים. 

אבל היתרונות האלו היו בעלי פחות משקל מהצד השני בשינוי באלגוריתם, שהעניק עדיפות לפעולות משתמשים כמו שיתופים מחדש ותגובות.

אחד הסימנים הראשונים לצרות, בקיץ של 2018, היה כשחוקרי־המידע של פייסבוק עשו סקרים בין משתמשים ושמעו מרבים מהם שלדעתם האיכות של הפיד ירדה, כך ניתן לקרוא במסמכים. כפי שהזהירה פייסבוק שצפוי היה לקרות, השינוי פגע בהרבה מו"לים של אתרי חדשות. במחצית הראשונה של 2018, באזפיד סבלה מירידה בתעבורה של 13% לעומת המחצית השנייה של 2017; אתר החדשות ברייטבארט ירד ב־46% ורשת ABC ירדה ב־12% - כך על פי נתוני חברת המידע Comscore.

נוצר לחץ לייצר תוכן שלילי

בראיונות, יותר מתריסר מנכ"לים של הוצאות לאור תיארו את השינוי, שעשתה פייסבוק כ"הקש האחרון" לאחר מספר שנים שבהן היא שינתה שוב ושוב מדיניות, ששכנע אותם שהם לא יכולים להסתמך על פייסבוק לתעבורת אינטרנט.

ג'יימס ברנס, עובד בפייסבוק לשעבר שעזב ב־2019, אמר שפייסבוק קיוותה שמתן עדיפות למעורבות משתמשים בפיד החדשות תקרב בין אנשים. אבל הפלטפורמה הפכה לכל כך מורכבת שהחברה לא הבינה איך השינוי עשוי לחזור אליה באופן הפוך. "אין קליעים יצוקים בכסף שיכולים לעשות זאת בקלות", אמר.

מקור וקרדיט : עיתון "גלובס אשר תרגם מאנגלית את סדרת הכתבות בwsj

 

 האלגוריתם לא מתמודד כראוי עם ניבים שונים

ערבית היא שפה של מיליוני משתמשים בפייסבוק באזורים שהחברה מגדירה כ"רגישים במיוחד". רוב בודקי התוכן של פייסבוק שדוברים את השפה, דוברים ערבית-מרוקאית, ולעתים קרובות לא מצליחים לבלום בזמן תוכן אלים או נצלני שנכתב בניבים אחרים, או שהם שוגים ומגבילים פוסטים שאינם מזיקים - כך נכתב במסמך מדצמבר. אלגוריתם האכיפה של פייסבוק גם הוא לא מסוגל להתמודד עם ניבים שונים של השפה.

"בוודאות אחת העדיפויות העליונות היא להקצות יותר משאבים למשימה של שיפור המערכות בערבית", כתב במסמך אחד העובדים.

כשאלימות פרצה בין ישראל לפלסטינים כמה חודשים אחרי שנכתב המסמך, החברה החלה בטעות להסיר ידיעות חדשותיות בערבית מהאזור, לחסום פעילים והחלה להסיר פוסטים, שכללו את הביטוי "אל אקצא", שהיה במוקד הסכסוך. הביטוי אל אקצא הוא גם חלק מהשם של גדודי חללי אל אקצא, שארה"ב מגדירה כארגון טרור. "אני רוצה להתנצל על התסכול שנגרם בגלל הטעויות האלה", כתב מנהל אחד בהודעה פנימית. דבר זה דווח בעבר על ידי באזפיד. פייסבוק התנצלה באופן פומבי והודיעה זמן קצר לפני פרסום התחקיר, שיש לה צוות שתפקידו למנוע טעויות מסוג זה.

לכתבה בעיתון גלובס , אשר תירגם  מאנגלית את סדרת הכתבות בעיתון WSJ

יום שלישי, 12 באוקטובר 2021

מאגר המידע המקוון "הגורם האנושי"

 



בשבוע האחרון עודכן מאגר המידע המקוון "הגורם האנושי" . נוספו עשרות תקצירים וסיכומים למאמרים ומחקרים בתחומי הרפואה , הפסיכולוגיה , הביולוגיה , הסוציולוגיה ועוד 

מאגר הגורם האנושי הוא מאגר רב-תחומי,  שהוקם עוד בשנת 2005  והוא מבוסס על זיקוק מידע מתוך מאות מקורות מידע .  במאגר מאוחסנים ומתוייגים עשרות אלפי מאמרים עם תקצירים בעברית.

לכל תקציר/סיכום יש מילות מפתח וניתן להשתמש במנוע החיפוש המתקדם של המאגר שפותח בסטנדרטים בינלאומיים .

מערכת איחזור המידע ( מנוע החיפוש המתקדם ) בפורטל הגורם האנושי נחשבת כאחת המתקדמות ביותר בישראל .

ללקט המחקרים האחרון במאגרי המידע של פורטל הגורם האנושי

כתובת מאגרי המידע של פורטל הגורם האנושי (קישור)




יום שלישי, 5 באוקטובר 2021

מאגרי מידע ממשלתיים באינטרנט : תמונת מצב 2021 וגם השוואה לעולם

 


מאת: עמי סלנט , מידען 

תאריך פרסום: אוקטובר 2021 


מבוא

נתונים פתוחים או נתונים גולמיים חופשיים (Open data) הוא רעיון לפיו חלק מהנתונים הגולמיים צריכים להיות זמינים לכל אדם, כך שניתן להשתמש בהם ולפרסם אותם מחדש בצורה חופשית, ללא מגבלות כמו זכויות יוצרים, פטנטים, או מכניזמים אחרים של שליטה. המטרה של "תנועת הנתונים הפתוחים" (Open data movement) דומה למטרות של תנועות אחרות של "פתיחות" כמו קוד פתוח, תוכן פתוח וגישה פתוחה.

המונח "נתונים פתוחים" הוא חדש יחסית, והוא צובר תאוצה עם הפיתוח של רשת האינטרנט. במיוחד עם הפתיחה של יוזמות ממשל עם נתונים פתוחים (open-data government) כמו Data.gov.

להבדיל מחופש המידע, נתונים פתוחים מאפשרים עיבוד מחדש של הנתונים, פיתוח יישומים, שילוב הנתונים בנתונים אחרים והפקת מידע חדש. דוגמה לחופש המידע הם דוחות ממשלתיים, או מחקרים מדעיים, דוגמה לנתונים חופשיים הם בסיסי הנתונים שעליהם מבוססים המחקרים והדוחות האלה.

נתונים חופשיים מתרכזים לעיתים קרובות במידע לא טקסטואלי כמו מפות, גנומים, מפות תאי מוח, תרכובות כימיות, סטטיסטיקה, נוסחאות מתמטיות ומדעיות, נתונים ונוהלים רפואיים, מידע ביולוגי ומגוון גנטי. קיימות בעיות רבות הנובעות מכך שנתונים אלה הם בעלי ערך כלכלי וניתן לצבור אותם כדי לקבל עוד ערך כלכלי. גישה אל או שימוש מחודש בנתונים נשלטת על ידי ארגונים, הן ציבוריים (ממשלות, אוניברסיטאות, רשויות וכו') והן פרטיות (פירמות)

מקור

 

ישראל

אתר מאגרי המידע הממשלתייםdata.gov.il,  בישראל  מרכז מאגרי נתונים מכלל משרדי הממשלה הפתוחים לשימוש הציבור.

האתר הוקם על-ידי מערך ממשל זמין כחלק ממדיניות ממשל פתוח, המבוססת על קידום השקיפות והצגת מידע ממשלתי אמין ומוסמך לשימוש הציבור

מאגר DATA GOV, מרכז מאגרי נתונים מכלל משרדי הממשלה הפתוחים לשימוש הציבור. האתר מאפשר חיפוש נתונים בקלות וביעילות. המשתמשים ב- data.gov.il מקבלים יד חופשית לפיתוח יישומים ומערכות המבוססות על המידע המפורסם בו וכל עדכון במאגרי המידע באתר מעודכן אוטומטית גם ביישומים המבוססים עליו.

באתר ניתן למצוא מאגרי מידע של משרדי ממשלה מרכזיים וכמה רשויות מרכזיות. המאגרים הם בנושא דיור, תחבורה, מזג אוויר, תקציב המדינה ועוד.

                                   מאגר הנתונים הממשלתי (קישור)




האתר המחודש

האתר חודש לאחרונה ומציג מאגרי מידע ממשלתיים בפורטל קוד פתוח, בטכנולוגיה המובילה בעולם בתחום - תשתיתCkan .

Ckan  היא מערכת רבת עוצמה לניהול נתונים שהופכת את הנתונים נגישים לכל על ידי מתן כלים לייעול פרסום, שיתוף, חיפוש ושימוש.

ארבעת הגופים שפרסמו הכי הרבה נתונים כללו את המרכז למיפוי ישראל שפרסם 110 מסמכים, חלקם הגדול תצלומי אוויר או נתוני מידע גאוגרפי (GIS), המשרד להגנת הסביבה שפרסם 62 מאגרי נתונים כולל מאגרי המפל"ס, ומשרד התיירות שפרסם 53 מאגרים.. משרד האוצר פרסם 33 נתוני תקציבים שונים אך לא פרסם נתונים כלכליים הנוגעים למשק בישראל.

מקור


מתוך דו"ח מבקר המדינה משנת 2021 על מאגרי המידע הממשלתיים

כשני שלישים ממשרדי הממשלה כשלו בהנגשת מאגרי המידע לציבור

 

כמעט שני שלישים ממשרדי הממשלה לא עמדו בהחלטת הממשלה שמחייבת אותם בהנגשת מאגרי מידע, כאשר כשליש מהם אפילו לא מיפו בצורה מלאה את כל המאגרים שברשותם – כך לפי דו"ח מבקר המדינה שמתפרסם היום. עוד עולה, כי גם כשהמידע מונגש, מצא המבקר בעיות באיכות מאגרי המידע, וחשש לפגיעה בפרטיות בהעדר תוכנית ממשלתית לביצוע אנונימיזציה של המאגרים.


בדיקת המבקר נערכה בין מרץ לאוקטובר 2020, במהלכה בדק המשרד הבטים שונים של הנגשת מאגרי מידע ממשלתיים וציבוריים ואת יישום החלטת הממשלה 1933 מ-2011 שלפיה עד סוף 2022 כל מאגרי המידע של משרד הממשלה יונגשו לציבור.

 

הביקורת העלתה כשלים רבים ביישום ההחלטה. בכל הנוגע למיפוי מאגרי המידע על ידי המשרדים השונים, שהיה אמור להסתיים ב-2017, מצא המבקר שכשליש מהמשרדים ביצעו את המיפוי באופן חלקי או לא ביצעו אותו כלל, ושכ-28% אף לא הכינו תוכנית עבודה למיפוי המאגרים. המשמעות: חלק ניכר ממשרדי הממשלה אפילו לא יודעים אילו מאגרי מידע הם מחזיקים, לא כל שכן החלו בתהליכים הדרושים להנגשתם.

 גם משרדים שביצעו מיפוי של מאגרי המידע שלהם לא עשו זאת בהכרח בצורה תקינה. בדיקה שערך המשרד של קבצי המיפוי השונים מצאה שיש מאגר שלא מופיעים בקבצים אך מתפרסמים באתר שיתוף המידע הממשלתי דאטה-גוב, ששמות המאגרים באתר ובקבצים אינם זהים בהכרח (מה שמקשה על ביצוע הצלבה בין המידע באתר למידע בקבצים), ושהנתונים בקבצים אינם אמינים וכוללים שדות ריקים או חלקיים, או שדות עם מידע סותר.

 

לא מפתיע שרק כ-30% מהמשרדים עמדו ביעד הממשלה של הנגשת כל מאגרי המידע שלהם בדאטה-גוב עד 2019. נכון לפברואר 2020, כ-60% מהמשרדים עמדו ביעד בצורה חלקית, וקצת יותר מ-10% לא הנגישו שום מאגרים. נכון ליוני 2020, היו באתר 824 מאגרים מונגשים. "גם במועד סיום הביקורת, באוקטובר 2020, היו מאגרים שהונגשו באתרי משרדי הממשלה, אולם אינם מונגשים באתר דאטה-גוב (דוגמת מאגרים שונים של משרד הבריאות - מאגר התרופות, מאגר דיאטנים בעלי תעודת מקצוע, מאגר מהפנטים בעלי רישיון, מאגר רוקחים בעלי רישיון, מאגר רופאים בעלי רישיון ותחומי מומחיותם). ביזור הנגשת המאגרים אינו עולה בקנה אחד עם החלטת הממשלה ומערים קשיים בפני המבקשים להשתמש במאגרים", נכתב בדו"ח.

החלטה 1933 קבעה גם רשימה של שמונה מאגרי מידע שיונגשו עד סוף 2017. זו כוללת את תקציבי משרד החינוך והרשויות המקומיות, זמן אמת של המראות ונחיתות וזמן אמת של רכבת ישראל. כל המאגרים הללו מונגשים כיום, פרט לאחד: נתוני הפשיעה של משטרת ישראל. "הנגשת נתוני הפשיעה לציבור עשויה לאפשר למשל למגזר הפרטי ולארגוני החברה האזרחית ליצור מפות פשיעה ולאתר מגמות, ובהתאם לכך האזרחים יכולים לקבל החלטות שונות, כגון היכן לגור והיכן לדרוש את הגברת הנוכחות המשטרתית", כותב המבקר. "על המשטרה לפעול ליישום החלטת הממשלה ולהנגיש את בסיסי הנתונים על הפשיעה הקיימים אצלה. הדבר מתחדד נוכח העובדה שנתונים רבים כבר נמסרו כאמור לציבור במסגרת מתן מענה על בקשות חופש המידע".

 

גם במאגרים שכבר הונגשו זיהה המבקר כשלים באיכות המידע המונגש, ובראשם העדר תאימות המאפשרת הצלבה בין מאגרים וארגונים שונים וניתוח של מידע. "למרבית המאגרים לא נמצא מטה-דאטה מלא, ובפרט הסבר אודות השדות אותם הוא מכיל, ולעיתים קרובות המידע עצמו אינו איכותי, חסר, בלתי אחיד או לא עקבי. בהיעדר מנגנון לטיוב המידע, מפתחים וחוקרים מתקשים להשתמש בו".

 

מוסדות כמו רשויות מקומיות, חברות ממשלתיות, מוסדות ממלכתיים, מועצות דתיות וקופות חולים לא מחוייבים בהנגשת מאגרים לפי החלטה 1933, אולם ההחלטה מעודדת אותם לעשות זאת. "בידי גופים ציבוריים רבים (למשל, רשויות מקומיות, בנק ישראל, מכון התקנים הישראלי, מוסדות להשכלה גבוהה, הרשות לשיקום האסיר, רשות החשמל, חברות הנמלים, שירות התעסוקה והמוסד לביטוח לאומי) מצויים מאגרי מידע רבים שלחלקם יש ערך רב עבור הציבור", נכתב בדו"ח. "החלטת הממשלה 1933 הכירה בצורך בקיום בחינה לגבי הרחבת חובת ההנגשה גם למאגרי מידע של גופים ציבוריים אחרים. נכון לספטמבר 2020, הליך בחינה זה לא בוצע בצורה מובנית וסדורה. ראוי כי רשות התקשוב תבצע הליך בחינה סדור בנושא זה".

 מקור 1

מקור 2  

 לדו"ח מבקר המדינה המלא

 

התנסות ומסקנות

 

במשך שעתיים חיפשתי נושאים שונים במאגרי הנתונים הממשלתיים בישראל .

מנוע החיפוש מבחינה מידענית עובד היטב ויוצר פילוח על פי ארגונים , תגיות ורלבנטיות .

אבל , המידע  בנושאי חינוך , למידה , למידה מרחוק ומורים לא קיים . על פניו נראה שמשרד החינוך לא העביר שום מאגרי נתונים לפרוייקט .

בנושאי בריאות ורפואה יש הרבה יותר מידע ונתונים . כלומר, משרד הבריאות הרבה יותר מתקדם מבחינת מאגרי הנתונים שלו .  




 

ראו גם:

מאגר COVID-19 - מאגרי מידע - Government Data

 

שומרים על הנתונים

Open Data - מאגרים - עיריית באר שבע


 

נתונים חופשיים מטעם ממשלות

כמה ממשלות יצרו אתרי אינטרנט כדי להפיץ חלק מהנתונים שהן אוספות.

על פי אתר הנתונים הפתוחים של ארצות הברית, ל-53 ממשלות ברחבי העולם יש אתרי נתונים פתוחים, נכון לשנת 2017.

 מקור וקרדיט



 חיפוש מידע גלובלי של נתונים פתוחים

 Dataset search  מנוע חיפוש ייעודי לסטים של נתונים פתוחים שחברת גוגל השיקה  בגרסת בטא ב- 2018 ובגרסה מלאה בינואר 2020.   פוסט שפורסם ב- 25 באוגוסט בבלוג של גוגל, כולל סקירה מעודכנת על הסטים של הנתונים שמכסה מנוע החיפוש, נתונים ותובנות מניתוח הסטים של הנתונים והמלצות לאופן פרסום סטים מדעיים עתידיים.

מממצאי הסקירה והניתוח:

לסקירה בבלוג של ד"ר יפה אהרוני

 למנוע החיפוש של גוגל לאיתור נתונים פתוחים ( קישור ישיר)

 

 



התעדכן מאגר הקישורים השימושי "חיפוש מידע : שיטות "

  בסדרת מאגרי המק"ש ( מאגר קישורים שימושי)  שאני בונה באינטרנט מזה שנתיים , התעדכן היום מאגר המק"ש חיפוש מידע : שיטות . נוספו כ40...