חפש בבלוג זה

יום שלישי, 23 בפברואר 2021

ה-Finder של אירגון סטארטאפ ניישן סנטרל, אחד ממאגרי המידע המתקדמים בעולם

 



מאת : עמי סלנט ,
מידען  ועורך הבלוג


תמונת הַיֶּדַע המידעני : מִכָּאן וּמִשָּׁם

 גרסה מס' 2 , 23 לפברואר 2021

 

הטייוואנים , מדינה מאד מתקדמת מבחינה טכנולוגית בעולם,  חיפשו להקים מאגר מידע מרכזי לכל חברות הסטראט-אפ שם . אחרי חיפושים בכל רחבי העולם הם מצאו כי המאגר הישראלי  Start-Up Nation Finder הוא המתקדם ביותר בעולם וחתמו על הסכם  לייעוץ עם ארגון ה- Startup Nation Central  הישראלי שיסייע להם להקים מאגר מידע דומה בטייוואן( מקור).

הדרך למחקר עוברת באמצעות נתונים זמינים. אחד הכלים המשמעותיים למידע על אקוסיסטם החדשנות בישראל הוא ה-Finder של אירגון סטארטאפ ניישן סנטרל.

זהו , ללא ספק , אחד ממאגרי המידע המתקדמים ביותר בעולם , מאגר המידע המקוון אודות חברות הסטראט-אפ הישראליות  Start-Up Nation Finder.

המאגר של Startup Nation Central, הוא מאגר מקיף על זירת החדשנות והיזמות הישראלית.  מאגר חינמי, ידידותי, קל לשימוש ויש בו מידע מקיף מקיף על כל הגורמים באקוסיסטם החדשנות הישראלי: מידע על כל אחת מחברות הסטארטאפ, משקיעי הון הסיכון לסוגיהם, אקסלרטורים ואינקובטורים וגורמים נוספים .

 

כמו כן המאגר כולל מחקרים וסקרים בעלי ערך רב לכל מי שעוסק ביזמות וחדשנות, וכן בלוג. לקישור למאגרלחצו כאן >> 

 


הפלטפורמה אוספת ומארגנת מידע מקיף על האקו-סיסטם הטכנולוגי הישראלי. נכון להיום, Finder מציגה מידע מפורט על כ6,500 חברות טכנולוגיה ישראליות פעילות, משקיעים, תוכניות האצה ותאגידים רב-לאומיים הפועלים בארץ.

בגרסה החדשה ממשק משתמש חדש, חיפוש מתקדם ומשופר, דף בית חדש עם נתונים סטטיסטיים וגרפים, אוסף אישי של משתמש, ציר זמן של החברה, מילון תגיות, ואפשרות חיבור עם לקוחות פוטנציאליים. המידע מוצג ללא תשלום, לכל דורש ישירות מהפלטפורמה.

נתוני ה-Finder מנוהלים על ידי צוות המחקר של "סטארט-אפ ניישן סנטרל", המכיל 10 אנליסטים לרבות מידענים/מידעניות המתמחים במגזרים שונים ובתחומים שונים. הפלטפורמה מאפשרת ליזמים עצמם לעדכן את הנתונים בדפי החברה שלהם, וכל הנתונים מאומתים לפני פרסומם. הצוות מוסיף 150 חברות חדשות בחודש ומעדכן יותר מ-1,000 פרופילים ב-Finder.

במבט על 18 החודשים האחרונים, החשיפה העולמית לאקוסיסטם הישראלי דרך Finder משמעותית למדי, וכוללת תנועה של 60 אלף מבקרים על בסיס חודשי אשר צברו 2.3 מיליון צפיות בדפי Finder במהלך התקופה. 50% מהתנועה מגיע מחו"ל, כאשר המספרים הגבוהים ביותר מגיעים מארה"ב, הודו ובריטניה.

"אנו מסוגלים לראות בדיוק מה משתמשים מחו"ל מחפשים באקו-סיסטם הישראלי. ראינו שהמגזרים הנצפים ביותר היו Cybersecurity, בריאות דיגיטלית, FinTech ו-IoT" אמר ליאור קרול, מנהל מוצר Finder ב-"סטארט-אפ ניישן סנטרל" (מקור).

 


הנה דוגמא לנתונים מעודכנים שנמצאו  במאגר FINDER  לאחרונה : סך "הגיוסים של חברות הסטארט-אפ בישראל שובר שיאים למרות משבר הקורונה, כך עולה מסיכומי Start-Up Nation Central. על פי נתוני מחלקת המחקר של Start-Up Nation Central (SNC), בשנת 2020 נרשם שיא בגיוסי הון בקרב חברות ישראליות. רף גיוסי ההון עומד נכון לתחילת חודש דצמבר על 9.5 מיליארד דולר, עליה בלמעלה מ-20% ביחס לסך גיוסי ההון בשנת 2019 כולה המסתכם ב-7.7 מיליארד דולר, כך על פי נתוני  Finder,  פלטפורמת המחקר מבית SNC  (מקור).

וגם :

 The updated list of companies can be found under the   tag #coronavirus on the Start-Up Nation Finder website 

 

במאגר FINDER  עובדות כיום 2 מידעניות מצויינות שלמדו אצלי לתואר שני במידענות באוניברסיטת בר אילן :

·       רינת קורבט, Director, Data & Information   Startup Nation Central 

 

·       ג'ני סוטניק-טליסמן  ,Jenny Sotnik-Talisman העובדת בFINDER בתפקיד Senior Information Specialist & BI Project Manager, Research and Analysis Team

 

כל פריט מידע שמועלה למאגר המידע Start-Up Nation Finder עובר עיבוד תבניתי ובקרה ע"י צוות המאגר בישראל. מלאכת האיסוף של צוות המאגר בהחלט מרשימה . הם שואבים את המידע מדוח"ות רבעוניים בארץ ובעולם מרשם החברות הממשלתי , אמצעי התקשורת וממפגשי הכרות עם חברות הסטארט-אפ הישראליות . 


 המיון  הוא על פי 14 סקטורים/מגזרים( כגון סייבר, ניהול מים, טכנולוגיות פיננסיות, רפואה דיגיטלית, קמעונאות ועוד ).

צוות המאגר הישראלי פיתח מתודלוגיה חכמה של תגיות נושא היררכיות (Tags hierarchy) המקלה רבות על המשתמש במאגר המידע המופלא הזה.

 


אחד ההישגים של מאגר FINDER הוא מילון התגיות/מילות מפתח אשר באמצעותו אפשר לחדד את החיפושים המקוונים במאגר. מילון התגיות הוא תוצר של חשיבה מידענית שיטתית שקשה למצוא כמוה במאגרי חברות אחרים בעולם .

השילוב המופלא בין חיפוש לבין Tags hierarchy

תוך כדי החיפוש החכם במאגר המידע הישראלי מוצגות תגיות-הנושא הרלבנטיות למגזר/סקטור הרלבנטי וגם חברות הסטראט-אפ הקשורות לחיפוש ולסקטור הספציפי . הצגת הטקסומיה תוך כדי החיפוש מאד מועילה ומאד חכמה.

חיפוש מתקדם במאגר

במאגר המידע  FINDER  יש גם חיפוש מתקדם ( חיפוש מורכב) במאגר המידע ע"י תגיות-נושא כנגד חתכים שונים כגון :

 

·       סקטור

·       מועסקים

·       שלב הפיתוח

·       מודל עסקי

·       שלבי מימון והשקעה

 

 התנסות במאגר FINDER

כך לדוגמא ,ערכתי חיפוש בתחום שאני מתעניין בו בשנה האחרונה , חברות סטראט -אפ ישראליות המתמחות בלמידה מקוונת  E-LEARNING והצלחתי להגיע לכמה חברות ישראליות מעניינות וחדשניות בעזרת מילון התגיות של FINDER וגם בעזרת המסננים של המאגר (FILTERS ) .

החיפוש במאגר FINDER  מבוסס על אופראטורים בוליאניים המאפשרים בניית חיפוש מורכב ומדוייק.

 

הנה דוגמאות של מסכי החיפוש  שלי במאגר FINDER  


 חיפוש על פי תגיות עם אופראטורים בוליאניים 


 

 חיפוש על פי מילון תגיות/מילות מפתח כולל מסננים 


השוואה למאגרי מידע דומים בעולם

 

ערכתי השוואה למאגרי מידע חופשיים דומים בעולם כגון  Crunchbase , angel.co , F6S   שהם וותיקים יותר , אך אינם מתמחים בהכרח בחברות הסאטרט-הישראליות בלבד. מצאתי כי החיפוש במאגר המידע הישראלי  Start-Up Nation Finder הוא הרבה יותר מתקדם ואינטואיטיבי בהשוואה לחיפוש במאגר Crunchbase  ובאגר הבינלאומי  f6s.

הניווט והחיפוש המתקדם על פי היררכיה מתואמת של תגיות-נושא והצלבת חתכים במאגר הישראלי הופכות אותו למתקדם ביותר מסוגו במאגרי המידע המקוונים בעולם. במאגר הישראלי יש גם הנחייה וסיוע מקוונים במהלך החיפוש ע"י מערכת שפעלת מאחורי הקלעים בצ'אט 


פרקי הדרכה

סרט הדרכה ביוטיוב

 

 









יום רביעי, 10 בפברואר 2021

אתר ארכיון העיתונות היהודית ההיסטורית – JPRESS החדש! מאפייני חיפוש והדרכה

 

הקדמה של עורך הבלוג , תמונת הַיֶּדַע המידעני  עמי סלנט: 

האתר של עיתונות היסטורית של הספריה הלאומית הוא אחד ממפעלי המידע החשובים בישראל ואולי החשוב ביותר .  יבוא יום ויוזמי האתר יזכו לפרס ישראל . האתר מתפתח כל הזמן ולפני כמה חודשים עבר שידרוג משמעותי , לכן מצאנו לנכון לכתוב עליו בהרחבה .

הספרייה הלאומית השיקה לפני כמה חודשים את אתר העיתונות ההיסטורית החדש הכולל 537 עיתונים מלמעלה מ 30 מדינות. אוסף העיתונות היהודי והישראלי הדיגיטאלי של הספרייה הלאומית בישראל, נחשב לאחד הגדולים ביותר בעולם - בוודאי מבחינת הגיוון הגיאוגרפי והלשוני שלו - והוא מהווה מאגר עשיר ונדיר של עיתונים מודפסים – החל מסוף המאה ה 18 ועד לימינו אנו, ובמעל 15 שפות שונות..

ייחודו של האתר המחודש הוא בכינוסם של אתרים שונים תחת קורת גג וירטואלית אחת. יש בו את אתר העיתונות היהודית ההיסטורית (בשותפות עם אוניברסיטת תל-אביב); את ג'ראייד- ארכיון עיתונות בערבית בארץ ישראל העות'מאנית והמנדטורית; את עיתונות ילדים של פעם וכן את e-תונות - אתר העיתונות היומית היוצאת לאור בישראל.

בנוסף, קיימת באתר החדש אפשרות לבצע חיפוש רוחבי ומתקדם על כל אוסף העיתונות הדיגיטלית, לרבות אפשרות לצפות בכל העיתונים שיצאו לאור לפי תאריך מסוים, אפשרויות חיפוש וסינון לפי פרמטרים של שפה, תדירות הופעה, לפי מרחב גיאוגרפי ועוד.

כמו כן נמצאת באתר מערכת תיוגים מתקדמת ברמת כתבה, גיליון וכותר שמאפשרת לכל אחד לתרום ולהעשיר את המידע על האוסף

מקור


רקע טכנולוגי ותכולה

האתר הוא מיזם של אוניברסיטת תל אביב והספרייה הלאומית, שהחל כניסוי פרטי בסוף שנות ה-90 על ידי חברת התוכנה הישראלית אוליב תוכנה (Olive Software), במסגרתו נסרקו עותקים היסטוריים של העיתון "פלסטיין פוסט" (שמו המקורי של העיתון "ג'רוזלם פוסט"). חברת אוליב פיתחה תוכנה המאפשרת לעיתונים להפיק מהדורות אלקטרוניות וכן ליצור ארכיון דיגיטלי של גיליונות העבר והווה, המוצגים בפורמט הדפוס האותנטי והמלא בדפדפן האינטרנט. עד שנת 2006 הצליחה החברה למכור את הטכנולוגיה לכ-600 מגזינים ועיתונים ברחבי העולם. בהמשך עבר הפרויקט לידי חוקר יהדות ארצות האסלאם באוניברסיטת תל אביב ירון צור, שהשתמש בטכנולוגיה לסריקת עיתונות יהודית בארצות ערב, ובשנת 2004 יזם את הרחבת המיזם לאתר חדש שיכיל עיתונים יהודיים מן העולם כולו.

 

הפרסומים הראשונים שנכללו במיזם היו כ-33 אלף עמודי העיתון "פלסטיין פוסט" ובטאוני ארגון "כל ישראל חברים". בשנת 2005 הצטרפה הספרייה הלאומית, שכבר הפעילה בנפרד את מיזם "עיתונות עברית היסטורית" משנת 2003, למיזם העיתונות היהודית. שותפה נוספת למיזם היא ספריית "כל ישראל חברים" בפריז, המפתחת באתר את מדורי העיתונים היהודיים בצרפתית, בתיאום עם ארגון הספריות היהודיות באירופה (RACHEL) ועם הספרייה הלאומית של צרפת (BNF). שותפים נוספים של המיזם הם אוניברסיטת ניו יורק, אוניברסיטת קולומביה, ספריית העיר ניו יורק, ספריית ההיברו יוניון קולג', הספרייה הלאומית של פולין, וספריית היודאיקה של אוניברסיטת הרווארד.

 

האתר החל לפעול בשנת 2008, ועם השקתו הרשמית בדצמבר 2010 הוצגו בו כ-400 אלף עמודים של כ-20 עיתונים בשפות שונות. נכון לינואר 2021, מוצגים באתר קרוב ל-3 מיליון עמודים, בלמעלה מ-290,000 גליונות ב-17 שפות שונות, בטווח השנים 1783–2014.

 

טכנולוגיה

עיתוני המאגר נסרקו ברובם ממקור נייר, מיקרופילם או מיקרופיש, ולאחר מכן הומרו לטקסט באמצעות זיהוי תווים אופטי, על מנת לאפשר חיפוש בטקסט המלא של כל עיתון, כאשר התוצאה מוצגת גם לעיון בדף המקורי כפי שהודפס. בשנים הראשונות לקיומו של האתר, תהליך הסריקה וזיהוי הטקסט נעשה תוך שימוש בתוכנת Active Paper שפותחה על ידי שאול דוק במימון חברת אוליב. עקב מצבם הרעוע של חלק מהמקורות וקשיים טכנולוגיים (בעיקר בעיתונים בעברית, יידיש, ערבית, ערבית-יהודית), מופיעות טעויות רבות בזיהוי הטקסט ובסֶגמֶנטציה. עם זאת, ההמרה לטקסט - גם אם חלקית- מאפשרת ביצוע חיפוש מהיר של מחרוזות חיפוש ותרמה רבות למחקר ההיסטוריה היהודית והישראלית.

 


באוקטובר 2013 חודש האתר שיתוף חברת אוליב. בסוף שנת 2020 הוחלפה התוכנה שמשמשת את האתר. את התוכנה של חברת אוליב, ששימשה את האתר מיומו הראשון, החליפה תוכנה של חברת וורידיאן (Veridian Software). האתר כולו עבר שדרוג ומתיחת פנים, כשאחד החידושים המרכזיים היה הצגת מאגר העיתונות היהודית ההיסטורית לצד האוסף "עיתונות ילדים של פעם" ואוסף העיתונות היומית של הספרייה הלאומית, מה שמאפשר חיפוש על קורפוס רחב ומגוון יותר עיתונים.

 

העיתונים

עיתוני המאגר, אשר כוללים עיתונים נדירים שהיו פזורים בעולם ולא התאפשרה אליהם גישה קודם לכן, מהווים מקור מידע רב חשיבות על ההיסטוריה היהודית ועל תרבות יהדות העולם.

 

המאגר כולל ארבעה מדורים, בהם המדור לעיתונות יידיש, אשר כולל את העיתונים "היינט" ו"דער מאמענט", המדור לעיתונות יהודית בארצות ערב, שמופיעים בו עיתונים שיצאו לאור החל מסוף המאה ה-19 בשפה הצרפתית ובערבית יהודית. שני המדורים הנוספים מתמקדים בעיקר בשפה העברית: "מדור העיתונות העברית במאה ה-19" כולל עיתונים עבריים שיצאו לאור החל משנות ה-50 במאה ה-19 על ידי הזרם המשכילי (המליץ), הזרם האורתודוקסי (הלבנון), ומאוחר יותר, עם הופעת ניצני הלאומיות היהודית, על ידי זרמים שהתמקדו בהתפתחות היישוב היהודי בארץ ישראל (כגון החבצלת). במדור הרביעי, "עיתונות היישוב ומדינת ישראל", נכללים עיתונים שיצאו לאור ביישוב היהודי בארץ ישראל במאה ה-20 ובמדינת ישראל, רובם בלשון העברית, כולל שני עיתונים גדולים כגון "מעריב" ו"דבר" שאפשרו את העלאתם לאתר.

 

העיתונים היומיים הפעילים, "ידיעות אחרונות", "גלובס" ו"הארץ" לא נתנו אישור לסריקת גיליונות העבר שלהם. 

בשנת 2019, לכבוד יובל המאה להקמת העיתון, הסכימה הנהלת "הארץ" לאפשר הנגשה של רוב הגיליונות ההיסטוריים לציבור באופן מלא וחינמי. 

כמו כן הסכימה לאפשר הנגשה לעיתון "חדשות", שיצא לאור בין השנים 1984–1993 והיה בבעלות קבוצת הארץ.

 

מקור

 

פרקי הדרכה 


הדרכה על הממשק החדש של פרויקט העיתונות היהודית ההיסטורית מבית הספרייה הלאומית ואוניברסיטת תל-אביב. בהנחיית אייל מילר, מנהל הפרויקט. הגישה למאגר חופשית, בקישור הבא


מצגת לאנשי חינוך :

הוראה עם האתר עיתונות היסטורית

חיפוש באוסף (קישור)
 
 דוגמא לחיפוש משולב שערכתי באוסף בנושא המעברות בישראל והשלג בשנת 1950 




שימו לב כי יש להציב את האופראטור וגם מייד לאחר שורת החיפוש

בצורה כזו נוצר חיפוש מורכב בין שני מונחים  מעברות וגם שלג


 חיפוש באוסף (קישור) 

חיפוש ביטוי מדויק

ניתן לחפש ביטוי מדויק באמצעות הצבת מרכאות סביב מונחי החיפוש. לדוגמה:

"זכרון יעקב"
"
רחוב הרצל 12"
"
מכללת תל חי"

חיפוש בוליאני

‏‏ ניתן להשתמש באופרטורים הבוליאניים 'וגם', 'או', 'ולא', לצמצום תוצאות החיפוש על ידי לחיצה על הכפתור שמשמאל לתיבת החיפוש. אין לכתוב 'וגם', 'או', 'ולא'- שכן זה עובד רק בלחיצה על הכפתור או בהקלדת מילים אלו באנגלית; ובמקרה זה שימו לב, באנגלית יש להשתמש באותיות רישיות AND, OR ו-NOT.

וגם מצמצם את החיפוש. התוצאות יכילו את כל מילות המפתח:
אנטוני וגם קלאופטרה‏

או מרחיב את החיפוש. התוצאות יכילו לפחות אחת ממילות המפתח:
אנטוני או קלאופטרה‏

ולא  מצמצם את החיפוש ומוציא תוצאות הכוללות את מילות המפתח:
יורק ולא ניו‏


התוצאות יכללו מאמרים על יורק, אך לא ניו יורק.

ניתן לקבץ ביטויים באמצעות סוגריים, למשל (תל-אביב או הירקון) וגם נחל‏.

 

חיפוש מורכב בנושא  קהילה יהודית  וגם ליטא עם הגבלת תאריכים 

חיפוש מתקדם

לחיצה על   הסמל  המוקטן תגרום להצגת החלונית "חיפוש מתקדם". החיפוש המתקדם מאפשר להגביל את תוצאות החיפוש באמצעות:

  • טווח תאריכים
  • פרסום אחד או יותר

הוא גם מאפשר לך לחפש בתוך טקסט מלא/כותרות מאמרים/הערות/תגיות, ולבחור האם להציג בתוצאות החיפוש תצוגות מקדימות של טקסט או תמונה.

  חיפוש באוסף (קישור) 


ראו גם :

רשימה מאוחדת של עיתונים יהודיים היסטורים וכתבי עת דיגיטליים




יום שבת, 6 בפברואר 2021

מאגר המידע "הגורם האנושי" שודרג בימים האחרונים

 

הצוות הטכנולוגי של מאגר הגורם האנושי שידרג בימים האחרונים את מאגר הגורם האנושי הפועל כבר 14 שנה . מהירות הגישה לתכנים השתפרה וגם מנוע החיפוש המתקדם.

מאגר המידע הרב-תחומי של  "הגורם האנושי" הוקם בשנת 2007 על מנת לתעד את ההתמודדות של אנשים ואישים , קורותיהם , תרומותיהם לאנושות ולחברה, אורח חייהם ולעתים גם תלאותיהם. המאגר כולל גם מחקרים בנושאים אלו.

המאגר נבנה על סמך סטנדרטים בינלאומיים לניהול מאגרי מאגרי מידע והוא כולל מנוע חיפוש מתקדם בדומה למאגרי המידע האקדמאיים הבינלאומיים .

היקף המאגר : נכון לשנת 2021 כולל המאגר הרב-תחומי עשרות אלפי מאמרים ומחקרים בסוגיות השונות של ההוויה האנושית וגורמי אנוש. 

לצורך הקמת המאגר הרב-תחומי חברה קבוצה של מידענים ואנשי אקדמיה הרואה במפעל תיעוד זה דרך להסתכלות הוליסיטית יותר על עולם התכנים הנוצר באינטרנט.

צוות הפרויקט מפעיל מערכת איסוף מידע מקיפה על מנת לברור ולקטלג את התכנים הדיגיטאליים.    

 הפיתוח התיכנותי הייחודי של מאגר המידע נעשה על ידי נמרוד בן נס ומיקי בן נס , חברת אפוק

 ניהול התוכן והאיסוף : עמי סלנט, מידען

למאגר הגורם האנושי (קישור)

עדכונים שוטפים בדף הפייסבוק של המאגר (קישור)

 



יום שני, 1 בפברואר 2021

התעדכן מאגר הקישורים השימושי "חיפוש מידע : שיטות "

  בסדרת מאגרי המק"ש ( מאגר קישורים שימושי)  שאני בונה באינטרנט מזה שנתיים , התעדכן היום מאגר המק"ש חיפוש מידע : שיטות . נוספו כ40...