חפש בבלוג זה

יום רביעי, 10 בפברואר 2021

אתר ארכיון העיתונות היהודית ההיסטורית – JPRESS החדש! מאפייני חיפוש והדרכה

 

הקדמה של עורך הבלוג , תמונת הַיֶּדַע המידעני  עמי סלנט: 

האתר של עיתונות היסטורית של הספריה הלאומית הוא אחד ממפעלי המידע החשובים בישראל ואולי החשוב ביותר .  יבוא יום ויוזמי האתר יזכו לפרס ישראל . האתר מתפתח כל הזמן ולפני כמה חודשים עבר שידרוג משמעותי , לכן מצאנו לנכון לכתוב עליו בהרחבה .

הספרייה הלאומית השיקה לפני כמה חודשים את אתר העיתונות ההיסטורית החדש הכולל 537 עיתונים מלמעלה מ 30 מדינות. אוסף העיתונות היהודי והישראלי הדיגיטאלי של הספרייה הלאומית בישראל, נחשב לאחד הגדולים ביותר בעולם - בוודאי מבחינת הגיוון הגיאוגרפי והלשוני שלו - והוא מהווה מאגר עשיר ונדיר של עיתונים מודפסים – החל מסוף המאה ה 18 ועד לימינו אנו, ובמעל 15 שפות שונות..

ייחודו של האתר המחודש הוא בכינוסם של אתרים שונים תחת קורת גג וירטואלית אחת. יש בו את אתר העיתונות היהודית ההיסטורית (בשותפות עם אוניברסיטת תל-אביב); את ג'ראייד- ארכיון עיתונות בערבית בארץ ישראל העות'מאנית והמנדטורית; את עיתונות ילדים של פעם וכן את e-תונות - אתר העיתונות היומית היוצאת לאור בישראל.

בנוסף, קיימת באתר החדש אפשרות לבצע חיפוש רוחבי ומתקדם על כל אוסף העיתונות הדיגיטלית, לרבות אפשרות לצפות בכל העיתונים שיצאו לאור לפי תאריך מסוים, אפשרויות חיפוש וסינון לפי פרמטרים של שפה, תדירות הופעה, לפי מרחב גיאוגרפי ועוד.

כמו כן נמצאת באתר מערכת תיוגים מתקדמת ברמת כתבה, גיליון וכותר שמאפשרת לכל אחד לתרום ולהעשיר את המידע על האוסף

מקור


רקע טכנולוגי ותכולה

האתר הוא מיזם של אוניברסיטת תל אביב והספרייה הלאומית, שהחל כניסוי פרטי בסוף שנות ה-90 על ידי חברת התוכנה הישראלית אוליב תוכנה (Olive Software), במסגרתו נסרקו עותקים היסטוריים של העיתון "פלסטיין פוסט" (שמו המקורי של העיתון "ג'רוזלם פוסט"). חברת אוליב פיתחה תוכנה המאפשרת לעיתונים להפיק מהדורות אלקטרוניות וכן ליצור ארכיון דיגיטלי של גיליונות העבר והווה, המוצגים בפורמט הדפוס האותנטי והמלא בדפדפן האינטרנט. עד שנת 2006 הצליחה החברה למכור את הטכנולוגיה לכ-600 מגזינים ועיתונים ברחבי העולם. בהמשך עבר הפרויקט לידי חוקר יהדות ארצות האסלאם באוניברסיטת תל אביב ירון צור, שהשתמש בטכנולוגיה לסריקת עיתונות יהודית בארצות ערב, ובשנת 2004 יזם את הרחבת המיזם לאתר חדש שיכיל עיתונים יהודיים מן העולם כולו.

 

הפרסומים הראשונים שנכללו במיזם היו כ-33 אלף עמודי העיתון "פלסטיין פוסט" ובטאוני ארגון "כל ישראל חברים". בשנת 2005 הצטרפה הספרייה הלאומית, שכבר הפעילה בנפרד את מיזם "עיתונות עברית היסטורית" משנת 2003, למיזם העיתונות היהודית. שותפה נוספת למיזם היא ספריית "כל ישראל חברים" בפריז, המפתחת באתר את מדורי העיתונים היהודיים בצרפתית, בתיאום עם ארגון הספריות היהודיות באירופה (RACHEL) ועם הספרייה הלאומית של צרפת (BNF). שותפים נוספים של המיזם הם אוניברסיטת ניו יורק, אוניברסיטת קולומביה, ספריית העיר ניו יורק, ספריית ההיברו יוניון קולג', הספרייה הלאומית של פולין, וספריית היודאיקה של אוניברסיטת הרווארד.

 

האתר החל לפעול בשנת 2008, ועם השקתו הרשמית בדצמבר 2010 הוצגו בו כ-400 אלף עמודים של כ-20 עיתונים בשפות שונות. נכון לינואר 2021, מוצגים באתר קרוב ל-3 מיליון עמודים, בלמעלה מ-290,000 גליונות ב-17 שפות שונות, בטווח השנים 1783–2014.

 

טכנולוגיה

עיתוני המאגר נסרקו ברובם ממקור נייר, מיקרופילם או מיקרופיש, ולאחר מכן הומרו לטקסט באמצעות זיהוי תווים אופטי, על מנת לאפשר חיפוש בטקסט המלא של כל עיתון, כאשר התוצאה מוצגת גם לעיון בדף המקורי כפי שהודפס. בשנים הראשונות לקיומו של האתר, תהליך הסריקה וזיהוי הטקסט נעשה תוך שימוש בתוכנת Active Paper שפותחה על ידי שאול דוק במימון חברת אוליב. עקב מצבם הרעוע של חלק מהמקורות וקשיים טכנולוגיים (בעיקר בעיתונים בעברית, יידיש, ערבית, ערבית-יהודית), מופיעות טעויות רבות בזיהוי הטקסט ובסֶגמֶנטציה. עם זאת, ההמרה לטקסט - גם אם חלקית- מאפשרת ביצוע חיפוש מהיר של מחרוזות חיפוש ותרמה רבות למחקר ההיסטוריה היהודית והישראלית.

 


באוקטובר 2013 חודש האתר שיתוף חברת אוליב. בסוף שנת 2020 הוחלפה התוכנה שמשמשת את האתר. את התוכנה של חברת אוליב, ששימשה את האתר מיומו הראשון, החליפה תוכנה של חברת וורידיאן (Veridian Software). האתר כולו עבר שדרוג ומתיחת פנים, כשאחד החידושים המרכזיים היה הצגת מאגר העיתונות היהודית ההיסטורית לצד האוסף "עיתונות ילדים של פעם" ואוסף העיתונות היומית של הספרייה הלאומית, מה שמאפשר חיפוש על קורפוס רחב ומגוון יותר עיתונים.

 

העיתונים

עיתוני המאגר, אשר כוללים עיתונים נדירים שהיו פזורים בעולם ולא התאפשרה אליהם גישה קודם לכן, מהווים מקור מידע רב חשיבות על ההיסטוריה היהודית ועל תרבות יהדות העולם.

 

המאגר כולל ארבעה מדורים, בהם המדור לעיתונות יידיש, אשר כולל את העיתונים "היינט" ו"דער מאמענט", המדור לעיתונות יהודית בארצות ערב, שמופיעים בו עיתונים שיצאו לאור החל מסוף המאה ה-19 בשפה הצרפתית ובערבית יהודית. שני המדורים הנוספים מתמקדים בעיקר בשפה העברית: "מדור העיתונות העברית במאה ה-19" כולל עיתונים עבריים שיצאו לאור החל משנות ה-50 במאה ה-19 על ידי הזרם המשכילי (המליץ), הזרם האורתודוקסי (הלבנון), ומאוחר יותר, עם הופעת ניצני הלאומיות היהודית, על ידי זרמים שהתמקדו בהתפתחות היישוב היהודי בארץ ישראל (כגון החבצלת). במדור הרביעי, "עיתונות היישוב ומדינת ישראל", נכללים עיתונים שיצאו לאור ביישוב היהודי בארץ ישראל במאה ה-20 ובמדינת ישראל, רובם בלשון העברית, כולל שני עיתונים גדולים כגון "מעריב" ו"דבר" שאפשרו את העלאתם לאתר.

 

העיתונים היומיים הפעילים, "ידיעות אחרונות", "גלובס" ו"הארץ" לא נתנו אישור לסריקת גיליונות העבר שלהם. 

בשנת 2019, לכבוד יובל המאה להקמת העיתון, הסכימה הנהלת "הארץ" לאפשר הנגשה של רוב הגיליונות ההיסטוריים לציבור באופן מלא וחינמי. 

כמו כן הסכימה לאפשר הנגשה לעיתון "חדשות", שיצא לאור בין השנים 1984–1993 והיה בבעלות קבוצת הארץ.

 

מקור

 

פרקי הדרכה 


הדרכה על הממשק החדש של פרויקט העיתונות היהודית ההיסטורית מבית הספרייה הלאומית ואוניברסיטת תל-אביב. בהנחיית אייל מילר, מנהל הפרויקט. הגישה למאגר חופשית, בקישור הבא


מצגת לאנשי חינוך :

הוראה עם האתר עיתונות היסטורית

חיפוש באוסף (קישור)
 
 דוגמא לחיפוש משולב שערכתי באוסף בנושא המעברות בישראל והשלג בשנת 1950 




שימו לב כי יש להציב את האופראטור וגם מייד לאחר שורת החיפוש

בצורה כזו נוצר חיפוש מורכב בין שני מונחים  מעברות וגם שלג


 חיפוש באוסף (קישור) 

חיפוש ביטוי מדויק

ניתן לחפש ביטוי מדויק באמצעות הצבת מרכאות סביב מונחי החיפוש. לדוגמה:

"זכרון יעקב"
"
רחוב הרצל 12"
"
מכללת תל חי"

חיפוש בוליאני

‏‏ ניתן להשתמש באופרטורים הבוליאניים 'וגם', 'או', 'ולא', לצמצום תוצאות החיפוש על ידי לחיצה על הכפתור שמשמאל לתיבת החיפוש. אין לכתוב 'וגם', 'או', 'ולא'- שכן זה עובד רק בלחיצה על הכפתור או בהקלדת מילים אלו באנגלית; ובמקרה זה שימו לב, באנגלית יש להשתמש באותיות רישיות AND, OR ו-NOT.

וגם מצמצם את החיפוש. התוצאות יכילו את כל מילות המפתח:
אנטוני וגם קלאופטרה‏

או מרחיב את החיפוש. התוצאות יכילו לפחות אחת ממילות המפתח:
אנטוני או קלאופטרה‏

ולא  מצמצם את החיפוש ומוציא תוצאות הכוללות את מילות המפתח:
יורק ולא ניו‏


התוצאות יכללו מאמרים על יורק, אך לא ניו יורק.

ניתן לקבץ ביטויים באמצעות סוגריים, למשל (תל-אביב או הירקון) וגם נחל‏.

 

חיפוש מורכב בנושא  קהילה יהודית  וגם ליטא עם הגבלת תאריכים 

חיפוש מתקדם

לחיצה על   הסמל  המוקטן תגרום להצגת החלונית "חיפוש מתקדם". החיפוש המתקדם מאפשר להגביל את תוצאות החיפוש באמצעות:

  • טווח תאריכים
  • פרסום אחד או יותר

הוא גם מאפשר לך לחפש בתוך טקסט מלא/כותרות מאמרים/הערות/תגיות, ולבחור האם להציג בתוצאות החיפוש תצוגות מקדימות של טקסט או תמונה.

  חיפוש באוסף (קישור) 


ראו גם :

רשימה מאוחדת של עיתונים יהודיים היסטורים וכתבי עת דיגיטליים




תגובה 1:

אגרגטורים (צוברי מידע) על כלים של בינה מלאכותית

    מאגר המק"ש ( מאגר קישורים שימושי ) " חיפוש מידע : שיטות " התעדכן היום ונוספו קישורים  מומלצים בתחומי האגרגטורים של כלים מ...