חפש בבלוג זה

יום ראשון, 20 באפריל 2014

"זחלן" החדשות ( Crawler )- מעקב מגמות החדשות



זחלן  (Crawler)הוא מנגנון תוכנה לשפותח לצרכי סריקה ואיסוף מידע ברשת האינטרנט . 

"זחלן" הוא כינוי לתוכנת מחשב אשר סורקת את האינטרנט בצורה אוטומטית, שיטתית וסידרתית. תוכנה זאת יכולה להיקרא גם "עכביש רשת", "רובוט רשת" ו"אינדקס אוטומטי". 

זחלן רשת (web crawler) או רובוט חיפוש הוא סוג של בוט או תוכנה שסורקת באופן אוטומטי ושיטתי את הרשת הכלל עולמית (WWW). אתרים רבים, בייחוד מנועי חיפוש, משתמשים בזחלנים כדי לקבל תמונה עדכנית של הרשת.

כבר כתבנו בעבר על "זחלני-איסוף" מידע חדשותיים באינטרט,  (וגם -2 ) אשר אינם רבים בעברית,  ולכן יש מקום להזכיר לטובה את המיזם הוותיק של אביב כנען הנקרא News Trends Israel - ארכיון חדשות / מחקר וניתוח חדשות. .

אתר זה מספק ראיה מתקדמת על החדשות ותכני החדשות במדינה. ניתן לגלוש בארכיון חדשות, ארכיון ידיעות ולחקור את התהליכים והמגמות בעיתונות הישראלית. מהם הנושאים החמים ביותר באתרי החדשות וכיצד התקדמו הידיעות. מה קדם למה ומה היה בשלב מאוחר יותר.
 

ראה גם :

Current challenges in web crawling - SlideShare

Web Crawler Spider Software - free download suggestions

A Fast Distributed Focused-web Crawling - ScienceDirect

Open Source Crawlers in Java

איתור חדשות באינטרנט , מנועי חיפוש ומערכות איסוף, חלק ב' : מנגנון התאמת מידע לצבירת חדשות בגוגל חדשות

מנוע החיפוש המותאם אישית של גוגל 

אין תגובות:

הוסף רשומת תגובה

החשיפה האורגנית ברשתות חברתיות : תמונת מצב 2025

  מאת: עמי סלנט , מידען   מזה כ10 שנים אני עוקב וחוקר את המאפיינים וההתפתחויות של רשתות חברתיות באינטרנט , גם באמצעות כמה וכמה קבוצות פייס...