חפש בבלוג זה

יום ראשון, 20 באפריל 2014

"זחלן" החדשות ( Crawler )- מעקב מגמות החדשות



זחלן  (Crawler)הוא מנגנון תוכנה לשפותח לצרכי סריקה ואיסוף מידע ברשת האינטרנט . 

"זחלן" הוא כינוי לתוכנת מחשב אשר סורקת את האינטרנט בצורה אוטומטית, שיטתית וסידרתית. תוכנה זאת יכולה להיקרא גם "עכביש רשת", "רובוט רשת" ו"אינדקס אוטומטי". 

זחלן רשת (web crawler) או רובוט חיפוש הוא סוג של בוט או תוכנה שסורקת באופן אוטומטי ושיטתי את הרשת הכלל עולמית (WWW). אתרים רבים, בייחוד מנועי חיפוש, משתמשים בזחלנים כדי לקבל תמונה עדכנית של הרשת.

כבר כתבנו בעבר על "זחלני-איסוף" מידע חדשותיים באינטרט,  (וגם -2 ) אשר אינם רבים בעברית,  ולכן יש מקום להזכיר לטובה את המיזם הוותיק של אביב כנען הנקרא News Trends Israel - ארכיון חדשות / מחקר וניתוח חדשות. .

אתר זה מספק ראיה מתקדמת על החדשות ותכני החדשות במדינה. ניתן לגלוש בארכיון חדשות, ארכיון ידיעות ולחקור את התהליכים והמגמות בעיתונות הישראלית. מהם הנושאים החמים ביותר באתרי החדשות וכיצד התקדמו הידיעות. מה קדם למה ומה היה בשלב מאוחר יותר.
 

ראה גם :

Current challenges in web crawling - SlideShare

Web Crawler Spider Software - free download suggestions

A Fast Distributed Focused-web Crawling - ScienceDirect

Open Source Crawlers in Java

איתור חדשות באינטרנט , מנועי חיפוש ומערכות איסוף, חלק ב' : מנגנון התאמת מידע לצבירת חדשות בגוגל חדשות

מנוע החיפוש המותאם אישית של גוגל 

אין תגובות:

הוסף רשומת תגובה

אגרגטורים (צוברי מידע) על כלים של בינה מלאכותית

    מאגר המק"ש ( מאגר קישורים שימושי ) " חיפוש מידע : שיטות " התעדכן היום ונוספו קישורים  מומלצים בתחומי האגרגטורים של כלים מ...