Yahoo открыла исходный код веб-краулера Anthelion

15 декабря 2015 года   |  Yahoo!

Yahoo открыла исходный код веб-краулера Anthelion

Компания Yahoo перевела в разряд открытых проектов веб-краулер Anthelion, созданный для парсинга структурированных данных из HTML-страниц.

«Anthelion может быть нацелен на сканирование конкретных страниц. К примеру, содержащих микроразметку для фильмов», — пояснил представитель компании в анонсе на Tumblr.

В прошлом году во время конференции в Шанхае сотрудники Yahoo Labs раскрыли некоторые детали по Anthelion в статье.

«Мы – первые, кто представил идею краулера, основной задачей которого является извлечение семантических данных, встроенных в HTML-страницы с помощью микроразметки», — заявили авторы статьи.

В своей публикации они также показали, как внедрение этой технологии может увеличить число релевантных результатов по конкретным поисковым запросам.

Код проекта доступен на GitHub.

Напомним, что ранее в этом месяце Microsoft объявил о решении открыть исходный код JavaScript-движка Chakra, используемого в браузерах Microsoft Edge и Internet Explorer.

Статьи