Yahoo открыла исходный код веб-краулера Anthelion

3

Компания Yahoo перевела в разряд открытых проектов веб-краулер Anthelion, созданный для парсинга структурированных данных из HTML-страниц.

yahoo-logo-700x400.jpg

«Anthelion может быть нацелен на сканирование конкретных страниц. К примеру, содержащих микроразметку для фильмов», — пояснил представитель компании в анонсе на Tumblr.

В прошлом году во время конференции в Шанхае сотрудники Yahoo Labs раскрыли некоторые детали по Anthelion в статье.

«Мы – первые, кто представил идею краулера, основной задачей которого является извлечение семантических данных, встроенных в HTML-страницы с помощью микроразметки», — заявили авторы статьи.

В своей публикации они также показали, как внедрение этой технологии может увеличить число релевантных результатов по конкретным поисковым запросам.

Код проекта доступен на GitHub.

Напомним, что ранее в этом месяце Microsoft объявил о решении открыть исходный код JavaScript-движка Chakra, используемого в браузерах Microsoft Edge и Internet Explorer.

Редактор-переводчик. Специализируется на западном интернет-маркетинге и SEO. Освещает события в этой области с 2014 года.