MegaIndex внедряет алгоритм LDA для определения тематик доноров ссылок

Команда сервиса MegaIndex сообщила о внедрении алгоритма LDA для определения тематик доноров ссылок. Знание о тематиках позволит более точно выявлять SEO-ссылки и усовершенствовать алгоритм закупки.

Ранее в MegaIndex уже работало определение тематик сайтов на основе поискового ранжирования, однако технология LDA значительно расширяет возможности для анализа тематик отдельных документов и сайтов, которые плохо ранжируются в результатах поиска.

Суть алгоритма лежит в текстовом анализе сайтов или документов, при котором исследуемый сайт сравнивается с заданной коллекцией. В качестве базовой коллекции были взяты сайты, разбитые по категориям Яндекс Каталога.

Для каждого из исследуемых сайтов рассчитывается тематический вектор, который сравнивается с векторами, посчитанными для сайтов из каждой тематической категории. По самому близкому вектору категории определяется тематика для исследуемого сайта или документа.

Для полного обновления базы внешних ссылок потребуется еще месяц, но уже сейчас данные по размеченным донорам начали появляться в отчетах.

Пример отчета

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета.
Языки: румынский, испанский.
Кредо: Арфы нет, возьмите бубен.