Построение вектора релевантности согласно формуле BM25

Автор: команда агентства интеллектуального web-маркетинга Darwin Global

На сегодняшний день в интернете существует множество материалов, касающихся эффективного продвижения, информации о факторах ранжирования от представителей поисковых систем. Несмотря на все эти полезные материалы, не стоит забывать о старенькой формуле BM25. Большинство специалистов области SEO проводили исследования и семинары касательно данной темы. Впервые об этом методе расчета Яндекс заявил девять лет назад. После этого доклада последовала массовая активность в познании расчетов формулы BM25.

Углубляться в историю и дублировать популярные источники типа Wikipedia не будем. Важно, что поисковик, к сожалению или счастью, очень ограничен в возможностях. Он может учитывать только то, что будет объективно, универсально и применимо для математического анализа.





И фактически мы получаем «таблицу или список в базе данных», где на основании каждой заполненной ячейки-признака строится вектор релевантности для каждой страницы.

Напомним, что в докладах специалистов все просчеты формулы BM25 на примерах отображали в таблицах Excel.

Наверное, данный материал полезен к прочтению. Но вот как он может помочь на практике? Особенно seo-компаниям, у которых сотни клиентов. Анализ релевантности, согласно существующей формуле, на выходе становится дорогостоящим и трудозатратным.

В рамках выхода функционала сравнения страницы с конкурентами, специалисты Seo Shield внедрили автоматический просчет релевантности по формуле BM25 и вот, что получилось:

1. Отображение информации о ТОП-10 конкурентов из выдачи Яндекс, Google нужной продвигаемой страницы

2. Отображение сравнительной таблицы со страницей конкурента (все контентные составляющие, основанные на формуле BМ25)

3. Расчет оптимального рекомендуемого кол-ва вхождений слов из запросов на странице (в разных зонах)

Помните, конкурируют не сайты, конкурируют страницы! Обращайте внимание на конкурентов и выполняйте только полезные действия, которые отразятся на результатах ваших интернет проектов.

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета.
Языки: румынский, испанский.
Кредо: Арфы нет, возьмите бубен.