Исследование данных поискового маршрута для улучшения поиска

Предлагаем вашему вниманию перевод исследования Яндекса о поведенческих факторах, представленного на конференции CIKM 2013 (Бёрлингейм, ноябрь 2013). Исследование посвящено изучению поведения пользователей после перехода на сайт со страницы поиска и анализу того, как эти данные могут влиять на выдачу.

Авторы исследования: Алексей Толстиков ([email protected]), Михаил Шахрай ([email protected]), Глеб Гусев ([email protected]), Павел Сердюков ([email protected]).

Авторский перевод Елены Камской (SiteClinic.ru).

Аннотация

С ростом популярности различных тулбаров увеличивается и важность корректного использования данных о поведении пользователей, которые хранятся в их логах.

Информация о поведении посетителей после перехода на сайт из выдачи (пост-кликах) оказалась очень полезной при изучении пользовательских предпочтений и помогла улучшить текущую систему поиска. Однако вопрос, насколько поведенческие характеристики могут влиять на модель ранжирования, до сих пор окончательно не раскрыт.

Мы провели масштабное исследование целого ряда характеристик поисковых маршрутов в реальных условиях и пришли к выводу, что более глубокое изучение пользовательского опыта задолго до клика по результатам поиска может значительно улучшить существующую модель ранжирования.

1. Введение

С недавнего времени данные о поведении пользователей играют важную роль в персонализации поиска.

Самый известный способ оценки предпочтений и степени удовлетворенности пользователя – это анализ его кликов по результатам поиска. Он дает много неявной информации о предпочтениях пользователей. Но объема и надежности этих данных не всегда достаточно, ведь основная активность проявляется за пределами поисковой выдачи.

С ростом популярности инструментов для браузеров появилась возможность частично компенсировать недостаток информации о пост-кликах за счет данных о просмотренных пользователями страницах, которые хранятся в журналах их тулбаров.

Оказалось, что такой показатель взаимодействия пользователя со страницей, как dwell time (время пребывания юзера на странице по запросу – прим. переводчика), может служить надежным показателем релевантности документа. Но последовательность передвижений посетителя по сайту с целью найти нужную информацию после того, как он перешел с результатов поиска (post-query search trail), до сих пор не изучена как фактор ранжирования страниц, попавших в его маршрут.

Мы предполагаем, что подробный анализ поисковых маршрутов поможет еще больше усовершенствовать поисковую модель, в которой используются всем уже известный dwell time.

В данной статье описывается масштабное исследование различных характеристик поисковых маршрутов, которое является продолжением предыдущих изысканий пользовательских факторов и их влияния на качество поиска…

Читать далее

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.