Предлагаем вашему вниманию перевод исследования Яндекса о поведенческих факторах, представленного на конференции CIKM 2013 (Бёрлингейм, ноябрь 2013). Исследование посвящено изучению поведения пользователей после перехода на сайт со страницы поиска и анализу того, как эти данные могут влиять на выдачу.
Авторы исследования: Алексей Толстиков (atolstikov@yandex-team.ru), Михаил Шахрай (smikler@yandex-team.ru), Глеб Гусев (gleb57@yandex-team.ru), Павел Сердюков (pavser@yandex-team.ru).
Авторский перевод Елены Камской (SiteClinic.ru).
Аннотация
С ростом популярности различных тулбаров увеличивается и важность корректного использования данных о поведении пользователей, которые хранятся в их логах.
Информация о поведении посетителей после перехода на сайт из выдачи (пост-кликах) оказалась очень полезной при изучении пользовательских предпочтений и помогла улучшить текущую систему поиска. Однако вопрос, насколько поведенческие характеристики могут влиять на модель ранжирования, до сих пор окончательно не раскрыт.
Мы провели масштабное исследование целого ряда характеристик поисковых маршрутов в реальных условиях и пришли к выводу, что более глубокое изучение пользовательского опыта задолго до клика по результатам поиска может значительно улучшить существующую модель ранжирования.
1. Введение
С недавнего времени данные о поведении пользователей играют важную роль в персонализации поиска.
Самый известный способ оценки предпочтений и степени удовлетворенности пользователя – это анализ его кликов по результатам поиска. Он дает много неявной информации о предпочтениях пользователей. Но объема и надежности этих данных не всегда достаточно, ведь основная активность проявляется за пределами поисковой выдачи.
С ростом популярности инструментов для браузеров появилась возможность частично компенсировать недостаток информации о пост-кликах за счет данных о просмотренных пользователями страницах, которые хранятся в журналах их тулбаров.
Оказалось, что такой показатель взаимодействия пользователя со страницей, как dwell time (время пребывания юзера на странице по запросу – прим. переводчика), может служить надежным показателем релевантности документа. Но последовательность передвижений посетителя по сайту с целью найти нужную информацию после того, как он перешел с результатов поиска (post-query search trail), до сих пор не изучена как фактор ранжирования страниц, попавших в его маршрут.
Мы предполагаем, что подробный анализ поисковых маршрутов поможет еще больше усовершенствовать поисковую модель, в которой используются всем уже известный dwell time.
В данной статье описывается масштабное исследование различных характеристик поисковых маршрутов, которое является продолжением предыдущих изысканий пользовательских факторов и их влияния на качество поиска…