Исследование данных поискового маршрута для улучшения поиска

Предлагаем вашему вниманию перевод исследования Яндекса о поведенческих факторах, представленного на конференции CIKM 2013 (Бёрлингейм, ноябрь 2013). Исследование посвящено изучению поведения пользователей после перехода на сайт со страницы поиска и анализу того, как эти данные могут влиять на выдачу.

Авторы исследования: Алексей Толстиков (atolstikov@yandex-team.ru), Михаил Шахрай (smikler@yandex-team.ru), Глеб Гусев (gleb57@yandex-team.ru), Павел Сердюков (pavser@yandex-team.ru).
Авторский перевод Елены Камской (SiteClinic.ru).

Аннотация
С ростом популярности различных тулбаров увеличивается и важность корректного использования данных о поведении пользователей, которые хранятся в их логах.

Информация о поведении посетителей после перехода на сайт из выдачи (пост-кликах) оказалась очень полезной при изучении пользовательских предпочтений и помогла улучшить текущую систему поиска. Однако вопрос, насколько поведенческие характеристики могут влиять на модель ранжирования, до сих пор окончательно не раскрыт.

Мы провели масштабное исследование целого ряда характеристик поисковых маршрутов в реальных условиях и пришли к выводу, что более глубокое изучение пользовательского опыта задолго до клика по результатам поиска может значительно улучшить существующую модель ранжирования.

1. Введение
С недавнего времени данные о поведении пользователей играют важную роль в персонализации поиска.

Самый известный способ оценки предпочтений и степени удовлетворенности пользователя – это анализ его кликов по результатам поиска. Он дает много неявной информации о предпочтениях пользователей. Но объема и надежности этих данных не всегда достаточно, ведь основная активность проявляется за пределами поисковой выдачи.

С ростом популярности инструментов для браузеров появилась возможность частично компенсировать недостаток информации о пост-кликах за счет данных о просмотренных пользователями страницах, которые хранятся в журналах их тулбаров.

Оказалось, что такой показатель взаимодействия пользователя со страницей, как dwell time (время пребывания юзера на странице по запросу – прим. переводчика), может служить надежным показателем релевантности документа. Но последовательность передвижений посетителя по сайту с целью найти нужную информацию после того, как он перешел с результатов поиска (post-query search trail), до сих пор не изучена как фактор ранжирования страниц, попавших в его маршрут.

Мы предполагаем, что подробный анализ поисковых маршрутов поможет еще больше усовершенствовать поисковую модель, в которой используются всем уже известный dwell time.

В данной статье описывается масштабное исследование различных характеристик поисковых маршрутов, которое является продолжением предыдущих изысканий пользовательских факторов и их влияния на качество поиска…

Читать далее

Google покупает компанию-разработчика искусственного интеллекта DeepMind

Google готовится приобрести стартап DeepMind. Компания, базируется в Лондоне и занимается разработками в области систем искусственного интеллекта

Яндекс обновил Панорамы на Яндекс.Картах и позволил встраивать их на сторонние ресурсы

Команда Яндекс.Карт сообщила о существенном обновлении сервиса Панорамы, а также о появлении возможности встраивать панорамы городов на сторонние сайты - чтобы показать...

34% результатов выдачи Google содержат визуальную информацию в сниппетах

34% результатов выдачи Google, содержат визуальную информацию – графические изображения и другие элементы расширенных сниппетов

Поиск Mail.ru научился искать по мобильным приложениям

Контент мобильных приложений появился в SERP десктопного Поиска@Mail.ru

Готовим сайт к отмене ссылок

Когда в декабре Яндекс сообщил о грядущей отмене ссылочного ранжирования, очень многие стали предполагать, что вместо ссылок будут считаться переходы по ссылкам

Amazon запатентовал систему доставки товаров до заказа

Amazon.com запатентовала новую систему доставки товаров, которая предугадает желания покупателя, чем существенно сэкономит время на формирование заказа и его доставку