Опубликован обзор основных поведенческих факторов в информационном поиске

28 мая 2012 года на сайте altertrader.com появился фундаментальный русскоязычный обзор, посвященный роли поведенческих факторов в информационном поиске. Авторы работы: Илья Зябрев, Олег Пожарков, Ирина Пожаркова.

Кликовые (поведенческие) факторы - это совокупность характеристик, описывающих поведение пользователя в запросном поиске по отношению к документам, сайтам, запросам и их результатам и пр. Большинство из этих факторов формируются на основе логов пользовательских поисковых сессий. Каждый такой лог содержит следующие данные:

  • Запрос и время запроса
  • Ответ поисковой системы на запрос в виде списка документов, отранжированных в порядке убывания релевантности (выдача).
  • Клики (переходы) на документы из списка и время кликов.

Эти данные группируются по сессиям, соответствующим отрезку времени между началом и концом работы пользователя с поисковой системой. Принципы разбивки на сессии у разных систем сбора таких логов могут отличаться. Обычно сессия заканчивается при отсутствии активных действий в течение заданного промежутка времени. Новая сессия начинается с запроса. Зачастую при построении лога учитывается и регион, в котором находится пользователь.

Вне поисковых сессий сбор данных производится на основе различных инструментов:

  • Собственные системы сбора статистики поисковых компаний (Яндекс.Метрика, Google Analytics), отслеживающие действия пользователей на страницах сайтов, в которые интегрированы соответствующие модули.
  • Сторонние системы сбора статистики (LiveInternet, SpyLog и пр.)
  • Собственные плагины (toolbar), интегрируемые в браузеры (Яндекс.Бар, Google Toolbar) и собирающие данные о действиях конкретного пользователя.
  • Сторонние независимые плагины, интегрируемые в браузеры (Neiron и пр).
  • Собственные браузеры (Google Chrome), также собирающие данные о действиях конкретного пользователя.

Полученных таким образом данных достаточно для построения разнообразных поведенческих факторов.

Узнать подробнее о наиболее часто используемых характеристиках, собранных из множественных литературных источников, и ознакомиться с различными типами факторов документа можно на сайте altertrader.com.

Google Voice с новыми возможностями сортировки контактов

Сервис Google Voice представил новую версию, в которой добавлены две новые группы пользователей — одна позволяет переводить звонок от анонимных абонентов непосредственно в...

Яндекс открыл доступ к контентному API Яндекс.Маркета

Компания Яндекс сообщила о запуске контентного API Яндекс...

SiteAuditor набирает тестеров

Команда разработки программы SiteAuditor открыла набор тестеров для оценки новой мобильной версии приложения

Bing удаляет из выдачи ссылки на пиратский контент только после Google

Как сообщает редакция SearchEngineLand, несмотря на то, что Microsoft чаще других правообладателей обращается в Google с требованием удалить из поисковой выдачи результаты...

Поиск Яндекса подскажет, когда отключат горячую воду летом

Как сообщает команда Яндекса, в поиске появились подсказки относительно сроков профилактики систем городского водоснабжения в крупнейших городах России

Google обновил алгоритм Penguin до версии 1.1

Как сообщило издание SearchEngineLand, поздним вечером в минувшую пятницу, 25 мая 2012 года Google анонсировал первый апдейт алгоритма Penguin до версии 1...