На состоявшейся в апреле в Амстердаме конференции ECIR-2014 (European Conference on Information Retrieval), компания Яндекс представила доклад «Personalizing Aggregated Search» с результатами исследования, посвященного использованию персонализированных характеристик для улучшения качества агрегированного поискового ранжирования.
Агрегированный поиск в настоящее время является широко распространенной техникой генерации страницы поисковой выдачи (SERP). Основная задача агрегированного поиска – подбор подходящих результатов из ряда специализированных вертикальных поисков и ранжирование их в соответствии с индивидуальной релевантностью.
Для полноты выдачи можно использовать множество различных источников информации, начиная с текстовой и заканчивая фото и видео контентом, а также постами в социальных сетях. Исследование, проведенное компанией Яндекс, основывалось на обучении поисковой машины смешиванию алгоритмов, которые отличаются от наборов используемых функций. Таким образом, это не только попытка измерить ценность индивидуального подхода в агрегированном контекстном поиске, но и попытка выяснить, какие именно классы персонализированных характеристик лучше всего работают.
Авторы исследования: Станислав Макеев (stasd07@yandex-team.ru), Андрей Плахов (finder@yandex-team.ru), Павел Сердюков (pavse@yandex-team.ru).
Доклад вызвал большой резонанс, так как ни одна из предыдущих работ не была посвящена оценке ценности индивидуальной релевантности вертикальных результатов поиска для каждого конкретного пользователя. Специалисты Яндекса первыми предложили извлекать подобную информацию из журнала истории поисковых запросов пользователя и использовать ее для формирования различных вариантов агрегированного вертикального поиска.
Главная ценность проделанной работы заключается в том, что она всесторонне рассматривает персонализированную функцию машинного осмысления ранжирования вертикалей, которая значительно улучшает показатели стандартного ранжирования вертикалей. Предлагает три класса персонализированных характеристик, которые должны улучшить ранжирование вертикалей, а также дает сравнительный анализ их влияния. Кроме того, в докладе приводится оценка влияния персонализированного метода на качество вертикального ранжирования для различных типов поисковых запросов и пользователей.
С адаптированным переводом доклада, выполненным специалистами компании Siteclinic, можно ознакомиться здесь.