Яндекс о пользе персонализации в агрегированном поисковом ранжировании

На состоявшейся в апреле в Амстердаме конференции ECIR-2014 (European Conference on Information Retrieval), компания Яндекс представила доклад «Personalizing Aggregated Search» с результатами исследования, посвященного использованию персонализированных характеристик для улучшения качества агрегированного поискового ранжирования.

Агрегированный поиск в настоящее время является широко распространенной техникой генерации страницы поисковой выдачи (SERP). Основная задача агрегированного поиска – подбор подходящих результатов из ряда специализированных вертикальных поисков и ранжирование их в соответствии с индивидуальной релевантностью.

Для полноты выдачи можно использовать множество различных источников информации, начиная с текстовой и заканчивая фото и видео контентом, а также постами в социальных сетях. Исследование, проведенное компанией Яндекс, основывалось на обучении поисковой машины смешиванию алгоритмов, которые отличаются от наборов используемых функций. Таким образом, это не только попытка измерить ценность индивидуального подхода в агрегированном контекстном поиске, но и попытка выяснить, какие именно классы персонализированных характеристик лучше всего работают.

Авторы исследования: Станислав Макеев ([email protected]), Андрей Плахов ([email protected]), Павел Сердюков ([email protected]).

Доклад вызвал большой резонанс, так как ни одна из предыдущих работ не была посвящена оценке ценности индивидуальной релевантности вертикальных результатов поиска для каждого конкретного пользователя. Специалисты Яндекса первыми предложили извлекать подобную информацию из журнала истории поисковых запросов пользователя и использовать ее для формирования различных вариантов агрегированного вертикального поиска.

Главная ценность проделанной работы заключается в том, что она всесторонне рассматривает персонализированную функцию машинного осмысления ранжирования вертикалей, которая значительно улучшает показатели стандартного ранжирования вертикалей. Предлагает три класса персонализированных характеристик, которые должны улучшить ранжирование вертикалей, а также дает сравнительный анализ их влияния. Кроме того, в докладе приводится оценка влияния персонализированного метода на качество вертикального ранжирования для различных типов поисковых запросов и пользователей.

С адаптированным переводом доклада, выполненным специалистами компании Siteclinic, можно ознакомиться здесь.

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.