Как Яндекс умно смешивает разные виды ответов

Яндекс рассказал о своей технологии под названием Блендер, которая обеспечивает ранжирование и встраивание блоков с вертикальными поисками в страницу поисковой выдачи Яндекса.

Вертикальные поиски, в некоторых случаях, бывают гораздо эффективнее стандартного веб-поиска. Например, когда пользователю требуется найти информацию определенного типа (картинки, видео). Некоторые запросы подразумевают другие критерии ранжирования: при поиске по товарам важно иметь возможность производить ранжирование по цене, а в поиске по людям необходимо учитывать дополнительные фильтры. Вертикальные поиски также могут предполагать совершенно иные способы взаимодействия с пользователем, как в случае с навигацией по результатам, отмеченным на карте, при поиске ближайшего магазина, кинотеатра или заправки.

Конечно, с таким запросами лучше всего обращаться в специализированные поисковые сервисы Яндекса: Картинки, Видео, Карты, Музыку. Однако это требует от пользователя дополнительных действий: нужно предварительно вбить адрес или выбрать определенный поисковый движок. Ввести запрос в омнибокс браузера и поискать дефолтным движком – наиболее простой и распространенный сценарий. Задача Яндекс.Поиска – предоставить релевантные результаты и встроить вертикали там, где это необходимо.

Но определить, насколько та или иная вертикаль соответствует конкретному запросу не так-то просто. Ведь запрос не всегда полностью отражает потребности пользователя. Проще говоря, нельзя точно узнать, что было у пользователя в голове, когда он этот запрос создавал. Например, пользователь вбил запрос [Гарри Поттер]. Он мог иметь в виду, как серию книг, так и серию фильмов. Сходу определить, хотел ли пользователь почитать книгу, заказать билет в кинотеатр, купить диск, посмотреть фильм онлайн или скачать файл с ним, невозможно. Задача Поиска заключается в том, чтобы определить, какие вертикали соответствуют возможным потребностям и встроить их на страницу выдачи.

Для начала запрос прогоняется через все вертикали. Применяя эвристические алгоритмы, отсекаются потребности, которые имеют наименьшую вероятность для каждой конкретной вертикали. Затем, на основе машинного обучения определяется категория запроса по критерию соответствия конкретным вертикалям. На основе этих категорий появляется возможность предсказывать вероятность того, что вертикаль соответствует запросу…

Читать далее в блоге Яндекса на habrahabr.ru

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.