Команда Поиска Mail.ru начала публикацию материалов об обработке и классификации запросов.
Чем занимаются специалисты отдела обработки запросов Поиска Mail.ru? Они пытаются «понять» пользовательский запрос - осуществляют подготовку запроса к поиску, приводят его в вид, пригодный для взаимодействия с поисковым индексом, ранжированием, подмесами и прочими компонентами.
Одна из областей работы отдела по обработке запросов – это парсер запросов.
На рисунке изображена структура сервиса поиска. Участки системы, в которых работает отдел обработки запросов, выделены розовым цветом.
Фронтенд предоставляет пользователю форму для ввода запроса, по готовности запрос пересылается на MetaSM, где попадает в Query Parser, занимающийся его разбором и классификацией. Затем запрос, обогащенный дополнительными параметрами, в виде дерева передается на бэкенды, где на основе этого дерева из индекса извлекаются соответствующие запросу данные, передаваемые на окончательную обработку ранжированию.
До того, как запрос передан в систему поиска, он обрабатывается еще двумя компонентами. Первый - саджесты, сервис, который реагирует практически на каждое нажатие клавиши, предлагая подходящие, по его мнению, варианты продолжения запроса. Второй - спеллчекер, которому запрос передается после отправки: он анализирует запрос на предмет опечаток.
Навигационная база изображена отдельно исходя из функционала; на самом деле она интегрирована в парсер запросов…
Читать далее в блоге Mail.ru Group на Habrahabr.ru