Команда Поиска Mail.ru продолжила публикацию материалов об обработке и классификации запросов в поиске.
Первый пост рассказывал о том, чем занимаются специалисты отдела обработки запросов Поиска Mail.ru: как они пытаются «понять» пользовательский запрос, как осуществляют подготовку запроса к поиску, приводят его в вид, пригодный для взаимодействия с поисковым индексом, ранжированием, подмесами и прочими компонентами. Второй пост был посвящен обработке и классификации навигационных запросов. В третьей публикации Михаил Долинин, руководитель группы обработки поисковых запросов поиска Mail.ru, рассказал об исправлении опечаток в поисковых запросах.
Михаил считает, что опечатки бывают иногда полезны тем, что веселят читателя, однако, поисковые системы оценить юмора пока не в состоянии, и слова, набранные с ошибками, приводят их в замешательство, что в результате огорчает пользователя. Для предотвращения этих явлений существуют автоматические «исправляторы» опечаток, они же спеллчекеры.
О различных подходах к исправлению опечаток написано уже более чем достаточно, поэтому в своей статье Михаил не стал повторять уже известное, а показал, как написать спеллчекер с нуля - простой, но вполне дееспособный…
Подробнее в блоге Mail.ru на habrahabr.ru