Поиск Mail.ru об исправлении опечаток в поисковых запросах

Команда Поиска Mail.ru продолжила публикацию материалов об обработке и классификации запросов в поиске.

Первый пост рассказывал о том, чем занимаются специалисты отдела обработки запросов Поиска Mail.ru: как они пытаются «понять» пользовательский запрос, как осуществляют подготовку запроса к поиску, приводят его в вид, пригодный для взаимодействия с поисковым индексом, ранжированием, подмесами и прочими компонентами. Второй пост был посвящен обработке и классификации навигационных запросов. В третьей публикации Михаил Долинин, руководитель группы обработки поисковых запросов поиска Mail.ru, рассказал об исправлении опечаток в поисковых запросах.

Михаил считает, что опечатки бывают иногда полезны тем, что веселят читателя, однако, поисковые системы оценить юмора пока не в состоянии, и слова, набранные с ошибками, приводят их в замешательство, что в результате огорчает пользователя. Для предотвращения этих явлений существуют автоматические «исправляторы» опечаток, они же спеллчекеры.

О различных подходах к исправлению опечаток написано уже более чем достаточно, поэтому в своей статье Михаил не стал повторять уже известное, а показал, как написать спеллчекер с нуля — простой, но вполне дееспособный…

Подробнее в блоге Mail.ru на habrahabr.ru

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.