Ранжирование в Яндексе: как поставить машинное обучение на поток

4 апреля 2013

295

Компания Яндекс продолжила серию публикаций о своем фреймворке FML, который автоматизировал работу с машинным обучением и позволил разработчикам Яндекса использовать его в своих задачах проще и чаще.

Предыдущий пост рассказывал о том, что такое функция ранжирования и как Яндекс научился строить ее, имея на входе лишь достаточно большое число оценок от асессоров и достаточно разнообразный набор факторов документов по большому количеству запросов.

Второй пост посвящен вопросам подбора и частого обновления формулы ранжирования при помощи FML, а также жизненному циклу новых факторов и оценке их эффективности.

Интернет быстро меняется и поисковым компаниям нужно постоянно повышать качество поиска. Разработчики Яндекса непрерывно ищут, какие новые факторы могли бы в этом помочь. Асессоры каждый день оценивают тысячи документов, чтобы оперативно обучать алгоритмы новым видам закономерностей, появляющимся в интернете, и учитывать изменения в полезности уже оцененных ранее документов. Поисковый робот собирает в интернете массу свежих документов, что постоянно меняет средние значения факторов. Значения могут изменяться даже при неизменных документах, так как алгоритмы расчета факторов и их реализация постоянно совершенствуются…

Читать далее на habrahabr.ru

Ранжирование в Яндексе: как поставить машинное обучение на поток

Ранжирование в Яндексе: мониторинг качества внедренных факторов

4 года службе безопасного поиска Яндекса

Как получить лучшие позиции в Google и Bing? Ответы представителей поиска

Сервис Адреса Google интегрировали в платформу Google+

О настоящем и будущем Яндекс.Карт и Яндекс.Пробок

Академия для вебмастеров от Google стала доступна на русском языке