Ранжирование в Яндексе: как поставить машинное обучение на поток

Компания Яндекс продолжила серию публикаций о своем фреймворке FML, который автоматизировал работу с машинным обучением и позволил разработчикам Яндекса использовать его в своих задачах проще и чаще.

Предыдущий пост рассказывал о том, что такое функция ранжирования и как Яндекс научился строить ее, имея на входе лишь достаточно большое число оценок от асессоров и достаточно разнообразный набор факторов документов по большому количеству запросов.

Второй пост посвящен вопросам подбора и частого обновления формулы ранжирования при помощи FML, а также жизненному циклу новых факторов и оценке их эффективности.

Интернет быстро меняется и поисковым компаниям нужно постоянно повышать качество поиска. Разработчики Яндекса непрерывно ищут, какие новые факторы могли бы в этом помочь. Асессоры каждый день оценивают тысячи документов, чтобы оперативно обучать алгоритмы новым видам закономерностей, появляющимся в интернете, и учитывать изменения в полезности уже оцененных ранее документов. Поисковый робот собирает в интернете массу свежих документов, что постоянно меняет средние значения факторов. Значения могут изменяться даже при неизменных документах, так как алгоритмы расчета факторов и их реализация постоянно совершенствуются…

Читать далее на habrahabr.ru

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.