Компания Яндекс продолжила серию публикаций о своем фреймворке FML, который автоматизировал работу с машинным обучением и позволил разработчикам Яндекса использовать его в своих задачах проще и чаще.
Предыдущий пост рассказывал о том, что такое функция ранжирования и как Яндекс научился строить ее, имея на входе лишь достаточно большое число оценок от асессоров и достаточно разнообразный набор факторов документов по большому количеству запросов.
Второй пост посвящен вопросам подбора и частого обновления формулы ранжирования при помощи FML, а также жизненному циклу новых факторов и оценке их эффективности.
Интернет быстро меняется и поисковым компаниям нужно постоянно повышать качество поиска. Разработчики Яндекса непрерывно ищут, какие новые факторы могли бы в этом помочь. Асессоры каждый день оценивают тысячи документов, чтобы оперативно обучать алгоритмы новым видам закономерностей, появляющимся в интернете, и учитывать изменения в полезности уже оцененных ранее документов. Поисковый робот собирает в интернете массу свежих документов, что постоянно меняет средние значения факторов. Значения могут изменяться даже при неизменных документах, так как алгоритмы расчета факторов и их реализация постоянно совершенствуются…
Читать далее на habrahabr.ru