Яндекс сообщил о запуске новой технологии, позволяющей ранжировать поисковые подсказки таким образом, чтобы они отвечали текущим интересам пользователей. Например, в обычные дни по запросам, начинающимся на «по», людей чаще всего интересует [погода], а в канун 8 марта - [подарки] и [поздравления]. Соответственно, перед 8 марта список подсказок должен выглядеть иначе, чем в другие дни.
Актуальность подсказок зависит от возможности предугадать, о чем люди будут спрашивать завтра. Ежедневно Яндекс обрабатывает сотни миллионов запросов и на основе сложных математических моделей просчитывает востребованность подсказок на следующий день. Чтобы построить прогноз для всех подсказок (а их десятки миллионов) Яндекс использует вычислительные мощности нескольких сотен машин.
Прогноз строится с помощью регрессионного анализа и позволяет вычислить будущее значение величины на основе данных за прошлый период. Для каждого запроса из базы подсказок Яндекс строит кривую, которая отражает, как менялась частота запроса за предшествующий период. Затем система подбирает функцию, которая максимально точно соответствует этой кривой. И по полученной формуле вычисляет, с какой частотой пользователи зададут этот же запрос в ближайшие дни:
На графике видно, что система довольно точно прогнозирует плавные изменения в динамике запросов и немного сглаживает резкие взлеты и падения. Чтобы достичь еще более высокой точности, Яндекс продолжает вести исследования и экспериментировать с разными методами прогнозирования.
Напомним, что актуальные поисковые подсказки появились в поиске Яндекса в августе этого года. Механизм обновления «свежих» поисковых подсказок основан на статистике - если много людей задают один и тот же запрос, он попадает в список подсказок.
Сочетая этот механизм с новой технологией ранжирования поисковых подсказок, основанной на регрессионном анализе, Яндекс помогает своим пользователям сэкономить время - можно не печатать запрос целиком. Поисковая машина сама понимает, какие показать подсказки, предугадывая еще не введенный пользователем запрос.