Компания Яндекс опубликовала официальный ответ на критику пользователей за недостаточное освещение в Яндекс.Новостях антикоррупционных митингов, которые прошли в нескольких городах России 26 марта.
В компании объяснили, что сюжеты о митингах собирались, но их вес был слишком мал для попадания в топ-5, так как о событии не писали крупнейшие информагентства. Яндекс также отвергает обвинения в ручном вмешательстве в составление рейтингов.
«Для большой темы о митингах, прошедших по всей России, было сформировано несколько сюжетов, которые касались самых разных аспектов — от оценки количества участников в Москве до задержаний во Владивостоке. Дальше автоматически оценивается вес каждого сюжета. Для этого используется много факторов — состав источников, плотность потока информации, время публикации сообщений, вес других сюжетов на ту же тему. Сюжеты ранжируются по весу, первые пять попадают на главную страницу «Яндекса». Топ обновляется и, соответственно, изменяется — вчера это происходило каждые три-четыре минуты.
В момент начала акции — она стартовала на Дальнем Востоке — событие освещали далеко не все СМИ. В результате в первой половине дня сюжеты формировались лишь из сообщений небольших источников, и некоторое время, примерно до 12:15 по Москве, их общего веса не хватало, чтобы вынести тему в топ-5».
Представители Яндекса отмечают, что другие темы попадали в топ из-за того, что на них решили отреагировать почти все издания. Кроме того, к некоторым темам могла применяться особенная оптимизация наподобие поисковой.
Одной из крупнейших проблем для выхода новостей о митингах в топ представители Яндекса назвали изменившийся состав источников: с 1 января 2017 года новостные агрегаторы обязаны транслировать только сообщения зарегистрированных СМИ, в остальных случаях компании придется нести ответственность за перепечатанные материалы. Кроме того, возможно, Яндекс.Новости сработали «недостаточно оперативно» из-за проблем с объединением новостей из разных регионов в один сюжет:
«Мы признаем, что вчера Яндекс.Новости отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты - в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса. Точно так же алгоритм срабатывает, когда есть много новостей про ДТП с разными людьми в разных городах. Он полагает, что это разные события, и не объединяет их в общий сюжет».
Напомним, Яндекс.Новости подверглись масштабной критике со стороны интернет-сообщества за игнорирование темы антикоррупционных протестов.