Михаил Сливинский: «Возможности и нюансы SEO в эпоху «multi-armed bandits» Яндекса»

Автор: Михаил Сливинский, руководитель отдела поискового продвижения Wikimart.ru. Исследует алгоритмы ранжирования и антиспама поисковых систем, занимается поиском идей и пишет методологии для повышения эффективности поискового продвижения.

Несколько дней назад, в рамках конференции Optimization-2015. Поисковый маркетинг и продвижение бизнеса в интернете, мы узнали некоторые подробности о новой технологии Яндекса из первых рук. Конечно, было интересно увидеть технологию «многорукого бандита» глазами разработчиков Яндекса.

Мы со Станиславом Поломарём рассказали о своих наблюдениях в выдаче Яндекса, начиная с весны этого года. Станислав написал о возможностях технического обнаружения примесей «многорукого бандита» в поисковой выдаче, а я хотел бы обозначить несколько мыслей о новых возможностях и нюансах SEO.

Вводная: хостовых преференций у кандидатов нет, подмешиваются конкретные документы по конкретным запросам.

Следствия:

1. Не стоит ожидать каннибализации топов крупными сайтами, равно как и консервации выдачи. Небольшие сайты вполне могут рассчитывать на подмес в топ «многоруким бандитом».

2. Хотя и подмешиваются документы, а не сайты целиком, конкретный сайт может «просесть» довольно значительно, если по многим его запросам появится примесь «многорукого бандита» выше по топу. По мере «вымывания» неэффективных документов позиции будут восстанавливаться. Вот как выглядит динамика большого количества коммерческих сайтов в октябре:

На графике по оси ординат отложена средняя дельта по количеству запросов в топ-10 по отношению к предыдущему апдейту. Очевидно, в октябре сайты кластеризовались в группы, совершенно не похожие на летние (я показывал их на SEO Conference 2015 в Казани, тогда мы наблюдали множество разнонаправленных кластеров со значительной амплитудой):

Кластер 5 имеет небольшую позитивную динамику, а 3 и 6 – существенную негативную в течение всего октября. Интересно, что кластеры 3 и 6 имеют худшие поведенческие метрики в сравнении с кластером 5:

Таким образом, даже из наблюдения на уровне хоста видно, что в течение октября сайты с лучшими поведенческими метриками укреплялись в топ-10, а более слабые по поведенческим метрикам – «вымывались» из топ-10. Возможно, в это время технология «многорукого бандита» была отключена, и мы наблюдали процесс накопления поведенческой информации по документам и, как следствие, естественное переранжирование документов.

Вводная: подмешиваются rel+ документы в московской коммерческой выдаче, для которых прогнозная релевантность = полезный документ.

Следствия:

  • Если документы вашего сайта были «подброшены» в топ многоруким бандитом, это означает, что по связке запрос-документ у поиска еще нет достоверной оценки полезности для пользователя. При этом прогнозная релевантность высокая, т.е. документ полезен по этому запросу. Чтобы успеть оправдать доверие поиска нужно попытаться максимизировать качество сниппета и документа.
  •  Например, можно:

    • выгрузить сниппеты и наполнить title/description полезной/важной информацией (цена, наличие, популярные бренды, доставка, акции и пр.)
    • добавить спецсимволы, чтобы сделать сниппеты более привлекательными:

    • дать скидку на товар или бесплатную доставку
    • полезны игровые механики, вовлекающие пользователя и удлиняющие сессию
    •  и т.д.
  • Предполагаю, что на вероятность подмеса документа «многоруким бандитом» могут влиять поведенческое качество документа по другим запросам и качество контента. Если это так, то, значит, все традиционные способы внутренней оптимизации могут повлиять на вероятность подмеса. Было бы интересно это измерить. И, с другой стороны, если документу был дан шанс, но со временем он не оправдал надежд и вылетел из зоны видимости, – нужно сделать «работу над ошибками», благо, в панели вебмастера Яндекса теперь доступна детальная информация о кликах и показах по большому количеству запросов.

Я показал CTR по большой группе неуникальных разнотематичных коммерческих запросов:

К примеру, для бытовой техники, доля уникальных запросов в показах – 88.6%, в кликах – 91.7%. Поэтому я уточнил выгрузку, добавив уникальные запросы и отбросив витальные (бытовая техника):

  • Возможно, в региональной выдаче активность «многорукого бандита» – ниже, либо отсутствует вообще. Это нужно уточнить. Если предположение верно, то признаком попадания хоста в ротацию может быть существенное расхождение тренда видимости по московской и региональной выдаче. Я проверю эту версию и напишу отдельно.
  • Возможно, удастся определять сайты «под бандитом» по наличию группы запросов с большой разнонаправленной амплитудой.
  • Вводная: подтверждено, что имеет место периодическое случайное перемешивание хостов: rand(Host) ∈ [-1;+1].

    Следствия:

    • Нужен монитор активности «многорукого бандита». В период высокой активности позициям документов по запросам нельзя доверять без проведения дополнительных проверок по методу Стаса Поломаря.
    • Стоит регулярно расширять семантику, это повышает шансы увидеть запросы с высокой дисперсией позиций, которая не объясняется другими причинами. Обнаружив, что документ находится в зоне интересов «многорукого бандита», можно попытаться успеть повлиять на решение поисковой машины, улучшив сниппет и документ. О том, как это сделать, я рассказывал выше.

    Вводная: объем «многорукобандитской» примеси ограничен потребностью не уронить текущее качество поиска.

    Это логично, ведь поиск, по сути, балансирует между тактическим риском ухудшить качество поиска и стратегической потребностью найти новые хорошие документы (и улучшить качество, таким образом). Практически это может означать, что самые лучшие документы находятся вне зоны турбулентности; а чем сильнее трясёт, тем больше шансов как на закрепление в топе, так и на вылет.

    Вводная: а какую на самом деле выдачу видят пользователи?

    Уже несколько лет Яндекс экспериментирует с персонализацией выдачи. Я попробовал оценить масштаб персонализации и посмотрел на 22 варианта SERP по запросу «игры для девочек», которые были получены реальными пользователями от Яндекса 25 октября 2015 года в Москве. В этот день не было апдейта ни по версии Яндекса, ни по версии tools.promosite.ru. В точности SERP совпал всего для двух сессий, в 20 остальных случаях мы видим разные варианты SERP. Из 40 сайтов, замеченных в топ-10 Яндекса по этому запросу, лишь 5 стабильно присутствуют в топе (в 16-19 SERP из 22-х), а остальные находятся в ротации (причем на различных позициях).

    А, скажем, по популярному adult-запросу 20 SERP из 23 уникальны, при этом в топ-10 были показаны 70 (!) хостов. А так выглядит распределение по количеству хостов, замеченных в топ-10, для разночастотных запросов (внутри региона в течение суток):

    С моей точки зрения, позиции документов, собираемые оптимизаторами в выдаче, весьма условны. В качестве KPI лучше использовать трафик или производные от него (заказы, GMV,GP). Как техническая метрика позиции интересны и необходимы, поэтому нужно пробовать разные варианты очистки позиций от шума и примесей. Это тема для отдельного большого исследования. Надеюсь, вскоре сможем показать некоторые инструменты для измерений.

    Улучшайте свои сайты, измеряйте себя и конкурентов, ищите и проверяйте гипотезы. Удачи!

    Редактор-переводчик портала Searchengines.ru, работает на сайте с 2010 года. Специализируется на западном интернет-маркетинге, новостях социальных сетей и поисковых систем. Постоянно принимает участие в профильных семинарах и конференциях в качестве журналиста-обозревателя. Языки: английский, французский.