Автор: Рэнд Фишкин – основатель Moz, признанный эксперт по поисковому маркетингу и SEO, постоянный участник профильных конференций.

В отрасли, где никто наверняка не знает, что нужно для того, чтобы занимать высокие позиции в Google, исследования факторов ранжирования кажутся невероятно заманчивыми. Но верить каждой корреляции, обнаруженной их авторами, может быть опасным, а мудрость заключается в том, чтобы воспринимать эту информацию через призму здоровой критики.

В статье мы рассмотрим распространённые мифы о корреляции, а затем – несколько способов того, как понимать и использовать эти данные.

На протяжении своей работы в SEO вы наверняка видели множество корреляционных исследований, посвящённых факторам ранжирования. Такого рода аналитику предлагают Searchmetrics, Ahrefs, SEMRush и другие крупные SEO-компании. До недавнего времени в их числе был и Moz.

Эти исследования используют в целом схожий формат: берётся большое количество результатов поиска из Google (в рамках одной или нескольких стран) и проводится анализ. В отчёте может говориться примерно следующее: «Мы проанализировали 100 тысяч результатов поиска Google и изучили следующие факторы, чтобы посмотреть, насколько хорошо они коррелируют с более высокими позициями в ранжировании». Полученные результаты предполагают, что страница, оптимизированная под эти факторы, будет ранжироваться выше той страницы, у которой эти факторы отсутствуют или менее выражены.

Корреляция в SEO-исследованиях

Авторы исследований о факторах ранжирования любят использовать диаграммы разброса данных. Им даже необязательно делать именно такую диаграмму, достаточно визуализировать полученные результаты. Затем они могут сказать примерно следующее: «Ок, ссылающиеся корневые домены демонстрируют более сильную корреляцию с более высокими позициями в результатах поиска, на уровне 0,39». Обычно они используют метод корреляционного анализа с помощью формулы  Спирмена или Пирсона. Мы не будем углубляться в эти вещи. На самом деле, это не имеет большого значения.

Установленная корреляция означает, что по заданной выборке результатов поиска, определённая метрика предсказывала более высокие или более низкие позиции в ранжировании с таким уровнем постоянства. Идеальной корреляцией будет 1.0.

Давайте, всё же, немного пройдёмся по этому пути. Допустим, посещения сайта имеют корреляцию 0,47 с более высокими позициями в ранжировании. Проблема в том, что это не обязательно фактор ранжирования. По крайней мере, я так считаю. Я не думаю, что чем больше переходов из Google вы получаете, тем выше он вас ранжирует. Скорее, эта корреляция свидетельствует об обратном: чем выше вы ранжируетесь, тем больше трафика получаете.

Таким образом, эти «факторы ранжирования» могут вовсе и не быть ими. Это всего лишь метрики или элементы, по которым исследователи анализировали корреляцию и пытаются показать вам ситуацию в среднем. Но вы должны понимать и воспринимать эту информацию правильно, в противном случае можно сделать неверные выводы.

Что же тогда мифы, а что правда?

Сначала давайте разберёмся с мифами.

  1. Корреляция не говорит нам о том, в каком направлении выявленная связь работает

Из корреляции мы не узнаем, что на что влияет: фактор X на ранжирование или более высокие позиции в ранжировании на фактор X. Рассмотрим ещё один пример – количество репостов в Facebook. Возможна ли ситуация, при которой те результаты, которые ранжируются в Google выше, получают больше репостов в Facebook, поскольку их видит большее количество людей? Я думаю, что вполне возможна. Так ли это на самом деле, мы сейчас сказать не можем.

Тем не менее, мы определённо можем сделать следующий вывод: корреляция не обязательно означает, что репосты в Facebook влияют на результаты поиска Google. Может, это результаты в Google влияют на статистику в Facebook. Также может быть третий фактор, влияющий на обе эти переменные. Наконец, не исключено, что на самом деле между ними нет связи, и это всего лишь совпадение, что маловероятно в данном случае, но всё же возможно.

  1. Корреляция не означает причинность

Корреляция – это скорее намёк на те вещи, которые заслуживают более углублённого изучения. Мы вернёмся к этому вопросу позже.

  1. Корреляция – это интересно

В поисковом алгоритме, который имеет тысячи возможных точек входа, любая метрика с корреляцией на уровне 0,1 и выше – это интересный результат.

Это ничего не доказывает, и не говорит о прямой корреляции, но уже интересно и заслуживает дальнейшего исследования. Это стоит того, чтобы попробовать в этом разобраться; чтобы выдвинуть гипотезы и попытаться их доказать. Это интересно.

  1. Корреляция показывает нам, что делают более успешные сайты и страницы, и чего не делают их менее успешные конкуренты

Иногда это может быть так же интересно, как и то, что на самом деле влияет на ранжирование в Google. Вы можете сказать: «Это ничего не доказывает».  Для меня это доказывает, что страницы, получающие больше репостов в Facebook, работают лучше, чем другие страницы.

Меня не волнует, является ли это прямым фактором ранжирования Google или это всего лишь то, что имеет место. Если это происходит в моём пространстве, то это полезная для меня информация, которую я буду использовать, поскольку она предполагает, что мои конкуренты уже это делают, а если я не буду этого делать, то не буду успешным или же не буду настолько успешным, как другие. Поэтому мне интересно, как они это делают и почему.

  1. Ни одно из тех исследований, которые я когда-либо видел, не анализировало поисковые функции

Поэтому, знакомясь с результатами этих исследований, вы должны воспринимать их с точки зрения традиционной органической выдачи, так называемого списка из «10 синих ссылок». Мы не говорим об AdWords и платных результатах, блоках и панелях выдачи Сети знаний, расширенных ответах (featured snippets), результатах поиска по картинкам, видеорезультатах, новостных блоках, Twitter-результатах и подобных вещах.

  1. Корреляция – это не лучшая практика

Это значит, что результаты корреляционных исследований нельзя рассматривать как истину в последней инстанции. Соответственно, списки факторов, ранжированные по степени корреляции, нельзя использовать как руководство к действию.

  1. Низкий коэффициент корреляции не означает, что метрика или тактика не работает

Когда мы провели своё первое исследование факторов ранжирования (в 2005, а может – в 2007 году), мы увидели, что использование ключевого слова в заголовке Title имеет сильную корреляцию с ранжированием – на уровне 0,2 или 0,15. Со временем этот коэффициент становился всё ниже и ниже. Теперь он находится на уровне 0,03, что говорит об очень слабой корреляции.

Что это значит? Это может говорить о двух вещах: 1) что Google стал меньше использовать эту информацию как фактор ранжирования; 2) что между ними никогда не было связи, и это полная случайность, полное совпадение. Может быть и ещё одно объяснение: 3) возможно многие сайты, которые ранжировались в топ-20 или топ-50 результатов поиска, на которые обычно смотрят такие исследования, стали добавлять ключевое слово в заголовок Title, и теперь нет разницы между результатом №1 и №31, поскольку они оба имеют ключевое слово в Title. Поэтому будьте осторожны с этой информацией.

И последнее примечание, возможна и отрицательная корреляция. Например, -0,02. Она означает, что чем меньше этот коэффициент, тем более высокими будут позиции в ранжировании. Опять же, пока это не сильно выраженная отрицательная корреляция, я склонен наблюдать и особо не уделять внимания этому пункту. К примеру, это может быть ключевое слово в метаописании. Сейчас практически у каждого сайта имеются ключевые слова в метаописаниях, так что это определённо не очень крупный фактор.

Для чего хороша корреляция?

В предыдущей части статьи мы рассмотрели мифы, касающиеся корреляции в SEO. Теперь мы попробуем разобраться, как можно с пользой использовать результаты этих исследований.

  1. Определение элементов, которыми обладают более успешные страницы

Если я посмотрю по корреляции и увижу, что многие страницы, имеющие X, ранжируются выше, чем те страницы, у которых этот фактор отсутствует, я обращу на это внимание.

  1. Наблюдение за элементами с течением времени: повышается или понижается их роль с точки зрения корреляции

Например, мы очень внимательно наблюдаем за ссылками, чтобы понять, меняется ли их корреляция с ранжированием Google. Если мы увидим, что коэффициент корреляции значительно упал, мы можем предположить: «Нам снова нужно протестировать роль ссылок». Это будет значить, что пришло время для следующего эксперимента и изучения влияния ссылок. В результате мы сможем понять, действительно ли ссылки начали меньше влиять на ранжирование, или же речь идёт только о снижении корреляции.

  1. Сравнивая наборы результатов поиска, мы можем выявить уникальные атрибуты, которые действительно влияют на ранжирование

Для примера давайте рассмотрим такой показатель, как авторитетность домена (Domain Authority, DA), в двух нишах: новости и фитнес. Как показано на рисунке выше, в новостном сегменте эта метрика будет намного более важной, чем в фитнес-тематике, где мелкие сайты имеют больше шансов на успех.

Или же мы можем увидеть, что в новостном сегменте использование HTTPS не помогает сайту выделиться, поскольку здесь практически все перешли на защищённый протокол. При этом в фитнес-тематике ситуация может быть диаметрально противоположной: это не только позволяет выделить сайт среди других, но и может говорить о том, что его разработчики более качественно делают свою работу.

  1. Анализ показателей по прогностичности

Когда я смотрю на такую метрику, как авторитетность домена, насколько ясно она сообщает мне, в какой степени один домен будет ранжироваться в Google лучше, чем другой? Я могу видеть, что эта цифра является хорошим индикатором. Если она снижается, то авторитетность домена становится для меня менее прогностичной и полезной метрикой. Пару лет назад я делал это с Alexa Rank и SimilarWeb, анализируя метрики трафика и сравнивая, какие из них лучше всего коррелируют с актуальным трафиком.

  1. Определение элементов для тестирования

Если я вижу, что такой фактор, как крупные изображения, встроенные на страницу, которая уже ранжируется в топ-10 Google, имеет коэффициент корреляции, равный 0,61, с изображением из этой страницы, которое ранжируется на первых позициях в результатах поиска по картинкам, то это реально интересно. И знаете, что? Я собираюсь протестировать это, взяв крупные изображения и встроив их на страницы, которые уже ранжируются, чтобы посмотреть, могу ли я получить те результаты в поиске по картинкам, которые мне нужны. Это отличная информация для тестирования.

Вместо заключения

Корреляция в SEO, особенно, что касается факторов ранжирования, может быть очень обманчивой. Я надеюсь, что этот материал поможет вам лучше понять, как нужно и не нужно использовать эти данные.

ИСТОЧНИКБлог Moz
Редактор-переводчик. Специализируется на западном интернет-маркетинге и SEO. Освещает события в этой области с 2014 года.