Мифы и правда о корреляции в SEO

24 января 2018

Анна Бондарь

3610

Ранее в этом месяце Moz ошарашил SEO-сообщество новостью о том, что больше не будет проводить исследование факторов ранжирования Google. В очередном выпуске Whiteboard Friday основатель Moz Рэнд Фишкин рассказал о том, как он относится к корреляционным исследованиям в SEO, из чего становится понятным, почему компания могла принять такое решение.

Автор: Рэнд Фишкин – основатель Moz, признанный эксперт по поисковому маркетингу и SEO, постоянный участник профильных конференций.

В отрасли, где никто наверняка не знает, что нужно для того, чтобы занимать высокие позиции в Google, исследования факторов ранжирования кажутся невероятно заманчивыми. Но верить каждой корреляции, обнаруженной их авторами, может быть опасным, а мудрость заключается в том, чтобы воспринимать эту информацию через призму здоровой критики.

В статье мы рассмотрим распространённые мифы о корреляции, а затем – несколько способов того, как понимать и использовать эти данные.

На протяжении своей работы в SEO вы наверняка видели множество корреляционных исследований, посвящённых факторам ранжирования. Такого рода аналитику предлагают Searchmetrics, Ahrefs, SEMRush и другие крупные SEO-компании. До недавнего времени в их числе был и Moz.

Эти исследования используют в целом схожий формат: берётся большое количество результатов поиска из Google (в рамках одной или нескольких стран) и проводится анализ. В отчёте может говориться примерно следующее: «Мы проанализировали 100 тысяч результатов поиска Google и изучили следующие факторы, чтобы посмотреть, насколько хорошо они коррелируют с более высокими позициями в ранжировании». Полученные результаты предполагают, что страница, оптимизированная под эти факторы, будет ранжироваться выше той страницы, у которой эти факторы отсутствуют или менее выражены.

Корреляция в SEO-исследованиях

Авторы исследований о факторах ранжирования любят использовать диаграммы разброса данных. Им даже необязательно делать именно такую диаграмму, достаточно визуализировать полученные результаты. Затем они могут сказать примерно следующее: «Ок, ссылающиеся корневые домены демонстрируют более сильную корреляцию с более высокими позициями в результатах поиска, на уровне 0,39». Обычно они используют метод корреляционного анализа с помощью формулы Спирмена или Пирсона. Мы не будем углубляться в эти вещи. На самом деле, это не имеет большого значения.

Установленная корреляция означает, что по заданной выборке результатов поиска, определённая метрика предсказывала более высокие или более низкие позиции в ранжировании с таким уровнем постоянства. Идеальной корреляцией будет 1.0.

Давайте, всё же, немного пройдёмся по этому пути. Допустим, посещения сайта имеют корреляцию 0,47 с более высокими позициями в ранжировании. Проблема в том, что это не обязательно фактор ранжирования. По крайней мере, я так считаю. Я не думаю, что чем больше переходов из Google вы получаете, тем выше он вас ранжирует. Скорее, эта корреляция свидетельствует об обратном: чем выше вы ранжируетесь, тем больше трафика получаете.

Таким образом, эти «факторы ранжирования» могут вовсе и не быть ими. Это всего лишь метрики или элементы, по которым исследователи анализировали корреляцию и пытаются показать вам ситуацию в среднем. Но вы должны понимать и воспринимать эту информацию правильно, в противном случае можно сделать неверные выводы.

Что же тогда мифы, а что правда?

Сначала давайте разберёмся с мифами.

Корреляция не говорит нам о том, в каком направлении выявленная связь работает

Из корреляции мы не узнаем, что на что влияет: фактор X на ранжирование или более высокие позиции в ранжировании на фактор X. Рассмотрим ещё один пример – количество репостов в Facebook. Возможна ли ситуация, при которой те результаты, которые ранжируются в Google выше, получают больше репостов в Facebook, поскольку их видит большее количество людей? Я думаю, что вполне возможна. Так ли это на самом деле, мы сейчас сказать не можем.

Тем не менее, мы определённо можем сделать следующий вывод: корреляция не обязательно означает, что репосты в Facebook влияют на результаты поиска Google. Может, это результаты в Google влияют на статистику в Facebook. Также может быть третий фактор, влияющий на обе эти переменные. Наконец, не исключено, что на самом деле между ними нет связи, и это всего лишь совпадение, что маловероятно в данном случае, но всё же возможно.

Корреляция не означает причинность

Корреляция – это скорее намёк на те вещи, которые заслуживают более углублённого изучения. Мы вернёмся к этому вопросу позже.

Корреляция – это интересно

В поисковом алгоритме, который имеет тысячи возможных точек входа, любая метрика с корреляцией на уровне 0,1 и выше – это интересный результат.

Это ничего не доказывает, и не говорит о прямой корреляции, но уже интересно и заслуживает дальнейшего исследования. Это стоит того, чтобы попробовать в этом разобраться; чтобы выдвинуть гипотезы и попытаться их доказать. Это интересно.

Корреляция показывает нам, что делают более успешные сайты и страницы, и чего не делают их менее успешные конкуренты

Иногда это может быть так же интересно, как и то, что на самом деле влияет на ранжирование в Google. Вы можете сказать: «Это ничего не доказывает». Для меня это доказывает, что страницы, получающие больше репостов в Facebook, работают лучше, чем другие страницы.

Меня не волнует, является ли это прямым фактором ранжирования Google или это всего лишь то, что имеет место. Если это происходит в моём пространстве, то это полезная для меня информация, которую я буду использовать, поскольку она предполагает, что мои конкуренты уже это делают, а если я не буду этого делать, то не буду успешным или же не буду настолько успешным, как другие. Поэтому мне интересно, как они это делают и почему.

Ни одно из тех исследований, которые я когда-либо видел, не анализировало поисковые функции

Поэтому, знакомясь с результатами этих исследований, вы должны воспринимать их с точки зрения традиционной органической выдачи, так называемого списка из «10 синих ссылок». Мы не говорим об AdWords и платных результатах, блоках и панелях выдачи Сети знаний, расширенных ответах (featured snippets), результатах поиска по картинкам, видеорезультатах, новостных блоках, Twitter-результатах и подобных вещах.

Корреляция – это не лучшая практика

Это значит, что результаты корреляционных исследований нельзя рассматривать как истину в последней инстанции. Соответственно, списки факторов, ранжированные по степени корреляции, нельзя использовать как руководство к действию.

Низкий коэффициент корреляции не означает, что метрика или тактика не работает

Когда мы провели своё первое исследование факторов ранжирования (в 2005, а может – в 2007 году), мы увидели, что использование ключевого слова в заголовке Title имеет сильную корреляцию с ранжированием – на уровне 0,2 или 0,15. Со временем этот коэффициент становился всё ниже и ниже. Теперь он находится на уровне 0,03, что говорит об очень слабой корреляции.

Что это значит? Это может говорить о двух вещах: 1) что Google стал меньше использовать эту информацию как фактор ранжирования; 2) что между ними никогда не было связи, и это полная случайность, полное совпадение. Может быть и ещё одно объяснение: 3) возможно многие сайты, которые ранжировались в топ-20 или топ-50 результатов поиска, на которые обычно смотрят такие исследования, стали добавлять ключевое слово в заголовок Title, и теперь нет разницы между результатом №1 и №31, поскольку они оба имеют ключевое слово в Title. Поэтому будьте осторожны с этой информацией.

И последнее примечание, возможна и отрицательная корреляция. Например, -0,02. Она означает, что чем меньше этот коэффициент, тем более высокими будут позиции в ранжировании. Опять же, пока это не сильно выраженная отрицательная корреляция, я склонен наблюдать и особо не уделять внимания этому пункту. К примеру, это может быть ключевое слово в метаописании. Сейчас практически у каждого сайта имеются ключевые слова в метаописаниях, так что это определённо не очень крупный фактор.

Для чего хороша корреляция?

В предыдущей части статьи мы рассмотрели мифы, касающиеся корреляции в SEO. Теперь мы попробуем разобраться, как можно с пользой использовать результаты этих исследований.

Определение элементов, которыми обладают более успешные страницы

Если я посмотрю по корреляции и увижу, что многие страницы, имеющие X, ранжируются выше, чем те страницы, у которых этот фактор отсутствует, я обращу на это внимание.

Наблюдение за элементами с течением времени: повышается или понижается их роль с точки зрения корреляции

Например, мы очень внимательно наблюдаем за ссылками, чтобы понять, меняется ли их корреляция с ранжированием Google. Если мы увидим, что коэффициент корреляции значительно упал, мы можем предположить: «Нам снова нужно протестировать роль ссылок». Это будет значить, что пришло время для следующего эксперимента и изучения влияния ссылок. В результате мы сможем понять, действительно ли ссылки начали меньше влиять на ранжирование, или же речь идёт только о снижении корреляции.

Сравнивая наборы результатов поиска, мы можем выявить уникальные атрибуты, которые действительно влияют на ранжирование

Для примера давайте рассмотрим такой показатель, как авторитетность домена (Domain Authority, DA), в двух нишах: новости и фитнес. Как показано на рисунке выше, в новостном сегменте эта метрика будет намного более важной, чем в фитнес-тематике, где мелкие сайты имеют больше шансов на успех.

Или же мы можем увидеть, что в новостном сегменте использование HTTPS не помогает сайту выделиться, поскольку здесь практически все перешли на защищённый протокол. При этом в фитнес-тематике ситуация может быть диаметрально противоположной: это не только позволяет выделить сайт среди других, но и может говорить о том, что его разработчики более качественно делают свою работу.

Анализ показателей по прогностичности

Когда я смотрю на такую метрику, как авторитетность домена, насколько ясно она сообщает мне, в какой степени один домен будет ранжироваться в Google лучше, чем другой? Я могу видеть, что эта цифра является хорошим индикатором. Если она снижается, то авторитетность домена становится для меня менее прогностичной и полезной метрикой. Пару лет назад я делал это с Alexa Rank и SimilarWeb, анализируя метрики трафика и сравнивая, какие из них лучше всего коррелируют с актуальным трафиком.

Определение элементов для тестирования

Если я вижу, что такой фактор, как крупные изображения, встроенные на страницу, которая уже ранжируется в топ-10 Google, имеет коэффициент корреляции, равный 0,61, с изображением из этой страницы, которое ранжируется на первых позициях в результатах поиска по картинкам, то это реально интересно. И знаете, что? Я собираюсь протестировать это, взяв крупные изображения и встроив их на страницы, которые уже ранжируются, чтобы посмотреть, могу ли я получить те результаты в поиске по картинкам, которые мне нужны. Это отличная информация для тестирования.

Вместо заключения

Корреляция в SEO, особенно, что касается факторов ранжирования, может быть очень обманчивой. Я надеюсь, что этот материал поможет вам лучше понять, как нужно и не нужно использовать эти данные.

Источник: Блог Moz

Еще один способ поиска поддоменов в Яндексе с помощью документированных операторов

Мифы и правда о корреляции в SEO

Корреляция в SEO-исследованиях

Что же тогда мифы, а что правда?

Корреляция не говорит нам о том, в каком направлении выявленная связь работает

Корреляция не означает причинность

Корреляция – это интересно

Корреляция показывает нам, что делают более успешные сайты и страницы, и чего не делают их менее успешные конкуренты

Ни одно из тех исследований, которые я когда-либо видел, не анализировало поисковые функции

Корреляция – это не лучшая практика

Низкий коэффициент корреляции не означает, что метрика или тактика не работает

Для чего хороша корреляция?

Определение элементов, которыми обладают более успешные страницы

Наблюдение за элементами с течением времени: повышается или понижается их роль с точки зрения корреляции

Сравнивая наборы результатов поиска, мы можем выявить уникальные атрибуты, которые действительно влияют на ранжирование

Анализ показателей по прогностичности

Определение элементов для тестирования

Вместо заключения

Еще один способ поиска поддоменов в Яндексе с помощью документированных операторов

Как молодому сайту получить качественные бэклинки?

Профилактика проблем сайта при помощи автоматизации

Всё, что нужно знать о mobile-first индексации и её влиянии на SEO

Своя модель атрибуции в Power BI для сквозной аналитики? – Легко!

Стоит ли вкладываться в создание и продвижение одностраничного сайта? Кейс