Практическое использование текстового анализа

Алексей Чекушин рассказывает о механике работы текстового анализатора и приводит три самых часто возникающих кейса при его использовании

Ранее я неоднократно писал про текстовый анализ и его роль в современной схеме оптимизации. Пришло время рассмотреть практические аспекты его использования.

Наблюдая за работой оптимизаторов, я замечаю, что многие из них воспринимают текстовый анализатор как систему автоматической генерации ТЗ c использованием ctrl+c и ctrl+v для вставки. Это неправильно. Анализатор – это инструмент, который позволяет проанализировать ТОП за оптимизатора, за секунды или минуты проделав расчеты, которые человек просто не в состоянии выполнить у себя в уме. И задача оптимизатора - не просто вставить результат в ТЗ копирайтеру, а осмыслить его и понять, как нужно оптимизировать свою страницу.

Сегодня будем разбирать как правильно интерпретировать результат анализатора и применять его в своей работе.

Как работает текстовый анализ

Чтобы правильно понимать результат текстового анализа, необходимо знать как появляются цифры в его результате и что они означают. Вот как выглядит типичный результат анализа:

Chekushin_1

Система разбирает запросы на элементарные вхождения (слова, пары слов в различных вариациях, тройки слов, и т.д.), анализирует их вхождения в различных словоформах, в различных зонах документа и выдает некие «оптимальные» значения. Давайте посмотрим, как они получаются.

Рассмотрим простой пример. Возьмем запрос [пластиковые окна] и посчитаем сколько точных вхождений пластиковые окна содержится на каждой странице из топ-10 внутри тега <body> (без дробления на под-зоны).

Chekushin_2

Взглянув на эту картинку пристальным взглядом, можно прикинуть, что для попадания в ТОП-10 нам нужно сделать от 8 до 13 вхождений. Может быть, чуть расширив границы диапазона в большую или меньшую сторону, но точно не 30 и не 2. Закономерность четко прослеживается, и мы ее понимаем. Обратите внимание, что отсутствует результат на шестой позиции. Это потому, что там находится страница другого типа – внутренняя. Почему мы разбираем отдельно главные и внутренние страницы – будет рассказано в одном из примеров.

Рассмотрим другой запрос – [купить пластиковые окна]:

Chekushin_3

Уже гораздо интереснее, правда? Явно, что какая-то очевидная закономерность отсутствует. Логичным предположением будет отбросить явно выбивающиеся (мы не знаем почему они там) из общего тренда значения. Именно это автоматически делает анализатор. Например, мы можем исключить из рассмотрения 1 и 6 значения, как очень низкие, и 5 – как очень высокое. Та цифра, которую вам отдает анализатор – это «середина» данного диапазона. Середина в кавычках, так как алгоритм чуть более сложный. Но в целом смысл такой.

Наконец, мы определились с диапазонами допустимых значений. Переходим к более сложному вопросу – а как определить диапазоны, если у нас есть несколько запросов?

Рассмотрим, опять же, на примере:

Chekushin_4

В данном случае у нас есть запросы [пластиковые окна] и [купить пластиковые окна]. Необходимо понять, сколько нам можно сделать на странице точных вхождений пластиковые окна. Для этого мы последовательно вычисляем диапазоны допустимых значений для каждого запроса в отдельности, а затем накладываем их друг на друга. Результат наложения – это и будет допустимый диапазон значений для двух запросов. Аналогичным образом это работает и для множества запросов.

Я разобрал самый простой и самый примитивный пример. Анализатор проделывает это для всех возможных вхождений, считает их независимо для всех зон (отдельно точные и словоформы), затем пересекает диапазоны по разным зонам и, наконец, высчитывает вложения запросов друг в друга. (например «окна» будут частью «пластиковые окна», а те, в свою очередь, частью «купить пластиковые окна»).

Примеры текстового анализа

1-й пример. Структура страницы

Текстовый анализ может многое сказать о структуре контента в ТОПе. Например, вот результат анализа по запросу [дизельные генераторы]. Ограничимся при этом внутренними страницами:

Chekushin_5

Итак, что мы видим?

1) Видим достаточно объемный текст (225 слов – это порядка 1,5 тыс. символов).

2) Видим большой объем «фрагментов» с относительно малым числом вхождений.

3) Видим большое число вхождений в тегах <a>. Особенно в словоформах ([дизельный генератор]).

Это – типичные признаки страницы листинг товаров + SEO текст. Давайте посмотрим, как устроена типичная страница в ТОПе:

Chekushin_6

Мы видим каталог генераторов с вхождением «дизельный генератор» в тегах <a>. Это и есть те самые вхождения. Одновременно, внизу расположен SEO-текст с вхождениями (выделено красным).

Chekushin_7

Именно такую структуру будет оптимально сделать для нашей продвигаемой страницы. Обратите внимание, что не обязательно придерживаться указанных в анализаторе значений. Это – середина диапазона допустимых значений, но никак не единственно правильное решение.

2-й пример. Оптимизация главной и внутренних страниц

Есть ряд запросов, по которым в топе стоят два различных типа страниц – главная и внутренняя. Посмотрим, чем они могут отличаться. Для этого рассмотрим топ, в котором есть оба типа примерно поровну. Запрос – [такси домодедово]:

Chekushin_8

Здесь мы видим довольно типичную ситуацию, когда присутствующие в топе внутренние страницы практически не обладают вхождениями в seo-тексте. Иногда он вообще отсутствует для внутренних страниц, там оптимизация размещается во фрагментах и/или в каталоге продукции.

Но, это не всегда работает так. Вот смежный запрос из данной тематики – [такси аэропорт]. Здесь оптимизация главных и внутренних страниц весьма похожа:

 

Chekushin_9

Вывод здесь простой – не нужно придерживаться шаблонных мнений о методах оптимизации главной и внутренней страниц. Всегда вначале обращайте внимание, какие закономерности есть в ТОПу именно по вашим запросам.

3-й пример. Низкоконкурентные запросы

Рассмотрим запрос [отели болгарии 4 звезды все включено первая линия]. Это длинный 8-мисловный запрос, который присутствует в подсказочнике и имеет хорошую частотность. Давайте посмотрим на результат текстового анализатора для него:

Chekushin_10

Что должен сказать оптимизатор глядя на эту таблицу? Что для этого запроса не нужно точного вхождения? Давайте посмотрим, почему так получилось:

Chekushin_11

Как видим, в ТОПе просто отсутствуют страницы, которые были бы полностью релевантны данному запросу. Ближе всех подобрался hotels.turizm.ru, но у него нет «все включено». Что означает такой результат анализа? Что мы можем не делать вхождения? Нет, совсем наоборот. Если мы сделаем подходящую страницу, и разместим на ней все слова запроса в правильном порядке – скорее всего мы сможем попасть не просто в ТОП-10, а забраться высоко внутри него. Каждый раз когда мы видим «слабый» результат в таблице текстового анализатора, это повод задуматься, может быть мы можем сделать лучше кого-то.

Вместо заключения

Сегодня я разобрал механику работы анализатора и привел три самых часто возникающих кейса при его использовании. Мой основной посыл, который я хочу еще раз повторить – не «генерируйте ТЗ». Используйте текстовый анализатор именно как инструмент анализа и обязательно включайте мозг. Тогда ваши сайты будут в ТОПе, а волосы – мягкими и шелковистыми.

Все примеры выполнены при помощи текстового анализатора JustMagic. Его можно попробовать самому (онлайн, бесплатно, c регистрацией, но без смс).
preview Особенности регионального ранжирования в Яндексе.  Региональность сайта

Особенности регионального ранжирования в Яндексе. Региональность сайта

В первой части статьи мы поговорили о региональности поисковой выдачи...
preview 8 базовых подходов к работе с Google Analytics для продвижения онлайн-стартапа

8 базовых подходов к работе с Google Analytics для продвижения онлайн-стартапа

В статье перечислены 8 нестандартных подходов к работе с базовым функционалом Google Analytics, которые предоставят владельцу проекта возможность собирать, обрабатывать и...
preview Long-tail запросы — насколько они длинные, и как их найти?

Long-tail запросы — насколько они длинные, и как их найти?

Каждый SEO-специалист знает о long-tail запросах (они же ключевики с «длинным хвостом»). Такие запросы важны, и любой сайт получит прибыль, если использует их правильно
preview Все, что вам нужно знать о веб-вирусах

Все, что вам нужно знать о веб-вирусах

Если спросить у посетителей, веб-мастеров, веб-разработчиков и представителей хостинг-компаний, что такое вирус на сайте, то, скорее всего, каждый даст свое собственное...
preview 7 глобальных SEO-трендов, с которыми столкнётся e-commerce в 2016 году

7 глобальных SEO-трендов, с которыми столкнётся e-commerce в 2016 году

Эволюция технологий и стратегий продвижения, новые способы измерения показателей, развитие направления технического SEO – эти аспекты сегодня выходят на первый план и заметно...
preview Особенности регионального ранжирования в Яндексе. Региональность поисковой выдачи

Особенности регионального ранжирования в Яндексе. Региональность поисковой выдачи

Сергей Людкевич о способе проверки запроса на геонезависимость, который не зависит от проделок «многорукого бандита», а также других вещей, искажающих органическую выдачу