Статистика запросов по теме поисковые системы

Исследование проводилось в июне 2002. Цель — установить количественные соотношения между “частыми” и “редкими” словами в запросах пользователей (для примера выбрана тематика “поисковые системы”) и выбрать возможные пути поисковой раскрутки по данной тематике.

Статистика получена из данных Яндекс-Директа по запросу поисковая. Запрос разделен на 3 подзапроса (из-за ограничений на число выдаваемых страниц в Я-Д), по которым получены полные данные о спрашиваемости. Стоп-слова, которые исключались из рассмотрения: “по на и к о в про для с а об от при” (больше не понадобилось).

Запрос к Яндекс-Директ: поисковая
Всего запросов: 25225 в месяц.
Всего вариантов запросов: 6143.

Число слов в запросе

На следующем рисунке представлены: относительное количество запросов и относительная спрашиваемость для запросов с разным числом слов.

Видно, что и количество, и спрашиваемость однословных запросов малы. Дело в том, что слово “поисковые” входит в состав различных фраз с существительными (поскольку само оно — прилагательное) и мало используется отдельно. В другом случае мы получили бы большую относительную спрашиваемость однословных запросов. Подобные случаи возможны не только для прилагательных, но для любых слов, входящих в “устойчивые словосочетания” или просто мало используемых отдельно (примеры: “купить”, “где”, “поиск”).

Количество запросов из двух слов довольно мало, однако в спрашиваемости двусловные запросы догоняют трехсловные. Видимо, основная масса “уточняющих” запросов — как раз состоит из трех слов, а уточняют — уже введенный двусловный запрос. Об этом говорит и близкая их спрашиваемость.

При увеличении числа слов в запросе спрашиваемость таких запросов уменьшается быстрее, чем количество вариантов. Однако, и по запросам из 4-5 слов можно получить 4-10% траффика. Если их угадать.

С этого момента и далее все запросы разобраны по отдельным словам, парам и тройкам слов, содержащимся в запросе. Каждому слову (паре, тройке) соответствует суммарная спрашиваемость по всем запросам, содержащим это слово (пару, тройку). Это сделано по двум причинам:

* При позиционировании нет большого смысла в точном соответствии многословным запросам, поскольку они редки (15% по спрашиваемости), и также редко встречаются релевантные таким запросам страницы. Поэтому соответствия части длинного запроса должно быть достаточно.
* Выбрасывать их из рассмотрения тоже нельзя — тогда мы можем недооценить частое словосочетание, которое входит в длинные запросы. Более того, мы можем вообще не заметить такое словосочетание, если оно редко используется само по себе.

Видно, что 200-500 слов (из 4500) встречаются в 80-90% всех запросов. Однако, мы не сможем только за счет употребления нескольких слов охватить всю аудиторию — поскольку основная масса запросов состоит из словосочетаний (2-3 слова), поэтому нам важен порядок слов. В то же время, с парами и тем более с тройками такой “резкости” нет — они распределены по запросам более равномерно, поэтому и работать с ними несколько сложнее. Набрать 80-90% всех запросов среди двусловных можно, используя 1000-3500 словосочетаний из 8000 (для трехсловных — 50-70% всех сочетаний).

Около 2/3 трехсловных сочетаний встречаются всего один раз и создают 30% спрашиваемости среди всех трехсловных сочетаний (на синей кривой в этом месте виден излом).

Итак, нужно использовать “частые” слова, в “частых” словосочетаниях. Это вовсе не призыв к спаму поисковых систем — но указание на то, что перед “общением” с будущим посетителем через поисковые системы нужно сначала изучить “язык” посетителей. И по возможности использовать его в текстах сайта.

Ниже представлены наиболее часто используемые слова, и словосочетания. Цифра слева от слова означает суммарную долю в спрашиваемости по этому и всем предыдущим словам (доли рассчитаны отдельно по каждой из групп):



Cлова Пары слов
поисковые 0.25
системы 0.42
поисковая 0.46
система 0.50
поисковых 0.52
сервера 0.55
украинские 0.57
поисковый 0.59
сайты 0.60
машины 0.62
украины 0.63
системах 0.64
регистрация 0.64
систем 0.65
сервер 0.66
информационно
сайт 0.67
поисковой 0.67
сайта 0.68
машина 0.68
поисковые системы 0.26
поисковая система 0.31
поисковые сервера 0.35
украинские поисковые 0.38
поисковые сайты 0.40
поисковые машины 0.42
поисковых системах 0.44
поисковых систем 0.45
поисковый сервер 0.46
системы украины 0.47
регистрация поисковых 0.48
поисковая машина 0.48
информационно поисковые
поисковые программы 0.49
поисковые серверы 0.50
немецкие поисковые 0.50
поисковый сайт 0.50
поисковые службы 0.51
поисковые отряды 0.51
зарубежные поисковые 0.51
Тройки слов
украинские поисковые системы 0.04
поисковые системы украины 0.06
украинские поисковые сервера 0.07
регистрация поисковых системах 0.08
информационно поисковые системы 0.09
поисковые системы интернета 0.10
поисковые сервера украины 0.10
немецкие поисковые системы 0.11
украинские поисковые сайты 0.11
поисковые системы интернете 0.12
поисковая система апорт 0.12
зарубежные поисковые системы 0.13
поисковая система мета 0.13
регистрация сайта поисковых 0.14
поисковые системы германии 0.14
сайта поисковых системах 0.15
российские поисковые системы 0.15
русские поисковые системы 0.16
французские поисковые системы 0.16
иностранные поисковые системы 0.16

По отдельным словам старт взят достаточно резко — варианты слов “поисковые” и “системы” — составляют половину всех спрашиваемых слов. В принципе, это и понятно — в каждом запросе есть слово “поисковый(ая, ые)” и соответствующее ему “система” или “сервер” (“машина”).

В случае с парами слов эти сочетания явно видны. Причем практически все они — целевые (не в тему лишь поисковые отряды и поисковые программы). А в случае с тройками слов уже видно, как начинается уточнение — появляются дополнительные слова, при этом “разброс” увеличивается. Итак, чтобы добиться посещаемости по тройным словосочетаниям, нужно использовать много вариантов. Однако и конкуренция в этом случае ниже.

Видно, что около 6% всех слов используются всего 1-2-3 раза, и именно эти слова составляют основную массу (70%, если считать различные слова) В логарифмических координатах видно, что суммарная спрашиваемость по редким словам растет пропорционально логарифму их количества. Итак, редкие слова или сочетания могут быть хорошим вариантом для поисковой раскрутки — по ним практически нет конкуренции. Рассмотрим отностительную спрашиваемость по частым и редким словам.

Вершки, корешки и цветочки

На графике ниже представлена суммарная спрашиваемость по словам, которые встречаются в общей массе запросов N раз (от 1). Т.е., в группу собираются все слова, спрашиваемость каждого из которых равна N, и суммируется спрашиваемость в этой группе.

Видно, что суммарная спрашиваемость по редким словам по порядку величины достигает спрашиваемости по частым словам. На линии представлены слова, спрашиваемость по которым достаточно велика и они не объединяются в группы с другими словами.

Получается, что пересечение воображаемых линий спрашиваемости для частотных и редких слов позволяет нам разделить всю группу слов на “вершки” и “корешки”. По “вершкам” рекламироваться проще — нужна цитируемость (для очень “верхних” слов) и релевантность текста словосочетанию, а по “корешкам” — ниже конкуренция, и для попадпния в выдачу достаточно присутствия сочетания на странице. Это, однако, досконально не проверялось.

Итак, рассмотрим интегральную спрашиваемость по словам от редких до частотных (эта величина складывается из суммы спрашиваемости по всем более редким словам):

usemap=#c

Увеличенный Увеличить Увеличить

Для того, чтобы лучше рассмотреть график, можно кликнуть на разные его участки или открыть в новых окнах вершки+корешки, только вершки, или только корешки.

Итак, можно выделить даже три группы слов: “цветочки”, “вершки”, и “корешки” — это видно по изломам на интегральной зависимости. Редкие слова имеют 1/3, и быстрый рост посещаемости, т.к. на кривой много точек, соответствующих этим словам. Наклон явно меняется при переходе к “вершкам”, и слова поисковая и система имеют также 1/3 в общей доле спрашиваемости.

Посещаемость по каждой из групп примерно одинакова, поэтому есть 3 возможных стратегии — оптимизировать сволй сайт по каждой из этих групп:

* Цветочки
Основной фактор — цитируемость и ссылочное ранжирование (Google, Яндекс), релевантность и количество страниц (Рамблер)
* Вершки
Основной фактор — релевантность страницы запросу, наличие словосочетания в title, h1-2-3, тексте сайта.
* Корешки
Основной фактор — наличие слова на странице

Конечно, рассмотрение отдельных слов и оптимизация по ним не дает гарантии находжения вашего сайта — дело в том, что работать надо с двойными и тройными словосочетаниями. Примерно таким же образом.

Что интересно:

* 200-500 слов присутствуют в 90-80% всех запросов.
* Основная масса запросов — двусловные и трехсловные, причем количество трехсловных запросов больше, а спрашиваемость одинакова. Это также значит, что основной тип поиска — ввод двусловного запроса и его уточнение.
* Можно выделить три группы слов: “цветочки”, “вершки”, и “корешки”, суммарная спрашиваемость по которым примерно одинакова.

При этом необходимо помнить, что это частный случай запроса — дело в том, что слово “поисковая” редко используется отдельно. В будущем грядет исследование по запросам с самостоятельным словом.

Евгений Трофименко, июнь 2002

PromoSite: Реклама и Интернет-маркетинг.

Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании "Яндекс.Украина". Основатель и директор крупнейшего коворкинга Одессы — "Терминал 42". Ведет блог, участвует в подкастах. Больше ничего не умеет.