Обзор базы Пастухова

Я давно слышал про так называемую базу поисковых запросов Пастухова, но поработать с ней удалось в середине 2012 года.

В этом обзоре я не буду описывать очевидный функционал базы. Очень подробно и с картинками он описан в хелпе на сайте Пастухова. Дублировать хелп в обзоре я не вижу смысла, моя цель – показать преимущества и недостатки данного продукта, а также области использования его с точки зрения SEO.

Итак…

Автор и создатель базы – Максим Пастухов – сделал большое дело. Он собрал несколько сотен миллионов (!) запросов из Wordstat’a Яндекса, Рамблера и других источников, структурировал и создал оболочку для работы с этой базой. За что ему отдельный респект!

Кроме самих запросов и частот, в базе также есть стоимости кликов по Бегуну с 1 по 3-ю позицию. А в отдельных базах и стоимость кликов по GoogleAdwords.

База достаточно быстро развивается. На тот момент, что я использовал базу, самая большая подборка, которая была – это 210 миллионов ключевых слов. Сейчас есть уже 800 миллионная база и, я думаю, что не за горами база в миллиард ключевиков.

Наряду с русской базой ключевых запросов, есть еще английская, итальянская, немецкая, испанская и французская база. Они могут пригодиться темм, кто продвигает сайты на Запад.
Также есть база на 16 с лишним миллионов доменов.

Помимо самих баз ключевых слов особый интерес представляют так называемые базы связей. База связей – это так называемые «подсказки» в Яндекс.Директ.

Для примера, по слову «туризм» на выходе будут такие слова как «карта дорог», «горящие путевки турция», «погода турция» и т.д.

На момент написания обзора самая крупная база связей на 167 миллионов запросов.

Сами базы платные, но цена за такой объем данных невелика, в районе 9 тысяч рублей. Окупится быстро.

Объем баз. Готовим террабайтный жесткий диск!

Сами базы достаточно объемные. 210-тимиллионная база весит 18 гигабайт, притом с запакованном виде. В распакованном аж 114 гигабайт! Поэтому качаются они с торрентов. Мой 320 ГБ съемный диск базы быстро заполнили. Поэтому если есть необходимость работать с большим количеством баз, имеет смысл купить съемный диск на 1 терабайт.

Работа с базой происходит через оболочку. Доступ выдается при оплате и регистрации:

Оболочка базы позволяет выполнять все виды операций.

Вот так выглядит оболочка базы:

Области применения базы

Применение с использованием оболочки

Создание семантического ядра оптимизатором.

Пожалуй, это основная область применения базы. При грамотной работе можно достаточно быстро собирать большие ядра запросов.

Мне удалось за 2-3 часа собрать ядро на 300 000 запросов для одного из клиентов. Да, это грубое ядро, но все же это сильно быстрее, чем работать с Wordstat’ом.

Создание «грубого» ядра запросов менеджером по продажам.

Мы протестировали возможности базы для отдела продаж. Довольно часто менеджер по продажам сталкивается с задачей создания большого ядра запросов. Чтобы показать Клиенту потенциал при продвижении сайта. Раньше эта задача была довольно трудоемка.

При использовании базы Пастухова она упростилась. Теперь менеджер по продажам может создавать «грубые» ядра за несколько десятков минут:

Продвижение не в Рунете

Иностранные базы ключевых слов подойдут для продвижения на Запад. Особенно интересна в этом плане база англоязычных запросов и доменов.

Продвижение в Google AdWords

В англоязычной базе, в отличие от русскоязычной, есть вот такие данные: • Популярность по Google; • Цена клика в Google Adwords; • Количество объявлений в Google Adwords; • Конкуренция рекламодателей в Google Adwords; • Стоимость слова в месяц (ориентировочный доход Google с показа объявлений по этому слову за месяц)

Их можно использовать для создания контекстной рекламы в Google AdWords.

Применение базы без оболочки

Автоматизация сервиса по созданию семантического ядра.

Базу можно применять и без оболочки. В частности для внутренних инструментов, которые позволяют создавать семантические ядра. После использования базы, мы стали реализовывать такой инструмент силами наших программистов. Написали техническое задание для автоматизации семантики, чтобы можно было использовать базу внутри CRM компании, без оболочки.

Недостаток базы с точки зрения рядового сеошника – нет точной частоты запроса в кавычках!

Основной недостаток, который я отметил, это то, что частоты в базе собраны без кавычек. Я обратился за комментариями к Максиму Пастухову, позволю себе процитировать автора базы:

«Для точной частотности нужно просто пересобирать базу. Может быть, в следующих релизах будет осуществлена точная частотность».

Очень хочется на это надеяться!

Второй недостаток – наличие большого количества очень «странных» запросов, например:

«07 ghost манга 5 глава»
«000 пациентам здесь оказывают такие услуги реставрация зубов»

Вот как комментирует это автор базы:

«При сборе базы из Вордстата собирается очень большое количество НЧ запросов или единичных запросов. Эти запросы не видны (почему-то) обычным пользователям при онлайн работе с Вордстатом, но зато они есть в базе, что несомненно является плюсом. О них нужно знать самое главное - такие запросы никогда не имели и не будут иметь статистики в Вордстате, поэтому вы и видите пустые поля в колонке данных, но это вовсе не означает, что по ним нет трафика».

Таким образом, если верить автору, недостаток превращается в плюс.

Еще один довольно важный момент и плюс базы – возможность работать с запросами, которые не видны при обычном анализе Вордстата.

Вот пример разницы в количестве ключевых слов по запросу «автогражданка» - http://www.pastukhov.com/what-is-better.

Я поставил эксперимент на себе. Взял тематику раскрутки сайтов и имеющееся у меня ядро примерно на 2 000 запросов. Ядро было собрано по wordstat.yandex.ru.

За 20 минут при помощи базы Пастухова было собрано ядро примерно на 10 000 запросов. Часть из них была типа «раскрутка сайта нижний новгород купить дешево сейчас». В целом же, после очистки ядра осталось порядка 7 000 запросов. Что не так уж и мало, и в 3.5 раза больше, чем было у меня до этого.

Хранение данных

Базу можно ставить на любой свой компьютер, а саму базу хранить на внешнем usb диске и носить ее с собой, подключая к нужному компьютеру, на котором уже просто установлена оболочка.

Это возможно благодаря тому, что база и оболочка разделены. Поэтому их также легко обновлять, не затрагивая свои наработки. Более того, т.к. оболочка синхронизируется с сервером, то вся уже сделанная работа автоматически переносится на любой компьютер, на который ставится оболочка.

Проделанная работа никогда не потеряется, даже если полетит винчестер, слетит Windows и т.д. Главное просто иметь подключение к интернету на компьютере.

Если говорить об оболочке, то она просто прочитывает базу при работе, поэтому ей все равно, где лежит база, даже если она только подключена на съемном диске.

Общий вывод

База Пастухова – полезный инструмент как для рядового специалиста, так и для SEO-компании в целом. Она позволяет собирать семантические ядра более качественно и автоматизировать работу, снижая трудозатраты.

Конечно, мозг оптимизатора никто не отменял и сама программа никогда не заменит и не отменит труд оптимизатора. Но она здорово поможет при работе. Тем более по такой приемлемой цене!

Автор: Иван Севостьянов,

генеральный директор Webprojects.ru

Форум технологий Mail.Ru Group: Полнотекстовый поиск в почте

9 апреля в Международном информационно-выставочном центре «ИнфоПространство» прошел пятый Форум технологий Mail.Ru Group

Форум технологий Mail.Ru Group: Поиск неточных дубликатов в рунете

9 апреля в Международном информационно-выставочном центре ИнфоПространство прошел пятый Форум технологий Mail.Ru Group

Илья Сегалович: «Как лингвистика помогает поисковой системе понять пользователя?»

В Европейском университете Санкт-Петербургa 3 апреля прошла встреча с одним из основателей компании «Яндекс» Ильей Сегаловичем, посвященная теме «Как лингвистика помогает...

Путеводитель по фильтрам и санкциям поисковых систем

Поисковые системы за последний десяток лет прошли длинный путь от простого алфавитного указателя до сложных программных комплексов, облегчающих поиск информации в сети интернет

Яндекс об интернете в регионах и не только

Сегодня, 2 апреля 2013 года, в московском офисе компании Яндекс прошла пресс-конференция, в ходе которой обсуждались вопросы развития интернета в регионах России

Обзор семинара «Анализ поведения пользователей: сегментируем активность»

28 марта исследователь-разработчик из Яндекса Юрий Устиновский рассказал о сегментировании пользовательской активности в сети