Мероприятие традиционно посвящёно установлению деловых контактов и полезным докладам, каждый из которых имеет практический уклон и содержит методику для внедрения. Спикерами конференции являются как известные личности в профессиональной среде, так и новички.
В рамках работы секции «Аналитика и исследования» состоялось выступление руководителя SEO-отдела компании «Пиксель Плюс» Дмитрия Севальнева на тему: «Максимум текстовой релевантности сегодня: факторы, практические рекомендации».
Основные факторы текстового ранжирования
По мнению докладчика, в последнее время текстовые факторы заметно влияют на позиции сайта в поисковой выдаче. При этом также важны текстовые характеристики хоста. Понижение позиций ресурса может быть вызвано текстовой переоптимизацией на этом уровне.
Все текстовые факторы можно разбить на следующие группы:
- «Частотные» по отдельным словам;
- Взаимное расположение и позиции слов;
- Качество и общие параметры текста;
- Хостовые (уникальность, спамность);
- Факторы антиспама;
- Соответствие языковой модели.
Встречаемость слов и их вес
Значимость факторов
Спикер отметил, что чем чаще встречается ключевое слово в запросе, тем менее оно ценно для поисковой системы и наоборот. Понять вес ключевого слова можно путём оценки документа в коллекции. Как это сделать, показано на слайдах ниже:
Факторы на базе TF-IDF
К значимым факторам этого типа докладчик отнёс следующие:
Общие рекомендации по этой группе факторов выглядят так:
- Больше вхождений – выше релевантность.
- Насыщение после 6-9 вхождений (зависит от объёма текста).
- Ставка на слова с бо́льшим весом.
- Вхождение всех слов во все зоны документа.
Что касается других факторов, для ранжирования также важно учитывать взаимное расположение слов из запроса относительно друг друга в тексте; словоформу (совпадение формы слова) и позицию слов в документе (относительно его начала).
Модель «bag-of-words» («мешок слов») не позволяет всё это учесть. Следовательно, важными становятся и другие группы факторов, отметил докладчик.
Фразовые соответствия
Всего выделяют три типа соответствия ключевых слов:
- Phrase – все слова из поискового запроса встречаются в документе подряд.
- Strict – все слова из поискового запроса есть в документе с учётом контекстных ограничений.
- All – все остальные найденные документы.
Эволюционно в Яндексе потребность в соответствии типа phase менялась согласно числу найденных по нему результатов. По мнению докладчика, именно этот тип соответствия в настоящее время наиболее благоприятный для ранжирования.
Учёт близости слов
Значимыми факторами этого типа являются:
Синонимы
После ввода в поисковую систему запрос перерабатывается («переколдовывается»). Затем поисковик определяет факторы запроса, в том числе «СНС»/ «без СНС», язык, геозависимость, основные поисковые интенты и т.п.
Учёт синонимов
Значимыми факторами этого типа являются:
Достоверную проверку синонимов можно провести следующим образом:
- Поиск документа без слов запроса, но с предполагаемым синонимом [продвижение сайта ~~ раскрутка ~~ seo ~~ москва].
- Поиск по исходному слову с оператором «url» [раскрутка сайтаurl:site.ru/dir/] (исключаем «СНС» с помощью ~~ ываывоатыват).
- Находится ли документ?
Статические языковые модели
Докладчик выделил два типа статических языковых моделей, используемых для разных целей:
- Какова вероятность, что после фразы будут идти определённые ключевые слова. Эта модель используется для распознавания речи, переводов. Например, после фразы: «Лето – это маленькая…» будут идти «жизнь», «смерть»…?
- Если слова «панда» и «поиск» встретились в тексте три и один раз соответственно, какова вероятность, что текст посвящён тематикам: «Зоология», «SEO», «Кино», …? Эта модель используется в информационном поиске и тематической классификации документов.
Антиспам vs ранжирование
Следующая часть выступления Дмитрия Севальнева была посвящена текстовому антиспаму.
Основные задачи текстового антиспама:
- Выявление переоптимизированных текстов и применение текстовых антиспампост-фильтров.
- Выявление откровенного спама (машинописный текст, синонимайзеры, автоматический перевод
- Поиск спамных хостов (неуникальные тексты).
При этом докладчик отметил, что чаще всего сайты попадают под фильтры за переоптимизацию контента.
Что касается объёма размещаемых материалов, Дмитрий рекомендовал слушателям находиться в зоне «небольших текстов», размер которых не превышает 2300 символов. Обоснование – на слайде ниже:
Рекомендации для SEO-специалистов по анализу текстов
Анализируя тексты, докладчик предложил слушателям придерживаться следующих правил:
- Вхождение всех слов – обязательно.
- «Подспамливать» лучше более тяжелым словом – это более эффективно (см. слайд «Почему «портянки рулили?»)
- При числе вхождений 6-9 итоговые значения близки к оптимальным.
- Можно сократить число необходимых вхождений путём урезания объёма текста.
- Пороги антиспам-фильтров постоянно сдвигаются – лучше немного недобрать, чем перебрать.
Практические рекомендации по формированию ТЗ для копирайтера
Ниже перечислены основные факторы для управления – это классические факторы, которыми оперируют SEO-специалисты. В их число входят:
- Объём текста.
- Процент вхождений каждого слова.
- Процент вхождений каждого из синонимов.
- Вхождение фраз и морфология.
- Структура и оформление текста: наличие списков, картинок, подзаголовков.
- Наличие специализированных терминов, задающих тематику и их количество.
- Распределение ключевых фраз по объёму.
Как собрать данные для технического задания, показано на слайде ниже:
При формировании задания следует указать следующие параметры:
- Объём текста: от 800 знаков достаточный для вхождения нужного количества ключевых фраз (без превышения порогов по спаму).
- Ограничение на использование слов «сверху»: необходимо задать ограничение на использование тех слов, которыми текст может быть переспамлен. Оптимально установить ограничение на уровне около 2% от планируемого количества слов в тексте (объём без пробелов разделить на 6,5).
- Минимальное использование слов: ограничивается число вхождений каждого слова «снизу». Его нужно задавать с помощью ключевых фраз (затребовать использовать нужное количество каждого из слов). В этом случае все слова будут употреблены в нужном виде и последовательности.
- Структура текста. Необходимо заранее определить основную мысль текста и его структуру. При этом нужно опираться на семантику и слова, задающие тематику.
- Пост-проверка текста: проверка на основные ошибки и соответствие техзаданию.
Основные ошибки, допускаемые оптимизаторами при постановке ТЗ:
- Слишком много ключевых фраз.
- Слишком мало ключевых фраз (слова из продвигаемых запросов встречаются менее 3 раз).
- «Корявые» ключевые фразы.
- В ключевых фразах отсутствуют синонимы слов из запроса и топоним (для ГЗ-фраз).
- Очень сложное задание.
- Не заданы тематические слова.
- Структура текста не продумана.
Ниже – примерный шаблон техзадания для копирайтера, предложенный докладчиком:
Рекомендации
В заключительной части своего доклада Дмитрий Севальнев предложил ещё несколько советов по достижению максимальной текстовой релевантности:
- Для вывода конкурентных запросов в ТОП требуется обязательно производить «тонкую юстировку» текстовых факторов.
- При размещении текста и его написании не забывайте про здравый смысл и пользователей.
- Не превышайте порог в примерно 2% вхождений и не раздувайте объем (≤ 550 слов для коммерческих запросов). Это важно, так как фиксируются регулярные сдвиги порогов срабатывания антиспам-фильтров.
- Важно понимать, что поиск оперирует более чем 50 факторами, связанными с текстом.
- Текст нужно проверять на корректность и соответствие требованиям SEO.