Возвращение непот-фильтра – больше вопросов, чем ответов

Непот-фильтр – это уже порядком позабытый термин из 2000-х годов. Строго говоря, непот-фильтр – это механизм полного неучета или частичного понижения вклада ссылки в ссылочные факторы ранжирования для акцептора.

Но название это приклеилось к конкретному явлению, наблюдавшемуся в поисковой выдаче Яндекса до февраля 2008 года. Заключалось оно в том, что в ряде случаев страница-акцептор не находилась в поисковой выдаче по тексту ссылки, ведущей на неё, несмотря на то, что эта ссылка была проиндексирована на странице-доноре. То есть, страница-донор по тексту ссылки находилась, а вот страница-акцептор – нет. В таких случаях и делался вывод о неучете данной ссылки в ранжировании. Исследования тех лет показывали, что накладывался данный фильтр на кластер (совокупность страниц, обладающих некими общими свойствами) сайта-донора. Например, имели место случаи, когда фильтровались ссылки только с главной страницы сайта-донора или только из каталога обменных ссылок, расположенного на нем, а со всех других страниц этого сайта – нет.

С мая 2014-го по октябрь 2015-го года в Яндексе наблюдалось явление, очень похожее на тот старый классический непот-фильтр. Назовем это новое явление «непот-фильтром-2014». О нем я писал в статье «Отмена ссылочного: исчезновение «НПС» из органики» и последующей серии статей о методике определения отключения ссылочного ранжирования по запросу (часть 1 , часть 2, часть 3 ). Явление это обнаружилось после объявления сотрудниками Яндекса в апреле 2014 года о полном отключении ссылочных факторов в ряде тематик московской выдачи Яндекса и обладало аналогичными непот-фильтру основными свойствами – страница-акцептор не находилась по тексту проиндексированной ссылки. Только вот явление это было довольно ограниченным. Во-первых, запросозависимым (наблюдалось только для некоторых коммерческих запросов). Во-вторых, регионозависимым (наблюдалось только в выдаче для Москвы). А, в-третьих, имела место и зависимость от наличия сохраненной ссылки – для документов без сохраненной копии данное явление не наблюдалось ни при каких условиях.

3 ноября 2015 года, во время своего доклада «Плохие методы продвижения сайтов», читаемого в рамках Школы вебмастеров Яндекса, аналитик отдела безопасного поиска Яндекса Екатерина Гладких объявила о возвращении учета ссылочных факторов, тех самых, отключенных для ряда коммерческих тематик в московской выдаче в апреле 2014 года. Индустрия ссылкоторговли поспешила водрузить этот факт на свой рекламный щит, пропагандируя мысль, что Яндекс «включил заднюю передачу» и все ссылки опять заработали. Скромно умалчивая о том, что на эти «возвращенные» ссылки также распространяется новая, «минусинская» ссылочная концепция Яндекса, заключающаяся в полном неучете так называемых SEO-ссылок.

Тем временем, явления, присущие «непот-фильтру 2014», в поисковой выдаче прекратились, но им на смену пришли новые, уже гораздо больше напоминающие старый классический непот-фильтр 2000-х годов. А именно: отсутствие страницы-акцептора в поисковой выдаче по тексту проиндексированной ссылки, ведущей на него, уже не зависящее от запроса, региона и наличия сохраненной копии. Именно это явление некоторые SEO-специалисты и окрестили «возвращением непот-фильтра». Мы же назовем его «непот-фильтром-2015».

На данный момент существует достаточно простой способ определения непот-фильтра-2015, однако, ограниченный в использовании только лишь для страниц-акцепторов, не содержащих проверяемую фразу в тексте, т.е. имеющих для нее нулевую текстовую релевантность. Данная методика заключается в проверке наличия разных результатов при разном построении запроса с использованием оператора << («неранжирующее И») для поиска на странице по анкору проверяемой ссылки. Вот так акцептор находится:

А вот так (поменяв местами правую и левую части запроса относительно оператора <<) – нет:

С помощью недокументированных операторов inlink: и intext: (о них я рассказывал в своих статьях «Сеанс поисковой магии. Недокументированные операторы языка запросов Яндекса» и «Сеанс поисковой магии. Поиск по-анкор-файлу» удостоверимся, что искомая фраза действительно находится в тексте ссылок на документ:

Небольшая справка. Оператор inlink: осуществляет поиск только по анкор-файлу. Обнуляет значения текстовых динамических (т.е. зависящих от запроса) факторов. К сожалению, он работает только справа от оператора << («неранжирующее И»). Оператор intext: осуществляет поиск только по тексту. Он обнуляет значения ссылочных динамических факторов. Работает полноценно.

Интересная особенность непот-фильтра 2015 заключается в том, что он накладывается на конкретную ссылку. Так, например, наблюдаются случаи, когда из разных ссылок на внешний сайт, расположенных на одной странице-доноре, одни попадают под фильтр, а другие – нет. Также пока не обнаружено случаев попадания под этот фильтр внутренних ссылок.

Наблюдая свойства нового непот-фильтра, во многом аналогичные старому классическому, возникает соблазн интерпретировать его действие также по аналогии — как полное обнуление ссылочных факторов. В случае, когда текстовая релевантность страницы-акцептора поисковой фразе нулевая, это, в общем-то не вызывает сомнения – ведь акцептор просто не находится по ссылке. Но хотелось бы проверить эту гипотезу и для случая, когда текстовая релевантность акцептора не равна нулю. К сожалению, вышеупомянутая простая методика тут уже не может помочь. В этой задаче мог бы помочь оператор inlink:, если б он работал и слева от оператора <<, но, увы, его использование имеет неприятные ограничения. Однако существует возможность специальным образом сконструировать альтернативный запрос для поиска по анкор-файлу. Причем, используя только документированные операторы языка запросов Яндекса, что не накладывает никаких ограничений на его использование. К сожалению, я пока не могу опубликовать этот запрос из-за опасений за его дальнейшую работоспособность, поэтому назову его «секретным запросом» и попрошу читателя поверить мне на слово в том, что он действительно существует.

В пользу того, что этот запрос действительно является аналогом оператора inlink:, свидетельствуют следующие факты:

  1. Логика построения запроса, учитывающая специфические особенности организации анкор-файла.
  2. Аналогичные результаты поисковой выдачи при использовании справа его от оператора << («неранжирующее И»).
  3. Корректность получаемых с его помощью результатов, при определении непот-фильтра-2015 для документов с нулевой текстовой релевантностью запросу.

На основании этих фактов логично предположить, что «секретный запрос» также корректно определяет наличие непот-фильтра-2015 и для документов с ненулевой текстовой релевантностью запросу.

Для проверки гипотезы о полном обнулении непот-фильтром-2015 динамических ссылочных факторов для документов с ненулевой текстовой релевантностью я буду использовать метод «ортогональных запросов», о котором я писал в своей статье «Как работали ссылки в «доминусинскую» эпоху». Суть его заключается в том, чтобы сконструировать запрос, состоящий из двух частей, разделяемых оператором | («логическое ИЛИ»). По одну сторону от оператора будем использовать выдачу, состоящую из одного результата для «контрольного документа», по другую сторону будет формироваться своеобразная «линейка» из многих результатов. Таким образом, измеряя позицию контрольного документа в общей выдаче по «линейке», мы сможем делать определенные выводы об изменении численного значения его релевантности запросу из первой части.

Итак, гипотеза следующая. Если динамические ссылочные факторы, в случае срабатывания непот-фильтра-2015 для документов с ненулевой текстовой релевантностью, действительно полностью обнуляются, то позиции в «ортогональной» выдаче для контрольного документа по базовому запросу и по запросу с использованием оператора intext: будут совпадать. Убедимся, что именно так и происходит для документа с нулевой ссылочной релевантностью запросу (т.е. не имеющего входящих ссылок с анкорами, содержащими текст запроса). Найдем подходящий документ c ненулевой текстовой релевантностью и нулевой ссылочной (контрольный документ #1):

«Взвесим» по ортогональной сетке варианты с базовым запросом и оператором intext: (отдельно подчеркиваю важность построения стабильной сетки, в которой не меняются позиции документов при изменении второй части запроса). Для данного случая получаем одинаковые результаты:

Теперь найдем документ (контрольный документ #2) с ненулевой текстовой релевантностью, имеющий вхождение запроса в анкор-лист, но попадающий под непот-фильтр-2015 согласно выдаче по «секретному запросу»:

И таким же образом пробиваем варианты выдачи для базового запроса и примененного к нему оператора intext: по ортогональной сетке. Обнаруживаем, что контрольный документ #2 по запросу с оператором intext: находится ниже, чем по базовому:

Таким образом, гипотеза о полном обнулении ссылочных динамических факторов для случая ненулевой текстовой релевантности запросу не подтверждается.

То есть, к сожалению, мы не можем с уверенностью утверждать о том, что попадающие под непот-фильтр-2015 ссылки не учитываются полностью. Вариантов здесь может быть масса:

  1. Учитывается пусть не ноль, но практически не значащая величина, мизер.
  2. Наблюдаемое явление – какой-то странный артефакт, по наличию которого нельзя сделать никаких практических выводов о природе учета оцениваемых ссылок. Тогда, естественно, возникает следующий вопрос – почему этот артефакт возник и есть ли в его существовании хоть какая-то логика?
  3. Используемая методика определения наличия нулевого ссылочного веса на самом деле некорректна и дает ничего не значащий результат. Надо искать более совершенную методику.
  4. И т.д. и т.п.

В общем, пока что вопросов сильно больше, чем ответов. Что ж, будем их искать. Ведь надежда на возвращение столь простой возможности оценки работоспособности ссылок, как старый классический непот-фильтр, ну, очень соблазнительна.

Статья написана автором по мотивам его выступления в рамках конференции All in Top 2016, которая проходила в Москве 16-17 февраля.

Сергей Людкевич
Независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru. Сфера профессиональных интересов - исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.