Сеанс поисковой магии. Недокументированные операторы языка запросов Яндекса.

За время своего существования язык запросов Яндекса претерпел существенные изменения. Причем изменения эти были далеко не в лучшую сторону для пользователя. Постепенно исчезло много операторов, применение которых пытливому исследователю позволяло творить чудеса. Так, в 2006-м году исключительно применением стандартного функционала языка запросов можно было полностью восстановить формулу текстового ранжирования Яндекса в аналитическом виде. И частично – формулу ссылочного ранжирования. Например, можно было установить, что вхождение термина в тег title ровно в два раза весомее вхождения в body. И многие другие интересные факты. С той поры исчезли замечательные операторы, такие как link (поиск по ссылающимся документам), anchor (поиск по текстам ссылок), : и :: (разные варианты присвоения веса термину из запроса), softness (настройка мягкости для фильтрации по кворуму) и другие. Текущий список документированных операторов можно найти в помощи Яндекса.

Однако, до сих пор в поиске продолжают использоваться операторы, которые исчезли из документации. Например, оператор << (неранжирующее логическое «И») бывает очень полезен при построении достаточно сложных конструкций в запросе. Более того, до сих пор используются операторы, которые никогда не были задокументированы. По крайней мере для большого поиска.

В свое время в разделе помощи Яндекса, посвященной Яндекс.Серверу (приложению для поиска в корпоративных сетях и поиска по сайту), содержался многостраничный документ «Яндекс.Сервер. Руководство по установке и эксплуатации» (до сих пор отдельные версии этого документа для различных сборок, закачанные на сторонние сайты, можно найти в глубинах сети). Там довольно подробно описывался язык запроса, который был несколько шире задокументированного языка запросов для большого поиска по вебу. Но что самое интересное, многие операторы из руководства Яндекс.Сервера работали (и до сих пор работают) в большом поиске. Рассмотрим самые, на мой взгляд, интересные из них.

Оператор intext.

Пожалуй, наиболее интересный оператор. Выдача с его использованием не пустая и отличается от выдачи без его использования:

Заявлено, что этот оператор используется для поиска только в текстах документов. И это действительно похоже на правду. Например, документы, найденные по ссылке, этим оператором, не ищутся:

То есть, при ранжировании по сути игнорируется анкор-файл. Этот оператор может быть весьма полезен при исследовании текстовой релевантности документов.

Оператор inlink.

Заявлено, что оператор используется для поиска в ссылках на документы. Однако, к большому сожалению, если этот оператор применять целиком ко всей поисковой фразе, выдача пуста:

Выдача становится непустой, если хотя бы одно слово запроса вынести из-под данного оператора:

Однако трудности с интерпретацией полученных результатов сводят к минимуму полезность этого оператора.

Оператор inpos.

Выдержка из руководства: «Специальное имя атрибута для указания точного диапазона позиций, в которых должен находиться предыдущий лист или скобка. Имеет синтаксис inpos:N1..N2, где N1 и N2 — целые положительные числа». Применение различных интервалов к запросу дает любопытные эффекты. Например, при достаточно малом диапазоне выдача сужается до документов, содержащих ключевые слова только в адресе документа:

Оператор linkint.

Сильно ужатая версия былого оператора link, осуществляющая поиск внутренних ссылок на определенный документ. Однако может быть полезен при решении определенных задач.

Оператор anchorint.

Аналогичным образом ужатая на внутренние ссылки версия отмененного оператора anchor. Осуществляет поиск по документам, содержащих ключевую фразу в текстах своих ссылок, ведущих на внутренние страницы того же сайта. Любопытна конструкция, объединяющая операторы linkint и anchorint (аналогичным образом в свое время можно было объединить в одном запросе операторы link и anchor), и позволяющая найти все внутренние страницы сайта, ссылающиеся на данную страницу заданной ключевой фразой:

Менее любопытны, но на мой взгляд, заслуживают упоминания операторы, позволяющие искать по определенным фрагментам текста документов:

address – поиск внутри текстов, заключенных в теге

quote — поиск внутри текстов, заключенных в теге

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.