В одной из своих предыдущих статей я рассмотрел параметры URL страницы поисковой выдачи Яндекса. Теперь рассмотрим тот же вопрос для поисковой системы Google. Там так же, как и в Яндексе, существует возможность регулировать результаты выдачи по базовому запросу (которому соответствует значение параметра q или as_q) с помощью целого ряда get-параметров формата переменная=значение, используемых в URL страницы поисковой выдачи после подстроки /search? . Использование этих параметров может быть весьма полезно при парсинге поисковой выдачи.

Также, как и в случае Яндекса, базовый набор этих параметров можно определить с помощью использования фильтров расширенного поиска, режима «Инструменты поиска», а также индивидуальных настроек поиска.

Примечательно, что некоторые параметры URL страницы выдачи Google сопровождаются появлением соответствующих им поисковых операторов в форме поиска (в Яндексе подобного не происходит). Таковым является набор параметров со значением в виде поисковой фразы:

as_epq – поиск по фразе в точной форме, аналог оператора “” (кавычки)

Ludkevich_1

as_oq – поиск по любому слову фразы, аналог оператора OR
as_eq – исключаемая из запроса фраза, аналог оператора – (минус)

А также параметры с другими типами значений:

as_nlo и as_nhi – задают начало и конец цифрового диапазона соответственно, аналог оператора .. (две точки)
as_sitesearch – сужают область поиска на заданный сайт, аналог оператора site:
as_rq – ищет страницы, похожие на заданный документ (в качестве значения используется URL документа), аналог оператора related:
as_occt – задает область документа для поиска, принимает значения
as_occt=title (поиск в теге title, аналог оператора allintitle:)
as_occt=body (поиск в тексте страницы, аналог оператора allintext:)
as_occt=url (поиск в URL страницы, аналог оператора allinurl:)
as_occt=links (поиск в текстах ссылок на страницу, аналог оператора allinanchor:)
as_filetype – задает формат документов для поиска (аналог оператора filetype:) и принимающий значения pdf, ps, dwf, kml, kmz, xls, ppt, doc, rtf, swf.

Другие типы параметров не производят изменений в поисковой строке.

Языковые параметры:

lr – язык документа (принимают значения в виде lr=lang_ru, где последние две буквы означают индекс языка, в данном примере – русский)
hl – язык интерфейса (приминает значения в виде двухбуквенного индекса языка, например, hl=ru – для русского).

Примечательно, что этот параметр влияет на выдачу, некоторое преимущество получают документы на языке интерфейса.

Региональные параметры:

cr – страна документа (принимает значения в виде cr=countryRU, где последние две буквы означают индекс страны, в данном примере – Россия).
gl – страна документа, принимает значения в виде двухбуквенного индекса страны (например, gl=ru для России), аналог оператора cr, однако выдачу строит отличную от него). Стоит заметить, что при использовании операторов cr и gl в топ выдачи подмешиваются сайты из региона или страны пользователя, если она не совпадает со страной, заданной оператором (об этом эффекте я упоминал в статье «Региональность в Google»).
near – весьма любопытный недокументированный параметр, которому можно указывать в качестве значения название населенного пункта (на английском или русском языке, например, near=Moscow или near=екатеринбург). Однако, эта выдача не является выдачей для указанного населенного пункта. Судя по всему, этот параметр в выдаче, построенной для региона пользователя, дает сайтам из указанного в качестве его значения населенного пункта некоторое преимущество.

Временные параметры:

as_qdr и tbs – поиск по документам, имеющим определенную дату обновления (при совместном использовании приоритет имеет параметр tbs). Принимают базовые значения:

Ludkevich_2

Если же к базовым значениям (кроме значений за все время) добавить число, то можно получить выдачу за несколько соответствующих временных промежутков, например, комбинация as_qdr=h9 сузит выдачу на документы, обновленную за последние 9 часов, а комбинация tbs=m24 – за последние 24 месяца.

Также с помощью оператора tbs можно задавать произвольный диапазон дат обновления документа, в этом случае, он принимает значение следующего формата:

tbs=cdr:1,cd_min:01.07.2016,cd_max:01.08.2016 (в данном примере указан диапазон от 01.07.1016 до 01.08.2016)

Если при использовании временных параметров с указанными значениями задать для параметра tbs дополнительное значение sbd:1, то результаты будут ранжироваться не по релевантности, а по времени обновления. Этот способ не работает только в том случае, если параметр as_qdr принимает значение all. Поэтому получить выдачу за все время, отсортированную по времени обновления, можно только с использованием комбинации tbs=sbd:1,qdr:all

Оператор tbs, являющий универсальным, может также принимать значение li:1 – поиск по запросу в точной форме (аналог оператора “”), однако в этом случае в поисковой форме не происходит появления соответствующего оператора.

Параметры фильтрации контента:

safe – значения active и on включают фильтрацию непристойных результатов с помощью безопасного поиска, значение off отключает фильтрацию в случае, если в настройках поиска был включен режим «Безопасный поиск»; этот параметр может быть весьма полезен для определения, не попал ли конкретный сайт или документ под данный фильтр
as_rights – задание различных вариантов прав на использование контента
tbm – поиск по различным типам контента, принимает значения
app – поиск по приложениям
bks – поиск по книгам
isch – поиск по изображениям
nws – поиск по новостям
pts – поиск по патентам
shop – поиск по магазинам
vid – поиск по видео

Параметры управления результатами поиска:

num – количество результатов на странице поиска, принимает значения от 1 до 100
start – показ выдачи, начиная с заданной позиции (например, start=100)
newwindow=1 – открывать ссылки в новом окне
filter=0 – показать скрытые результаты, которые очень похожи на уже представленные
pws – управление персональными результатами поиска, принимает значения 0 (персональные результаты скрыты) и 1 (персональные результаты включены)

Сергей Людкевич

Независимый консультант, супермодератор форума о поисковых системах Searchengines.Guru.
Сфера профессиональных интересов — исследование алгоритмов ранжирования поисковых машин, разработка методик поискового продвижения сайтов.