FAQ: Всё о новом сигнале ранжирования Google RankBrain

Вчера стало известно, что Google использует в формировании поисковой выдачи систему искусственного интеллекта RankBrain, созданную на базе алгоритмов машинного обучения. Редактор Search Engine Land Дэнни Салливан (Danny Sullivan) подготовил список часто задаваемых вопросов об этом сигнале и его месте в системе ранжирования Google.

google-brain-data2-ss-1920-800x450.jpg

Изложенная ниже информация получена из трёх источников: публикации Bloomberg; дополнительных комментариев от представителей Google; собственных исследований и мнений сотрудников редакции.

Что представляет собой RankBrain?

RankBrain – это рабочее название системы искусственного интеллекта, созданной на базе алгоритмов машинного обучения. Система помогает обрабатывать результаты поиска. Об этом сообщалось в статье Bloomberg. Представители Google подтвердили эту информацию.

Что такое машинное обучение?

Машинное обучение предполагает, что компьютер обучается выполнению определённых задач или следует детальным инструкциям автоматически,то есть без какого-либо участия человека.

Что такое искусственный интеллект?

Искусственный интеллект (AI) предполагает, что компьютер может обладать таким же разумом, как человек. По крайней мере, аналогия прослеживается с точки зрения приобретения знаний – как в процессе внешнего обучения, так и на базе приобретаемого опыта.

RankBrain – это новый способ ранжирования результатов поиска Google?

Нет. RankBrain – часть поискового алгоритма Google, компьютерная программа, которая используется для отбора наиболее релевантных конкретным запросам страниц из миллиардов других, о которых она знает.

Как называется основной поисковый алгоритм Google?

Он называется «Колибри» (Hummingbird). В течение многих лет основной алгоритм Google не имел официального названия. Однако в середине 2013 года Google полностью переработал его и назвал «Колибри».

google-hummingbird1-ss-1920-800x450.jpg

RankBrain – часть поискового алгоритма «Колибри»?

Да, такого мнения придерживается редакция Search Engine Land. «Колибри» – основной алгоритм Google, включающий в себя множество различных элементов (фильтров). Самым новым из них является RankBrain.

RankBrain входит в состав основного поискового алгоритма, поскольку он обрабатывает не все запросы, а лишь часть.

«Колибри» также включает такие фильтры, как «Панда»«Пингвин»; алгоритм локального поиска PigeonMobile-friendly алгоритм; Payday, разработанный для борьбы с «переспамленными запросами»; Top Heavy, удаляющий из топа выдачи ресурсы, на страницах которых рекламный контент преобладает над содержательной составляющей; и Pirate – призванный бороться с нарушением авторских прав.

В отрасли принято считать, что основным алгоритмом Google является PageRank. Разве это не так?

PageRank – это часть основного алгоритма Google, которым на сегодняшний день является «Колибри». Он присваивает странице определённое численное значение, основываясь на анализе ссылающихся на неё документов.

Строго говоря, PageRank – особенный показатель. Ведь именно такое название Google дал одному из основополагающих элементов своего первого поискового алгоритма, на основе которого строилась работа поисковой системы, запущенной в 1998 году.

Что такое «сигналы», которые Google использует в ранжировании?

Сигналы – это то, что Google использует для определения того, какую позицию присвоить веб-странице в поисковой выдаче. Все сигналы обрабатываются разными элементами внутри алгоритма «Колибри». В расчётах частично используются показатели PageRank. В частности, вес странице до сих пор присваивается на основе тех алгоритмов, на которых работает PageRank.

С помощью сигналов поисковая система понимает, какие страницы показывать в ответ на различные поисковые запросы пользователей.

Сколько сигналов ранжирования использует Google?

Представители Google неоднократно заявляли о том, что поисковик использует более 200 сигналов ранжирования. В публикации Bloomberg говорится о «сотнях» таких сигналов.

RankBrain – третий по важности сигнал?

Да. По словам представителя Google, новый сигнал – третий по важности фактор в ранжировании веб-страниц. Об этом также сообщается в публикации Bloomberg.

«RankBrain – один из сотен сигналов поискового алгоритма, который определяет, какие именно результаты должны показываться в выдаче, и как высоко они будут ранжироваться. В ближайшие месяцы сигнал будет дорабатываться и развиваться. На сегодняшний день RankBrain занимает третье место по значимости среди сигналов ранжирования Google», – поясняет представитель компании Грег Коррадо (Greg Corrado).

По личному мнению Дэнни Салливана, самым важным сигналом остаются ссылки, а вторым по значимости – «слова» (семантика), начиная от слов на странице и, заканчивая тем, как Google интерпретирует слова, содержащиеся в запросах, вводимых в поисковую строку.

Что именно делает RankBrain?

По заявлению Google, RankBrain используется преимущественно для интерпретации поисковых запросов. Главная цель сигнала – страницы, релевантные запросу, но на которых могут не использоваться точные вхождения ключевых слов из этого запроса.

Как RankBrain помогает определять запросы?

Ежедневно Google обрабатывает три миллиарда поисковых запросов. При этом около 15% из них поисковая система видит впервые.

Среди них могут быть сложные многословные, низкочастотные запросы, так называемые «запросы с длинным хвостом». RankBrain призван помочь алгоритмам системы грамотно интерпретировать их, чтобы найти наиболее релевантные таким запросам страницы.

По словам представителя Google, RankBrain может выявлять закономерности между, вроде бы, несвязанными между собой сложными запросами и понимать, схожи ли они друг с другом. Самообучение, в свою очередь, позволяет лучше понимать будущие сложные запросы. Это предоставляет поисковой системе возможность распределять запросы по тематикам.

И что самое важное, RankBrain способен связывать эти группы поисковых запросов с результатами выдачи, которые, по версии алгоритма, являются наиболее популярными среди пользователей.

Когда был запущен RankBrain?

По информации Google, постепенный запуск RankBrain стартовал в начале 2015 года и был закончен несколько месяцев назад. Сигнал работает во всех странах присутствия Google.

Какую долю запросов он затрагивает?

По словам представителя Google, RankBrain обрабатывает «очень большую долю» запросов. Конкретную цифру он не назвал.

RankBrain постоянно обучается?

Весь процесс обучения RankBrain происходит офлайн. Об этом представитель компании рассказал редакции Search Engine Land. RankBrain получает на обработку группы исторических запросов и на их примерах учится строить прогнозы. Полученные прогнозы в обязательном порядке тестируются. В случае, если сигнал обработал запросы верно, запускается новая версия RankBrain. Затем этот цикл повторяется.

RankBrain – действительно сигнал ранжирования?

Да. Представитель Google подтвердил это и пояснил, что существует компонент, в котором RankBrain непосредственно влияет на ранжирование страницы.

По предположению Дэнни Салливана, RankBrain каким-то образом помогает Google лучше классифицировать страницы. Функция реализуется путём анализа контента, который содержат эти страницы. Возможно, RankBrain способен лучше, чем другие математические модели Google, понять, о чём идёт речь на странице. Однако пока это только предположения. Представители Google не предоставили официальных данных о том, как именно работает данный аспект.

Где можно получить дополнительную информацию о RankBrain?

Представители Google рекомендуют желающим получить дополнительную информацию о «векторах» – математической модели, посредством которой слова и фразы могут быть объединены в группы – ознакомиться с этой публикацией. В ней рассказывается о том, как система (в публикации не упоминается название RankBrain) изучила понятие «столицы», сканируя новостные статьи:

image00-800x593.gif

Более обширная научная статья на эту тему доступна здесь. Желающие больше узнать об алгоритмах машинного обучения могут ознакомиться со справочными публикациями, руководствами и технической документацией на этой странице.

Немецкие издатели намерены подать в суд на Google за нарушение авторских прав

Немецкие издатели и Google в очередной раз не смогли прийти к компромиссу по вопросу выплаты компенсации за появление фрагментов публикаций в поисковой выдаче

Google показывает сообщения старых владельцев аккаунта в Search Console новым

Несколько дней назад появились заявления вебмастеров о том, что они видят сообщения предыдущих владельцев в только что подтверждённых аккаунтах в Google Search Console

Яндекс ведет переговоры с производителями мобильных устройств о предустановке своих сервисов

Яндекс начал переговоры с производителями о предустановке своих сервисов на мобильные устройства

Google ждут годы антимонопольных разбирательств в Европе

Еврокомиссар по вопросам конкуренции Маргрет Вестагер (Margrethe Vestager) заявила, что Alphabet/Google может столкнуться с несколькими новыми антимонопольными...

Яндекс готовится к запуску автоматически формируемой новостной ленты для медиа

В середине ноября Яндекс планирует запуск прототипа информационного агентства будущего - специальной ленты для СМИ и медиа с регулярными поставками данных

Рекомендации Яндекса по переезду на HTTPS

Тот самый Платон Щукин рассказал в своем блоге о том, что представляет собой процесс переезда на HTTPS, и дал рекомендации относительно того, как лучше его организовать