Что такое «сущности» и почему они важны для SEO

Автор: Дэйв Дэвис(Dave Davies), исполнительный директор Beanstalk Internet Marketing

На сегодняшний день сущности являются самой важной концепцией для понимания современного SEO. Почему? Рассмотрим в статье.

Как стало известно ранее, тремя самыми важными факторами ранжирования Google являются контент, ссылки и RankBrain. С тех пор, как Андрей Липатцев раскрыл эту информацию, все эти области претерпели изменения, но они по-прежнему важны.

Мы знаем, что Google определяет сущность, как «вещь или понятие, которое является особым, уникальным, чётко определённым и различимым».

Важно понимать, что под «вещами» здесь подразумеваются не только физические объекты, но и такие понятия, как дата, цвет, идея и т.д.

Теперь давайте снова посмотрим на упомянутые выше три фактора ранжирования.

Контент

Контент, с точки зрения SEO, является объединением связанных между собой сущностей. Так, в утверждении «поисковая оптимизация мертва» есть сущность «поисковая оптимизация» и сущность «мертва» и между ними есть связь, которая соединяет их между собой.

Ссылки

Ссылки представляют собой связи между сущностями, которые существуют ещё до того, как мы (или Google) подумаем о них как о таковых (взаимосвязанных).

Ссылки декларируют связь и направление этой связи между страницами в интернете. Эти страницы в свою очередь являются сущностями, которые содержат другие сущности.

Далее, сущность анкорного текста через отношение подключена к теме (также сущности) и эта тематическая сущность также подключена через направленное отношение (ссылку) к сущности целевой страницы.

RankBrain

RankBrain не является фактором ранжирования в традиционном смысле. Его задача не действовать как сигнал, а определять, какой вес следует присвоить каждому сигналу, который принимает участие в ранжировании.

Получая запрос, RankBrain определяет, какие сигналы будут наиболее значимыми для предоставления наилучшего результата.

Например, для запроса [ лучшие подарки к Новому году] решающее значение будет иметь такой фактор, как время публикации. При этом для такого запроса, как [ гражданская война в США], авторитетность будет более важным сигналом, чем свежесть.

Что мы знаем о сущностях?

Большинство из того, что мы знаем о сущностях, стало известно из отдельных патентов Google и высказываний экспертов отрасли. Хотя все патенты желательно читать с определённой долей скепсиса, ниже мы рассмотрим те из них, которые с высокой вероятностью используются в системах Google.

Ранжирование результатов поиска на основании метрик сущностей

Этот патент Google получил в 2015 году. С полным анализом этого документа можно ознакомиться по ссылке, но там много текста и формул, поэтому ниже мы рассмотрим только основные моменты.

Согласно данному патенту, ранжирование сущностей для поиска включает в себя учёт четырёх факторов, таких как:

1. Связанность

    Связанность определяется на основании совместного появления сущностей. Так, если две сущности часто упоминаются в интернете вместе (например, «Дональд Трамп» и «президент»), то мы получим примерно такие результаты поиска в Google:

    Эти сущности появляются вместе достаточно часто и на достаточно авторитетных ресурсах, чтобы получить единый результат. Как видно на примере ниже, этот же процесс связывает другие сущности с термином, когда мы придаём ему форму множественного числа: каждый человек в карусели ниже является сущностью, и все эти люди связаны с сущностью «президент».


    2. Известность

      Чтобы определить, насколько известной является сущность, Google использует довольно простую формулу (в патенте). В частности, чем более ценной является сущность (исходя из таких вещей, как ссылки, отзывы, упоминания и релевантность) и чем ниже ценность той категории или темы, в которой она конкурирует, тем выше будет её известность. Например, если речь идёт о крупной рыбе в небольшом пруду, то эта рыба будет более известной, чем такая же рыба в океане.

      3. Вклад

        Этот фактор определяется с помощью внешних сигналов, таких как ссылки и отзывы, и является мерилом вклада сущности в тему. Отзыв от известного и уважаемого ресторанного критика больше повлияет на эту метрику, чем отзыв рядового пользователя в Yelp, поскольку вклад критика в этом пространстве будет более ценным.

        4. Награды

          Эта метрика учитывает те награды, которые получила сущность. Это может быть Нобелевская премия, «Оскар» или «Личность года в поиске». Тип награды определяет её вес, и чем более значимой была эта награла, тем больше ценности будет присвоено рассматриваемой сущности.

          Процесс ранжирования начинается с поступления запроса пользователя на информацию о сущности.

          Например, пользователь вводит запрос [ лучшие актрисы]. Далее Google выполняет свой процесс в следующем порядке:

          • Определяет связаность других сущностей и присваивает значения;
          • Определяет известность этих сущностей и присваивает каждой из них определённое значение;
          • Определяет вклад этих сущностей и присваивает значение;
          • Определяет, получали ли эти сущности какие-либо награды, и присваивает значение;
          • Определяет соответствующий вес каждой из них, исходя из типа запроса;
          • Определяет конечную оценку для каждой возможной сущности.

          После этого Google генерирует SERP, которая может выглядеть так:

          Да, алгоритмы Google не безупречны, но и не плохи.

          Ответы на вопросы с использованием ссылок на сущности в неструктурированных данных

          Этот патент Google получил в 2016 году. Основные тезисы:

          • Каждой сущности присваивается уникальный идентификатор. Это, вероятно, имеет отношение к приобретению Metaweb в 2010 году.
          • Определение наиболее вероятной сущности, запрашиваемой пользователем поиска, может быть выполнено через определение того, какая сущность чаще всего появляется в топ-10 поисковой выдачи. Например, если пользователь вводит запрос [ dave davies], то большинство результатов в топе поисковой выдаче будет ссылаться на сущность гитариста рок-группы The Kinks. Соответственно, это та сущность, которая будет использоваться для формирования панели выдачи Сети знаний.
          • Существует база сущностей. Чтобы сэкономить время на обработку топ-результатов каждый раз при получении запроса, существует база данных, где хранятся сущности и связи между ними. Это похоже на ссылочный граф, но для сущностей.
          • Сущности ранжируются по показателю качества. Этот показатель может включать такие метрики, как свежесть, предыдущие выборы пользователей, входящие ссылки и, возможно, исходящие ссылки. Помните, это всего лишь патент – поэтому вам не нужно ссылаться на каждый сайт, который вы можете найти. По нашим наблюдениям эта часть имеет вес лишь в особых ситуациях.
          • Когда выполняется запрос на сущность, определяется релевантность других сущностей для результата. Например, для запроса [dave davies] Google необходимо определить, какие сущностные метрики наиболее важны для него. Такие сущности, как "дата рождения", "брат", "группа" и ряд других кажутся достаточно важными для того, чтобы сформировать панель знаний. Тот факт, что музыкант был восьмым ребёнком в семье не выглядит достаточно важным. Стоит отметить, что важность сущностей определяется не только относительно панелей знаний, просто это одна из самых наглядных иллюстраций для этого процесса.

          У Google также есть методы, которые помогают ему вывести контекст для нескольких объектов с одинаковым названием. Например, такая сущность, как «Филадельфия» может быть городом, сортом сыра и фильмом. Если пользователь спросит «где», то Google покажет результаты для города, «кто снимается в» – фильма, «что хорошо сочетается с» – сыра.

          Эта техника позволяет Google определять сущности и связи между ними, когда данные являются неструктурированными. Данный метод также помогает поисковой системе узнавать о новых сущностях.

          В связи с достижениями Google в понимании естественного языка и машинном обучении важность сущностей постоянно растёт.

          Связанные сущности

          Последний патент, который мы рассмотрим, Related Entities, был выдан компании ранее в этом году.

          В этом патенте мы снова видим упоминания базы сущностей. Эта база представляет собой не просто список известных сущностей, но и информацию о том, как они связаны с другими сущностями. Так, сущность «Дейв Дэвис» может быть связана с такими сущностями, как:

          • «3 февраля 1947 года» в связи с «его день рождения»
          • «Дэниел Дэвис» в связи с «его сын»
          • «com» в связи с «его сайт» и т.д.

          Все эти связи содержатся в базе данных.

          У Google есть механизм для определения приоритетных сущностей. Как отмечалось выше, порядок рождения Дейва Дэвиса в его семье – известная сущность, однако она не так важна по сравнению с другими сущностями, определёнными как те, что могут вызвать интерес у пользователя.

          Почему сущности важны для SEO ?

          Сущности значимы для SEO потому, что по своей сути они представляют собой реальный мир. Мы и сами понимаем всё, что нас окружает, в контексте сущностей и связей между ними. Это особенность человеческого мышления.

          Однако, чтобы использовать эту концепцию, Google необходимо машинное обучение. Без машинного обучения Google не может достаточно хорошо понимать язык для того, чтобы интерпретировать страницы и связи между сущностями.

          Без машинного обучения и, в частности, RankBrain, Google не мог бы узнать, как корректно и «на лету» приоритизировать сигналы, а также адаптироваться к неизвестным ранее сущностям и изучать их.

          Поэтому сейчас мы видим, как Google меняет механизмы своей работы, что также влечёт за собой крупные изменения в ранжировании страниц.

          Вместе с сущностями у поисковой системы появляются новые возможности. Благодаря использованию этой концепции Google способен:

          • рассчитать вероятность удовлетворения намерения пользователя с более высокой точностью;
          • понять из речи и тона, каким будет результат – позитивным или негативным.

          При этом резко снижается зависимость от ссылок.

          Ссылки будут оставаться сигналом ранжирования, но они станут просто одним из многих механизмов для определения значимости сущностей.

          Чтобы проводить оптимизацию в этом новом мире, нам нужно изменить своё представление о сайтах и о том, как мы их продвигаем на рынке.

          Если мы хотим ранжироваться по запросу [ blue widgets], нам нужно учесть тот факт, что Google уже понимает или скоро поймёт все сущности, связанные с ним, а также то, в каком порядке они будут соответствовать поисковому намерению пользователя.

          Поэтому оптимизаторам нужно подумать, какие сущности нужны им на сайте, и как они должны быть связаны между собой, чтобы Google выбрал именно их ресурс как тот, что с большей вероятностью удовлетворит потребности пользователей, чем конкурирующие сайты.

          Сущности и ссылки

          Наверное, наиболее значимыми для SEO-специалистов будут изменения в роли ссылок. Судя по всему, и это кажется неизбежным, ссылки станут просто ещё одним коннектором для сущностей среди многих.

          Зачем Google нужно будет передавать ценность через ссылки, если будут другие сигналы и чёткое понимание того, как сущности связаны между собой?

          Google не нужно, чтобы в этой статье мы ссылались на сайт Дейва Дэвиса из The Kinks. Поисковая система знает из контекста, что в статье упоминается эта сущность, и она связывает её с рядом других сущностей. При этом системы Google способны определить, что в статье отсутствует такой фактор, как связанность, поэтому связь между этой статьёй и гитаристом The Kinks будет минимальной.

          Исходя из изложенного выше, старайтесь учитывать логические связи, независимо от того, каким направлением SEO вы занимаетесь.

          Если вы создаёте контент, подумайте о других сущностях, которые должны присутствовать на странице или на сайте, и добавьте их. Посмотрите на топ-10 сайтов и выясните, какие ещё сущности содержатся на этих страницах.

          Когда вы занимаетесь линкбилдингом, подумайте о тех сущностях, с которыми должен ассоциироваться сайт, и получите ссылки от тех ресурсов, где они есть.

          Например, если ваша компания оказывает риелторские услуги в Майами, то вам нужно получить ссылки не только от сайтов недвижимости, но и от сайтов, имеющих отношение к Майами. Вы также можете продвинуться на шаг дальше и подумать, какие типы сайтов имеют выраженное отношение к сфере недвижимости.

          Например, ипотечные брокеры будут иметь сильную связь с сущностью недвижимости и таким образом, будут представлять собой хорошие связи второго уровня.

          Сущности будут использоваться и впредь

          Сущности необходимы Google, чтобы предоставлять нам ту информацию, которая нам нужна, когда мы запрашиваем сущность «пицца» вместе с сущностью «рядом со мной».

          Поэтому закажите себе любимую пиццу и начните думать о том, какой контент должен быть на вашем сайте.

          Источник: Search Engine Journal
          preview Новейшая система веб-аналитики Finteza - Будь в тренде!

          Новейшая система веб-аналитики Finteza - Будь в тренде!

          Finteza — это полные данные по всем пользователям в режиме реального времени и в любом разрезе
          preview YouTube SEO: топ-факторы, над которыми стоит работать

          YouTube SEO: топ-факторы, над которыми стоит работать

          Самые важные и полезные выводы из масштабного исследования факторов ранжирования YouTube
          preview Яндекс.Апдейт «Андромеда» – органика всё глубже

          Яндекс.Апдейт «Андромеда» – органика всё глубже

          Понятие «новый алгоритм» в Яндексе – это уже не совсем то, что было ранее
          preview 10 типичных ошибок интернет-агентств при разработке сайта

          10 типичных ошибок интернет-агентств при разработке сайта

          Иногда приходит клиент с острым желанием получить сайт через 2 месяца
          preview 10 интересных выводов из последних западных SEO-конференций

          10 интересных выводов из последних западных SEO-конференций

          В статье автор делится своими выводами, сделанными из самых интересных докладов, прозвучавших на последних SEO-конференциях
          preview Как избежать санкций Google за спам в микроразметке

          Как избежать санкций Google за спам в микроразметке

          Добавление структурированных данных на сайт – это всегда хорошая идея. Однако ошибки при внедрении семантической разметки могут приводить к ручным санкциям со стороны Google