SMX East 2013: Интентный поиск - революция в мире веб-поиска

С 1 по 3 октября 2013 года в Jacob K. Javits Convention Center в Нью-Йорке (США) прошла ежегодная международная конференция Search Marketing and Expo 2013 (SMX East 2013). Организаторами и ведущими мероприятия выступили редакторы Search Engine Land: Дэнни Салливан (Danny Sullivan) и Крис Шерман (Chris Sherman).

Ключевой и наиболее интересной сессией второго дня конференции стала дискуссионная панель, получившая название «Интентный поиск: революция в мире веб-поиска» (The Coming Entity Search Revolution). В ходе обсуждения были рассмотрены все основные вехи развития поиска, сделаны попытки предсказать дальнейшее развитие поисковых технологий и отрасли в целом.

Модератором сессии выступил Дэнни Салливан (Danny Sullivan), основатель и главный редактор издания Search Engine Land. Спикерами сессии стали Дэвид Эмерланд (David Amerland), автор статей для целого ряда специализированных изданий и авторитетный аналитик отрасли; Джонатан Гудман (Jonathan Goodman), президент агентства Halyard Consulting; и Рева МакИчерн (Reva McEachern), главный технолог компании REVA Digital Media LLC.

Приступая к дискуссии Дэнни Салливан не без лёгкой иронии отметил, что буквально ненавидит понятие «поиск по сущностям» или «интентный поиск», точно также, как понятие «семантический» поиск. «Все эти слова значат так много, но, используя их, удаётся выразить так мало», - заметил он. Однако, продолжая введение в дискуссию, Салливан отметил, что новая концепция поиска по смыслам (или сущностям) по-настоящему стирает границы между вебом и реальной жизнью. Это значит, что теперь поисковые системы умеют не просто соотносить между собой слова и выдавать пользователю релевантные значения, они «научились» понимать идеи, концепции и анализировать окружающую действительность.

Дэвид Эмерланд «Введение в поиск по сущностям: SEO в эпоху семантического веба»

Первым выступил Дэвид Эмерланд с докладом на тему «Введение в поиск по сущностям: SEO в эпоху семантического веба». По мнению докладчика, данную дискуссию целесообразнее начинать с разъяснения понятия сущностей. Обратившись к слушателям, Дэвид попросил всех закрыть глаза и представить себе дерево – после этого он пояснил, что каждый человек, присутствующий в зале, представил собственную картинку с изображением дерева – это и есть концепция, которая без нужных уточнений никогда не будет понятна поиску. Более того, раньше поисковик в ответ на неуточнённый запрос обрушивал на пользователя все эти концепции разом. Таким образом, в прошлом работа поисковых алгоритмов сводилась к установлению вероятностных соответствий между запросом пользователя и результатами поисковой выдачи.

Вот почему поисковые алгоритмы со временем научились находить и анализировать ключевые слова; анкорные тексты; ссылки, поступающие на сайт, с тематически связанных источников; внутренние ссылки и т.п.

Далее Дэвид несколько усложнил исходные данные: «Допустим, что я сформулировал свой вопрос к вам на немецком языке. И опять же попросил вас представить дерево. При этом, вполне естественно, что вы можете и не знать иностранный язык. Таким образом, если вы не знаете немецкого, то вы не сможете выполнить то, о чем я вас прошу». Завершая свою мысль, докладчик подвёл промежуточный итог, отражающий всю концепцию поиска: «Всё, что вы знаете о деревьях – то ваша персональная «Сеть знаний» и у каждого из вас есть собственный персональный контекст, всплывающий в сознании в качестве ассоциации, как только вы слышите определённое слово. Эти контексты существенно разнятся у разных людей».

Можно представить «дерево» как сущность или концепцию. Таким образом, мы и Google, вычленяя сущность, опираемся на окружающий нас контекст, опыт, знания, зависимости, социальные взаимосвязи и целый ряд прочих факторов.

По мнению Дэвида, все эти рассуждения необходимы для понимания того, как работает поиск, а значит, и для грамотного выстраивания SEO-стратегий. Так, в прошлом все стратегии продвижения сводились к анализу вероятностей влияния того или иного фактора на ранжирование ресурса в выдаче. Специально для выявления этих вероятностей и создавалось огромное количество сервисов аналитики и статистики. Однако, это - SEO прошлого.

Раньше для поиска же была важна релевантность выдачи. Вот почему оптимизаторы пытались постигнуть механизмы работы поисковых алгоритмов, отвечающих за ранжирование сайта в выдаче. С появлением семантического веба, значение статистики для поискового продвижения стало постепенно уменьшаться.

Сегодня поиск снова меняется: появляется огромное количество вертикалей, расширяется поисковый функционал. Кроме того, сегодня интернет столкнулся с проблемой Big Data, и поисковым алгоритмам приходится обрабатывать этот огромный массив персональной, персонализированной и постоянно обновляющейся информации.

Одним из наиболее показательных примеров изменения концепции поиска является появление виртуального ассистента Google Now. Данный программный продукт от Google, действительно понимает, чего хочет пользователь в настоящий момент. Кроме того, анализируя предыдущие поисковые сценарии, он способен предсказывать, чего хочет конкретный пользователь в определённый момент времени.

Таким образом, новые концепции поиска бросают новый вызов SEO-специалистам. Главная цель теперь сводится к тому, чтобы научиться понимать, каким образом следует обрабатывать данные о пользователях и от пользователей, чтобы достигать поставленных целей.

Сегодня в интернете накапливаются огромные массивы структурированных и неструктурированных данных. Чтобы помочь поисковикам лучше индексировать контент, прежде всего, следует:

  • Установить оптимальные объемы публикуемого контента;
  • Понять, насколько быстро он распространяется в интернете и сделать этот процесс максимально оперативным;
  • Публиковать контент различных форматов;
  • Убедиться в том, что вашему ресурсу и публикуемой на нём информации, действительно, доверяют (с этой целью полезно наращивать авторитетность сайта, привлекать к созданию контента авторитетных авторов и не пренебрегать функционалом авторской разметки).

Что касается социальных факторов, способствующих продвижению контента, то здесь, прежде всего, важно установление профильных социальных связей; создание «социального шума» вокруг контента ресурса; активное позиционирование себя в профессиональных сообществах; использование авторской разметки и работа на повышение Author Rank.

Понимание сущностей формируется на основе анализа самых разных аспектов, знаний и сценариев поведения пользователей в интернете. Принцип вычленения сущностей алгоритмами Google в общем виде сводится к следующей схеме:

По словам докладчика, сегодня в интернете содержится огромное количество неструктурированных данных, и основная задача Google сводится к тому, чтобы выявить эти данные, упорядочить их и структурировать определённым образом.

Более совершенное решение данной задачи стало возможно благодаря вычленению сущностей или концепций. Данный подход позволяет пользователю получить в поиске не просто ответ на поставленный вопрос, но и полноценное решение своей задачи.

Так, например, теперь, введя в поисковую строку запрос [кто является президентом США], пользователь может видеть: 1. ответ на свой вопрос; 2. биографию данной персоналии, содержащую ссылки на соответствующие сайты; 3. свежие посты пользователей соцсетей с упоминанием данной личности, дополненные ссылками на источники; 4. связанные с персоналией сущности (к примеру, поисковик покажет информацию о родственниках президента и т.п).

Таким образом, сегодня в поисковой выдаче может содержаться огромное количество самой разнообразной информации, связанной с поисковым запросом. Это свидетельствует о том, что поиск начинает максимально полно удовлетворять интересам пользователей.

Для поисковой оптимизации это означает следующее: все мероприятия, направленные на улучшение позиций ресурса в поисковых системах сведутся к поиску путей максимально полного ответа на запрос пользователя. Выиграют те, кто сможет сделать это лучше других.

Таким образом, поисковая оптимизация сведется к работе над on-page SEO (цель – сделать ресурс в максимальной степени удовлетворяющим потребностям пользователей). Работа над ключевыми словами будет постепенно отодвигаться на второй план. В тоже время, на первое место выйдет работа по оптимизации сайта под различные интерфейсы выдачи, с которыми в последнее время активно экспериментируют все ведущие поисковые системы.

Что останется неизменным, так это:

  • Авторитетность страниц и сайта;
  • Трастовость сайта;
  • Репутация авторов контента;
  • Позиционирование ресурса в соцмедиа.

Завершая своё выступление, Дэвид Эмерланд заявил, что сегодня мы вступаем в эпоху персонализированного поиска, умеющего понимать и предсказывать сценарии поведения пользователей и их потребности.

Джонатан Гудман «Что такое Freebase и для чего она нужна Google

Следующим докладчиком стал Джонатан Гудман. В своём выступлении он рассказал о том, как Google работает с открытой семантической базой Freebase, заимствуя из неё данные для развития «Сети знаний».

В настоящее время в базе знаний насчитывается 40 млн. различных тем в тысячах различных категорий. Кроме того, Freebase, используя стандарт Sсhema.org, объединяет все полученные об объекте факты в определенные блоки, делая эти знания доступными на многих языках мира и во многих странах.

В общем виде алгоритм процесса структурирования данных выглядит примерно так:

История взаимодействия Google и Freebase восходит к тому, что в 2010 году компания-разработчик базы знаний Metaweb была приобретена корпорацией Google. Это было сделано для того, чтобы впоследствии интегрировать все знания, организованные в единую систему, в «Сеть знаний», развитие которой позволит существенно изменить всю сущность веб- и мобильного поиска.

В заключение Джонатан добавил, что в ближайшем будущем поиск будет представлять собой органичный синтез семантического поиска с интентным. Без сомнения, поисковые системы научатся безошибочно идентифицировать потребности и намерения пользователей; будут запоминать предыдущие поисковые сценарии; а также научатся анализировать действия пользователей как онлайн, так и оффлайн (к примеру, поисковая система будет знать в каком магазине и какой товар недавно приобрёл пользователь). Все эти изменения не смогут не отразиться на интерфейсе и функционале поисковой выдачи.

Оптимизаторам Джонатан посоветовал определяться с нишами рынка, контролировать сферы влияния на пользователей, используя с этой целью различные инструменты и приёмы. По мнению докладчика, сегодня особенно полезно осваивать методики предоставления поисковикам структурированных данных, не пренебрегать разметкой и микроформатами. «Именно на эти основные столпы опирается поиск в новой сегодняшней концепции его существования», - прокомментировал докладчик.

Кроме того, по словам Джонатана Гудмана, в ближайшее время оптимизаторам придётся забыть о входящих ссылках и стратегиях линкбилдинга, поскольку в новом поиске они потеряют своё практическое значение.

Далее в дискуссию включился Дэнни Салливан, добавив, что, горя о новом поиске по сущностям, невозможно не упомянуть об алгоритме Google Hummingbird (Колибри). Инновационный алгоритм поиска существует уже несколько месяцев, однако был запущен Google в конце сентября текущего года. Он представляет собой синтез всех ранее существовавших в Google алгоритмов, разработанный таким образом, чтобы поиск уделял должное внимание комбинации слов, использованных в запросе, а не отдельным словам. Основной акцент в поиске делается не на анализ ключевых слов, а на понимание алгоритмом всего содержания запроса.

Таким образом, страницы, попадающие в выдачу, будут максимально соответствовать всему поисковому запросу, учитывая контексты, историю поиска и социальные связи пользователя.

«Такой подход позволит Google выдавать не только наиболее точные ответы на поисковые запросы пользователей, но и максимально точно обрабатывать страницы сайтов и ранжировать их в выдаче в зависимости от того, что нужно пользователю в конкретный момент поиска», - подытожил главный редактор Search Engine Land.

Рева МакИчерн «Как персоналии становятся сущностями: или как Граф знаний работает с Социальным графом»

Завершил секцию доклад Ревы МакИчерн, посвященный теме: «Как люди становятся вещами: или как Граф знаний работает с Социальным графом». Своё выступление докладчица начала с цитирования слов Мэтта Каттса (Matt Cutts): «Все эти люди заняты исключительно оптимизацией вместо того, чтобы создавать отличный контент и делать хорошие сайты. Мы пытаемся сделать так, чтобы поисковый робот стал умнее и лучше различал потребности пользователя». Еще одна цитата, которую привела Рева МакИчерн, звучала следующим образом: «Когда речь заходит об информации, то её ценность нельзя приравнять к списку разрозненных элементов. Истинная ценность – в понимании свойств и взаимосвязей – т.е. того, как взаимодействуют между собой элементы. Это именно то, что реализуют концепции Сети знаний и социального графа». Высказывание принадлежит Джону Михалик (John Mihalik) и было опубликовано в Search Engine Journal.

После этого участница сессии привела несколько важных цифр, связанных с деятельностью Google. Так, на сегодняшний день корпорация насчитывает 425 млн. пользователей почты Gmai, 500 млн. пользователей Google+ (из них постоянными являются 343 млн.). Кроме того, в последнее время Google практически перестал предоставлять данные о ключевых словах, содержащихся в пользовательских запросах: так во втором квартале 2013 года количество поисковых запросов категории «Not provided», поступающих из основного поиска Google, резко увеличилось и достигло, в среднем, 49%.

С другой же стороны, сегодня происходит, так называемая, «демократизация данных» – т.е. все данные (которые доступны для анализа) можно отождествлять с конкретными пользователями, а весь контент, публикуемый в интернете, имеет социальный подтекст:

Такое положение вещей напрямую указывает на то, что сегодня на странице выдачи пользователю предоставляется гораздо больше информации, чем раньше. Сегодня поисковые системы совершают переход от простого индексирования документов и анализа ссылок и контента, содержащегося на странице к пониманию сути вещей.

Для SEO-специалистов это означает то, что у них появился отличный шанс сделать коммуникации в глобальной сети более полноценными и разносторонними, научится оперировать данными несколько иного порядка, отойти от скучного анализа статистики и заняться выстраиванием онлайн-модели окружающего мира. «Глобальная сеть подчиняется абсолютно тем же законам, что и человеческое мышление – в этом и заключается её феномен», - прокомментировала докладчица.

Таким образом, сегодня Google делает основную ставку на синтез Социального графа с Графом знаний. Как и прежде, все связи осуществляются при помощи ссылок.

Google уже умеет довольно качественно выявлять потребности и предпочтения пользователя, и, исходя из этого, предоставлять людям персонализированные результаты выдачи, основанные на анализе его социальной активности и предыдущих сценариях поиска.

Если задуматься о том, как Google удалось сделать свою выдачу персонализированной, вспоминается сразу несколько нашумевших нововведений гиганта поиска: запуск соцсети Google+, появление расширенных сниппетов и функционала указания авторства, разработка Сети знаний, присоединение к инициативе Schema.org. Именно этот набор инноваций и позволил Google создать и продолжать развивать концепцию интентного поиска.

Кроме того, сегодня немаловажное значение приобретает такой показатель, как AuthorRank – велика вероятность того, что в ближайшее время он станет одним из важнейших показателей, влияющих на коэффициент PageRank. То есть AuthorRank станет одним из ключевых факторов при подсчёте PageRank.

Подводя итоги своего выступления, Рева МакИчерн заявила о том, что совсем скоро SEO-специалистам придётся вплотную взаимодействовать с представителями SMM-индустрии, с тем, чтобы ресурс мог заработать достаточную авторитетность в социальных сервисах. Еще одним важным фактором в работе оптимизатора станет использование микроформатов – без этого Google не сможет уловить всех взаимосвязей контента сайта с окружающей информацией и контекстами, а значит, ресурс попросту не будет показываться релевантной аудитории.

Данная сессия стала ключевой в рамках второго дня конференции SMX East 2013, поскольку на ней была раскрыта концепция эволюции поиска и намечены основные пути дальнейшего развития отрасли SEO.

Завершился день масштабной вечеринкой SMX After Dark, на которой гостей угощали алкогольным коктейлем с символическим названием «Колибри».

Обзор подготовили: Лада Калашникова и Анастасия Матвеева

RIW–2013. SEO: как избежать ошибок

18 октября 2013 года в рамках Шестой ежегодной Недели Российского Интернета (Russian Internet Week, RIW–2013) прошла секция «SEO: как избежать ошибок»

Сергей Кокшаров о факторах, вызывающих доверие поисковых систем

Выступление Сергея Кокшарова, независимого аналитика в области поисковой оптимизации, на 45-ом выпуске передачи «На Доске» было посвящено доверию поисковых систем к сайту

SMX East 2013: Как добиться высот, используя структурированные данные?

С 1 по 3 октября 2013 года в Jacob K. Javits Convention Center в Нью-Йорке (США) прошла ежегодная международная конференция Search Marketing and Expo 2013 (SMX East 2013

128 экспертов в сфере SEO говорят о Google: коллективное мнение умных людей в результатах опроса

Каждые два года Moz проводит опрос среди специалистов в сфере SEO с целью узнать их мнение по поводу важности разных факторов ранжирования алгоритма Google

SMX East 2013: Ключевые факторы ранжирования

С 1 по 3 октября 2013 года в Jacob K. Javits Convention Center в Нью-Йорке (США) проходила ежегодная международная конференция Search Marketing and Expo 2013 (SMX East 2013

Жизнь вне Google: используем альтернативные ресурсы для привлечения органического трафика

1 октября 2013 года в Jacob K. Javits Convention Center в Нью-Йорке (США) стартовала ежегодная международная конференция Search Marketing and Expo 2013 (SMX East 2013