SMX London: Революция в мире веб-поиска

13 мая в Лондоне в Конференц-Центре ФК «Челси» открылась одна из ключевых конференций серии SMX — Search Marketing Expo London 2014.

Организаторами мероприятия по традиции выступили редакторы Search Engine Land: Дэнни Салливан (Danny Sullivan) и Крис Шерман (Chris Sherman).

В рамках секции What is Hummingbird & the Entity Search Revolution (Алгоритм «Колибри» и поиск по сущностям). Состоялись выступления Дэвида Эмерланда (David Amerland), сотрудника HMS Media, аналитика трендов, автора книг Google Semantic Search и The Social Media Mind, и Джастина Бриггса (Justin Briggs), директора по маркетингу, Getty Images.

Дэвид Эмерланд признался, что симпатизирует Яндексу, его персонализированная выдача очень импонирует ему, как специалисту. Докладчик считает, что будущее поиска – именно за такими технологиями. Недавно о семантическом поиске Дэвид рассказывал на SEO Конференции в Софии, где популярно объяснял суть концепции на примере поиска Google.

По мнению спикера, семантический поиск был разработан, чтобы организовать и связать между собой весь огромный массив данных, накопленных в интернете. Теперь, чтобы концепция заработала, вебмастерам необходимо проделать серьёзную работу и структурировать все данные, имеющиеся на их сайтах, при помощи микроразметки.

Несмотря на то, что пока поисковые системы не требуют от вебмастеров в принудительном порядке начинать использовать структурированные данные — лучше делать это. Использование разметки на страницах сайта помогает поисковой системе лучше распознавать содержание ресурса и лучше представлять его в результатах выдачи.

Сегодня поисковые системы стремятся сделать поиск простым и понятным для пользователя.

Для Яндекса пока по-прежнему важны ключевые слова, Google пытается понять, что ищет пользователь, предоставляет релевантные результаты, анализирует пользовательский интент, пытается понять контексты, в которых осуществлялся поиск.

В целом, меняется концепция поисковых систем – от традиционного предоставления ответов на пользовательские запросы поисковики переходят к обслуживанию всех областей жизни пользователей. Включая физическую возможность совершать покупки прямо из результатов поиска. Список факторов, критически важных для семантического поиска выглядит следующим образом:

Алгоритм «Колибри» меняет традиционные принципы работы поисковой системы и само понятие индекса. Теперь в индекс попадают не просто сайты и страницы, а большие пласты объективно существующих в действительности данных.

Традиционно поисковая система состоит из следующих компонентов: краулер, индекс, поисковая выдача. Но теперь появляется еще один важный элемент системы – это сам пользователь. Иными словами, поисковая система анализирует не просто качество и релевантность страниц, но и пытается понять и проанализировать поведение пользователей. При таком подходе ключевое значение получает исторический контекст, социальные связи, психология и особенности поведения пользователей, их активность.

Что касается страниц сайтов, то для успешного продвижения в поиске теперь крайне важны авторитетность страницы. Именно это фактор позволит Google со временем выявлять наиболее качественные страницы, когда концепция сущностей получит повсеместное развитие.

Основу семантического поиска заложил Facebook – именно в его концепции теория графов получила наибольшее развитие. Впоследствии эту концепцию перенял и Google, разработав свою «Сеть знаний». Каждый объект окружен информацией и находится в непрерывной взаимосвязи с другими объектами, предметами и сущностями.

Безусловно, развитие семантического поиска существенно осложнит жизнь оптимизаторов в ближайшее время – экономические и технические факторы теряют свою актуальность. В то же время возрастает значение маркетинга – вместо технического продвижения в поиске придётся заниматься интегрированными маркетинговыми коммуникациями, повышать узнаваемость и авторитетность бренда и людей, создающих его. Поиск постепенно приближается к концепции реальной жизни.

Джастин Бриггс выступил с докладом об алгоритме «Колибри».

Алгоритм «Колибри», прежде всего, создавался для того, чтобы помочь понимать поисковой системе скрытые запросы пользователей, выявлять их потребности и истинные причины и цели поиска.

Растет и количество вертикалей поиска: социальный, поиск по картинкам; поиск видео, товарный и т.п. Вводя одни и те же ключевые слова, пользователь может осуществлять разные типы поиска. Для того чтобы понять, что конкретно интересует пользователя, Google начал внедрение семантического поиска.

Важную роль играет визуализация поиска. Распознавание речи (естественный язык запросов) и лемматизация – становятся трендами. При таком подходе поисковику становится все труднее выявлять качественный контент, именно на это нацелены последние изменения алгоритмов Google.

Сегодня быстрое индексирование страниц поисковиками просто невозможно без использования лемматизации. Оптимизаторам важно это учитывать. Работая над контентной базой сайта, важно периодически выявлять наиболее актуальные запросы пользователей.

Меняются и принципы поисковых запросов – люди начинают искать не просто конкретные продукты и документы, но и хотят мгновенно получать полноценные ответы на информационные запросы. Для ответов на запросы Google использует данные Freebase и Википедии.

Оптимизация для «Сети знаний» становится отдельным направлением деятельности специалистов. Ознакомиться с основами можно на специальном ресурсе.

Использование микроформатов и структурированных данных активно поддерживается поисковыми системами, поскольку позволяет алгоритмам детально определять тип контента, опубликованного на странице, а также содержание как текстов, так и нетекстовых элементов.

Полезно использовать сущности в их взаимосвязях – Google поощряет это, поскольку сам заинтересован в лучшем понимании этих взаимосвязей. Здесь имеет смысл уделять внимание внутренней перелинковке.

Также на сайте полезно использовать ответы на вопросы о сущностях, которые чаще всего задают пользователи. Такой тип информации будет хорошо индексироваться.

Создавая контент для сайта, полезно учитывать естественный язык вопросов и особенности человеческой устной речи. Такая концепция также радикально меняет подход к созданию продвигающего контента.

Допустимо использовать 50-60 знаков в теге <title> – при этом желательно, чтобы описание отражало не только сам объект, но и его взаимосвязь с критически важными для вас сущностями.

Полезно ознакомиться с основными принципами использования семантической разметки Shema.org – именно на нее делают ставку ведущие поисковики.



Вопрос из зала: Нужно ли передавать Google данные о содержимом изображений при помощи разметки или EXIF файлов в случае размещения фото?

Джастин Бриггс: Google, конечно, уже научился находить котиков на картинках при помощи алгоритмов машинного обучения. Но все же, сами сотрудники поиска рекомендуют владельцам ресурсов при размещении изображения передавать информацию об изображениях алгоритмам.

Вопрос из зала: Что необходимо использовать коммерческим сайтам для лучшего продвижения?

Дэвид Эмерланд: Полезно использовать структурированные данные, создавать расширенные сниппеты, работать над разумным расширением семантического ядра, устанавливая взаимосвязи с другими сущностями. Также полезно зарабатывать органические положительные отзывы и доверие пользователей.

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета. Языки: румынский, испанский. Кредо: Арфы нет, возьмите бубен.