Белорусская SEO Революция 2010: Оксана Команеску «Современные семантические технологии в результатах поиска Google: расширенные сниппеты»

2

18 ноября, на Минской международной практической конференции «Продвижение сайтов в белорусском интернете. Революция», в рамках секции по поисковым системам и их сервисам прозвучал доклад Оксаны Команеску, инженера-аналитика команды качества поиска компании Google.

Александр Садовский: — Сфотографируйте кто-нибудь Яндекс и Гугл вместе!!! Редкий кадр на самом деле.

Здравствуйте, меня зовут Оксана, я работаю в компании Google уже практически пять лет, пять лет я часть команды качества поиска. Я занимаюсь аналитикой и тестированием. Расскажу я вам сегодня про один проект, которым я горжусь, он – часть нашего двадцатипроцентного времени. Я не знаю, в курсе ли вы, но в Google существует такая традиция, что любой инженер может себе выбрать проект по нраву, и работать над этим проектом 20% своего рабочего времени. В принципе, наш Joomail так и родился, как двадцатипроцентный проект, как и очень много хороших идей, родившихся в это время. И моя презентация как раз посвящена вот такому же проекту, в котором участвую я.

Итак, я расскажу вам немножко о семантических технологиях. В принципе это очень древняя идея, которая родилась у Тима Бернерса Ли – создателя веба и создателя html. Именно он придумал такую фишку, чтобы сделать расширение веба, чтобы в этом расширении все данные сайтов были структурированы, четко определены и между ними можно было построить какие-то связи. К примеру, если я хочу пригласить Петю на пиво, и введу в поисковик [петю на пиво], поисковик мне должен будет вернуть не только когда у Пети заканчивается рабочий день, но и пивные, которые будут недалеко от нас, и стоимость литра пива, и еще кучу подобной, связанной между собою, информации, позволяющей принимать быстрые решения.

Это очень милая такая теория, до сих пор существующая немножко в вакууме, потому что никто так и не придумал, как же ее внедрить на практике. Потому что, к сожалению, мы все представляем и описываем мир по-разному, и прийти к какой-то одной большой антологии не получается. То, что мы предлагаем на данный момент, оно немножко простое, не сложное, но оно выглядит красиво. Это делают и другие поисковые компании, например, Яндекс, поэтому я надеюсь, что вы воспользуетесь нашей технологией и будете применять ее на практике. К сожалению, в Белоруссии я не знаю ни одного сайта, который бы применял то, что мы называем расширенными сниппетами.

Я вам покажу несколько примеров. Итак, вот это наши расширенные сниппеты – некий симбиоз между вебмастерами и поисковиками:

На самом деле нам очень часто приходят претензии, что вебмастера никак не могут управлять внешним видом своих сайтов в выдаче. И вот, здесь прекрасно показано, как сайты с рецептами могут показывать своим пользователям сразу же из сниппета очень красивую, очень структурированную информацию. Вы видите, что здесь и фотография, и отзывы, и приготовление, и калорийность блюда – в общем, все, что может понадобиться для быстрого принятия решения. То есть, если бы я, например, захотела приготовить суп харчо, я бы сразу же из выдачи нажала бы на какой-нибудь результат, который бы выглядел так, чем на обычный, никак неорганизованный поисковой результат.

Другим примером расширенных сниппетов являются обзоры, которые оказываются очень важны при принятии решения о том или ином приобретении. Есть также сниппеты для форумов, которые тоже очень хорошо работают. Так же хочу представить новый сниппет, который был внедрен совсем недавно, где-то недели три назад для России, демонстрирующий диапазон цен. Помимо этого у нас есть еще более детальное описание продуктов, мы для этого используем hProdact, микроданные или RDFa.

Другой вид расширенного сниппета – если ваш сайт предоставляет информацию по лекциям или по концертам:

Еще одним примером расширенных сниппетов является поиск людей. Если вы существуете онлайн, если вы онлайн-личность, то тогда вы наверняка присутствуете в какой-нибудь социальной сети. Наши расширенные сниппеты покажут пользователю, та ли это личность, которую он ищет или нет, демонстрируя личную информацию из социальных сетей.

Помимо этого мы поддерживаем расширенные сниппеты для компаний и организаций. Вы можете написать контактные данные компании, имя начальника, звездность отеля, меню ресторана… есть куча данных, которые можно определить сразу же, в теле документа.

Строка навигации — это то, что вебмастера называют Breadcrumbs, вы все, наверное, знаете, как это пишется. Раньше мы определяли это автоматически. Мы и сейчас определяем это автоматически для определенного количества сайтов, но если вам это интересно, вы можете это определить и сами посредством микроданных и RDFa, потому что микроформат, к сожалению, не поддерживает эту опцию.

Ну и нашему видео-поиску вы также можете помочь понять, что на вашей странице видео, насколько оно новое, старое и кучу другой информации.

Как же это все работает? Очень просто. Вот, например, код сайта Gastronom.ru, сделанный очень качественно и очень грамотно:

Они определяют разными значениям в теле документа разные маленькие части информации, иначе говоря – структурируют свою информацию. Это очень прямолинейно определяется в любом шаблоне, который вы используете.

Зал: — Кто парсит эти данные?
Оксана Команеску: — Робот парсит эти данные.
Зал: — Ваш робот парсит?
Оксана Команеску: — Ну а чей бы вы хотели?

Мы поддерживаем три стандарта разметки – микроформаты, микроданные и RDFa.

Микроформаты – это самый старый формат, который появился в 2004 году (это практически древность). Плюсом микроформата является доступность и простота, а проблемой то, что он использует формат class, практически замусоривая этот атрибут.

RDFa – на самом деле очень гибкий инструмент, но и очень сложный. Плюсом является его гибкость, объемность, действующая экосистема… Но в нем достаточно сложно разобраться, он апеллирует в этом трехмерном пространстве «субъект-объект-предикат», и если вы хорошо учились в школе, то вам стоит за это браться, а если нет, то лучше стоит обратить внимание на микроданные.

Микроданные – очень похожи на микроформаты, но не используют class. Они были предложены как стандартный формат для html 5, что породило очень много холиваров. Если вы почитаете форумы, то увидите, что семантические маньяки очень сильно спорят о том, нужно ли в html вводить еще какие-то данные по структуре или нужно это выводить все совершенно на другой уровень какой-то. Их преимущество – это внятность и аккуратность, а недостатки – отсутствие инструментов поддержки.

Практические советы:

1. Пользуйтесь Rich Snippets Testing Tool. Мы придумали такой инструмент тестирования, где вы сразу же можете посмотреть, как эти расширенные сниппеты будут выглядеть в выдаче. Инструмент тестирования у нас находится в очень красивом состоянии beta, в нем он уже находится год, и будет наверное еще долго находиться в этом состоянии, ибо нет на свете ничего более постоянного, чем временное. Но мы бы хотели, чтобы у нас было больше ресурсов на этот инструмент, но пока, то что мы пытаемся сделать, — это увеличить количество ошибок, которые он показывает. К сожалению, у вебмастеров фантазия настолько богатая, что мы просто не успеваем понять и поймать все их ошибки, поэтому у нас все усилия уходят именно в эту сторону.

2. Размечайте данные соответствующими атрибутами. Если вы поймете сразу же, зачем вы делаете этот сайт, что вы пытаетесь разметить, то вам будет легче принять решение и сделаете вы все намного правильнее.

3. Не используйте скрытый текст. Это мой призыв. Я очень долго была и являюсь частью команды веб-спама, и поэтому декларирую — скрытый текст в Google считается спамом, пожалуйста, не используйте его! Размечайте видимые элементы контента. Если вам кажется, что разметка как-то портит внешний вид вашей страницы, то есть куча разных других способов показать все это, без использования скрытого текста.

Ну и немного про ошибки, которые я вижу чаще всего, когда оцениваю, почему для того или иного сайта не показываются расширенные сниппеты.

К типичным ляпам я отношу:
— путаницу в разметке отзывов, оценок, индивидуальных или суммарных обзоров;
— ошибочное форматирование времени (несоблюдение формата ISO);
— ошибки при построении отношений между смысловыми элементами (определение в один класс названия и количества и т.д.).

И всех призываю помнить, что бот – он очень глупый, и не понимает, что вебмастера могут с фантазией подходить к разметке, ему нужно, чтобы все было определено очень четко.

Ну и в конце своего доклада хочу рассказать о наших планах на будущее. Планов, на самом деле, у нас много, — у нас команда маленькая.
Во-первых, конечно же, это популяризация семантической разметки. Сайтов, которые все это используют, до смешного мало в русскоязычном сегменте, и в национальных сегментах стран СНГ. Почему-то наши оптимизаторы считают, что это неинтересное направление, хотя на Западе это считается очень действенным средством увеличения CTR.

Во-вторых, мы хотели бы внедрить новые типы расширенных сниппетов, повысить скорость определения и скорость валидации страниц, потому что все это происходит достаточно медленно (мы покрываем 49 языков).

В-третьих, вывести инструмент тестирования из статуса beta – тоже было бы неплохо.

Теперь я с удовольствием отвечу на ваши вопросы, если они есть.

Зал: — Скажите, ваши примеры в основном касались некоммерческих запросов, того, где люди ищут не столько сам продукт, сколько отзывы о продукте. Существует ли какая-то разница в формировании rich-сниппетов между тематиками?
Оксана Команеску: — Нет, разницы в тематиках нет. Она существует даже не в вертикали, а скорее в направленности сайта. Мы поддерживаем расширенные сниппеты для описания людей, компаний и организаций, продуктов, как в данном случае, и событий, у которых есть начало и конец. И еще у нас есть очень интересное направление, но оно пока работает только на Штаты, или в той стране, где у нас есть карты, — расширенные сниппеты для географических мест на карте. Это выглядит очень красиво – с картой, с превью и т.д.
Зал: — Скажите, как можно еще повлиять на красивость сайта в выдаче по географическим запросам в отсутствии Local Business Listing? Ведь я так понимаю, когда-нибудь это придет же в Россию?
Оксана Команеску: — На самом деле в России вы сможете сделать все тоже самое в самом ближайшем будущем. Это только вопрос времени. К сожалению, в странах, где у нас нет разрешения показывать карты, мы ничего не можем сделать.

Зал: — У нас коммерческий каталог, и наши вебмастера совсем недавно добавили микроформат в код нашего сайта. Скажите, вот такое улучшение сниппета как-то повлияет на наши позиции в выдаче?
Оксана Команеску: — Вы знаете, это очень такой цикличный вопрос, который задают все. Прямолинейно он на ваши позиции никак не повлияет, но на кликабельность повлияет точно. И со временем, когда мы будем понимать, что этот сайт интересен пользователям, мы будем его показывать по-другому, это наверняка.
Мы делали внутренние исследования на англоязычном сегменте, это работает именно так.

Зал: — Если страница попадает в поиск по разным запросам, могу ли я управлять тем, какой именно сниппет должен отражаться по каждому из запросов?
Оксана Команеску: — Хороший вопрос. Я не знаю, вы попробуйте. На самом деле я сам не пробовала этого делать, но думаю, что если это все будет валидный код, пропарсится нормально без ошибок, то мы, вполне возможно, будем отображать и то, и другое. Управлять данными в зависимости от запроса – пока невозможно. Поймите, сниппет не зависит от запроса. Мы пропарсили вашу страницу, бот прошелся и знает, что для нее есть вот эта структурированная разметка, и он будет ее показывать вне зависимости от запроса. Я не знаю, нужно ли привязывать показ того или иного сниппета к запросу, возможно, ваша идея имеет смысл, надо над этим подумать.

Зал: — Скажите, а вот когда все станут себе делать расширенные сниппеты, не приведет ли это к тому, что количество сайтов в выдаче на видимой части экрана значительно сократится? Есть ли ограничения по величине сниппетов?
Оксана Команеску: — На данный момент нет, но мы думали об этом. Пока эта проблема у нас не стоит, а когда она появится – будем решать. На самом деле, только у новостных, событийных сайтов сниппеты большие, у остальных это просто одна строчка. Поэтому даже если вся десятка будет с этой одной дополнительной строчкой – ничего страшного не произойдет.