Владимир Офицеров: «Проблема российского интернета — в отсутствии контента, релевантного запросам»

Около года назад поисковая система Google приступила к последовательному запуску алгоритма семантического поиска  Сеть знаний. Новая концепция призвана осуществлять семантический поиск информации, собранной из различных источников. Все данные, объединяются на основе логических взаимосвязей. Кроме того, за последний год индекс Google стал еще больше и полнее.

Редакция Searchengines.ru обратилась в корпорацию Google с просьбой подробнее рассказать о значении запуска «Сети знаний» для концепции поиска в целом, микроформатах, перспективах развития регионального поиска, о грядущем обновлении алгоритма «Пингвин» и многом другом. На вопросы отвечает инженер отдела качества поиска Google Владимир Офицеров.

SE: Владимир, как в итоге после реализации всех изменений трансформируется выдача для пользователей?

Владимир Офицеров: Мы постараемся расширить выдачу с использованием семантического поиска «Сеть знаний» насколько это возможно. На текущий момент там есть такие данные, которые присутствуют в открытом доступе в интернете, к примеру, из «Википедии». Также есть информация из Карт Google – о локальных бизнесах и достопримечательностях. Там есть база данных актёров, певцов и музыкантов, а также база данных их песен, композиций и концертов. Присутствует информация об авторах книг, а также о режиссёрах фильмов и актерах. Мы постоянно ищем способы, как можно расширить представленную в поиске информацию, и один из способов – это индексация информации, присутствующей в интернете в случаях, когда владельцы ресурсов использовали на своих страницах микроформаты.

SE: Как могут использовать микроформаты сайты небольших коммерческих организаций для наиболее выгодного представления своего бизнеса в результатах выдачи Google?

Владимир Офицеров: Конечно же, коммерческие компании могут использовать микроформаты и все преимущества Сети знаний с этой целью. К примеру, я могу ввести запрос с названием какого-либо ресторана, и в выдаче он будет выводиться как отдельный блок. Более того, вся информация, представленная в таком блоке, будет заимствоваться с локальной страницы компании.

Для каждого локального бизнеса, который более или менее представил в локальной выдаче, будет формироваться отдельный блок.

SE: И плюс, в таком случае при запросе будет учитываться индивидуальный социальный контекст пользователя: к примеру, если я нахожусь в Москве, то мне будут показываться ближайшие рестораны Москвы?

Владимир Офицеров: Действительно, это так. Особенно это актуально, если в различных городах и регионах присутствуют рестораны с одинаковым названием.

SE: Отличаются ли Острова Яндекса от Графа знаний Google, или все-таки это явления одного порядка?

Владимир Офицеров: Граф или Сеть знаний – это абсолютно самостоятельная база объектов. К примеру, у нас есть данные относительно какого-либо актера, и мы знаем, как написать его имя по-английски, по-русски, по-японски и т.д. Объекты имеют разные виды связей, позволяющих уточнить: кто его бывшая жена, кто его текущая жена, в каких фильмах он играл. Также есть информация о семье, месте рождения и т.п. Основная идея Графа знаний в том, чтобы, анализируя взаимосвязи, предоставлять пользователям максимально чёткие и актуальные ответы на вопросы. Совсем скоро данный функционал в полной мере будет реализован и в голосовом поиске Google.

Таким образом, граф знаний ориентирован на удовлетворение, прежде всего, информационной потребности пользователей. В отличие от него Острова Яндекса в большей степени ориентированы на решение повседневных практических задач (к примеру, забронировать билет на самолёт прямо из поиска).

SE: А не будет ли проблемы у владельцев сайтов, что пользователь выдернет интересующий контент из описания, предлагающегося в выдаче, а затем уйдёт, не переходя на сам источник?

Владимир Офицеров: На самом деле, этот вопрос задают достаточно часто. Попытаюсь развеять этот миф: та информация, которую предоставляет Граф знаний позволяет пользователю, да и самому владельцу сайта, сориентироваться в текущем потоке информации.

Представьте себе, что на ваш сайт приходит человек по запросу [Достопримечательности России], как вы поймёте, что он хочет от вас, и что покажете ему на первой странице. Таким образом, Сеть знаний лучше всего отвечает на общие запросы пользователя, предоставляя максимум информации, в том числе, и визуальной, (специально для этого мы разработали новый формат отображения визуальных данных «Карусель»). Из этой информации пользователь в дальнейшем выбирает только ту, которая действительно интересует его.

Иными словами, граф знаний позволяет уточнить пользователю запрос, а сайт получает более целевого посетителя. Вебмастерам волноваться не о чем – отсекаются только нецелевые клики. Применение графа знаний избавляет вебмастера от необходимости наполнять свой сайт нецелевым и дублирующимся с другими ресурсами контентом, и позволяет сосредоточиться на наполнении ресурсов целевой информацией.

SE: К пятнадцатому дню рождения Google представил новый алгоритм определения Page Rank. Что изменилось, и к чему готовиться вебмастерам?

Владимир Офицеров: Page Rank всегда есть, был и будет – это основной фактор ранжирования страниц сайтов. Однако здесь важно понимать, что Page Rank, который относится к алгоритму ранжирования, мы пересчитываем очень часто. В то же время Page Rank, который показывается в тулбаре, просто-напросто периодически копируется из одного места в другое и, к тому же, он очень условен. Это делается для того, чтобы пользователи не воспринимали его слишком серьёзно, потому что в реальности – это то же самое, что искать у себя болезни, читая медицинскую литературу. В итоге вы найдете у себя все существующие заболевания. Также и здесь, если вы будете постоянно смотреть на свой Page Rank и останетесь недовольны результатами, то вам будет казаться, что у вашего сайта плохая статистика.

В любом случае, вся информация будет обновляться, и будет всегда доступна вебмастерам. Что же касается использования данного алгоритма для ранжирования, то мы делаем это постоянно.

SE: Что поменяется в поиске Google с внедрением алгоритма Hummingbird (Колибри)?

Владимир Офицеров: Алгоритм Колибри был выпущен несколько месяцев назад, и все что могло измениться – уже изменилось. Новая реализация алгоритма ранжирования еще лучше находит соответствие пользовательскому запросу и содержимому документа. Главное отличие содержится внутри: мы обобщили и объединили алгоритмы ранжирования чтобы упростить и ускорить внедрение новых улучшений.

SE: Владимир, а что могут ожидать вебмастерам от «Пингвина» 2.1?

Владимир Офицеров: Все, кто был понижен ранее – теперь понизятся гораздо сильнее.

SE: А что случилось с алгоритмом «Панда»?

Владимир Офицеров: Теперь он интегрирован в индекс Google, работает также хорошо, как и прежде. Однако его апдейты стали более регулярными и менее скачкообразными.

SE: Как сейчас решается вопрос индексации Google контента из соцсети Facebook. Будут ли достигнуты какие-либо соглашения на этот счёт?

Владимир Офицеров: Google сканирует, индерсирует и ранжирует открытые страницы из Facebook’а, как любые другие страницы на интернете. Мы не ожидаем никаких изменений в этом отношении. На всякий случай: поисковым машинам «Лайки» из Facebook’а не доступны и в ранжировании не участвуют.

SE: Теперь немного поговорим о микроформатах, на которые сегодня Google делает основную ставку. Можно наблюдать, что некоторые микроформаты используются для создания сниппетов, фактически дублируя функцию метатегов, например, description. Почему нельзя было оставить все как раньше? Для чего понадобилось заставлять вебмастеров осваивать новый вид представления данных?

Владимир Офицеров: Существует целый набор тегов, позволяющих поиску показать дополнительную информацию в сниппете по самым разнообразным запросам. Это целая группа тэгов. Отдельные тэги, конечно, могут пересекаться; однако описание, содержащееся внутри микроформата, представляет собой конкретный механизм отображения информации. В свою очередь, описание, созданное внутри мета-тега, может и не показываться: и здесь надо точно понимать, что хочет показать вебмастер в выдаче — полное описание сайта или отдельный сниппет.

SE: Не опасаетесь ли вы, что недобросовестные вебмастера могут начать использовать микроформаты для быстрого «нагона» трафика, указывая, например, намеренно неверные данные? Google как-то борется с поддельной микроразметкой?

Владимир Офицеров: Мы иногда видим попытки нарушить правила использования микроформатов. Однако для того, чтобы сайт начал показывать микроформат, он должен пройти предварительную модерацию в Google. Кто-то из инженеров должен посмотреть на сайт и убедиться в том, что микроформаты используются правильно. То есть просто сделать микроформат и отправить заявку в Google – недостаточно. Сайт обязательно будет модерироваться, прежде чем будет отправлен на индексацию.

SE: А правда ли, что в Google просматриваются и анализируются все заявки, содержащие жалобы на конкретный сайт? К примеру, если конкурент решит «выбить» мой сайт из выдачи подобным способом и отправит жалобу на мой ресурс в Google, его не удалят из выдачи без проверки?

Владимир Офицеров: Да, это так – у нас есть специальный отдел, который занимается модерацией сайтов. В любом случае, мы не принимаем меры против ресурса, не проверив его. Кроме того, если сайт был понижен за нарушение – у вебмастера есть все шансы восстановить его в выдаче, устранив их, и направив заявку на повторную проверку. Рано или поздно справедливость восторжествует.

SE: Владимир, а могу ли я защитить свой сайт от недобросовестных действий конкурентов и как-то верифицировать его в поиске как «качественный»?

Владимир Офицеров: Вы можете запретить входящие ссылки с «плохих» сайтов. Если же рассуждать более глобально, то, возможно, если вопрос встанет довольно остро – мы разработаем какой-либо специальный инструмент для этого.

SE: Чего, по вашему мнению, не хватает российским сайтам?

Владимир Офицеров: Я не устаю повторять, что основная проблема российского Интернета заключается в отсутствии релевантного контента. У нас есть специальная метрика, которая показывает то, насколько пользователь удовлетворён качеством поиска с точки зрения релевантности и полноты ответов на его запросы. Так, например, разница между средним русским пользователем и средним английским пользователем составляет порядка 10 пунктов по специальной шкале. Для сравнения, разница всего в полпункта будет стёрта, если убрать из английской выдачи абсолютно весь контент из «Википедии». Иными словами, размер ниши, которая не заполнена можно приравнять к объёму контента, равному 20 «Википедиям». Даже в Бразилии и Греции данная ситуация выглядит гораздо оптимистичнее, чем в России. Не знаю, чем это объяснить, но очевидно, что в поиске присутствует множество запросов, по которым просто-напросто нет релевантных ответов в выдаче.

Приведу довольно оригинальный пример запроса: [где купить коромысло для носки воды в Самаре] – в выдаче по этому поводу ничего нет. Также абсолютно не заполнены ниши «хобби» и «домашние животные».

Дело в том, что российские вебмастера сосредоточены на технологиях продвижения, в то время как пользователи этой страны испытывают контентный голод.

SE: Владимир, а что бы вы могли посоветовать российским вебмастерам как представитель поиска? Чем вообще выдача в России отличается от зарубежного поиска?

Владимир Офицеров: Основная рекомендация – дать возможность малому бизнесу присутствовать в интернете и не создавать ресурсы исключительно для монетизации трафика. Вебмастера слишком заботятся о том, чтобы попасть в ТОП-выдачи по монетизированным запросам, вместо того, чтобы помогать пользователям. Таким способом построить долгосрочный бизнес нельзя. Его можно построить только, создавая сайты под реальное предложение и получая довольных клиентов.

По отдельным подсчётам, среднее количество вебмастеров на душу населения в России – самое высокое в мире, в то же время количество полезного контента в этой стране ниже, чем в целом по миру. Всё это говорит о том, что вебмастера попросту заняты чем-то не тем. Сейчас они в погоне за лёгкой прибылью, вместо того, чтобы строить долгосрочный бизнес. Однако, на мой взгляд, это проблема неразвитости рынка и со времени это пройдёт…

SE: Устраивает ли вас формат проводящихся сегодня профессиональных конференций? Возможно, следует делать мероприятия какого-то иного формата, к примеру, для представителей локального бизнеса, самостоятельно продвигающих свои сайты в интернете?

Владимир Офицеров: Если мы возьмём срез по интернету в целом, то процент владельцев сайтов, имеющих аккаунты в «Инструментах для веб-мастеров», будет довольно низким, в то же время – среди участников отраслевых конференций замечены исключительно профессиональные вебмастера и оптимизаторы. Нам же в большей степени интересны представители локального бизнеса, которым мы бы хотели помочь продвигать свои сайты в поиске. Специально для этого мы организовали новый формат мероприятий «Вперед вместе с Google

Первым российским регионом, участвующим в программе, стала республика Татарстан. Программа «Татарстан, вперед!» стартовала 1 октября 2013 года в Казани на территории IТ-Парка и должна продлится в течении двух недель. Прежде всего, мероприятие рассчитано на предпринимателей и обычных интернет-пользователей. Пока это первая инициатива Google. И если всё пройдёт успешно, то в будущем мы планируем проводить по 4 подобных конференции в год в разных регионах.

Редактор-переводчик портала Searchengines.ru, работает на сайте с 2010 года. Специализируется на западном интернет-маркетинге, новостях социальных сетей и поисковых систем. Постоянно принимает участие в профильных семинарах и конференциях в качестве журналиста-обозревателя. Языки: английский, французский.