Майкл Басилян: Роль качества контента в ранжировании Bing

7

Ведущий менеджер по разработке программ Bing Майкл Басилян (Michael Basilyan) рассказал о том, какую роль играет качество контента в ранжировании страниц алгоритмом Bing и как он его оценивает.

В Сети множество веб-документов, релевантных любому поисковому запросу. Эффективный алгоритм ранжирования должен учитывать не только релевантность, но также авторитетность, полезность и презентацию контента, чтобы предоставить самые лучшие поисковые результаты.

Ежедневно миллионы людей приходят в Bing, чтобы найти важную для них информацию. В качестве примера Майкл Басилян привёл запрос [симптомы рака груди]. За ним – реальный человек. Возвращаемые поисковой системой результаты могут иметь последствия, влияющие на всю его жизнь. Бо́льшая часть контента, соответствующего этому запросу, –  низкого качества: неполные и написанные на скорую руку статьи людей, не имеющих отношения к медицине и не являющихся экспертами по данному вопросу. По словам Майкла Басиляна, такие запросы мотивируют команду качества поиска Bing выходить за рамки простого соответствия по ключевым словам. Они видят свою задачу в том, чтобы помочь пользователю найти авторитетный, полезный, хорошо написанный и презентованный контент.

Три кита качества контента

Говоря о качестве контента, специалисты Bing ссылаются на три аспекта веб-сайта или страницы, которые они называют тремя китами качества контента:

3-pillars-of-content-quality.jpg

Авторитетность (Authority)

Оценивая авторитетность страницы, Bing пытается ответить на вопрос: можно ли доверять странице, её автору, сайту в целом?

При этом учитывается ряд факторов, включая сигналы из социальных сетей, цитируемые ресуры, узнаваемость имени и личности автора.

Авторитетность оценивается по-разному в зависимости от категории запроса. Например, для запросов на медицинскую тематику, алгоритмы Bing предпочтут документы, написанные профессионалами, из широко известных источников.

Полезность (Utility)

Оценивая этот аспект, алгоритмы Bing пытаются предсказать, будет ли контент достаточно полезен для конкретного запроса. Предоставляет ли страница нужную информацию? Соответствует ли глубина раскрываемого материала целевой аудитории? Bing отдаёт предпочтение страницам, на которых присутствует релевантный вспомогательный мультимедийный контент: обучающее видео, картинки, графики и т.п.

Ещё один важный критерий оценки полезности контента – это усилия и уровень знаний, необходимые для его создания. Сайтам, предоставляющим уникальный контент, отдаётся предпочтение перед теми, которые вторично использует уже существующие данные или широко доступные материалы. Например, каталоги недвижимости. Обычно, эти сайты собирают информацию из разных источников. Тем не менее, даже эти виды интернет-ресурсов могут ранжироваться выше, если их контент предоставляет дополнительную уникальную информацию, которой нет на других сайтах в этой категории. В примере с недвижимостью это может быть информация о школах или транспортных развязках, находящихся рядом с рассматриваемым объектом.

Презентация (Presentation)

Хорошо представленная страница имеет легкочитаемый, доступный дизайн. Основной контент такой страницы легко найти. И наоборот, на плохо представленной странице пользователю нужно пробраться через вводные или нерелевантные материалы, чтобы добраться до нужного контента.

Важным аспектом качества контента также является надлежащее использование и презентация рекламных материалов. Bing продвигает и поддерживает те сайты, которые предоставляют рекламные объявления, релевантные контенту их сайта, и размещают их таким образом, чтобы они не мешали пользователю. Страницы с хорошо продуманным макетом ранжируются выше, чем страницы, которые прячут контент за рекламой, не могут чётко разделить рекламные материалы и основное содержимое сайта или же размещают рекламные объявления так, что они ошибочно воспринимаются пользователями как элементы навигации.

Примеры страниц, имеющих проблемы с качеством контента

example-of-a-problematic-page.jpg

С точки зрения авторитетности, эта страница имеет проблемы, поскольку написана неопределённым автором («admin»). Навигация по сайту предоставляет мало информации об источнике материала и его авторе. Также страница имеет проблемы с презентацией контента: четыре или больше рекламных объявления предшествуют основному контенту и занимают большую площадь над ним. Более того, рекламные объявления не всегда легко отличить от основного контента и они могут быть легко приняты за навигационные элементы или гиперссылки.

В качестве альтернативного варианта Майкл Басилян приводит следующую страницу:

alternate-example.jpg

В этом примере навигация по сайту предоставляет мало информации об источнике контента или его авторе. Также присутствуют проблемы с презентацией контента: страница содержит больше четырёх рекламных блоков, предшествующих основному контенту и занимающих обширную площадь над ним. Рекламные объявления так же, как и в предыдущем примере, не чётко разделены с основными материалами сайта и могут быть легко приняты за навигационные элементы. Что касается полезности, эта страница кажется плохо написанной и не располагает вспомогательный или мультимедийным контентом. В целом, она имеет относительно низкое качество контента. 

Алгоритмы Bing разработаны так, чтобы продвигать страницы с лучшим дизайном и более авторитетным контентом.

Качество контента – ведущий фактор ранжирования Bing

ranking-topical-relevane-context-content-quality-1024x107.jpg

В Bing релевантность поискового результата – это функция от:

  • Тематической релевантности запросу (Topical relevance) – отвечает ли результат поиска на запрос пользователя?
  • Качества контента (Content Quality) – измеряется по трём аспектам, описанным выше.
  • Контекста (Context) – связан ли запрос с недавней темой? Какое физическое местоположение пользователя?

«Большая часть нашей работы состоит в повышении эффективности алгоритма ранжирования поисковой системы вдоль этих трёх осей при определении оптимального компромисса. Когда мы готовим изменение алгоритма ранжирования, мы всегда планомерно оцениваем его эффективность по этим трём осям и проверяем эти данные на реальных пользователях Bing.com, чтобы убедиться в их возросшей вовлечённости и удовлетворённости», — подвёл итог руководитель.

Таким образом, качество контента – одно из основных измерений, вдоль которого специалисты Bing оптимизируют модели ранжирования поисковой системы.