Факторы ранжирования 2019. Недвижимость

Особенности ранжирования в Яндексе и Google для сайтов недвижимости

Автор аналитического отчета: Михаил Волович, «Ашманов и партнеры».

Пятый отраслевой аналитический отчет посвящен недвижимости. Здесь правят бал агрегаторы — в Яндексе они занимают почти 75% топ-30, 90% топ-10 и 95% топ-3, в Google лишь немногим меньше (60%, 80% и 90%, соответственно).

Оставшиеся места делят между собой агентства недвижимости, информационные сайты, доски объявлений и (едва ли не на последнем месте) девелоперы. Последние в топ-10 попадают лишь эпизодически: на 300 запросов нашей выборки меньше 10 случаев в Яндексе, меньше пятидесяти — в Google.

В ситуации, когда доминирование одного типа сайтов столь явно выражено, ни смысла, ни возможности оценивать ранжирование других типов по отдельности не остается — для этого просто недостаточно данных.

«Магазины» недвижимости

Но кроме того, создается впечатление, что сайты других типов ранжируются по более или менее общим правилам с агрегаторами и просто не выдерживают конкуренции с ними.

Напомним, что в автомобильном отчете мы видели, что сайты производителей занимают высокие (хотя не обязательно первые) места по многим запросам, относящимся к моделям и маркам автомобилей, их покупке и т. п., — включая запросы типа рено автосалоны или мицубиси дилеры. Судя по всему, производители автомобилей «идут вне конкурса» и подмешиваются в выдачу примерно так же, как в нее подмешиваются результаты собственных сервисов поисковой машины (например, Яндекс.Недвижимость или карты Google).

С «производителями» недвижимости ситуация в корне другая. Казалось бы, результаты поиска, например, по запросу новостройки в Зеленограде от застройщика должны начинаться с сайтов этих самых застройщиков, они же девелоперы. Но нет — в обоих поисковиках застройщики отметились разве что в рекламных объявлениях, а основная выдача состоит из агрегаторов, которые подобрали 17 новостроек эконом класса в Зеленограде от застройщиков ПИК ГК, А101, ДСК-1 и других компаний или сделали что-нибудь еще в этом роде. И не сильно отличается от результатов поиска по запросу новостройки в Зеленограде. Если сайты застройщиков не возглавляют поисковую выдачу, а плетутся в хвосте, есть ли основания предполагать, что к ним применяется некий особый алгоритм ранжирования?

Квартиры от застройщика в результатах поиска представляют обычно агрегаторы.

С точки зрения пользователя, который ищет квартиру (офис, участок земли), сайты застройщика, агентства или агрегатора мало отличаются друг от друга и решают одни и те же задачи. Каждый из них предлагает какое-то количество вариантов продаваемой (сдаваемой в аренду) недвижимости, среди которых пользователь будет искать подходящие. Сколько-то объектов представлены прямо на странице, на которую выводит поисковик, а для выбора остальных сайт предоставляет более или менее удобный сервис: карту, отбор по характеристикам, калькулятор и т. п. Изучив варианты на странице и оценив предлагаемые средства навигации по сайту, пользователь решает, продолжить ли поиск здесь или перейти к другому сайту.

В этом смысле любой сайт недвижимости похож на интернет-магазин — только товар здесь специальный. Главное отличие агрегаторов не в том, что товар у них «чужой», а у застройщиков и агентств «свой», а в том, что ассортимент у них шире и выбор больше. Соответственно, успешно конкурировать с агрегаторами удается прежде всего тем агентствам (а иногда и крупным застройщикам), у которых ассортимент тоже достаточно велик.

Естественно, если запрос касается конкретного жилищного комплекса или агентства, вступают в действие иные механизмы — например, навигационного поиска. Но такие запросы мы в нашу выборку не включали. Чем уже запрос, тем больше шансов у небольших сайтов (агентств и застройщиков, включая сайты конкретных проектов) попасть в топ — просто в силу меньшей конкуренции со стороны крупных проектов.

Продолжая аналогию с «магазинами недвижимости», можно сравнить агрегаторы с гипер- и супер- маркетами, агентства — с магазинами среднего размера, застройщиков — со специализированными «монобрендовыми» магазинчиками. Понятно, что небольшие магазины могут конкурировать с гипермаркетами, только если их товар эксклюзивный или нишевый. Так и происходит: в области эксклюзивного жилья и при узкой географической привязке агентствам и застройщикам легче конкурировать с агрегаторами — уже хотя бы потому, что далеко не у всех агрегаторов есть соответствующие предложения.

Какие-то различия в ранжировании между сайтами разных типов, конечно, существуют, и формула ранжирования, например, для агентств у одного или обоих поисковиков может отличаться от фор- мулы ранжирования для агрегаторов. Это отчасти подтверждается тем, что для агрегаторов некоторые параметры оказываются сильнее, чем для всей выборки в целом, а некоторые слабее. Тем не менее, для недвижимости анализ ранжирования по выборке в целом, без деления на типы сайтов, представляется и оправданным, и едва ли не единственно возможным.

Подобно рынку интернет-торговли, в онлайн-недвижимости велик уровень «монополизации»: небольшое количество крупных сайтов занимают ведущие позиции сразу по многим запросам. Не удивительно, что многие параметры (и даже группы параметров) в нашей «риелторской» выборке ведут себя примерно так же, как в e-commerce.

Одна из характерных особенностей ранжирования для запросов по недвижимости — сильная корреляция с позицией (или связь с попаданием в топ) у параметров, характерных для крупных сайтов: ИКС, трафиковые факторы, ассортимент, размер сайта, ссылочные факторы и др.

Коммерческие факторы

Коммерческие параметры — это та сфера, где отраслевые особенности ранжирования проявляются особенно ярко. В случае недвижимости на отраслевые особенности накладываются особенности преобладающего типа сайтов — в нашем случае это агрегаторы.

Ассортимент, размер витрины, размер сайта

Наши асессоры оценивают ассортимент товаров или услуг, предлагаемых сайтом, по довольно грубой шкале с четырьмя «делениями»: он может быть огромнымширокимсредним или узким. Когда мы проектировали анкету для оценки сайтов, мы, пожалуй, не ожидали, что эти не вполне формальные оценки будут так сильно коррелировать с ранжированием. Тем не менее, границы между широким и средним ассортиментом и особенно между огромным и широким оказались очень важными. И чем больше «монополизированы» результаты поиска, тем сильнее основанные на них параметры — огромный и включающий его широкий ассортимент.

Не будет преувеличением сказать, что в топ-30 Яндекса и Google как минимум широкий ассортимент имеют почти все сайты: 96% в Яндексе (против 83% в фоне) и 91% в Google. Коэффициент корреляции с позицией в Яндексе 0,10, в Google 0,18 — но это как раз тот случай, когда связь с попаданием в топ-30 важнее, чем корреляция с позицией.

В 92% случаев сайты, попавшие на первую позицию в Яндексе и в 84% — в Google имеют огромный ассортимент. Дальше средние значения этого параметра быстро падают с позицией, но всё равно остаются заметно выше, чем на общей выборке. Значения в Яндексе выше, чем в Google.

Огромный ассортимент встречается, естественно, реже, но таких сайтов тоже очень много — около половины (в Яндексе 52%, в Google 48%). Это намного больше, чем в общей выборке, больше, чем в электронной коммерции и в автомобилях. В обоих поисковиках процент таких сайтов очень сильно растет при приближении к первой позиции: в топ-3 их 81% в Яндексе и 77% в Google (в других выборках не более 60%). Неудивительно, что коэффициенты корреляции очень высокие.

Интересно, что если посмотреть только на агрегаторы, сила параметров, связанных с ассортиментом, там слабее (хотя значения параметров выше). Похоже, ассортимент — это один из важных факторов, по которым агентства и застройщики проигрывают агрегаторам.

Мы, разумеется, не хотим сказать, что Яндекс или Google, как и мы, делит ассортимент на огромный, широкий и средний. Поисковые машины выкачивают сайты целиком, умеют распознавать типы страниц и делить их на функциональные зоны, и у них есть все возможности для количественной оценки ассортимента. Однако нет сомнений, что ассортимент влияет на ранжирование, и при поисковой оптимизации необходимо это учитывать.

При этом поисковые машины, при всей их технологической продвинутости, вынуждены судить об ассортименте только по внешним признакам — грубо говоря, они могут сосчитать количество категорий товаров, брендов и т. п., а также самих товаров. Но в недвижимости «товары» специфические — их можно квантовать по-разному. Можно подавать как отдельное предложение целый жилищный комплекс, можно — двухкомнатные квартиры в нём, а можно — квартиры определенного метража и планировки (и еще этаж, например, учитывать). От того, с какой степенью подробности создатели сайта представили предлагаемую на нём недвижимость, сильно зависит, каким увидят ассортимент сайта поисковые машины.

Если подробно описать на сайте все типы квартир в качестве отдельных товарных позиций, снабдив их фотографиями, описаниями планировки и т. п., от этого не только расширится ассортимент, но и пользователи получат больше информации, что положительно скажется на поведенческих факторах.

Оценки количества брендов в ассортименте к недвижимости неприменимы. Зато здесь очень важны другие параметры, косвенно связанные с ассортиментом. Чем он больше, тем большестраниц в индексе (мы получаем данные от Яндекса) и тем больше на сайте релевантных страниц — растет количество найденных страниц с сайта (опять же, данные от Яндекса). В обоих поисковиках для этих параметров есть сильная связь с попаданием в топ и очень сильная корреляция с позицией.

Косвенной оценкой ассортимента можно считать также размер «витрины» на найденной стра- нице. О нём можно (правда, тоже косвенно) судить по количеству цен на странице. Здесь очень большая разница в значениях между страницами, попавшими в топ-30 Яндекса (20) и фоном (3,27). В Google разница меньше, но тоже заметная, и в обоих поисковиках очень сильная корреляция с позицией: коэффициент корреляции 0,27. Агентства и тем более девелоперы по этому параметру катастрофически отстают от агрегаторов (не удивительно, что они в основном плетутся в хвосте), но параметр остается сильным и только для агрегаторов.

Региональность и связь с пользователем

Привязка к региону, из которого задан запрос, присутствие в других регионах, контактные данные и каналы связи с посетителем сайта — всё это для недвижимости не то чтобы не работает, но заметно ослаблено по сравнению с общей выборкой.

Локализация сайта в Москве (то есть наличие московских адресов, телефонов и т. п.) для запросов, заданных из Москвы, — всегда очень сильный параметр, и недвижимость тут не исключение. В Яндексе для него характерны значения, близкие к 100%, и сильная связь с попаданием в топ-30; в Google — сильная корреляция с позицией. Но уже с основной локализацией в Москве — обычно тоже весьма сильным параметром — у запросов по недвижимости всё как-то не складывается: в Яндексе значения ниже и связь с попаданием в топ слабая, в Google слабая корреляция с позицией (правда, есть связь с попаданием в топ).

Наличие представительств в других регионах менее характерно для сайтов недвижимости, чем для сайтов из общей выборки, и соответствующие параметры слабее. Для локализации в Санкт- Петербурге падение по сравнению с общей выборкой более слабое, чем для присутствия в нескольких или многих регионах.

Наличие адреса на сайте и на страниценескольких или многих адресов для запросов по недвижимости в Яндексе не связано или очень слабо связано с ранжированием; в Google есть связь с попаданием в топ.

Правда, для некоторых из этих параметров связь с ранжированием усиливается, если посмотреть отдельно на сайты агрегаторов. При оценке без разделения по типам сайтов начинает перевешивать «хвост» топ-30, где больше агентств и застройщиков, которые, естественно, чаще публикуют свой адрес (или адреса). Этим же может объясняться и связь с попаданием в топ в Google, где доля агрегаторов меньше, а агентств и застройщиков — больше. Наличие адреса у агрегаторов и в Яндексе, и в Google довольно сильно коррелирует с позицией и связано с попаданием в топ-30; а вот наличие адреса на странице, нескольких и тем более многих адресов для агрегаторов не характерно.

Аналогичная ситуация и с телефонами: телефон на сайте, на странице, несколько или много телефонов — в Яндексе эти параметры «не работают», а в Google для них есть связь с попаданием в топ. Однако если посмотреть отдельно на агрегаторы, в Яндексе для этих параметров появляется и связь с попаданием в топ-30, и корреляция с позицией.

Интересная ситуация со знаменитым телефоном 8-800 — возможно, самым раскрученным из предполагаемых коммерческих факторов. На сайтах, попадающих в результаты поиска по нашей риелторской выборке, он встречается редко и на ранжирование, судя по всему, не влияет.

Совершенно другая картина с автоматическим аналогом этого параметра (автоматически проверяется наличие телефона с кодом региона 800 на найденной странице). Парадоксальным образом его значения заметно выше, чем для «ручного» параметра. Для обеих поисковых машин есть и связь с попаданием в топ-30, и корреляция с позицией — правда, не очень сильная, но если смотреть только на агрегаторы, она усиливается. Аналогичная ситуация, кстати, с телефонами на странице: при автоматическом определении их оказывается намного больше, чем «видят» асессоры. Разгадка в том, что автомат реагирует преимущественно не на контактный телефон сайта или стоящей за ним компании (как это делают асессоры), а на телефоны владельцев недвижимости, которая представлена на сайте. Напомним, что в результатах поиска по риелторским запросам преобладают агрегаторы, которые чаще публикуют контактные данные своих клиентов, чем свои собственные.

То есть преимущество в поиске получают не те агрегаторы, у которых есть телефон на сайте или странице, или у которых этот телефон бесплатный для клиентов, — а те, которые включают в карточки объектов недвижимости номера телефонов (особенно если среди этих телефонов есть начинающиеся с 8-800).

Заказ обратного звонка, как и номер 8-800, дает преимущество тем, кому дорого звонить, — т. е. прежде всего иногородним клиентам. Довольно сомнительное преимущество — но для сайтов по недвижимости (как, впрочем, и для других выборок) «работает». В Яндексе видна корреляция с позицией, а для агрегаторов и связь с попаданием в топ; в Google — связь с попаданием в топ, а для агрегаторов и корреляция с позицией.

А вот для онлайн-консультанта (и автоматически определяемой формы чата) на нашей выборке связи с ранжированием не видно. Впрочем, и на общей выборке корреляции с позицией нет, а видна только связь с попаданием в топ-30 в Яндексе (где онлайн-консультант при определенных условиях показывается прямо в результатах поиска). На выборке по недвижимости значения этих параметров выше в Google — скорее всего потому, что в результатах поиска Google меньше агрегаторов.

Представление объектов недвижимости

Слабость параметров, связанных с присутствием в регионах и контактными данными, компенсируется в сфере недвижимости большей значимостью параметров, связанных с представлением предлагаемого «товара» — объектов недвижимости.

Здесь значения параметров близки к максимальным, а связь с ранжированием обычно сильнее, чем на общей выборке.

Так, описание «товаров» и в Яндексе, и в Google есть почти в 100% случаев, и при этом сохраняется корреляция с позицией. Фотографии есть практически всегда, и даже несколько фотографий на предложение предусмотрены в 98% случаев в Яндексе и в 94% в Google (против 72-73% на общей выборке).

Казалось бы, совсем небольшая разница между выборкой по недвижимости и общей выборкой — всего 1-2 процентных пункта, 99% против 98% или 97% — на самом деле означает сокращение доли сайтов выборки без соответствующего свойства в два-три раза. Чем ближе мы к 100%, тем тяжелее даются оставшиеся единицы процентов. В этой зоне статистические методы могут уже не показывать разницы (или показывать слабо), однако влияние на ранжирование при этом может быть решающим: сайт без свойства просто не имеет шансов пролезть в топ.

Характеристики предлагаемых объектов присутствуют почти всегда; в Яндексе есть сильная связь с попаданием в топ-30 и в обоих поисковиках — корреляция с позицией. Подбор по параметрам есть чуть реже, но тоже очень часто: 97% в топ-30 Яндекса и 93% в Google; и там, и там — сильная корреляция с позицией и связь с попаданием в топ. А вот сравнение предлагаемых объектов встречается гораздо реже — всего примерно в 20% случаев. Но это тоже очень сильный параметр, особенно в Яндексе.

Доля сайтов, на которых есть сравнение предложений по параметрам, растет при приближении к топ-1... но, достигнув максимума на третьей позиции, на второй и особенно на первой резко падает. Этот парадокс объясняется просто. Иметь на сайте сравнение предложений полезно для ранжирования, но если этот сайт — Cian.ru или Avito (именно они чаще всего встречаются на первых позициях), то он вполне может обойтись и без сравнения.

Мы долго сомневались, упоминать ли среди сильных параметров наличие на сайте калькуляторастоимости недвижимости с рекордной корреляцией с позицией в Яндексе 0,59. Дело в том, что калькулятор вполне уместен на сайте застройщика (определить цену квартиры и т. п. в зависимости от метража, планировки, этажа и других условий), а на сайтах агентств и агрегаторов вроде бы и не нужен, хотя иногда встречается и там. При отсутствии калькулятора асессоры часто ставили оценку «неактуально», а при наличии, естественно, «да» (калькулятор есть) — и результаты получились не вполне объективными. Автоматический параметр калькулятор в интерфейсетоже демонстрирует и сильную связь с попаданием в топ, и сильную корреляцию с позицией в обоих поисковиках, хотя и показывает более скромные результаты. Зато его объективность не вызывает сомнений.

Цены, скидки, оплата и др.

Цены на сайте есть практически всегда, на странице — у 97% сайтов, попавших в топ-30 Яндекса, и у 90% — в Google. Автоматическая проверка наличия цен на странице дает меньшую полноту, но зато очень сильную корреляцию с позицией и связь с попаданием в топ в обеих поисковых машинах. О том, что такая же ситуация и с количеством цен на странице, мы выше уже упоминали.

Как и в случае с автомобилями, поисковики не гонятся за дешевизной: какую бы цену мы ни взяли —минимальнуюмедианнуюсреднюю или максимальную — в топ-30 Яндекса и Google она выше, чем в фоне, а внутри топа растет при приближении к первой позиции.

Несмотря на то, что уровень цен может быть высоким, акции, скидки, спецпредложения очень желательны — на сайтах, попавших в топ-30 по недвижимости, они встречаются примерно в 80% случаев. Это, правда, меньше, чем в других отраслях (электронная коммерция, автомобили) и на сайтах из общей выборки, но зато на сайтах из первой тройки спецпредложения есть в 97-98% случаев. Параметр в обеих поисковых машинах довольно сильный: есть и связь с попаданием в топ-30, и корреляция с позицией.

На найденной странице спецпредложения присутствуют заметно реже — менее чем в 40% случаев. Несмотря на то, что сайты первой тройки в этом отношении отстают, для этого параметра в обоих поисковиках также есть и связь с попаданием в топ, и корреляция с позицией.

Другие коммерческие факторы

Параметры, имеющие отношение к контенту, обычно важны для сайта в целом, но не для конкретной найденной страницы — там ничего такого обычно нет. Такая ситуация со справочными материаламиответами на вопросы, а также с видеоотзывами, представлением специалистов компании.

Упомянем здесь для полноты картины несколько групп параметров, для которых внятной картины не получается — по-видимому, они для недвижимости (по крайней мере, для преобладающих в этой сфере агрегаторов) не слишком актуальны:

  • «кнопка заказа» (возможность выполнить действие, направленное на получение товара или услуги);
  • оплатаоплата картой и др.
  • гарантия;
  • доставка;
  • список услуг компании;
  • сертификаты, лицензии, награды.

Что делать

  1. Расширять ассортимент, увеличивать количество предложений на «витрине» — благо в случае недвижимости это можно сделать за счет вариантов имеющихся предложений.
  2. Чем подробнее представление объектов недвижимости и больше возможностей для их подбора и сравнения, тем лучше.
  3. Подбор по параметрам — необходимый функционал, сравнение различных предложений и калькулятор — очень желательный.
  4. Цены необходимо показывать. Они не обязательно должны быть низкими, но очень желательно демонстрировать готовность идти навстречу покупателю, анонсируя акции и скидки.
  5. На сайте (но не обязательно на каждой его странице) полезно иметь видео, отзывы, справочные материалы и ответы на вопросы.

Трафиковые, ссылочные и другие факторы

Несколько вроде бы разнородных групп факторов — трафиковые, ссылочные, социальные и некоторые технические — демонстрируют похожую и уже знакомую нам по другим отраслям картину, характерную для выборок с сильным расслоением, где первые позиции часто принадлежат одним и тем же крупным сайтам.

В отличие от коммерческих и (отчасти) текстовых параметров, здесь очень мало отраслевой специфики. Побеждают сильнейшие — и эти сильнейшие часто оказываются первыми сразу по множеству параметров. У них больше накопленная ссылочная масса, больше ссылок из соцсетей, они в среднем старше и просто больше — по количеству страниц вообще и страниц, релевантных запросу. У них лучше поведенческие факторы, выше ранги и больше трафик.

Это запускает положительную обратную связь, которая закрепляет статус-кво. Чем выше сайт в результатах поиска, тем больше у него трафик — прежде всего поисковый, но не только. Чем больше посетителей, тем больше на него ставят ссылок, делятся им в соцсетях и т. д. И тем больше сайт зарабатывает — что позволяет находить ресурсы на дальнейший рост и улучшение поведенческих факторов.

В результате выдача оказывается монополизированной: по самым разным запросам наверху оказываются одни и те же очень крупные сайты, а у сайтов поменьше шансы есть только по нишевым запросам, которые «крупняку» по тем или иным причинам менее интересны.

Безусловный лидер по видимости — сайт Cian.ru. Он попадает в топ-30 по 246 запросам из 300 в Яндексе и по 252 — в Google, со средней позицией... 1. То есть в 80% случаев — по-видимому, просто всегда, когда на Cian.ru есть релевантная страница, — к первой позиции «прибит гвоздями» один и тот же сайт.

Следом за Cian.ru в Яндексе идут Avito (285 запросов, средняя позиция 3; в Google 216 и 6 соответственно) и Яндекс.Недвижимость (277 запросов, средняя позиция 4, в Google 236 и 7). Понятно, что во многих случаях первая тройка именно из этих трех сайтов и состоит. В Яндексе есть еще одиннадцать, а в Google — семь сайтов, которые попадают в топ-30 более чем по половине из наших 300 запросов, но у них средние позиции в выдаче уже не такие высокие.

Для недвижимости в большей степени, чем для других отраслей, характерен контраст между очень высокими значениями многих параметров в первой десятке (и особенно тройке) и значительно более низкими и медленно падающими их значениями в оставшейся части результатов поиска. Параметры рассматриваемых групп получаются очень сильными — но их сила в большой мере определяется весом лидирующих сайтов, оторвавшихся от «пелотона». Эффект усиливается тем, что мы смотрим на все коммерческие сайты вместе, без разделения по типам.

Икс и трафиковые параметры

Мы традиционно начинаем раздел про трафиковые факторы с «индекса количества качества сайта» (написать без кавычек рука не поднимается), который, как известно, имеет самое прямое отношение к посещаемости: по Яндексу, качество сайта меряется в первую очередь размером аудитории. Параметр очень сильный — в обоих поисковиках сильны и связь с попаданием в топ, и корреляция с позицией.

Такая же ситуация и с другими трафиковыми параметрами: с рангами — Alexa Rank и всеми вариантами рангов от SimilarWebGlobal RankCountry RankCategory Rank; с количеством посещений сайта и любыми его «срезами» — например, из поискапо ссылкамиз почтыиз соц- сетейс рекламы (display) или прямых переходов.

В Яндексе трафиковые параметры сильнее, чем в Google: выше коэффициенты корреляции с позицией и больше контраст между значениями для топ-30 и фона. По-видимому, это связано с большей степенью монополизации первых позиций в выдаче крупными сайтами.

Посещения из соцсетей (по данным SimilarWeb): средние значения по позициям в топ-30 Яндекса и Google. Очень высокие коэффициенты корреляции у трафиковых параметров, особенно в Яндексе, определяются тем, что первые несколько позиций по большинству запросов заняты крупнейшими сайтами. При этом максимальные значения параметра — не на первой позиции, которую фактически монополизировал Cian.ru, а на второй: в Яндексе за нее обычно конкурируют Яндекс.Недвижимость и Avito.ru, в Google разнообразие немного больше.

Структура трафика и поведенческие параметры

Параметры, связанные со структурой трафика, и поведенческие параметры в обеих поисковых машинах также весьма сильные — и тоже в большой мере благодаря крупным сайтам, имеющим по ним хорошие показатели.

Несмотря на то, что больше половины трафика на сайты топ-30 приходит из поиска, доля поискового трафика в Яндексе — сильный «обратный» параметр. Если смотреть только на агрегаторы, то в Яндексе этот параметр еще заметно усиливается, а в Google — становится сильным.

Доля прямых переходов в топ-3 Яндекса превышает одну треть: 34% против 20% на общей выборке (и 23–24% в оставшейся части топ-30). Cian.ru и другие сайты, занимающие верхние позиции, действительно имеют свою собственную аудиторию! Доля других источников трафика —соцсетипочтареклама (display) — ниже, но корреляции с позицией в обоих поисковиках еще сильнее. Для всех этих параметров корреляция с позицией выше в Яндексе, и в обеих поисковых машинах она заметно возрастает, если смотреть отдельно на агрегаторы. Исключение — доля переходов по ссылкам: здесь корреляции с позицией не видно.

Аналогичная картина — и с имеющимися в нашем распоряжении поведенческими факторами: количество просмотренных страниц за посещениепродолжительность посещенияпроцент отказов. Здесь в Яндексе очень высокие коэффициенты корреляции с позицией, а в Google — чуть ниже; коэффициенты корреляции увеличиваются, если смотреть отдельно на агрегаторы.

Ссылочные параметры

Со ссылочными параметрами — ничего необычного.

  • И в Яндексе, и в Google они заметно сильнее, чем на общей выборке — что не удивительно, если учесть, что первая тройка в обоих поисковиках «захвачена» крупными сайтами.
  • В Google немного сильнее, чем в Яндексе.
  • Для Google важны как ссылки на сайт, так и ссылки на страницу (но корреляции с позициейу страничных параметров слабее).
  • Для Яндекса, похоже, важны только ссылки на сайт. Это, в принципе, нормально — хотя на автомобильной выборке мы видели другую картину.

Из разных способов считать ссылки — по количеству ссылающихся доменовуникальных ссылокколичеству ссылающихся страницсуммарному LinkRank — в Яндексе с небольшим отрывом «побеждают» домены, а в Google (правда, с еще меньшим отрывом) — LinkRank.

Долю ссылок на главную страницу сайта можно считать косвенным показателем качества ссылочной массы: чем она меньше, тем лучше. Наша выборка по недвижимости по этому параметру — едва ли не рекордсмен, и главные герои здесь, как всегда, — Cian.ru и другие крупные сайты, прочно занимающие первую тройку результатов, особенно в Яндексе. Значение для топ-3 в Яндексе — 9% (на общей выборке 33%), для топ-30 — 24% (на общей выборке 38%).

К сожалению, несмотря на очень сильные корреляции с позицией в обоих поисковиках и не менее сильную связь с попаданием в топ-30 в Яндексе (в Google она тоже есть, но контраст между топ-30 и фоном гораздо слабее), мы не можем утверждать, что этот параметр учитывается при ранжировании. Дело тут не только в том, что лидирующая группа сайтов опережает все остальные сайты, попавшие в поиск, и по множеству других параметров. В нашей выборке очень много агрегаторов, а у них доля ссылок на главную страницу обычно сильно ниже, чем у сайтов «продавцов» и «производителей».

Для ссылочно-текстовых параметров верно всё перечисленное выше про ссылочные параметры. Кроме того, действует принцип антибуквализма: количество отдельных слов запроса, входящих в текст ссылок, (а также их синонимов и слов, выделяемых поисковиками в снипетах наряду со словами запроса), важнее, чем количество входящих в них точных (или даже неточных) запро- сов. См. ниже таблицы для ссылочно-текстовых параметров и диаграммы для двух из них — по словам запроса в ссылках на сайт и на отдельную страницу.

Мы условно считаем «SEO-ссылками» все ссылки с доменов, когда-либо замеченных в размеще- нии ссылок за деньги — например, в участии в ссылочных биржах. Несмотря на то, что наш способ деления ссылок на «серые» и «белые» далек от совершенства, видно, что разница между ними важна. Для «серых» ссылок в Яндексе коэффициенты корреляции сильно ниже, а в Google — просто ниже, чем для всех ссылок без разделения на два класса. Наоборот, параметры для«белых» ссылок сильнее, чем для всех ссылок.

Соцсети

Наличие групп в соцсетях, а также по отдельности группы в Facebook, ВКонтактев Твиттерев «Одноклассниках»страницы в Инстаграммеи канала на Youtube — сильные факторы в обеих поисковых машинах.

В Яндексе выше коэффициенты корреляции с позицией, зато в Google сильнее связь с попаданием в топ-30 — выше контраст между топ-30 и фоном. Из всех соцсетей, если судить по коэффициентам корреляции, важнее всего группы в Facebook и ВКонтакте, а в Яндексе также группа в «Одноклассниках» и канал на Youtube; наименее важен Твиттер.

Как обычно на нашей выборке, большой вклад в коэффициенты корреляции и даже в средние значения по топ-30 вносят крупные сайты, занимающие верхние позиции в выдаче поисковиков. И трудно оценить, что первично: группы в соцсетях помогают этим сайтам высоко ранжироваться, или, наоборот, то, что у этих сайтов есть группы в соцсетях, помогает социальным параметрам быть сильными.

Ссылки «Поделиться» на сайте — в целом и по отдельности в FacebookВКонтактев «Одноклассниках», в Твиттере — тоже сильные параметры в обоих поисковиках. Только в этом случае коэффициенты корреляции немного выше в Google, а в Яндексе больше контраст между топ-30 и фоном. Из конкретных соцсетей сильнее Facebook и ВКонтакте, а Твиттер слабее всех (даже «Одноклассников»).

При этом если ссылки «Поделиться» встречаются примерно на 80% сайтов, найденных по нашим запросам, то непосредственно на найденных страницах они есть всего примерно в 15% случаев, а в топ-3 — в 2-3%. Не удивительно, что для ссылок «Поделиться» на странице видна обратная корреляция с позицией. Получается, что при «витринах» с объектами недвижимости ссылки на группы в соцсетях нужны, а ссылки «Поделиться» — не очень.

Еще один сильный параметр, опирающийся на «топовые» крупные сайты, — наличие микроразметки Open Graph, предназначенной для оптимизации представления страницы в соцсетях. Интересно, что разметка присутствует и на тех страницах, которые (судя по отсутствию на них ссылок «Поделиться») для выкладывания в соцсети не предназначены.

Количество «шеров» страницы ВКонтакте и в «Одноклассниках» (для других соцсетей разумных данных получить не удается) — параметры весьма слабые: корреляции с позицией есть, но сильными их не назовешь.

Некоторые технические параметры

Среди технических параметров достаточно таких, которые характерны для крупных и/или хорошо оптимизированных сайтов. На нашей риелторской выборке они сильнее, чем на большинстве других.

Параметры, связанные с возрастом сайта — возраст домена и возраст по упоминаниям на Archive.org — ожидаемо сильны (в Google немного сильнее, чем в Яндексе): в обеих поисковых машинах сильная связь с попаданием в топ-30 и высокая корреляция с позицией. Средний возраст домена в топ-30 Google — 12,6 лет (в Яндексе просто 12), в топ-3 — 13,8 (в Яндексе 13,9).

Переход к защищенному протоколу https обычно ассоциируется в первую очередь с Google, однако доля сайтов с https немного выше в Яндексе; в обоих поисковиках есть связь с попаданием в топ-30 (контраст с фоном сильнее также в Яндексе) и сильная корреляция с позицией (и там, и там коэффициент корреляции 0,21).

Поисковые машины рекомендуют добавлять на сайт микроразметку — и крупные сайты этой рекомендации следуют. Наличие микроразметки Schema.org — сильный параметр и в Яндексе, и в Google (в Яндексе немного сильнее). И там, и там сильная связь с попаданием в топ-30 и коэффициент корреляции 0,20.

В мобильной выдаче процент страниц с адаптивной версткой в обоих поисковиках выше 90%, в первой тройке — почти 100%. Есть корреляция с позицией, а в Яндексе — и связь с попаданием в топ-30. В десктопной выкачке страниц с адаптивной версткой детектируется меньше — но, похоже, это объясняется скорее трудностями ее распознавания, чем реальным отсутствием: десктопные и мобильные результаты поиска не совпадают, но отличаются друг от друга не очень сильно.

Сайтам выгодно иметь большие «витрины»; см. выше о количестве цен на странице и ниже — о текстовом ранжировании. Не удивительно, что параметры, связанные с размером страницы —размер HTML-кода и текста — сильны и в Яндексе, и в Google.

Было бы странно, если бы при этом страницы из первой тройки загружались быстрее, чем страницы из «хвоста» топ-30. И действительно — время загрузки страницы в обеих поисковых машинах положительно коррелирует с позицией (чем ближе к первой позиции, тем больше время загрузки), а страницы из топ-30 загружаются дольше, чем страницы из фона. Правда, всё это в пределах одной секунды (но оценивается загрузка только чистого кода, без картинок и т. п.)

Что делать

  1. Расти большими. Использовать любые доступные источники трафика. Увеличивать долю трафика из непоисковых источников (прямые переходы, соцсети и др.)
  2. Работать над поведенческими факторами: добиваться увеличения глубины просмотра и продолжительности посещений.
  3. Наращивать ссылочную базу. Для Яндекса важны ссылки на сайт, для Google — и ссылки на страницу.
  4. Иметь группы в соцсетях, микроразметку Open Graph для соцсетей, ссылки «Поделиться» на текстовых страницах.
  5. Https, микроразметка, адаптивная верстка — всем этим не стоит пренебрегать.
  6. Не нужно любой ценой сокращать время загрузки — поисковики не имеют ничего против больших страниц.

Текстовые факторы

Текстовое ранжирование, лежащее в основе всякого ранжирования, на разных выборках выглядит немного по-разному, но при этом подчиняется одним и тем же закономерностям.

Вынуждены заранее извиниться перед теми, кто читал наши предыдущие аналитические отчеты: поскольку эти закономерности не меняются, нам поневоле приходится повторяться.

За текстовое ранжирование у нас отвечает примерно половина всех параметров — около трехсот! Многие из них представлены в сводных таблицах, приведенных в конце этого раздела. Рекомендуем перед чтением раздела на них взглянуть — они дают хорошее представление об общей картине текстового ранжирования.

Строки этих таблиц — зоны документа, для которых оценивается связь между наличием слов запроса и т. п. и ранжированием. Сравнивая строки, можно оценить значимость различных зон для ранжирования. Столбцы соответствуют разным способам подсчета количества вхождений запроса и связанных с ним слов в документ. Справа налево — от самых жестких (запрос в точной форме) до самых мягких (слова запроса «россыпью», с учетом слов, выделенных в снипетах). Как обычно, иконки с двумя столбиками показывают силу связи с попаданием в топ-30 (если она есть), иконки с «трапециями» — силу корреляции с позицией (мы также приводим под каждой из них коэффициент корреляции).

Напомним здесь основные закономерности текстового ранжирования:

  • в Яндексе для текстовых параметров чаще видна связь с попаданием в топ, а в Google — корреляция с позицией;
  • слов запроса в тексте должно быть много — по крайней мере для конкурентных запросов;
  • «принцип антибуквализма»: чем дальше от точного запроса, тем сильнее параметры;
  • кроме текста страницы и <title>, могут быть важны и другие зоны — но значение некоторых из них часто преувеличивают;
  • Яндекс научился игнорировать SEO-тексты, Google учится.

Яндекс vs. Google

В Яндексе значения основных текстовых параметров — например, количества вхождений слов запроса в текст страницы — для топ-30 обычно сильно отличаются от их значений для фона, и этот контраст обычно сильнее, чем разброс их значений внутри топ-30 (например, между первой тройкой и третьей десяткой).

Наши данные по общей и другим выборкам позволяют выдвинуть гипотезу (и данные по недвижимости ей не противоречат), что в Яндексе учет текстовых факторов осуществляется в основном на предварительном этапе ранжирования.

Формулы ранжирования современных поисковых машин очень сложны. Даже на мощных серверах и при многопоточной обработке успеть применить полную формулу ранжирования к миллионам страниц, поднятых из индекса по короткому запросу, — практически нереально. Поэтому обычно ранжирование разбивают на несколько этапов. Сначала выполняется предварительное ранжирование по упрощенной — и потому гораздо быстрее вычисляемой — формуле. Таким образом отбирается ограниченное количество — порядка тысячи — страниц, к которым уже и применяется окончательное ранжирование по полной формуле. Именно поэтому, кстати, количество результатов поиска по запросу, которые можно получить, подгружая страницы выдачи одну за другой, ограничено примерно тысячей сайтов.

В Google, наоборот, обычно велик разброс между значениями основных текстовых параметров между «головой» и «хвостом» топ-30, что обеспечивает очень сильные корреляции с позицией. При этом значения для топ-30 часто ниже, чем для фона — а если и выше, то не сильно.

Это не значит, что в Яндексе не бывает корреляции текстовых параметров с позицией, а в Google — связи с попаданием в топ. На нашей выборке по недвижимости представлено и то, и другое, но корреляции с позицией в Яндексе обычно слабее, чем в Google, а связь с попаданием в топ в Google слабее, чем в Яндексе.

Количество вхождений

Если в Яндексе текстовые факторы действительно, как мы предполагаем, играют важную роль в предварительном отборе кандидатов на окончательное ранжирование, то получается, что у страниц, содержащих недостаточно вхождений запроса (или слов запроса), высок риск остаться за бортом, даже если с другими факторами ранжирования у них всё хорошо. Они могут не пройти конкурс на предварительном этапе, и при окончательном ранжировании их многочисленные достоинства уже не будут замечены — просто потому, что они не примут в нём участия.

А «достаточно» вхождений — это сколько?

Разумеется, для разных запросов по-разному, но в среднем довольно много. Например, по запросу новостройки Мытищи в тексте половины найденных Яндексом страниц слова запроса содержатся в количестве, эквивалентном 27,7 запросам или больше (это медиана значения параметра для топ-30 по этому запросу). Всего на четырех из тридцати найденных страниц слов запроса набирается меньше, чем на 15 запросов; всего на одной (с сайта Avito.ru) — меньше, чем на 10.

Среднее количество слов запроса (в пересчете на запросы) на нашей выборке составляет 33,6. Мы рекомендуем ориентироваться не на средние значения, а на медианы (как в примере выше) — но результат получается лишь немногим меньше: в среднем по запросам выборки 27,7, как раз как в нашем примере.

Если смотреть на вхождения в текст страницы слов запроса с учетом синонимов, пороги для попадания в топ-30 оказываются еще выше — среднее по выборке 45, усредненная медиана — 36,8. Это меньше, чем для общей выборки и для электронной коммерции, но всё равно много.

Список коммерческих предложений (то, что мы называем витриной) с таким количеством слов запроса может выглядеть естественно, а вот связный текст — вряд ли.

Принцип антибуквализма

Поисковые машины давно ушли от прямой оценки релевантности страниц запросу по количеству вхождений «ключевиков». Их многократное повторение в тексте страницы, особенно в точной форме, уже не помогает ранжированию и к тому же может быть воспринято поисковой машиной как переспам.

Для точного запросазапроса с точностью до словоформ, даже «неточного запроса» (все значимые слова из него недалеко друг от друга) сила текстовых параметров невелика — а часто связи с ранжированием просто нет или она отрицательная. Связь с ранжированием сильнее для слов запроса вразбивку, и часто повышается еще больше, если учитывать слова, связанные с запросом, но не входящие в него — например, синонимы слов запроса или слова, выделяемые в снипетах. Возможно, какие-то еще группы слов (или, например, «вектора») также важны, но у нас пока нет соответствующих параметров.

Во всяком случае, идея, что может быть полезно иметь в тексте слова и выражения, которые часто встречаются на страницах из топ-10, (и вредно — слова, которых там нет), — представляется не лишенной оснований.

На нашей выборке по недвижимости принцип антибуквализма выражен очень сильно, особенно в Яндексе, — аналогичную картину мы уже видели в таблицах по ссылочно-текстовым параметрам, см. выше. Так, для текста страницы сильная связь с попаданием в топ в Яндексе и сильная корреляция с позицией в Google есть только начиная с вхождений отдельных слов запроса.

Уже для неточного запроса сколько-нибудь сильной связи с ранжированием не видно, и при этом резко падает количество вхождений. В Яндексе среднее значение по нашей выборке — 2,76, усредненная медиана — всего 1,16, а для неточного запроса с учетом синонимов — 4,8 и 2,66 соот- ветственно.

Есть, правда, одно важное исключение из принципа антибуквализма, а заодно и принципа, согласно которому в Google связь текстовых параметров с ранжированием проявляется обычно в форме корреляции с позицией. Вхождения точного запроса в <title> в Google обычно сильно связаны с попаданием в топ. На нашей выборке по недвижимости связь с попаданием в топ есть не только для точного запроса, но и для запроса с точностью до словоформ, и даже для неточ- ного запроса, а также для точного запроса в <h1>. В Яндексе же на выборке по недвижимости сильная связь с попаданием в топ-30 для <title> видна только для параметров, учитывающих синонимы и слова, выделенные в снипетах.

Текст, заголовки, далее, везде

Текст страницы и <title>, очевидно, очень важны для текстового ранжирования, но ими оно не ограничивается. Есть ряд дополняющих их зон (доменное имя и URL, meta descriptionи keywords, атрибуты alt и title) и ряд зон, часто выделяемых внутри текста страницы (заголовки, жирный шрифт и курсив, элементы списков, ссылки), про которые тоже важно понимать, участвуют ли они в ранжировании.

Вхождения слов запроса в доменное имя (отдельно или с учетом синонимов) демонстрируют корреляцию с позицией в Google и связь с попаданием в топ в Яндексе. Несмотря на то, что статистика по Яндексу выглядит не слишком убедительной (8% по топ-30 против 6% в фоне, при этом в топ-3 — всего 5%), кажется всё-таки, что доменные имена очень важны. Прежде всего, топ-3 Яндекса почти полностью захвачен крупными сайтами — и если туда попадают хоть какие-то говорящие домены, то это для них — невероятный успех, которого никакими другими средствами добиться бы, скорее всего, не получилось. Например, по запросу купить лофт после неизбежного Cian.ru следуют сайты KupiteLoft.ru и Loft-Catalog.ru.

Если вхождений слов запроса в доменные имена — как обычно, в пересчете на целые запросы — 6% в Яндексе и 4% в Google, то вхождений в URL вне доменной зоны — на порядок больше: 53% и 47% соответственно (а в топ-3 — 65% и 61%). В Яндексе сильная связь с попаданием в топ- 30, в обоих поисковиках — сильная корреляция с позицией. В общем, ЧПУ («человекопонятные URL») работают.

Представление об остальных зонах легко составить по таблицам, приведенным ниже. Вот некоторые наблюдения.

  • В отличие от некоторых других выборок (включая общетематическую), заголовки <h1> в Яндексе на выборке по недвижимости сильнее связаны с ранжированием, чем заголовки более низких уровней (<h2>–<h4>). В Google, в принципе, тоже — но здесь связь с ранжированием для обеих групп параметров слабая.
  • Важны вхождения во внутренние ссылки — группа параметров, ассоциируемых с «витриной» и с блоком страниц, подчиненных данной.
  • Для вхождений в элементы списков <li> в Яндексе видна сильная связь с попаданием в топ-30; в то же время в Google для большинства параметров этой группы связи с ранжированием не видно.
  • Важны вхождения в meta description, но не в keywords.

SEO-текст и «текстовые фрагменты»

Самый большой текстовый блок на странице (выделяется автоматически) часто содержит SEO- текст — высокооптимизированный текст, предназначенный в первую очередь для поисковых машин. Яндекс не без оснований считает, что SEO-тексты используются для манипулирования выдачей, и борется с ними — в частности, в 2017 году был введен фильтр «Баден-Баден», наказывающий за плохое качество текстов понижением в результатах поиска. Поэтому интересно посмотреть, как связаны с ранжированием а) SEO-текст; б) часть текста за вычетом SEO-текста, которую часто условно называют «текстовыми фрагментами», поскольку это текст из описаний товаров или услуг на «витрине» и различных небольших текстовых блоков.

На нашей риелторской выборке результаты для SEO-текста резко отличаются от результатов для текста в целом, причем не только в Яндексе, но и в Google: связи с попаданием в топ-30 не видно; наблюдаются сильные обратные корреляции с позицией — чем ближе к топ-1, тем ниже значения параметров. Наоборот, для части текста за вычетом самого большого текстового блока многие параметры в обеих поисковых машинах усиливаются по сравнению с аналогичными параметрами для текста в целом.

Однако в данном случае не стоит торопиться с выводом, что не только Яндекс, но и Google считает SEO-тексты вредными и учитывает их «с обратным знаком», а текстовым фрагментам придает больший вес. Для нашей выборки есть более прозаическое объяснение наблюдаемой картины — в том числе и обратных корреляций в Google.

Дело в том, что размер SEO-текста при приближении к первой позиции быстро падает.

В Яндексе объем SEO-текста в среднем меньше, чем в Google; в обеих поисковых машинах при приближении к топ-1 он падает.

Отчасти это объясняется тем, что на сайтах агентств и застройщиков, которых больше в «хвосте» топ-30, тексты в среднем длиннее, чем у агрегаторов; однако и на сайтах агрегаторов объем SEO-текстов с позицией растет. Если концентрация слов запроса примерно одинакова, то в более длинном тексте их поместится больше — отсюда и обратные корреляции количества вхождений слов запроса и т. п. с позицией.

Что делать

  1. Слов запроса на странице должно быть не меньше, чем у большинства конку- рентов. При этом наличие в тексте запросов целиком менее важно.
  2. Если для вас важно продвижение в Google, в <title> должны быть запросы, по которым продвигается страница, причем желательно в начальной форме.
  3. Если домен вашего сайта говорящий — это ваш шанс; постарайтесь его не упустить.
  4. Чем меньше на странице SEO-текста, тем лучше. Текстовая релевантность должна достигаться прежде всего за счет «витрины» — в данном случае, за счет анонсов описаний объектов недвижимости.

Общие выводы:

Недвижимость — очень трудная тематика для поискового продвижения. Здесь впереди сайты, у которых всё хорошо — и со ссылками, и с ИКСом, и с поисковым трафиком, и с непоисковым, и с поведенческими параметрами, и с ассортиментом, и с текстами, и даже с возрастом домена.

Эти сайты — агрегаторы, и если у вас, например, агентство недвижимости или вы сами — застройщик, то, возможно, следует думать в первую очередь не о том, как их обогнать, а о том, как сделать, чтобы ваши объекты недвижимости были у них достойно представлены. Но это уже совсем другая тема.

В любом случае, если вы продвигаете сайт, имеющий отношение к недвижимости, вам нужно не забыть о следующем.

  • Найдите те ниши и поисковые запросы, по которым конкуренция ниже или у вас есть серьезные козыри — например, ваше доменное имя.
  • Расширяйте ассортимент, который видят пользователи и поисковые машины. Это можно сделать не только в ширину, но и в глубину, представив те объекты, которые у вас есть, более подробно и всесторонне.
  • У каждого предложения должна быть своя полноценная страница, они должны быть собраны в разделы, и так далее. Витрина вашего «магазина недвижимости» должна быть большой и яркой. Товар на ней не должен быть дешевым, но обязательно нужны акции и спецпредложения.
  • Не гонитесь за вхождениями ключевиков, но слов запроса и связанных с ним слов на странице (и на сайте) должно быть много. Причем не в SEO-тексте (которого как раз должно быть мало), а в представлении объектов недвижимости на вашей витрине. Впрочем, в <title> ключевики как раз нужны — для Google.
  • Https, «человекопонятные URL», адаптивная верстка, несколько фотографий на предложение, отбор по характеристикам и сравнение вариантов, калькулятор, видео, отзывы, микроразметка, активные группы в соцсетях — всё это или необходимые, или просто очень полезные вещи.
preview Самые крупные SEO-мифы по версии Билла Славски

Самые крупные SEO-мифы по версии Билла Славски

Как распознать мифы и избежать ошибочной информации? Рассказывает известный западный SEO-эксперт Билл Славски
preview Новый формат сохраненной копии страницы в Яндексе

Новый формат сохраненной копии страницы в Яндексе

В октябре 2019-го года Яндекс безо всяких анонсов и объявлений, заменил формат сохраненной копии страницы
preview Как правильно рассчитать CTR для сайта на основе данных Search Console

Как правильно рассчитать CTR для сайта на основе данных Search Console

В статье автор рассказывает о том, как обойти недостатки Search Console и получить более точные данные
preview 20 раз отмерь: полный чек-лист проверки семантического ядра

20 раз отмерь: полный чек-лист проверки семантического ядра

Все этапы создания семантического ядра через призму распространенных ошибок, которые совершают владельцы сайтов
preview Факторы ранжирования в автомобильной тематике в 2019 году

Факторы ранжирования в автомобильной тематике в 2019 году

Особенности ранжирования в Яндексе и Google для сайтов автосалонов
preview Ссылочные атрибуты nofollow, sponsored, ugc и их влияние на SEO

Ссылочные атрибуты nofollow, sponsored, ugc и их влияние на SEO

Разбираемся с последними изменениями в обработке ссылочных атрибутов со стороны Google