Как правильно использовать rel="canonical" для успешной индексации в поиске Google

9 апреля 2013

10025

Аллан Скотт (Allan Scott), инженер программного обеспечения команды индексирования Google, перечислил в блоге Webmaster Central пять наиболее распространенных ошибок, которые допускают вебмастера при использовании атрибута rel="canonical", а также дал несколько важных советов по применению данного тега.

Прежде всего, представитель поиска напомнил специалистам отрасли о том, что атрибут канонической страницы чётко указывает поисковым роботам, на какой именно экземпляр из набора страниц с похожим содержанием ссылаются дубликаты. При этом, дополнительные свойства адреса (к примеру PageRank) и связанные сигналы (качество входящей ссылочной массы) также переносятся с дублированных страниц на каноническую. В настоящее время атрибут rel="canonical" поддерживают все ведущие западные поисковые системы: Yahoo!, Bing, и Google.

Однако зачастую применение атрибута rel="canonical" вызывает у вебмастеров определенные трудности. В свою очередь, ошибки, связанные с указанием канонической страницы могут повлиять и на отображение страниц ресурса в поисковой выдаче.

Чтобы избежать подобных ошибок, специалисты Google рекомендуют придерживаться следующих общих правил при проставлении атрибута rel="canonical":

Большинство дублированных страниц должно содержать ссылки на канонический адрес.
Важно убедиться в том, что страница, на которую ссылаются при помощи атрибута rel="canonical" существует, а ее URL - правильный (проверьте не возвращает ли сервер ошибку 404 ).
Необходимо убедиться в том, что каноническая страница не закрыта для индексации поисковыми роботами.
Важно четко понимать, какую страницу вебмастер хочет видеть в результатах поиска, именно ее и следует указывать как каноническую (к примеру, если сайт содержит набор страниц с одной и той же моделью товара, различающегося по цвету - целесообразно в качестве канонической указать страницу с наиболее популярным цветом).
Не стоит забывать о включении атрибута rel="canonical" в раздел документа кода HTML.
Важно избегать использования атрибута rel="canonical" более одного раза для одной страницы. В противном случае поисковик просто-напросто проигнорирует указание атрибута.

Далее Аллан Скотт перечислил 5 основных ошибок, допускаемых вебмасетрами и оптимизаторами при применении атрибута rel="canonical":

Ошибка 1. Атрибут rel="canonical" использован для первой страницы серии пагинации:

Представьте, что статья на вашем сайте имеет несколько страниц:

example.com/article?story=cupcake-news&page=1
example.com/article?story=cupcake-news&page=2
и т.д.

В данном случае страницы 2 и 3 не являются дубликатами, а значит и применение атрибута rel="canonical" для указания в качестве канонической первой страницы документа будет ошибкой. Данная ошибка может повлечь за собой выпадение страниц 2 и 3 из индекса.

В подобных случаях представители Google рекомендуют использовать атрибут rel="canonical" для страниц компонента, указывая в качестве канонического, адрес страницы, на которой расположена статья целиком.

Кроме того, при разбиении документа на страницы важно грамотно применять HTML-атрибуты rel="next" и rel="prev", позволяющие указать на взаимосвязь между отдельными URL.

Ошибка 2. Абсолютные ссылки записываются как относительные:

Безусловно, rel="canonical" можно использовать как для абсолютных, так для относительных ссылок, однако Google рекомендует использовать абсолютные ссылки для минимизации возможных ошибок. Если в документе указана базовая ссылка, то все относительные ссылки будут вычисляться на ее основе.

Однако в случаях, когда абсолютные ссылки на каноническую страницу по ошибке записываются как относительные (<link rel=canonical href=“example.com/cupcake.html”/> вместо http://example.com/example.com/cupcake.html), алгоритмы могут проигнорировать то, что данная страница была указана в качестве канонической.

Ошибка 3. Если каноническими назначено несколько страниц из набора с похожим содержанием, или атрибут rel="canonical" использован по ошибке:

Часто специалисты Google наблюдают следующую ситуацию: вебмастер копирует шаблон страницы, забывая при этом изменить значение атрибута rel="canonical"

Если вы используете шаблоны – не забывайте проверять, не был ли случайно скопирован атрибут rel="canonical".

Еще одна ошибка вебмастеров, когда каноническими назначается несколько страниц из набора с похожим содержанием. Часто это происходит из-за использования различных плагинов на странице. Код плагина по ошибке встраивается в атрибут rel="canonical".

Важно понимать, что в обоих случаях алгоритмы Google распознают применение атрибута rel="canonical" как ошибочное, и не учтут его использование при индексации.

Ошибка 4. Одна из категорий целевой страницы ссылается при помощи атрибута rel="canonical" на избранную статью:

При таком подходе в индекс попадет только страница со статьёй, сама же страница категории не будет проиндексирована.

Ошибка 5. Атрибут rel="canonical" используется в разделе документа <body> :

Как уже говорилось выше, атрибут rel="canonical" должен быть включен в раздел документа кода HTML, при этом он не должен попадать в раздел документа <body>. В противном случае алгоритмы Google не будут учитывать использование данного тега, особенно если он будет показываться обычного текста, или тегов, которые мы обычно присутствуют в разделе <body>.

Дополнительная информация, касающаяся применения атрибута rel="canonical" доступна на формуе Webmaster Help.

Как правильно использовать rel="canonical" для успешной индексации в поиске Google

Мэтт Каттс рассказал о влиянии хостинга на ранжирование сайта

Переезд сайтов Яндекс.Народ на платформу uCoz начался

Мэтт Каттс рассказал, почему позиции посадочных страниц постоянно меняются

Подсказки Яндекса стали трилингвальными

Исследование: поиск по хэштегам стремительно набирает популярность среди пользователей

Сервис Google Web Fonts покажет шрифты сторонних разработчиков