Аллан Скотт (Allan Scott), инженер программного обеспечения команды индексирования Google, перечислил в блоге Webmaster Central пять наиболее распространенных ошибок, которые допускают вебмастера при использовании атрибута rel="canonical", а также дал несколько важных советов по применению данного тега.
Прежде всего, представитель поиска напомнил специалистам отрасли о том, что атрибут канонической страницы чётко указывает поисковым роботам, на какой именно экземпляр из набора страниц с похожим содержанием ссылаются дубликаты. При этом, дополнительные свойства адреса (к примеру PageRank) и связанные сигналы (качество входящей ссылочной массы) также переносятся с дублированных страниц на каноническую. В настоящее время атрибут rel="canonical" поддерживают все ведущие западные поисковые системы: Yahoo!, Bing, и Google.
Однако зачастую применение атрибута rel="canonical" вызывает у вебмастеров определенные трудности. В свою очередь, ошибки, связанные с указанием канонической страницы могут повлиять и на отображение страниц ресурса в поисковой выдаче.
Чтобы избежать подобных ошибок, специалисты Google рекомендуют придерживаться следующих общих правил при проставлении атрибута rel="canonical":
- Большинство дублированных страниц должно содержать ссылки на канонический адрес.
- Важно убедиться в том, что страница, на которую ссылаются при помощи атрибута rel="canonical" существует, а ее URL - правильный (проверьте не возвращает ли сервер ошибку 404 ).
- Необходимо убедиться в том, что каноническая страница не закрыта для индексации поисковыми роботами.
- Важно четко понимать, какую страницу вебмастер хочет видеть в результатах поиска, именно ее и следует указывать как каноническую (к примеру, если сайт содержит набор страниц с одной и той же моделью товара, различающегося по цвету - целесообразно в качестве канонической указать страницу с наиболее популярным цветом).
- Не стоит забывать о включении атрибута rel="canonical" в раздел документа кода HTML.
- Важно избегать использования атрибута rel="canonical" более одного раза для одной страницы. В противном случае поисковик просто-напросто проигнорирует указание атрибута.
Далее Аллан Скотт перечислил 5 основных ошибок, допускаемых вебмасетрами и оптимизаторами при применении атрибута rel="canonical":
Ошибка 1. Атрибут rel="canonical" использован для первой страницы серии пагинации:
Представьте, что статья на вашем сайте имеет несколько страниц:
- example.com/article?story=cupcake-news&page=1
- example.com/article?story=cupcake-news&page=2
- и т.д.
В данном случае страницы 2 и 3 не являются дубликатами, а значит и применение атрибута rel="canonical" для указания в качестве канонической первой страницы документа будет ошибкой. Данная ошибка может повлечь за собой выпадение страниц 2 и 3 из индекса.
В подобных случаях представители Google рекомендуют использовать атрибут rel="canonical" для страниц компонента, указывая в качестве канонического, адрес страницы, на которой расположена статья целиком.
Кроме того, при разбиении документа на страницы важно грамотно применять HTML-атрибуты rel="next" и rel="prev", позволяющие указать на взаимосвязь между отдельными URL.
Ошибка 2. Абсолютные ссылки записываются как относительные:
Безусловно, rel="canonical" можно использовать как для абсолютных, так для относительных ссылок, однако Google рекомендует использовать абсолютные ссылки для минимизации возможных ошибок. Если в документе указана базовая ссылка, то все относительные ссылки будут вычисляться на ее основе.
Однако в случаях, когда абсолютные ссылки на каноническую страницу по ошибке записываются как относительные (<link rel=canonical href=“example.com/cupcake.html”/> вместо http://example.com/example.com/cupcake.html), алгоритмы могут проигнорировать то, что данная страница была указана в качестве канонической.
Ошибка 3. Если каноническими назначено несколько страниц из набора с похожим содержанием, или атрибут rel="canonical" использован по ошибке:
Часто специалисты Google наблюдают следующую ситуацию: вебмастер копирует шаблон страницы, забывая при этом изменить значение атрибута rel="canonical"
Если вы используете шаблоны – не забывайте проверять, не был ли случайно скопирован атрибут rel="canonical".
Еще одна ошибка вебмастеров, когда каноническими назначается несколько страниц из набора с похожим содержанием. Часто это происходит из-за использования различных плагинов на странице. Код плагина по ошибке встраивается в атрибут rel="canonical".
Важно понимать, что в обоих случаях алгоритмы Google распознают применение атрибута rel="canonical" как ошибочное, и не учтут его использование при индексации.
Ошибка 4. Одна из категорий целевой страницы ссылается при помощи атрибута rel="canonical" на избранную статью:
При таком подходе в индекс попадет только страница со статьёй, сама же страница категории не будет проиндексирована.
Ошибка 5. Атрибут rel="canonical" используется в разделе документа <body> :
Как уже говорилось выше, атрибут rel="canonical" должен быть включен в раздел документа кода HTML, при этом он не должен попадать в раздел документа <body>. В противном случае алгоритмы Google не будут учитывать использование данного тега, особенно если он будет показываться обычного текста, или тегов, которые мы обычно присутствуют в разделе <body>.
Дополнительная информация, касающаяся применения атрибута rel="canonical" доступна на формуе Webmaster Help.