rel=«canonical»

Атрибут rel=’canonical’ – это тег, который позволяет бороться с дублирующимся контентом в пределах одного сайта. Он сообщает поисковику, что некоторые страницы, имеющие разные URL-адреса, являются одинаковыми по своему содержанию. Чаще всего встречаются ситуации, когда один и тот же товар относится к разным категориям. Например, страницы iPhone 13 Pro с одинаковым содержанием и разными адресами могут находиться в разделах «Смартфоны», «Смартфоны в золотом цвете» и «Смартфоны с диагональю 6,1″». Использование атрибута ‘canonical’ позволяет указать предпочитаемый канонический URL, чтобы поисковая система не расценивала остальные страницы с таким же содержанием как дубликаты.

Когда необходим атрибут rel=’canonical’

Чтобы предупредить появление дублей.

К ним относятся:

  • страницы сортировки, создаваемые для удобства пользователей;
  • дубли, возникающие из-за UTM-меток;
  • страницы с GET-параметрами в адресе;
  • дубли, связанные с особенностями работы CMS.

В этих случаях необходимо использовать тег ‘canonical’ на всех статических страницах. К примеру, для страницы https://www.amazon.com/category-1/page-2 это будет выглядеть следующим образом:

<head><link rel="canonical" href="https://www.amazon.com/category-1/page-2/"></head>

Для страниц с похожим контентом.

Об этом мы подробно рассказывали в первом абзаце. Но бывают и другие причины, по которым на сайте есть страницы с разными адресами и похожим содержанием. Например, товары отличаются только цветом, размером, объемом памяти или диагональю. В таком случае следует указать канонический URL на всех похожих страницах, чтобы поисковые системы не расценивали их как дубли.

На страницах пагинации, если в категориях сайта есть страницы «Показать все».

В этой ситуации для каждой страницы пагинации необходимо сделать канонической страницу «Показать все». Это будет выглядеть следующим образом:

<head><link rel="canonical" href="https://www.amazon.com/category-1/show-all/"></head>

Где можно указать каноническую страницу с помощью атрибута rel=’canonical’

Между тегами <head></head>

Это самый распространенный способ, который заключается в указании полного URL канонической страницы. Например, для https://www.amazon.com/*utm_content= канонической ссылкой будет https://www.amazon.com/. Для этого мы укажем ее между тегами <head></head>:

<head><link rel="canonical" href="https://www.amazon.com/"></head>

Совет: чтобы снизить вероятность появления ошибок в URL, используйте абсолютные, а не относительные ссылки.

В файле Sitemap.xml

В файле Sitemap.xml можно указать каноническую ссылку для любой страницы.

В заголовке HTTP

Этот вариант лучше использовать для файлов, не имеющих разметку HTML. Например, для документов в формате PDF. При запросе дубля сервер должен отдавать ссылку на оригинальный документ. Но обратите внимание, что этот способ подойдет только в том случае, если у вас есть права на изменение настроек сервера.

Настройка атрибута rel=’canonical’ с помощью плагинов

Есть различные плагины для CMS, которые дают возможность указать каноническую страницу.

  • Плагин Yoast SEO в WordPress позволяет автоматически добавлять канонические адреса. Для этого нужно использовать вкладку «Дополнительно».
Yoast SEO в WordPress
  • На платформе OpenCart для интернет-магазинов достаточно зайти в настройки товара и задать параметр SEO URL, чтобы указать каноническую страницу.
  • В Joomla нужно включить в настройках движка функцию SEF, которая позволяет настраивать атрибут rel=’canonical’.

Как проверить корректность настройки канонических страниц

Проще всего это сделать с помощью программы Screaming Frog SEO Spider. Она анализирует сайт и показывает, какие страницы не имеют атрибута rel=’canonical’, на каких URL он есть и какие страницы являются для них каноническими.

Распространенные ошибки настройки rel=’canonical’

Несколько канонических ссылок для одной страницы.

Для одного урла может быть указан только один канонический адрес. Если использовано сразу несколько, робот поисковой системы либо посчитает страницу дублем, либо примет к сведению первый указанный URL. Следите за тем, как плагин CMS использует атрибут – иногда из-за ошибок в настройках он может указывать сразу несколько адресов.

Каноническая страница закрыта от индексирования.

Если URL канонической страницы запрещен для индексирования или робот не может получить к нему доступ по другим причинам, страница не попадет в выдачу.

Использование главной страницы сайта как канонической для других страниц.

Такое решение может привести к тому, что роботы «Яндекса» или Google проиндексируют только главную страницу.

Размещение атрибута не между тегами <head></head>

Атрибут rel=’canonical’ не должен оказаться за пределами тега <head> в секции <body>. Иногда секция <head> закрывается раньше из-за вставок JavaScript, контейнеров <iframe>, а также незакрытых парных тегов. В этом случае атрибут часто оказывается не в той секции, что приводит к игнорированию документа поисковыми роботами.

Канонические ссылки вместо 301-го редиректа

Атрибут rel=’canonical’ и 301-й редирект выглядят похожими, так как перенаправляют роботов на основную страницу. Однако нежелательно использовать канонические ссылки вместо редиректов. Несмотря на схожесть, редирект переносит весь трафик на основную страницу, а метатег с атрибутом rel=’canonical’ позволяет URL получать свой трафик, не попадая в поисковую выдачу.

Использование атрибута rel=’canonical’ дает возможность оптимизировать сайт для продвижения в поисковых системах, ускорить его индексирование и усилить позиции в выдаче.