Что такое канонизация URL-адресов и как правильно использовать канонический тег?
Опубликовано: 2015-12-17
Google определенно не был первой поисковой системой, которая появилась в Интернете. Но Google сделал все лучше и дал действительно полезные результаты. С того самого дня Google не прекращал расширяться как компания.
Хотя поисковая оптимизация проводится для всех поисковых систем, существующих сегодня, одной из основных поисковых систем, обрабатывающих большую часть трафика в Интернете, является Google. Когда мы говорим о SEO, люди автоматически предполагают, что мы говорим об оптимизации сайта для Google.
Когда дело доходит до SEO, нам нужно проверить множество факторов, как на месте, так и за его пределами. Но если ваше внутреннее SEO не на должном уровне, независимо от того, насколько хорошо вы делаете свое внешнее SEO, вы не получите ожидаемых результатов.
Я проверял один из веб-сайтов, на которых занимался поисковой оптимизацией, и обнаружил, что на нем есть серьезные проблемы, связанные с канонизацией. Я исправил проблемы в кратчайшие сроки, но также решил, что буду работать над постом, в котором объясню, что означает каноникализация и как правильно выполнить каноникализацию веб-сайта.
Что такое канонизация URL-адресов?
Термин каноникализация может быть трудным для понимания. Позвольте мне попытаться объяснить это простым языком.
Допустим, есть два URL-адреса веб-сайта:
- http://thewebpage.org
- http://www.thewebpage.org
Обе эти страницы показывают контент, и ни одна из этих страниц не перенаправляет ни на одну из них. Это может привести к проблеме дублирования контента в Google, и вам грозят штрафные санкции.
Посмотрим еще на один пример. На веб-сайте есть два URL-адреса, которые приводят к одинаковому разрешению страницы.
- http://thewebpage.org
- http://thewebpage.org/index.php
Если обе эти веб-страницы показывают одинаковый результат, это также может вызвать проблему!
Возможно, вы не уделяете много внимания этой проблеме, но это может привести к серьезным штрафам за дублирование контента. Проблема с ботами поисковых систем заключается в том, что они не могут решить, какую версию URL-адреса следует добавить в свой индекс. Если две страницы разрешают один и тот же контент, они просто предполагают, что одна копия является копией другой, и ваш веб-сайт будет оштрафован.
Если ваш сайт открывается на двух URL-адресах, показывающих одно и то же содержимое, вы должны это исправить. Вы должны использовать настройки сервера таким образом, чтобы вне зависимости от того, открывает пользователь с www или без www, сайт будет открываться на любой из одной версии. Таким образом можно исправить канонизацию.
Хотя иногда вы хотели бы поделиться одним и тем же контентом на двух URL-адресах, тогда вы можете использовать теги rel = ”canonical”, чтобы поисковая система узнала, что является оригиналом, а какой является его копией. Это может спасти вас от штрафов за дублирование контента.
Как правильно применить канонизацию URL?
Давайте теперь проверим, как применить канонизацию URL-адресов. Для этого нам не нужно набирать строки кода. Для применения канонизации достаточно простого тега rel = "canonical".
Возьмем, к примеру, два URL-адреса на веб-сайте, которые при разрешении приводят к одинаковому содержанию. Эти два URL-адреса:
- http://thewebpage.org
- http://thewebpage.org/index.php
Канонизация HTML
Второй URL-адрес приводит к тому же содержанию, что и первый URL-адрес. Оба они отображают одну и ту же страницу, и поэтому вы можете применить тег rel = ”canonical” в этом случае, чтобы указать, что URL-адрес с index.php является каноническим URL-адресом первого.
Вот как это применяется.
<link rel = ”canonical” href = ”http://thewebpage.org/index.php”>
Канонизация заголовка HTTP
Вышеупомянутая разметка может использоваться в случае содержимого HTML, но что, если мы имеем дело с содержимым, отличным от HTML, таким как документ PDF? В этих случаях мы можем использовать канонизацию заголовка HTTP.
> HTTP / 1.1 200 ОК
> Тип содержимого: приложение / pdf
> Ссылка: <http://www.example.com/white-paper.html>; rel = "canonical"
> Длина содержимого: 785710
Дополнительную информацию о канонизации на основе заголовков HTTP можно найти в официальном блоге Google для веб-мастеров.
Когда следует использовать каноникализацию?
Теперь, когда вы знаете, что именно означает каноникализация, вы можете перейти к теме и посмотреть, когда вам следует ее использовать. Потому что существует гораздо больше случаев, кроме двух, которые я упомянул в примерах выше.
Вот несколько условий, которые можно предотвратить с помощью правильной канонизации URL.
- Другой URL для одного и того же контента
- Различные категории и теги, которые приводят к одинаковому содержанию
- Мобильный веб-сайт, отображающий тот же контент, но на другом URL / субдомене
- URL-адреса, содержащие URL-адреса HTTP и HTTPS, которые приводят к одинаковому содержанию
- Различные порты
- Когда у веб-сайта есть версия с www и без www
- В случае совместного использования синдицированного контента
Вот некоторые основные условия, при которых мы можем применить каноникализацию URL-адресов, чтобы спасти наш сайт от любых штрафов за дублирование контента.

В этом случае НЕ следует выполнять канонизацию URL!
Существуют сценарии, в которых мы не должны выполнять канонизацию URL-адресов, и этот раздел этого сообщения нацелен на определение этих конкретных условий. Вы также можете рассматривать это как ошибки, когда дело доходит до канонизации URL-адресов . Позвольте мне перечислить их по порядку. Я постараюсь объяснить большинство из них по-настоящему просто.
Пропустить канонизацию нумерации страниц
Если вы планируете канонизировать URL-адреса с разбивкой на страницы, вы должны знать, что это очень плохая идея. Не следует добавлять тег канонизации на вторую страницу URL-адреса, поскольку этот URL-адрес вообще не будет проиндексирован Google.
Множественные канонические теги - это плохо
Если на веб-странице есть несколько тегов rel = ”canonical”, это может быть действительно вредно для вас. Сделайте один конкретный тег и поясните, какой из них вы предпочитаете.
Нажмите, чтобы твитнуть
Я видел, что многие люди применяют тег Canonical следующим образом:
<link rel = ”canonical” href = ”index.php”>
Такой стиль канонизации ведет к множеству ошибок. Вы должны понимать, что чем полнее будет ваша каноническая разметка, тем лучше для вас и вашего контента.
<link rel = ”canonical” href = ”http://thewebpage.org/index.php”>
Приведенная выше разметка - лучший способ применить канонизацию.
Нажмите, чтобы твитнуть
Локализация означает нацеливание и управление содержимым веб-сайта с целью его обслуживания в зависимости от региона, в котором он просматривается. Если вы действительно хотите создать лучший веб-сайт для своей глобальной аудитории, вы можете прочитать это руководство по созданию многоязычных веб-сайтов. от Google.
Канонизация на мобильной версии сайтов
Просто канонического тега, чтобы отличить мобильный сайт от субдомена вашего основного сайта, недостаточно. Google предлагает использовать как rel = "alternate", так и rel = "canonical", чтобы указать, что URL-адрес предназначен для отображения мобильной версии веб-сайта.
Вот как это можно реализовать:
> <html>
> <head>
> <link rel = ”canonical” href = ”http://example.com/”>
> <link rel = ”alternate” href = ”http://m.example.com/” media = ”только экран и (max-width: 640px)”>
> </head>
> <body>
Не используйте канонический тег вне <head>
Боты поисковых систем полностью игнорируют теги, установленные за пределами <head> веб-сайта, поэтому для применения правильного канонического тега вам необходимо добавить его между <head> </head>.
Не используйте на веб-сайте несколько канонических тегов
Использование нескольких канонических тегов бессмысленно. Поисковые системы будут игнорировать оба тега, и вы столкнетесь со странным поведением SEO и проблемами. Несколько канонических URL-адресов тегов иногда возникают из-за сбоев плагина, поэтому вам, возможно, придется следить за этим.
Не указывайте канонический URL-адрес на веб-сайт с кодом состояния, отличным от 200.
Веб-сайт с такими кодами, как 301 и 302, заставит поисковые системы сканировать один дополнительный URL-адрес, а это означает, что им необходимо сканировать два URL-адреса одновременно. Это очень много и может легко истощить ваш краулинговый бюджет.
URL-адрес с кодом состояния 404 - это бесполезное сканирование, и поисковые системы вообще проигнорируют ваш тег.
Не используйте канонизацию для построения рейтинга страниц
PageRank больше не является публичной единицей или статистикой для веб-сайта, но по-прежнему учитывается поисковыми системами. Если вы планируете использовать канонические теги для формирования PageRank и повышения рейтинга, позвольте мне прояснить, что это принесет вашему сайту больше вреда, чем пользы.
Последнее слово
Концепция локального SEO намного шире, чем вы себе представляете. Вам нужно заботиться о многих вещах одновременно, и вам также нужно быть в курсе изменений, которые происходят в повседневной жизни.
Этот пост был постом для демонстрации того, как можно применять канонические URL-адреса на веб-сайте. Имейте в виду, что канонизация - это деликатный процесс, и в случае неправильного выполнения может нанести вред вашему веб-сайту. Держите свой веб-сайт под контролем и убедитесь, что вы правильно выполняете канонизацию.
