Что такое канонизация URL-адресов и как правильно использовать канонический тег?

Опубликовано: 2015-12-17

ptpost banner What is URL Canonicalization  and how to Use Canonical Tag Properly?

Google определенно не был первой поисковой системой, которая появилась в Интернете. Но Google сделал все лучше и дал действительно полезные результаты. С того самого дня Google не прекращал расширяться как компания.

Хотя поисковая оптимизация проводится для всех поисковых систем, существующих сегодня, одной из основных поисковых систем, обрабатывающих большую часть трафика в Интернете, является Google. Когда мы говорим о SEO, люди автоматически предполагают, что мы говорим об оптимизации сайта для Google.

Когда дело доходит до SEO, нам нужно проверить множество факторов, как на месте, так и за его пределами. Но если ваше внутреннее SEO не на должном уровне, независимо от того, насколько хорошо вы делаете свое внешнее SEO, вы не получите ожидаемых результатов.

Я проверял один из веб-сайтов, на которых занимался поисковой оптимизацией, и обнаружил, что на нем есть серьезные проблемы, связанные с канонизацией. Я исправил проблемы в кратчайшие сроки, но также решил, что буду работать над постом, в котором объясню, что означает каноникализация и как правильно выполнить каноникализацию веб-сайта.

Что такое канонизация URL-адресов?

Термин каноникализация может быть трудным для понимания. Позвольте мне попытаться объяснить это простым языком.

Допустим, есть два URL-адреса веб-сайта:

  • http://thewebpage.org
  • http://www.thewebpage.org

Обе эти страницы показывают контент, и ни одна из этих страниц не перенаправляет ни на одну из них. Это может привести к проблеме дублирования контента в Google, и вам грозят штрафные санкции.

Посмотрим еще на один пример. На веб-сайте есть два URL-адреса, которые приводят к одинаковому разрешению страницы.

  • http://thewebpage.org
  • http://thewebpage.org/index.php

Если обе эти веб-страницы показывают одинаковый результат, это также может вызвать проблему!

Возможно, вы не уделяете много внимания этой проблеме, но это может привести к серьезным штрафам за дублирование контента. Проблема с ботами поисковых систем заключается в том, что они не могут решить, какую версию URL-адреса следует добавить в свой индекс. Если две страницы разрешают один и тот же контент, они просто предполагают, что одна копия является копией другой, и ваш веб-сайт будет оштрафован.

Если ваш сайт открывается на двух URL-адресах, показывающих одно и то же содержимое, вы должны это исправить. Вы должны использовать настройки сервера таким образом, чтобы вне зависимости от того, открывает пользователь с www или без www, сайт будет открываться на любой из одной версии. Таким образом можно исправить канонизацию.

Хотя иногда вы хотели бы поделиться одним и тем же контентом на двух URL-адресах, тогда вы можете использовать теги rel = ”canonical”, чтобы поисковая система узнала, что является оригиналом, а какой является его копией. Это может спасти вас от штрафов за дублирование контента.

Как правильно применить канонизацию URL?

Давайте теперь проверим, как применить канонизацию URL-адресов. Для этого нам не нужно набирать строки кода. Для применения канонизации достаточно простого тега rel = "canonical".

Возьмем, к примеру, два URL-адреса на веб-сайте, которые при разрешении приводят к одинаковому содержанию. Эти два URL-адреса:

  • http://thewebpage.org
  • http://thewebpage.org/index.php

Канонизация HTML

Второй URL-адрес приводит к тому же содержанию, что и первый URL-адрес. Оба они отображают одну и ту же страницу, и поэтому вы можете применить тег rel = ”canonical” в этом случае, чтобы указать, что URL-адрес с index.php является каноническим URL-адресом первого.

Вот как это применяется.

<link rel = ”canonical” href = ”http://thewebpage.org/index.php”>

Канонизация заголовка HTTP

Вышеупомянутая разметка может использоваться в случае содержимого HTML, но что, если мы имеем дело с содержимым, отличным от HTML, таким как документ PDF? В этих случаях мы можем использовать канонизацию заголовка HTTP.

> HTTP / 1.1 200 ОК

> Тип содержимого: приложение / pdf

> Ссылка: <http://www.example.com/white-paper.html>; rel = "canonical"

> Длина содержимого: 785710

Дополнительную информацию о канонизации на основе заголовков HTTP можно найти в официальном блоге Google для веб-мастеров.

Когда следует использовать каноникализацию?

Теперь, когда вы знаете, что именно означает каноникализация, вы можете перейти к теме и посмотреть, когда вам следует ее использовать. Потому что существует гораздо больше случаев, кроме двух, которые я упомянул в примерах выше.

Вот несколько условий, которые можно предотвратить с помощью правильной канонизации URL.

  • Другой URL для одного и того же контента
  • Различные категории и теги, которые приводят к одинаковому содержанию
  • Мобильный веб-сайт, отображающий тот же контент, но на другом URL / субдомене
  • URL-адреса, содержащие URL-адреса HTTP и HTTPS, которые приводят к одинаковому содержанию
  • Различные порты
  • Когда у веб-сайта есть версия с www и без www
  • В случае совместного использования синдицированного контента

Вот некоторые основные условия, при которых мы можем применить каноникализацию URL-адресов, чтобы спасти наш сайт от любых штрафов за дублирование контента.

В этом случае НЕ следует выполнять канонизацию URL!

Существуют сценарии, в которых мы не должны выполнять канонизацию URL-адресов, и этот раздел этого сообщения нацелен на определение этих конкретных условий. Вы также можете рассматривать это как ошибки, когда дело доходит до канонизации URL-адресов . Позвольте мне перечислить их по порядку. Я постараюсь объяснить большинство из них по-настоящему просто.

Пропустить канонизацию нумерации страниц

Если вы планируете канонизировать URL-адреса с разбивкой на страницы, вы должны знать, что это очень плохая идея. Не следует добавлять тег канонизации на вторую страницу URL-адреса, поскольку этот URL-адрес вообще не будет проиндексирован Google.

Множественные канонические теги - это плохо

Если на веб-странице есть несколько тегов rel = ”canonical”, это может быть действительно вредно для вас. Сделайте один конкретный тег и поясните, какой из них вы предпочитаете.

Не добавляйте канонические теги в сокращенные URL

Нажмите, чтобы твитнуть

Я видел, что многие люди применяют тег Canonical следующим образом:

<link rel = ”canonical” href = ”index.php”>

Такой стиль канонизации ведет к множеству ошибок. Вы должны понимать, что чем полнее будет ваша каноническая разметка, тем лучше для вас и вашего контента.

<link rel = ”canonical” href = ”http://thewebpage.org/index.php”>

Приведенная выше разметка - лучший способ применить канонизацию.

Не применять канонизацию для локализации #SEO #Google

Нажмите, чтобы твитнуть

Локализация означает нацеливание и управление содержимым веб-сайта с целью его обслуживания в зависимости от региона, в котором он просматривается. Если вы действительно хотите создать лучший веб-сайт для своей глобальной аудитории, вы можете прочитать это руководство по созданию многоязычных веб-сайтов. от Google.

Канонизация на мобильной версии сайтов

Просто канонического тега, чтобы отличить мобильный сайт от субдомена вашего основного сайта, недостаточно. Google предлагает использовать как rel = "alternate", так и rel = "canonical", чтобы указать, что URL-адрес предназначен для отображения мобильной версии веб-сайта.

Вот как это можно реализовать:

> <html>

> <head>

> <link rel = ”canonical” href = ”http://example.com/”>

> <link rel = ”alternate” href = ”http://m.example.com/” media = ”только экран и (max-width: 640px)”>

> </head>

> <body>

Не используйте канонический тег вне <head>

Боты поисковых систем полностью игнорируют теги, установленные за пределами <head> веб-сайта, поэтому для применения правильного канонического тега вам необходимо добавить его между <head> </head>.

Не используйте на веб-сайте несколько канонических тегов

Использование нескольких канонических тегов бессмысленно. Поисковые системы будут игнорировать оба тега, и вы столкнетесь со странным поведением SEO и проблемами. Несколько канонических URL-адресов тегов иногда возникают из-за сбоев плагина, поэтому вам, возможно, придется следить за этим.

Не указывайте канонический URL-адрес на веб-сайт с кодом состояния, отличным от 200.

Веб-сайт с такими кодами, как 301 и 302, заставит поисковые системы сканировать один дополнительный URL-адрес, а это означает, что им необходимо сканировать два URL-адреса одновременно. Это очень много и может легко истощить ваш краулинговый бюджет.

URL-адрес с кодом состояния 404 - это бесполезное сканирование, и поисковые системы вообще проигнорируют ваш тег.

Не используйте канонизацию для построения рейтинга страниц

PageRank больше не является публичной единицей или статистикой для веб-сайта, но по-прежнему учитывается поисковыми системами. Если вы планируете использовать канонические теги для формирования PageRank и повышения рейтинга, позвольте мне прояснить, что это принесет вашему сайту больше вреда, чем пользы.

Последнее слово

Концепция локального SEO намного шире, чем вы себе представляете. Вам нужно заботиться о многих вещах одновременно, и вам также нужно быть в курсе изменений, которые происходят в повседневной жизни.

Этот пост был постом для демонстрации того, как можно применять канонические URL-адреса на веб-сайте. Имейте в виду, что канонизация - это деликатный процесс, и в случае неправильного выполнения может нанести вред вашему веб-сайту. Держите свой веб-сайт под контролем и убедитесь, что вы правильно выполняете канонизацию.