Qu'est-ce que la canonisation d'URL et comment utiliser correctement la balise canonique ?

Publié: 2015-12-17

ptpost banner What is URL Canonicalization  and how to Use Canonical Tag Properly?

Google n'était certainement pas le premier moteur de recherche à apparaître sur Internet. Mais Google a fait les choses mieux et a fourni des résultats réellement utiles. Google n'a cessé de se développer en tant qu'entreprise depuis ce jour-là.

Bien que le référencement soit fait pour tous les moteurs de recherche qui existent aujourd'hui, l'un des principaux moteurs de recherche qui gère la majeure partie du trafic sur Internet est Google. Chaque fois que nous parlons de référencement, les gens supposent automatiquement que nous parlons d'optimiser le site Web pour Google.

En matière de référencement, nous devons vérifier de nombreux facteurs, à la fois sur site et hors site. Mais si votre référencement sur site n'est pas à la hauteur, quelle que soit la qualité de votre référencement hors site, vous n'obtiendrez pas les résultats que vous attendez.

Je vérifiais l'un des sites Web sur lesquels je faisais du référencement et j'ai découvert que le site Web présentait de graves problèmes liés à la canonisation. J'ai résolu les problèmes en un rien de temps, mais j'ai également décidé de travailler sur un article expliquant ce que signifie la canonisation et comment effectuer correctement la canonisation d'un site Web.

Qu'est-ce que la canonisation d'URL ?

Le terme canonisation peut être difficile à comprendre. Permettez-moi d'essayer d'expliquer cela en termes simples.

Disons qu'il y a deux URL d'un site Web :

  • http://thewebpage.org
  • http://www.thewebpage.org

Ces deux pages affichent du contenu et aucune de ces pages ne redirige vers l'une d'entre elles. Cela peut entraîner un problème de contenu en double sur Google et vous pouvez faire face à des sanctions.

Voyons un autre exemple. Il existe deux URL sur un site Web qui donnent la même résolution de page.

  • http://thewebpage.org
  • http://thewebpage.org/index.php

Si ces deux pages Web affichent le même résultat, cela peut également poser problème !

Vous n'accordez peut-être pas beaucoup d'attention à ce problème, mais cela peut entraîner de sérieuses pénalités de contenu en double. Le problème avec les robots des moteurs de recherche est qu'ils ne peuvent pas décider quelle version de l'URL ils doivent ajouter dans leur index. Si deux pages résolvent le même contenu, elles supposeront simplement qu'une copie est une copie de l'autre et votre site Web sera pénalisé.

Si votre site s'ouvre sur 2 URL affichant le même contenu, alors vous devez le corriger. Vous devez utiliser les paramètres du serveur afin que, qu'un utilisateur s'ouvre avec www ou sans www, le site s'ouvrira sur l'une des versions. De cette façon, vous pouvez corriger la canonisation.

Bien que, parfois, vous voudriez partager le même contenu sur deux URL, vous pouvez utiliser les balises rel="canonical" pour indiquer au moteur de recherche lequel est l'original et lequel en est une copie. Cela peut vous éviter des pénalités de contenu en double.

Comment appliquer correctement la canonisation d'URL ?

Voyons maintenant comment appliquer la canonisation d'URL. Nous n'avons pas besoin de taper des lignes de code pour le faire. Une simple balise rel="canonical" suffit pour appliquer la canonisation.

Prenons un exemple, il existe deux URL sur le site Web qui génèrent le même contenu lorsqu'elles sont résolues. Ces deux URL sont :

  • http://thewebpage.org
  • http://thewebpage.org/index.php

Canonisation HTML

La deuxième URL génère le même contenu que la première URL. Ils affichent tous les deux la même page et vous pouvez donc appliquer la balise rel="canonical", dans ce cas, pour indiquer que l'URL avec index.php est une URL canonique de la première.

C'est ainsi qu'il est appliqué.

<link rel="canonical" href="http://thewebpage.org/index.php">

Canonisation de l'en-tête HTTP

Le balisage ci-dessus peut être utilisé dans le cas d'un contenu HTML, mais que se passe-t-il si nous avons affaire à un contenu non HTML comme un document PDF ? Dans ces cas, nous pouvons utiliser la canonisation des en-têtes HTTP.

> HTTP/1.1 200 OK

> Type de contenu : application/pdf

> Lien : <http://www.example.com/white-paper.html> ; rel="canonique"

> Contenu-Longueur : 785710

Vous pouvez obtenir plus d'informations sur la canonisation basée sur l'en-tête HTTP sur le blog officiel de Google pour les webmasters.

Quand utiliser la canonisation ?

Maintenant que vous savez ce que signifie exactement la canonisation, vous pouvez avancer sur le sujet et voir quand l'utiliser. Parce qu'il y a beaucoup plus de cas autres que les deux que j'ai mentionnés dans les exemples ci-dessus.

Voici quelques conditions qui peuvent être évitées avec une canonisation d'URL appropriée.

  • URL différente pour un même contenu
  • Diverses catégories et balises qui aboutissent au même contenu
  • Site Web mobile affichant le même contenu mais sur une URL/sous-domaine différent
  • URL ayant des URL HTTP et HTTPS et les deux résultant en le même contenu
  • Divers ports
  • Lorsque le site Web a une version www et une version non www
  • En cas de partage de contenu syndiqué

Voici quelques conditions majeures dans lesquelles nous pouvons appliquer la canonisation d'URL pour éviter à notre site de faire face à tout type de pénalité de contenu en double.

C'est à ce moment que vous ne devez PAS effectuer de canonisation d'URL !

Il existe des scénarios dans lesquels nous ne devrions pas effectuer de canonisation d'URL, et cette section de cet article vise à spécifier ces conditions particulières. Vous pouvez également les considérer comme des erreurs lorsqu'il s'agit de canonisation d'URL . Permettez-moi de les énumérer un par un. Je vais essayer d'expliquer la plupart d'entre eux d'une manière très simple.

Ignorer la canonisation de la pagination

Si vous envisagez de canoniser les URL paginées, sachez que c'est une très mauvaise idée. Vous ne devez pas ajouter de balise de canonisation sur la deuxième page d'une URL car cette URL ne sera pas du tout indexée par Google.

Plusieurs balises canoniques sont mauvaises

Si une page Web contient plusieurs balises rel="canonical", cela peut vous être très dangereux. Créez une balise spécifique et indiquez clairement celle que vous préférez.

N'ajoutez pas de balises Canonical sur les URL raccourcies

Cliquez pour tweeter

J'ai vu que beaucoup de gens appliquent la balise Canonical comme ceci :

<link rel="canonical" href="index.php">

Ce style de canonisation est une invitation à beaucoup d'erreurs. Vous devez comprendre que plus votre balisage canonique est complet, meilleur il sera pour vous et votre contenu.

<link rel="canonical" href="http://thewebpage.org/index.php">

Le balisage ci-dessus est un meilleur moyen d'appliquer la canonisation.

Ne pas appliquer la canonisation pour la localisation #SEO #Google

Cliquez pour tweeter

La localisation signifie cibler et manipuler le contenu du site Web afin de le servir en fonction de la région dans laquelle il est consulté. Si vous voulez vraiment créer un meilleur site Web pour votre public mondial, vous pouvez lire ce guide pour créer des sites Web multilingues. par Google.

Canonisation sur la version mobile des sites Web

Une simple balise canonique pour différencier un site Web mobile sur le sous-domaine de votre site Web principal ne suffit pas. Google vous suggère d'utiliser à la fois rel="alternate" et rel="canonical" afin de mentionner que l'URL sert à afficher la version mobile du site Web.

Voici comment vous pouvez le mettre en œuvre :

> <html>

> <tête>

> <link rel="canonical" href="http://example.com/">

> <link rel="alternate" href="http://m.example.com/" media="only screen and (max-width: 640px)">

> </head>

> <corps>

N'utilisez pas de balise canonique en dehors de <head>

Les robots des moteurs de recherche ignoreront totalement les balises définies en dehors de la zone <head> du site Web. Afin d'appliquer une balise canonique appropriée, vous devez l'ajouter entre <head></head>.

N'utilisez pas plusieurs balises Canonical sur un site Web

L'utilisation de plusieurs balises Canonical est inutile. Les moteurs de recherche ignoreront les deux balises et vous serez confronté à un comportement et à des problèmes de référencement étranges. Plusieurs URL de balises canoniques sont parfois dues à des problèmes de plug-in, vous devrez donc peut-être garder un œil dessus.

Ne pointez pas une URL canonique vers un site Web avec un code d'état autre que 200

Un site Web avec un code comme 301 et 302 forcera les moteurs de recherche à explorer une URL supplémentaire, ce qui signifie qu'ils doivent explorer deux URL à la fois. Cela représente un montant important et peut facilement épuiser votre budget de crawl.

Une URL avec un code d'état de 404 est un crawl totalement inutile et les moteurs de recherche ignoreront du tout votre balise.

N'utilisez pas la canonisation pour la sculpture du PageRank

Le PageRank n'est plus une entité publique ou une statistique pour un site Web, mais il est toujours considéré par les moteurs de recherche. Si vous envisagez d'utiliser des balises Canonical pour la sculpture de PageRank et d'obtenir un meilleur classement, permettez-moi de préciser que cela fera plus de mal que de bien à votre site Web.

Dernier mot

Le concept de référencement sur site est bien plus vaste que ce que vous imaginez. Vous devez vous occuper de beaucoup de choses à la fois et vous devez également vous tenir au courant des changements qui se produisent au quotidien.

Cet article était un article pour montrer comment vous pouvez appliquer des URL canoniques sur un site Web. Gardez à l'esprit que la canonisation est un processus délicat et si elle est effectuée de manière incorrecte, elle peut nuire à votre site Web. Gardez votre site Web sous contrôle et assurez-vous d'effectuer correctement la canonisation.