Ce este canonizarea URL și cum să utilizați corect eticheta canonică?
Publicat: 2015-12-17
Google cu siguranță nu a fost primul motor de căutare care a apărut pe internet. Dar Google a făcut lucrurile într-un mod mai bun și a oferit rezultate care au fost de fapt utile. Google nu a încetat să se extindă ca companie din acea zi.
Deși SEO se face pentru toate motoarele de căutare care există astăzi, un motor de căutare major care gestionează cea mai mare parte a traficului de pe Internet este Google. Ori de câte ori vorbim despre SEO, oamenii presupun automat că vorbim despre optimizarea site-ului web pentru Google.
Când vine vorba de SEO, trebuie să verificăm mulți factori, atât onsite, cât și offsite. Dar dacă SEO pe site nu este la înălțime, indiferent cât de bine ați face SEO offsite, nu veți obține rezultatele pe care le așteptați.
Verificam unul dintre site-urile web pe care făceam SEO și am constatat că site-ul web avea câteva probleme serioase legate de canonizare. Am rezolvat problemele în cel mai scurt timp, dar am decis și că voi lucra la o postare pentru a explica ce înseamnă canonizarea și cum se poate efectua corect canonizarea unui site web.
Ce este canonizarea URL?
Termenul de canonizare poate fi greu de înțeles. Permiteți-mi să încerc să explic acest lucru în termeni simpli.
Să presupunem că există două adrese URL ale unui site web:
- http://thewebpage.org
- http://www.thewebpage.org
Ambele pagini afișează conținut și niciuna dintre aceste pagini nu redirecționează către niciuna dintre ele. Acest lucru poate duce la o problemă de conținut duplicat pe Google și vă puteți confrunta cu penalități.
Să mai vedem un exemplu. Există două adrese URL pe un site web care au ca rezultat aceeași rezoluție a paginii.
- http://thewebpage.org
- http://thewebpage.org/index.php
Dacă ambele pagini web arată același rezultat, atunci acest lucru ar putea cauza și o problemă!
Este posibil să nu acordați prea multă atenție acestei probleme, dar acest lucru ar putea duce la penalități grave de conținut duplicat. Problema cu roboții motoarelor de căutare este că nu pot decide ce versiune a adresei URL ar trebui să adauge în indexul lor. Dacă două pagini rezolvă același conținut, vor presupune doar că o copie este o copie a celeilalte, iar site-ul dvs. va fi penalizat.
Dacă site-ul dvs. se deschide pe 2 URL-uri care arată același conținut, atunci trebuie să îl remediați. Trebuie să utilizați setările serverului, astfel încât, indiferent dacă un utilizator se deschide cu www sau fără www, site-ul se va deschide pe oricare dintre versiuni. În acest fel, puteți remedia canonizarea.
Deși, uneori, doriți să partajați același conținut pe două URL-uri, atunci puteți utiliza etichetele rel="canonical" pentru a informa motorul de căutare care este originalul și care este o copie a acestuia. Acest lucru vă poate salva de penalizările de conținut duplicat.
Cum se aplică corect canonizarea URL?
Să verificăm acum cum să aplicăm canonizarea URL. Nu trebuie să introducem linii de cod pentru a face acest lucru. O simplă etichetă rel="canonical" este suficientă pentru a aplica canonizarea.
Luați un exemplu, există două adrese URL pe site care au ca rezultat același conținut atunci când se rezolvă. Aceste două adrese URL sunt:
- http://thewebpage.org
- http://thewebpage.org/index.php
Canonizare HTML
A doua adresă URL are același conținut ca și prima adresă URL. Ambele afișează aceeași pagină și, prin urmare, puteți aplica eticheta rel="canonical", în acest caz, pentru a indica faptul că URL-ul cu index.php este un URL canonic al primului.
Așa se aplică.
<link rel="canonical” href="http://thewebpage.org/index.php”>
Canonizare antet HTTP
Marcajul de mai sus poate fi utilizat în cazul conținutului HTML, dar ce se întâmplă dacă avem de-a face cu conținut non-HTML, cum ar fi un document PDF? În aceste cazuri, putem folosi HTTP Header Canonicalization.
> HTTP/1.1 200 OK
> Tip de conținut: aplicație/pdf
> Link: <http://www.example.com/white-paper.html>; rel=”canonic”
> Lungimea conținutului: 785710
Puteți obține mai multe informații despre canonizarea bazată pe antet HTTP pe blogul oficial Google pentru webmasteri.
Când ar trebui să utilizați Canonicalizarea?
Acum că știi ce înseamnă exact canonizarea, poți să mergi mai departe pe subiect și să vezi când ar trebui să o folosești. Pentru că sunt mult mai multe cazuri în afară de cele două pe care le-am menționat în exemplele de mai sus.
Iată câteva condiții care pot fi prevenite cu canonizarea corectă a URL-ului.
- Adresă URL diferită pentru același conținut
- Diverse categorii și etichete care au ca rezultat același conținut
- Site web mobil care afișează același conținut, dar pe URL/subdomeniu diferit
- Adrese URL care au adrese URL HTTP și HTTPS și ambele duc la același conținut
- Diverse porturi
- Când site-ul are o versiune www și o versiune non-www
- În cazul partajării conținutului sindicalizat
Acestea sunt câteva condiții majore în care putem aplica canonizarea URL pentru a salva site-ul nostru de la orice fel de penalizare pentru conținut duplicat.

Acesta este momentul în care NU ar trebui să efectuați canonizarea URL!
Există scenarii în care nu ar trebui să efectuăm canonizarea URL, iar această secțiune a acestei postări are ca scop specificarea acestor condiții particulare. De asemenea, le puteți considera erori atunci când vine vorba de canonizarea URL . Lasă-mă să le enumer pe acestea unul câte unul. Voi încerca să explic cele mai multe dintre ele într-un mod foarte simplu.
Omiteți canonizarea de paginare
Dacă intenționați să canonizați URL-uri paginate, atunci ar trebui să știți că aceasta este o idee foarte proastă. Nu ar trebui să adăugați o etichetă de canonizare pe a doua pagină a unei adrese URL, deoarece acea adresă URL nu va fi indexată deloc de Google.
Etichetele Canonical multiple sunt proaste
Dacă o pagină web are mai multe etichete rel="canonical", atunci poate fi cu adevărat dăunătoare pentru tine. Faceți o etichetă specifică și clarificați pe care o preferați.
Faceți clic pentru a Tweet
Am văzut că mulți oameni aplică eticheta Canonical astfel:
<link rel="canonical” href="index.php”>
Acest stil de canonizare este o invitație la o mulțime de erori. Trebuie să înțelegeți că, cu cât marcajul dvs. canonic este mai complet, cu atât va fi mai bine pentru dvs. și pentru conținutul dvs.
<link rel="canonical” href="http://thewebpage.org/index.php”>
Marcajul de mai sus este o modalitate mai bună de a aplica canonizarea.
Faceți clic pentru a Tweet
Localizarea înseamnă direcționarea și manipularea conținutului site-ului web pentru a-l servi pe baza regiunii în care este vizualizat. Dacă doriți cu adevărat să creați un site web mai bun pentru publicul dvs. global, puteți citi acest ghid pentru a crea site-uri web multilingve de către Google.
Canonizare pe versiunea mobilă a site-urilor web
Nu este suficientă doar o etichetă canonică pentru a diferenția un site web mobil pe subdomeniul site-ului dvs. principal. Google vă sugerează să utilizați atât rel=”alternate”, cât și rel=”canonical” pentru a menționa că adresa URL este pentru afișarea versiunii mobile a site-ului web.
Iată cum îl puteți implementa:
> <html>
> <cap>
> <link rel="canonical” href="http://example.com/” >
> <link rel="alternate” href="http://m.example.com/” media="numai ecran și (lățime maximă: 640 px)”>
>> </cap>
> <corp>
Nu utilizați o etichetă Canonical în afara <head>
Boții motoarelor de căutare vor ignora complet etichetele care sunt setate în afara site-ului <head>, așa că pentru a aplica o etichetă canonică adecvată, trebuie să o adăugați între <head></head>.
Nu utilizați mai multe etichete Canonical pe un site web
Folosirea mai multor etichete Canonical este inutilă. Motoarele de căutare vor ignora ambele etichete și vă veți confrunta cu un comportament și probleme SEO ciudate. Mai multe adrese URL de etichete canonice sunt uneori cauzate de erori ale pluginului, așa că ar putea fi necesar să fii atent la asta.
Nu trimiteți o adresă URL canonică către un site web cu un cod de stare non-200
Un site web cu un cod precum 301 și 302 va forța motoarele de căutare să acceseze cu crawlere o adresă URL suplimentară, ceea ce înseamnă că trebuie să acceseze cu crawlere două adrese URL simultan. Aceasta înseamnă o sumă mare și vă poate epuiza cu ușurință bugetul de accesare cu crawlere.
O adresă URL cu un cod de stare de 404 este o accesare complet irosită, iar motoarele de căutare vă vor ignora eticheta.
Nu utilizați Canonicalizarea pentru Sculptarea PageRank
PageRank nu mai este o entitate publică sau o statistică pentru un site web, dar este încă considerat de motoarele de căutare. Dacă intenționați să utilizați etichete Canonical pentru sculptarea PageRank și pentru a obține o clasare mai bună, permiteți-mi să vă explic că va face mai mult rău site-ului dvs. decât bine.
Cuvântul final
Conceptul de SEO onsite este mult mai mare decât ceea ce vă imaginați că este. Trebuie să ai grijă de multe lucruri deodată și, de asemenea, trebuie să te ții la curent cu schimbările care au loc în timpul de zi cu zi.
Această postare a fost o postare pentru a arăta cum puteți aplica adrese URL canonice pe un site web. Rețineți că canonizarea este un proces delicat și, dacă este făcută într-un mod greșit, vă poate dăuna site-ului. Păstrați-vă site-ul web sub control și asigurați-vă că efectuați corect canonizarea.
