URL Canonicalization이란 무엇이며 Canonical 태그를 올바르게 사용하는 방법은 무엇입니까?

게시 됨: 2015-12-17

ptpost banner What is URL Canonicalization  and how to Use Canonical Tag Properly?

Google은 인터넷에 등장한 최초의 검색 엔진이 아니었습니다. 그러나 Google은 더 나은 방식으로 작업을 수행했고 실제로 유용한 결과를 제공했습니다. Google은 그날 이후로 기업 확장을 멈추지 않았습니다.

현재 존재하는 모든 검색 엔진에 대해 SEO가 수행되지만 인터넷 트래픽의 대부분을 처리하는 주요 검색 엔진 중 하나는 Google입니다. SEO에 대해 이야기할 때마다 사람들은 자동으로 우리가 Google에 맞게 웹사이트를 최적화하는 것에 대해 이야기하고 있다고 가정합니다.

SEO와 관련하여 온사이트와 오프사이트 모두에서 많은 요소를 확인해야 합니다. 그러나 온사이트 SEO가 기대에 미치지 못한다면, 오프사이트 SEO를 아무리 잘해도 기대한 결과를 얻지 못할 것입니다.

나는 SEO를 하고 있는 웹사이트 중 하나를 확인하고 있었고 웹사이트에 Canonicalization과 관련된 몇 가지 심각한 문제가 있음을 발견했습니다. 나는 즉시 문제를 해결했지만 Canonicalization의 의미와 웹 사이트의 Canonicalization을 올바르게 수행하는 방법을 설명하는 게시물을 작성하기로 결정했습니다.

URL 정규화란 무엇입니까?

정규화라는 용어는 이해하기 어려울 수 있습니다. 이것을 간단한 용어로 설명하려고 합니다.

웹 사이트의 URL이 두 개 있다고 가정해 보겠습니다.

  • http://thewebpage.org
  • http://www.thewebpage.org

두 페이지 모두 콘텐츠를 표시하며 이러한 페이지 중 어느 페이지로도 리디렉션되지 않습니다. 이로 인해 Google에서 중복 콘텐츠 문제가 발생할 수 있으며 처벌을 받을 수 있습니다.

예를 하나 더 보자. 웹 사이트에는 동일한 페이지 해상도를 제공하는 두 개의 URL이 있습니다.

  • http://thewebpage.org
  • http://thewebpage.org/index.php

이 두 웹 페이지에 동일한 결과가 표시되면 문제가 발생할 수도 있습니다!

이 문제에 그다지 주의를 기울이지 않을 수 있지만, 이로 인해 심각한 중복 콘텐츠 불이익이 발생할 수 있습니다. 검색 엔진 봇의 문제는 색인에 추가해야 하는 URL 버전을 결정할 수 없다는 것입니다. 두 페이지가 동일한 내용을 해결하는 경우 한 사본이 다른 사본의 사본이라고 가정하고 귀하의 웹사이트는 불이익을 받게 됩니다.

사이트가 동일한 콘텐츠를 표시하는 2개의 URL에서 열리는 경우 수정해야 합니다. 사용자가 www를 사용하여 열든 www 없이 열든 관계없이 사이트가 한 버전에서 열리도록 서버 설정을 사용해야 합니다. 이런 식으로 정규화를 수정할 수 있습니다.

그러나 때때로 두 개의 URL에서 동일한 콘텐츠를 공유하고 싶은 경우 rel=”canonical” 태그를 사용하여 검색 엔진에 어느 것이 원본이고 어느 것이 사본인지 알릴 수 있습니다. 이렇게 하면 중복 콘텐츠 처벌을 피할 수 있습니다.

URL 정규화를 올바르게 적용하는 방법은 무엇입니까?

이제 URL Canonicalization을 적용하는 방법을 확인해 보겠습니다. 이를 수행하기 위해 코드 줄을 입력할 필요가 없습니다. 간단한 rel=”canonical” 태그는 Canonicalization을 적용하기에 충분합니다.

예를 들어, 웹사이트에 두 개의 URL이 있으며, 두 URL이 확인되면 동일한 콘텐츠가 생성됩니다. 이 두 URL은 다음과 같습니다.

  • http://thewebpage.org
  • http://thewebpage.org/index.php

HTML 정규화

두 번째 URL은 첫 번째 URL과 동일한 콘텐츠를 생성합니다. 둘 다 같은 페이지를 표시하므로 rel=”canonical” 태그를 적용하여 index.php가 있는 URL이 첫 번째 URL의 Canonical URL임을 나타낼 수 있습니다.

이것이 적용되는 방식입니다.

<link rel="canonical" href="http://thewebpage.org/index.php">

HTTP 헤더 정규화

위의 마크업은 HTML 콘텐츠의 경우 사용할 수 있지만 PDF 문서와 같은 HTML이 아닌 콘텐츠를 처리하는 경우에는 어떻게 될까요? 이러한 경우 HTTP 헤더 정규화를 사용할 수 있습니다.

> HTTP/1.1 200 OK

> 내용 유형: application/pdf

> 링크: <http://www.example.com/white-paper.html>; rel="표준"

> 콘텐츠 길이: 785710

Google의 공식 웹마스터 블로그에서 HTTP 헤더 기반 정규화에 대한 자세한 정보를 얻을 수 있습니다.

정규화는 언제 사용해야 합니까?

이제 정식화가 정확히 무엇을 의미하는지 알았으므로 주제로 이동하여 언제 사용해야 하는지 알 수 있습니다. 위의 예에서 언급한 두 가지 외에도 더 많은 경우가 있기 때문입니다.

다음은 적절한 URL 정규화로 방지할 수 있는 몇 가지 조건입니다.

  • 동일한 콘텐츠에 대한 다른 URL
  • 동일한 콘텐츠를 생성하는 다양한 카테고리 및 태그
  • 동일한 콘텐츠를 표시하지만 다른 URL/하위 도메인에 있는 모바일 웹사이트
  • HTTP 및 HTTPS URL이 있고 둘 다 동일한 콘텐츠를 생성하는 URL
  • 다양한 포트
  • 웹 사이트에 www 및 www가 없는 버전이 있는 경우
  • 신디케이트된 콘텐츠를 공유하는 경우

다음은 URL 정규화를 적용하여 사이트가 모든 종류의 중복 콘텐츠 패널티에 직면하지 않도록 할 수 있는 몇 가지 주요 조건입니다.

이것은 URL 정규화를 수행하지 말아야 할 때입니다!

URL 정규화를 수행하지 않아야 하는 시나리오가 있으며 이 게시물의 이 섹션은 이러한 특정 조건을 지정하는 것을 목표로 합니다. URL Canonicalization 과 관련하여 오류 로 간주할 수도 있습니다. 이것들을 하나씩 나열하겠습니다. 나는 그들 중 대부분을 정말 간단한 방식으로 설명하려고 노력할 것입니다.

페이지 매김 정규화 건너뛰기

페이지가 매겨진 URL을 정규화하려는 경우 이것이 매우 나쁜 생각이라는 것을 알아야 합니다. URL은 Google에서 전혀 색인을 생성하지 않으므로 URL의 두 번째 페이지에 정규화 태그를 추가하면 안 됩니다.

여러 Canonical 태그는 좋지 않습니다.

웹 페이지에 rel="canonical" 태그가 여러 개 있으면 실제로 해로울 수 있습니다. 하나의 특정 태그를 만들고 선호하는 태그를 명확히 하세요.

단축 URL에 Canonical 태그를 추가하지 마세요.

트윗하려면 클릭

많은 사람들이 다음과 같이 Canonical 태그를 적용하는 것을 보았습니다.

<link rel="canonical" href="index.php">

이러한 형식의 정규화는 많은 오류를 유발합니다. 표준 마크업이 더 완전할수록 귀하와 귀하의 콘텐츠에 더 좋다는 것을 이해해야 합니다.

<link rel="canonical" href="http://thewebpage.org/index.php">

위의 마크업은 정규화를 적용하는 더 좋은 방법입니다.

현지화에 정규화를 적용하지 않음 #SEO #Google

트윗하려면 클릭

현지화는 웹사이트가 표시되는 지역을 기반으로 서비스를 제공하기 위해 웹사이트의 콘텐츠를 타겟팅하고 조작하는 것을 의미합니다. 전 세계 사용자를 위해 더 나은 웹사이트를 만들고 싶다면 이 가이드를 읽고 다국어 웹사이트를 만들 수 있습니다. 구글에 의해.

웹사이트의 모바일 버전에서 정규화

기본 웹사이트의 하위 도메인에서 모바일 웹사이트를 구별하기 위한 표준 태그만으로는 충분하지 않습니다. Google은 URL이 웹사이트의 모바일 버전을 표시하기 위한 것임을 언급하기 위해 rel=”alternate”와 rel=”canonical”을 모두 사용할 것을 제안합니다.

구현 방법은 다음과 같습니다.

> <html>

> <머리>

> <link rel=”canonical” href=”http://example.com/” >

> <link rel=”alternate” href=”http://m.example.com/” media=”only 화면 및 (최대 너비: 640px)”>

> </head>

> <본체>

<head> 외부에서 Canonical 태그를 사용하지 마십시오.

검색 엔진 봇은 웹사이트의 <head> 외부에 설정된 태그를 완전히 무시하므로 적절한 표준 태그를 적용하려면 <head></head> 사이에 태그를 추가해야 합니다.

웹사이트에서 여러 개의 Canonical 태그를 사용하지 마세요.

여러 Canonical 태그를 사용하는 것은 무의미합니다. 검색 엔진은 두 태그를 모두 무시하며 이상한 SEO 동작과 문제에 직면하게 됩니다. 플러그인 결함으로 인해 여러 표준 태그 URL이 발생하는 경우가 있으므로 이를 주시해야 할 수 있습니다.

상태 코드가 200이 아닌 웹사이트에 대한 표준 URL을 지정하지 마세요.

301 및 302와 같은 코드가 있는 웹사이트는 검색 엔진이 하나의 추가 URL을 크롤링하도록 강제하므로 한 번에 두 개의 URL을 크롤링해야 합니다. 이것은 많은 양을 추가하고 크롤링 예산을 쉽게 고갈시킬 수 있습니다.

상태 코드가 404인 URL은 완전히 낭비된 크롤링이며 검색 엔진은 태그를 전혀 무시합니다.

PageRank 조각에 정규화를 사용하지 마십시오.

PageRank는 더 이상 웹사이트에 대한 공공 기관이나 통계가 아니지만 여전히 검색 엔진에서 고려됩니다. PageRank 조각에 Canonical 태그를 사용하고 더 나은 순위를 얻으려는 경우 웹사이트에 득보다 실이 더 많을 것임을 분명히 밝힙니다.

마지막 단어

현장 SEO의 개념은 상상하는 것보다 훨씬 큽니다. 한 번에 많은 일을 처리해야 하고, 일상에서 일어나는 변화에 대해서도 최신 정보를 유지해야 합니다.

이 게시물은 웹사이트에서 Canonical URL을 적용하는 방법을 보여주기 위한 게시물이었습니다. 정규화는 섬세한 과정이며 잘못된 방식으로 수행될 경우 웹사이트에 해를 끼칠 수 있습니다. 웹사이트를 점검하고 정규화를 올바르게 수행했는지 확인하십시오.