URL正規化とは何ですか?正規タグを適切に使用する方法は?
公開: 2015-12-17
グーグルは間違いなくインターネットを表面化した最初の検索エンジンではなかった。 しかし、グーグルはより良い方法で物事を行い、実際に役立つ結果を提供しました。 グーグルはその日以来、会社としての拡大を止めていません。
SEOは現在存在するすべての検索エンジンに対して実行されますが、インターネット上のほとんどのトラフィックを処理する1つの主要な検索エンジンはGoogleです。 私たちがSEOについて話すときはいつでも、人々は私たちがGoogleのためにウェブサイトを最適化することについて話していると自動的に想定します。
SEOに関しては、オンサイトとオフサイトの両方で多くの要素をチェックする必要があります。 しかし、オンサイトのSEOが目標に達していない場合は、オフサイトのSEOをどれだけ上手く行っても、期待した結果は得られません。
SEOを行っているWebサイトの1つをチェックしていたところ、そのWebサイトに正規化に関連する深刻な問題があることがわかりました。 私はすぐに問題を修正しましたが、正規化の意味とWebサイトの正規化を適切に実行する方法を説明する投稿に取り組むことにしました。
URL正規化とは何ですか?
正規化という用語は理解するのが難しい場合があります。 これを簡単に説明してみましょう。
WebサイトのURLが2つあるとしましょう。
- http://thewebpage.org
- http://www.thewebpage.org
これらのページは両方ともコンテンツを表示し、これらのページはいずれもそれらのいずれにもリダイレクトされません。 これにより、Googleで重複コンテンツの問題が発生する可能性があり、ペナルティに直面する可能性があります。
もう1つの例を見てみましょう。 Webサイトには2つのURLがあり、同じページ解像度になります。
- http://thewebpage.org
- http://thewebpage.org/index.php
これらのWebページの両方で同じ結果が表示される場合は、これも問題を引き起こす可能性があります。
この問題にはあまり注意を払わないかもしれませんが、これにより、深刻な重複コンテンツのペナルティが発生する可能性があります。 検索エンジンボットの問題は、インデックスに追加するURLのバージョンを決定できないことです。 2つのページが同じコンテンツを解決している場合、一方のコピーがもう一方のコピーであると見なされ、Webサイトにペナルティが科せられます。
同じコンテンツを表示する2つのURLでサイトを開いている場合は、修正する必要があります。 ユーザーがwwwを使用して開くかどうかに関係なく、サイトがいずれかのバージョンで開くように、サーバー設定を使用する必要があります。 このようにして、正規化を修正できます。
ただし、2つのURLで同じコンテンツを共有したい場合は、rel =” canonical”タグを使用して、どちらがオリジナルでどちらがコピーであるかを検索エンジンに知らせることができます。 これにより、重複コンテンツのペナルティからあなたを救うことができます。
URL正規化を正しく適用する方法は?
ここで、URL正規化を適用する方法を確認しましょう。 それを行うためにコード行を入力する必要はありません。 Canonicalizationを適用するには、単純なrel =” canonical”タグで十分です。
たとえば、Webサイトには2つのURLがあり、それらが解決されたときに同じコンテンツになります。 これらの2つのURLは次のとおりです。
- http://thewebpage.org
- http://thewebpage.org/index.php
HTMLの正規化
2番目のURLは、最初のURLと同じコンテンツになります。 どちらも同じページを表示しているため、rel =” canonical”タグを適用して、この場合、index.phpのURLが最初のURLの正規URLであることを示すことができます。
これが適用される方法です。
<link rel =” canonical” href =” http://thewebpage.org/index.php”>
HTTPヘッダーの正規化
上記のマークアップはHTMLコンテンツの場合に使用できますが、PDFドキュメントなどの非HTMLコンテンツを処理する場合はどうなりますか? そのような場合、HTTPヘッダーの正規化を使用できます。
> HTTP / 1.1 200 OK
>コンテンツタイプ:application / pdf
>リンク:<http://www.example.com/white-paper.html>; rel =” canonical”
>コンテンツの長さ:785710
HTTPヘッダーベースの正規化の詳細については、Googleの公式ウェブマスターブログをご覧ください。
いつCanonicalizationを使用する必要がありますか?
Canonicalizationの正確な意味がわかったので、トピックを進めて、いつ使用するかを確認できます。 上記の例で述べた2つ以外にも多くのケースがあるためです。
適切なURL正規化で防ぐことができるいくつかの条件を次に示します。
- 1つの同じコンテンツの異なるURL
- 同じコンテンツになるさまざまなカテゴリとタグ
- 同じコンテンツを表示しているが、URL /サブドメインが異なるモバイルウェブサイト
- HTTPURLとHTTPSURLを持ち、どちらも同じコンテンツになるURL
- さまざまなポート
- ウェブサイトにwwwバージョンと非wwwバージョンがある場合
- シンジケートコンテンツを共有する場合
これらは、URL正規化を適用して、サイトが重複コンテンツのペナルティに直面するのを防ぐことができるいくつかの主要な条件です。

これは、URLの正規化を実行するべきではない場合です。
URLの正規化を実行すべきでないシナリオがあります。この投稿のこのセクションは、これらの特定の条件を指定することを目的としています。 URLの正規化に関しては、これらをエラーと見なすこともできます。 これらを1つずつリストします。 私はそれらのほとんどを本当に簡単な方法で説明しようとします。
ページネーションの正規化をスキップする
ページ化されたURLを正規化することを計画している場合は、これは非常に悪い考えであることを知っておく必要があります。 URLの2ページ目に正規化タグを追加しないでください。そのURLはGoogleによってまったくインデックスに登録されません。
複数のCanonicalタグは悪い
Webページに複数のrel =” canonical”タグがある場合、それはあなたにとって本当に有害である可能性があります。 特定のタグを1つ作成し、どちらを使用するかを明確にします。
クリックしてツイート
多くの人が次のようなCanonicalタグを適用しているのを見てきました。
<link rel =” canonical” href =” index.php”>
このスタイルの正規化は、多くのエラーへの誘いです。 正規のマークアップが完全であるほど、それがあなたとあなたのコンテンツにとってより良いものになることを理解する必要があります。
<link rel =” canonical” href =” http://thewebpage.org/index.php”>
上記のマークアップは、正規化を適用するためのより良い方法です。
クリックしてツイート
ローカリゼーションとは、表示されている地域に基づいてWebサイトを提供するために、Webサイトのコンテンツをターゲットにして操作することを意味します。世界中の視聴者にとってより良いWebサイトを本当に作成したい場合は、このガイドを読んで多言語Webサイトを作成できます。 Googleによる。
モバイル版のウェブサイトでの正規化
メインWebサイトのサブドメインでモバイルWebサイトを区別するための正規タグだけでは不十分です。 URLがモバイル版のウェブサイトを表示するためのものであることを示すために、rel =” alternate”とrel =” canonical”の両方を使用することをお勧めします。
実装方法は次のとおりです。
> <html>
> <頭>
> <link rel =” canonical” href =” http://example.com/”>
> <link rel =” alternate” href =” http://m.example.com/” media =” only screen and(max-width:640px)”>
> </ head>
> <ボディ>
<head>の外部でCanonicalタグを使用しないでください
検索エンジンボットは、ウェブサイトの<head>の外側に設定されたタグを完全に無視するため、適切な正規タグを適用するには、<head> </ head>の間にタグを追加する必要があります。
Webサイトで複数のCanonicalタグを使用しないでください
複数のCanonicalタグを使用することは無意味です。 検索エンジンは両方のタグを無視し、奇妙なSEOの動作と問題に直面します。 プラグインの不具合が原因で複数の正規タグURLが発生することがあるため、注意が必要な場合があります。
ステータスコードが200以外のWebサイトに正規URLを指定しないでください
301や302のようなコードを持つWebサイトは、検索エンジンに1つの余分なURLをクロールさせます。これは、2つのURLを一度にクロールする必要があることを意味します。 これは合計でかなりの金額になり、クロール予算を簡単に使い果たす可能性があります。
ステータスコードが404のURLは完全に無駄なクロールであり、検索エンジンはタグをまったく無視します。
PageRankスカルプティングにCanonicalizationを使用しないでください
PageRankは、もはやWebサイトの公開エンティティまたは統計ではありませんが、検索エンジンによって引き続き考慮されます。 PageRankのスカルプティングにCanonicalタグを使用し、ランキングを上げることを計画している場合は、それがWebサイトに良いよりも害を及ぼすことを明確にしておきます。
最後の言葉
オンサイトSEOの概念は、あなたが想像しているものよりもはるかに大きいです。 あなたは一度に多くのことを世話する必要があります、そしてあなたはまたあなた自身が毎日起こる変化であなた自身を最新の状態に保つ必要があります。
この投稿は、Webサイトに正規URLを適用する方法を示すための投稿でした。 Canonicalizationはデリケートなプロセスであり、間違った方法で実行すると、Webサイトに損害を与える可能性があることに注意してください。 Webサイトをチェックし、正規化を適切に実行していることを確認してください。
