Googleの重複コンテンツの問題を回避する方法は？

公開: 2021-11-01

ページ上の重複するコンテンツには、予算超過と多くの共通点があります。この場合のみ、検索ロボットのサイトでの「信頼予算」の減少について話します。この問題は、多くのサイト所有者に関係しています。これは、背後にある場合でも発生する可能性があるためです。重複コンテンツの問題について何かを読んだ後、あなたのサイトは時限爆弾に変わりました。時計にチェックマークを付けると、Googleの制裁があなたを待っています。

悲しいことですが、確かに、Web上には重複コンテンツの約25〜30％があります。元Google社員のMattCuttsがこの見解を持っています。コンテンツが重複していると、検索エンジン最適化で問題が発生する可能性がありますが、それほど劇的なことではありません。解決策があります—この記事を読んで、Googleの重複コンテンツの問題を回避する方法を理解してください。

目次に表示

重複コンテンツとは何ですか？
重複コンテンツに関する事実
どんなコンテンツがありますか？
コードとは何ですか？
- HTTPSページ
- 重複コンテンツを作成するコンテンツ管理システム
- 印刷用のページまたは複数の並べ替えオプション
- ブログやアーカイブシステムのコンテンツが重複している
- ユーザー生成の重複コンテンツ（繰り返し投稿など）
結論

重複コンテンツとは何ですか？

content-marketing-desk-laptop-note-work-writing-article-blog

重複コンテンツには主に3つのタイプがあります。

完全に重複： 2つのURLのコンテンツは完全に同一です。
わずかな違いのあるコンテンツ：文の順序、少し異なる画像など。
ドメイン間の重複：正確なコピーまたはわずかに変更されたコピーが多くのドメインに存在します。

さらに、Googleが重複コンテンツと見なさない2つの関連する概念が存在します。しかし、それほど経験のない出版社やSEOスペシャリストは、重複したコンテンツと簡単に混同する可能性があります。

薄いコンテンツ：これらはコンテンツがほとんどないページです。組織のアドレスのリストに基づいて作成されたページのセット。6000個のアドレスがありますが、各ページには1つのアドレス（数行）しか含まれていません。
スライスコンテンツ：互いにわずかに異なるページ。このサイトでは、38、38.5、39、40、41、42などのサイズのティンバーランドシューズを販売しています。サイトに靴のサイズごとに個別のページがある場合、それらすべてのページにわずかな違いがあります。 Googleがスライスコンテンツとして認識するこのような効果。

Googleは、同様に薄くスライスされたコンテンツを嫌います。これらの効果はすべて、GooglePandaで検出できます。そのため、発行者はこれらのタイプのページの作成を避ける必要があります。

重複するコンテンツは、さまざまな理由で発生する可能性があります。

サイトのコンテンツのライセンス。
検索エンジン向けに最適化されていないコンテンツ管理システムによるサイトアーキテクチャの欠陥。
盗作の存在。

過去5年間で、特別なコンテンツニーズを持つスパマーは、正当なソースからコンテンツを「取り除いて」、さまざまな複雑なプロセスを使用して単語を転置し、結果のテキストをページに配置して「ロングテール」検索操作を引き付け始めました。コンテンツターゲット広告やその他の不正な目的を示します。そのため、今日、人々は「重複コンテンツの問題」と「重複コンテンツのペナルティ」の世界に住んでいます。

あなたにおすすめ：優れたコンテンツがマーケティング活動をスピードアップできる5つの方法。

重複コンテンツに関する事実

重複するコンテンツの場所

特定のコンテンツがすべてサイトにある場合、それは重複コンテンツですか？

はい。同じサイトと異なるサイトの両方で重複コンテンツが発生する可能性があるためです。

重複コンテンツの割合

重複コンテンツフィルターに分類するには、ページの何パーセントを複製する必要がありますか？残念ながら、検索エンジンは、問題自体を防ぐ能力に影響を与えるため、この情報を公開することはありません。このパーセンテージは、すべてのエンジンで常に変化しています。肝心なのは、重複と見なされるためにページが同一である必要はないということです。

コードとテキストの比率

コードが非常に大きいが、ページにいくつかの固有のHTML要素がある場合はどうなりますか？グーグルはすべてのページが互いに重複していると思いませんか？

いいえ。検索エンジンはコードを気にしませんが、ページのコンテンツを気にします。コードサイズが問題になるのは、比率が大きくなったときだけです。

ナビゲーション要素と固有のコンテンツの比率

サイトのすべてのページには、大きなナビゲーションバー、多くのヘッダー、フッターがありますが、コンテンツはほとんどありません。 Googleはこれらすべてのページが重複していると見なしませんか？

いいえ。Googleは、ページの重複を評価する前に、ナビゲーション要素を考慮します。

ライセンスコンテンツ

重複コンテンツの問題を回避したい。しかし、訪問者に表示するためにライセンスを取得した他のWebソースのコンテンツがある場合はどうすればよいでしょうか。

meta name =“ robots” content =” noindex、follow”を使用します。あなたのページのヘッダーにそれを入れてください、そうすれば検索エンジンはこのコンテンツが彼らのためではないことを知るでしょう。もう1つのオプションは、そのコンテンツを所有および公開するための排他的権利を取得することです。

どんなコンテンツがありますか？

コンピューター-ラップトップ-デスク-ワーク-オフィス-コンテンツ-ライティング-ノート-リサーチ

ユニークなコンテンツは人によって書かれています。これは、Web上の他の文字、記号、および単語の組み合わせとは完全に異なり、コンピューターのテキスト処理アルゴリズムの影響を受けません。
フラグメントは、コピーされて何度も使用される小さなコンテンツ（引用符など）です。特に、多くの固有のコンテンツを含む大きなドキュメントに含まれている場合、検索エンジンで問題が発生することはめったにありません。
帯状疱疹。 検索エンジンは、他のWebページでフレーズの比較的小さなセグメント（5〜6語）を検索します。 2つのドキュメントに帯状疱疹が多すぎる場合、検索エンジンはそれらのドキュメントを重複コンテンツとして解釈する可能性があります。

コードとは何ですか？

重複コンテンツを作成する方法はたくさんあります。これは、ウェブ上にそれが十分すぎる理由を説明しています。内部の重複コンテンツには、最適化の観点から最良の結果を得るには、特定の戦術が必要です。率直に言って、重複ページはユーザーと検索エンジンの両方にとって価値のないページです。次に、この問題を完全に回避してください。各ページを参照するURLが1つだけであることを確認してください。さらに、古いURLを残りのURLに301リダイレクトします。これは、検索ロボットが行った変更をできるだけ早く確認し、削除されたページにあった「リンクジュース」を保持するのに役立ちます。

これが不可能な場合は、他にも多くのオプションがあります。さまざまなシナリオで最も簡単なソリューションの概要は次のとおりです。

robots.txtファイルを使用して、検索エンジンスパイダーがサイトページの重複バージョンをクロールするのをブロックできます。
rel =” canonical”要素を使用します。これは重複ページを削除するための2番目に良い解決策です。
CODE <meta name =” robots” content =” noindex”>を使用して、重複するページを表示しないようにSEARCHエンジンに指示します。

ただし、robots.txtを使用してページが表示されないようにする場合は、ページにnoindexまたはnofollowを適用しても意味がありません。スパイダーはページを読み取ることができないため、noindexまたはnofollowメタタグは表示されません。これらのツールを念頭に置いて、重複コンテンツの特定の状況を検討してください。

あなたは好きかもしれません：なぜコンテンツ作成はブランドとビジネスにとって重要なのでしょうか？

HTTPSページ

SSLプロトコル（ブラウザとWebサーバー間の暗号化されたデータ交換。これはeコマースでよく使用されます）を使用している場合、サイトには（HTTP:ではなく）HTTPS:で始まるページがあります。 HTTPSページのリンクが、絶対リンクではなく相対リンクを使用してサイト上の他のページを指している場合、問題が発生します。たとえば、ホームページへのリンクはhttp://www.YourDomain.comではなくhttps://www.YourDomain.comになります。

サイトにこの問題がある場合は、rel =” canonical”または301リダイレクトを使用して修正できます。別の解決策は、リンクを絶対に変更することです：/ contenthtmlではなくhttp://www.YourDomain.com/content.html）。これにより、コンテンツを盗む人の生活が少し難しくなります。

重複コンテンツを作成するコンテンツ管理システム

サイトに同じページのバージョンがたくさんある場合があります。 1つ以上のURLで同じコンテンツを参照する一部のコンテンツ管理システムでは制限が発生します。これは通常、完全に余分な複製であり、ユーザーにとっては価値がありません。最善の決定は、重複するページを削除し、削除されたページを残りのページに301リダイレクトすることです。うまくいかない場合は、他の方法を試してください。

印刷用のページまたは複数の並べ替えオプション

多くのサイトでは、同じコンテンツをプリンターに適合した形式でユーザーに提供する印刷用のページを提供しています。一部のeコマースサイトでは、製品のリストを複数の並べ替え（サイズ、色、ブランド、価格）で提供しています。これらのページはユーザーにとっては価値がありますが、検索エンジンにとっては価値がありません。したがって、彼らはそれが重複コンテンツであると考えています。このような状況では、印刷用のCSSスプレッドシートを作成できます。

ブログやアーカイブシステムのコンテンツが重複している

ブログは、重複コンテンツの問題に関する興味深い変種の形をしています。ブログ投稿は、いくつかの異なるページに表示される可能性があります。

ブログのスタートページ。
その投稿のパーマリンクページ。
アーカイブページ。
カテゴリページ。

各投稿コピーは、他のコピーの複製です。出版社がブログのホームページとパーマリンクページの両方に投稿が存在するという問題に対処しようとすることはめったにありません。そして、検索エンジンはこの問題に非常にうまく対処しているようです。ただし、カテゴリページとアーカイブページに投稿スニペットのみを表示することは理にかなっている場合があります。

ユーザー生成の重複コンテンツ（繰り返し投稿など）

さまざまなサイトが構造を使用して、ブログ、フォーラム、メッセージボードなどのユーザー生成コンテンツを取得します。これらは、非常に低コストで多くのコンテンツを開発するための優れた方法です。問題は、ユーザーが自分のサイトと他の複数のサイトの両方で同時に同じコンテンツを公開できることです。これにより、重複コンテンツの問題が発生します。制御するのは難しいですが、問題を減らすために、次のように進めることができます。

ユーザーがサイトに提供するコンテンツは一意であり、他のサイトに投稿できないことをユーザーに通知する明確なポリシーが必要です。間違いなくこれを取得することは困難ですが、それはあなたの期待を実現するのに役立ちます。
さまざまなコンテンツを必要とする独自の方法でフォーラムをブラッシュアップします。標準のデータ入力フィールドに加えて、サイト訪問者に役立ついくつかの固有のフィールド（他のサイトとは異なる）も追加します。

あなたも好きかもしれません：ビデオコンテンツであなたのSEOを増幅する方法？

結論

重複するコンテンツについてはあまり心配しないでください。通常、それほど大したことではありません。ほとんどの場合、Google自体は、マスターページやコンテンツの引用などの問題に対処する方法を知っています。その上、多くの人々が重複コンテンツの問題に直面しています。重複は、期待する場所に誰にも表示されないことがあるため、常にサイトで重複を確認する必要があります。それらを防ぐには、ページごとに固有のコンテンツを作成する必要があります。





この記事はIsabelleJordanによって書かれました。 Isabelleは、ektatraveling.com保険会社のビジネスおよびマーケティングジャーナリストです。 彼女は、旅行や保険のニュースの中心にとどまるのに役立つさまざまなニュースポータルやテーマ別ブログに書き込みます。 そのような仕事は彼女に今日の最も関連したトピックに関する記事を書く機会を与えます。