Googleのトラストメトリック
公開: 2019-05-02Googleでトラストメトリックを見る
信頼! Googleでページをランク付けする際にどのような役割を果たしますか? これは、検索エンジン、特にGoogleによっていくつかの異なる方法で使用されます。 信頼とランキングに関する特許がGoogleで更新されたばかりなので、Googleで開発されたトラストメトリックを確認する良い機会になります。
私が言及した特許の変更について議論する前に、Googleが使用している可能性がある、または過去に使用したことのあるいくつかの信頼指標を共有することを考えました。
すぐに頭に浮かぶ信頼の言及の1つは、Google Quality Rater'sGuidelinesにあるものです。これは専門知識-信頼性と権限を評価者がサイトをレビューするときに探してほしい3つのこととして指摘しています。 私たちはそこで言われています:
7.2.1最低のEAT
PQ評価の最も重要な基準の1つはEATです。 MCの作成者の専門知識、および信頼性または
ページまたはウェブサイトの信頼性は、ページがその目的をうまく達成するために非常に重要です。
ページのEATが十分に低い場合、ユーザーはページのMCを使用できないか使用しないでください。 これは特にYMYLに当てはまります
トピック。 ページが非常に専門的でない、信頼できない、または信頼できない場合、その目的を達成できません。
重要:ページの専門性が非常に低い、信頼できない、または信頼できない場合は、最低の評価を使用する必要があります。
信頼に基づいていることに気付かない可能性のあるもう1つの信頼指標は、Googleが出願した特許に記載されている、信頼できるシードサイトのセットにどれだけ近いか離れているかに基づいてページをランク付けするバージョンのPageRankです。 。 この特許の要約は、このアプローチの下でランキングがどのように計算されるかを示しています。
動作中、システムはランク付けされるページのセットを受け取り、ページのセットはリンクと相互接続されます。 システムは、一連のページへの送信リンクを含む一連のシードページも受信します。 次に、システムは、リンクのプロパティとリンクに接続されているページのプロパティに基づいて、リンクに長さを割り当てます。 次に、システムは、ページ間のリンクの長さに基づいて、シードページのセットからページのセット内の各ページまでの最短距離を計算します。 次に、システムは、計算された最短距離に基づいて、ページのセット内の各ページのランキングスコアを決定します。 次に、システムは、ページのセットのランキングスコアに基づいて、ページのセットのランキングを生成します。

おそらく最も有名なトラストメトリックであり、誤ってGoogleに起因するもの、またはGoogleが使用しているものと類似していると誤って引用されているものは、スタンフォード大学とトラストランクと呼ばれるものについての論文を発表したGoogleの競合企業Yahooからのものです。 Yahooが開発したTrustRankは、Googleが開発したTrustベースのアプローチとはまったく異なります。 TrustRankに関する論文を書くことに加えて、彼らは特許(リンクベースのスパム検出)も提出しました。これにより、Googleが同じアプローチを合法的に使用することができなくなります。 その特許からの要約:
検索結果セット内の検索ヒットをランク付けするコンピューター実装の方法。 コンピュータで実装された方法は、ユーザからクエリを受け取り、クエリに関連するヒットのリストを生成することを含み、各ヒットはクエリに関連性があり、ヒットはヒットを指す1つまたは複数のブーストリンクされたドキュメントを有する。リンクされたドキュメントのブーストがクエリへのヒットの関連性に影響を与える場合。 この方法は、メトリックを少なくともヒットのサブセットのそれぞれに関連付け、メトリックは、ヒットの少なくともサブセットのそれぞれを指し、ヒットの関連性を人為的に膨らませるブーストリンクされたドキュメントの数を表す。 次に、このメソッドは、ヒットを指すスパムファームのサイズを表すメトリックをしきい値と比較し、ヒットのリストを処理して、比較に一部基づいて変更されたリストを形成し、変更されたリストをに送信します。ユーザー。
YahooのTrustRankはスパムを識別する方法であり、必ずしも上記の新しいPageRankアプローチのようにページをランク付けする必要はありません。 Yahoo特許はより詳細を提供します:
TrustRankは、PageRankに関連するリンク分析手法です。 TrustRankは、Web上の信頼できる優れたページをWebスパムから分離するための方法です。 TrustRankは、Web上の優れたドキュメントがスパムにリンクすることはめったにないという推定に基づいています。 TrustRankには、シードの選択とスコアの伝播の2つのステップが含まれます。 ドキュメントのTrustRankは、ドキュメントが信頼できる(つまり、スパムではない)ドキュメントである可能性の尺度です。

GoogleがWebページに関して専門家として行動することを信頼している人々を使用しようとした他の方法があります。たとえば、GoogleのSidewikiプロジェクトです。 これは信頼性の指標ではありませんが、人々がページに注釈を付け、ページに追加したり、同意したり、批評したりできるようにすることを目的としています。
SidewikiプロジェクトはGoogleによってシャットダウンされました。 もはや使用されていませんが、信頼と専門知識をどのように扱うかという点で興味深いものです。 このGoogleブログの投稿で説明されているように:ウェブを閲覧するときに他の人から助けて学びましょう:Google Sidewiki:
地元の専門家から有名な医師まで、誰もがWeb上の任意のページについての洞察をあなたと共有する簡単な方法を持っていたらどうでしょうか。 通過している他の人のためにあなたの洞察を追加できたらどうでしょうか?
また、Googleはリンクに基づかない信頼性指標も開発しましたが、事実の正確性と正確性は驚くべきことではありません。
Googleのホワイトペーパーが2015年に発表され、知識ベースの信頼と呼ばれるものについて説明されています。これは、1,000のファクトのセットを使用し、サイトを比較して、サイトで正解したファクトの数を確認します。 論文は知識ベースの信頼:Webソースの信頼性の推定でした。 知識ベースの信頼アプローチの発明者と見なされているXinLuna Dongは、「貴重なデータを残さない:クレイジーなアイデアとビジネス」というプレゼンテーションを発表しました。 知識ベースの信頼を調査し、それをPageRankと比較します。PageRankは、プレゼンテーションのこのスライドによく示されています。

GoogleのTrustRank特許の以前のバージョンが存在します。これについては、2009年にGoogle Trust Rank PatentGrantedの投稿で説明しました。 これについては、この投稿のさらに下にあります。
GoogleCSEを使用したGoogleTrustrank
信頼ベースのCSE(カスタム検索エンジン)特許の下で、私たちはそれらが解決しようとしている問題について言われています:
検索エンジンの設計に固有の問題は、特定のユーザーに対する検索結果の関連性が、ユーザーの検索の意図、つまりユーザーが検索している理由、およびユーザーの状況、事実に大きく依存する要因に依存することです。ユーザーの情報ニーズについて。 したがって、2人の異なるユーザーによる同じクエリが与えられた場合、意図と情報のニーズが異なるために、特定の検索結果のセットは1人のユーザーに関連し、別のユーザーには関連しない可能性があります。 ユーザーの意図を推測する問題を解決するためのほとんどの試みは、通常、静的なユーザー設定などの比較的弱い指標、またはクエリ用語に基づいてユーザーが何に興味を持っているかについての知識に基づいた推測にすぎないクエリ再定式化の事前定義された方法に依存します。 このようなアプローチは、ユーザーの意図を完全に捉えることはできません。これは、そのような意図自体が非常に可変であり、一般的なクエリ用語から推定できない多数の状況事実に依存しているためです。
したがって、一連の検索結果の値は、その検索を実行する検索者の意図に依存します。 これらの特許はどのようにしてその問題を解決しようとするのでしょうか? 解決策は、何かがリンクされている理由についての注釈を含むトピックで専門家によって設定されたサイトを調べることである可能性があります。これは、ここの特許に記載されています。
現代の検索エンジンでは、ユーザーのクエリ用語だけでなく、ユーザーの情報ニーズを満たす情報を一貫して見つけることができないこともあり、ユーザーはインターネット上で利用可能なコンテンツの追加分析または理解を提供するWebサイトに頻繁にアクセスします。 議論のために、これらのサイトは垂直知識サイトと呼ばれます。 一部の垂直知識Webサイト、通常は共通の関心を持つユーザー向けのコミュニティサイトでは、ユーザーがインターネット上のコンテンツにリンクし、コンテンツを説明するラベルまたはタグを提供できます。 たとえば、サイトを使用すると、ユーザーは自動車メーカーのWebサイトにリンクして、メーカーが提供している特定の自動車に関するコメントや説明を投稿できます。 同様に、そのようなサイトは、ユーザーが通信社のウェブサイト上のニュースレポートにリンクし、レポートについてのコメントを投稿することを可能にする可能性があります。 これらおよびその他の垂直知識サイトは、専門家または特定の分野の知識、専門知識、または視点を持つ他の人の分析およびコメントをホストする場合があり、インターネットで見つかったコンテンツに再びコメントすることができます。 たとえば、デジタルカメラの専門家が運営し、デジタルカメラを専門とするウェブサイトには、通常、製品レビュー、デジタルカメラの購入方法に関するガイダンス、カメラメーカーのサイトへのリンク、新製品の発表、技術記事、追加のレビュー、またはその他のコンテンツソース。 ユーザーを支援するために、専門家は、特定の技術記事を「専門家レベル」、特定のレビューを「否定的な専門家のレビュー」、または新製品の発表を「新しい10 MPデジタル」としてラベル付けするなど、リンクされたコンテンツに関するコメントを含めることができます。 SLR」。 次に、特定の視点、情報の種類などに関心のあるユーザーは、そのようなサイトのドメイン内で、特定のラベルまたはコメントが関連付けられている記事またはリンクを検索します。 たとえば、ユーザーは前述のデジタルカメラサイトで「デジタル一眼レフ」というラベルの付いたすべてのカメラレビューを検索できます。
したがって、この特許は、カスタム検索エンジンからの注釈を、それらの検索エンジンが注釈を付けられる可能性のあるトピックについての信頼感(信頼メトリックまたはスコア)を取得しようとしているトピックの専門家からのものであるかのように使用できることを示しています。 。
この特許を読み始めたとき、カスタム検索エンジンでラベルを作成する人々への信頼は、カスタム検索エンジンの結果にのみ適用されるのか、それとも一般的な検索エンジンの結果にも何らかの形で適用されるのか疑問に思いました。 特許は私たちに次のように言ってその問題を指摘しています:
問題は、ユーザーが垂直知識サイトの外で一般的な検索エンジンに戻ったときに、ドキュメント自体の信頼性、または関連する可能性のあるコメントや意見の信頼性を反映する検索結果を取得できないことです。検索結果のドキュメント。 したがって、垂直知識サイトのユーザーに関連付けられている追加のレピュテーションベースの情報は、他のユーザーにより意味のある検索結果を提供するために一般的な検索エンジンで利用できません。
この特許は、他のページに注釈を付けるラベルを適用したエンティティをユーザー(または検索者)がどれだけ信頼しているかを理解し、一般的な検索エンジンの結果に適用する信頼ランクを決定しようとする可能性があることを示しています。 この特許は、検索結果にラベルを付ける可能性のあるエンティティをユーザーがどれだけ信頼できるかを特定するいくつかの方法を説明しています。 これが1つの例です:
上記のように、システムはWebクローラーを使用してWebページを調べ、特定のエンティティを信頼しているユーザーを示す情報を見つけることもできます。 Webクローラーは、Webページを調べているときに、次のようないくつかの関係を探すことができます。(1)ユーザーのWebページから信頼できるエンティティに属するWebページへのリンク。 (2)ユーザーが信頼するエンティティを識別する信頼リスト。 または(3)バニティページの所有者を信頼するユーザーを識別するバニティリスト。
特定のクエリ(およびラベル)のTrustRankは、複数のカスタム検索エンジンに集約される場合があります。 特許はまた私達に告げます:
一致するラベルに関連付けられているエンティティの信頼ランクが集約されて、集約された信頼ランクが作成されます。 したがって、この例では、3人の異なる専門家の信頼ランクが、レビュードキュメントの特定のラベル「professionalreview」に関連付けられた単一の信頼ランクに集約されます。 この集計は、ドキュメントに関連付けられているラベルごとに実行されます。
つまり、トピックの専門家であれば、Googleのカスタム検索エンジン機能を使用してサイトにカスタム検索エンジンを設定し、自分以外のサイトを含めることができ、検索結果に絞り込みのラベルを付けることができます。ラベル。
特定のサイトのページにラベルを付けると、そのサイトを信頼していることをGoogleに示し、Google TrustRankの特許に基づいて検索結果に表示される場合があります(Googleは、信頼度に基づいてこれを行うかどうかを判断する場合があります) CSEのページにラベルを付けるエンティティとして持っている可能性があり、複数のエンティティからの集約された注釈があるかどうか。
今週付与されたばかりのCSEトラスト特許のこの新しいバージョンは継続特許です。つまり、両方の特許のタイトルと説明は同じですが、それぞれのクレームは書き直されています。 それはで見つけることができます:
信頼に基づく検索結果のランキング
発明者:Ramanathan V. Guha
譲受人:Google LLC
米国特許:10,268,641
付与:2019年4月23日
提出日:2014年7月29日
概要
検索エンジンシステムは、検索結果のドキュメントにラベルを提供したエンティティに関連付けられた信頼の尺度に従ってランク付けされた検索結果を提供します。 検索エンジンはクエリを受信し、クエリに関連するドキュメントを選択します。 検索エンジンは、選択したドキュメントに関連付けられているラベルと、ラベルを提供したエンティティの信頼ランクも決定します。 信頼ランクは、それぞれのドキュメントの信頼係数を決定するために使用されます。 信頼係数は、ドキュメントの情報検索スコアを調整するために使用されます。 次に、調整された情報検索スコアに基づいて検索結果がランク付けされます。
TrustRank特許からのクレーム
この特許の2006年5月に提出されたバージョンは、信頼に基づく検索結果ランキングとも呼ばれました。
2006年に提出された特許からの最初のクレームのバージョン:
データ処理装置によって実行される方法であって、以下を含む方法。検索クエリを受信する。検索クエリは、クエリ用語およびクエリラベル用語を含み、クエリラベル用語は、カテゴリ識別子である。 検索クエリに応答する検索結果セット内の1つまたは複数のリソースを識別する。1つまたは複数のリソースのそれぞれには、クエリラベル用語と一致する関連する一致ラベル用語と、クエリと一致しない関連する不一致ラベル用語があります。ラベル用語。関連付けられた各ラベル用語は、各リソースを説明し、それぞれのエンティティによってリソースに関連付けられたカテゴリ識別子です。 1つまたは複数のリソースのそれぞれについて、関連する一致するラベル用語をリソースに関連付けたエンティティの信頼ランクを決定します。信頼ランクは、ユーザーがリソースの関連する一致するラベル用語を信頼するかどうかを示し、関連性を高めます。それぞれの信頼ランクに基づく関連する一致するラベル用語を有する各リソースのスコア。関連性スコアは、それぞれのリソースとクエリ用語との間の関連性の程度を示す。 それぞれの関連性スコアに基づいて、検索結果セット内の1つ以上のリソースのそれぞれをランク付けします。 一致するラベル用語を各リソースに関連付けたそれぞれのエンティティの名前で、ランク付けされた検索結果セットの各リソースを識別するマークに注釈を付けます。 検索クエリへの応答で指標を提供します。
これは、新しいバージョンの特許からの最初のクレームです。
私は主張します:
第1のコンピューティングデバイスでの表示のために、特定のエンティティに関連付けられたユーザインターフェースを提供することを含むコンピュータ実装方法。(i)第2のコンピューティングデバイスにスコアを割り当てるように指示するように構成された対話型制御を含むユーザインターフェース。インタラクティブコントロールとのユーザーインタラクションへの応答、および(ii)ユーザーが特定のエンティティのトピックを示すためのインターフェース。インターフェースは、インタラクティブコントロールに対応する複数のトピックを示す。 (i)ユーザによる対話型制御とのユーザの相互作用、および(ii)対話型制御に対応する複数のトピックの中からユーザによって選択された1つまたは複数のトピックを示すデータを受信する。 (i)ユーザによる対話型制御とのユーザ相互作用、および(ii)対話型制御に対応する複数のトピックの中からユーザによって選択された1つまたは複数のトピックを示すデータの受信に応答して、ネットワークを介して送信する。対話型制御に対応する複数のトピックの中からユーザによって選択された1つまたは複数のトピックを示すデータ。このデータにより、第2のコンピューティングデバイスは、一方の特定のエンティティに関してユーザにスコアを割り当てる。以上のトピック、検索エンジンに対して、(i)特定のエンティティに関連付けられ、(ii)1つ以上のトピックに関連するコンテンツが検索エンジンによって信頼されて検索結果を生成する程度を示すスコアユーザーからのクエリへの応答。 ユーザーからのクエリに応答して、クエリの検索結果のセットを取得します。検索結果のセットは、特定のエンティティに関するユーザーのスコアに少なくとも部分的に基づいて、検索エンジンによってランク付けされます。インタラクティブコントロールに対応する複数のトピックの中からユーザによって選択された複数のトピック。ここで、検索結果のセットは、それぞれが1つまたは複数のエンティティによって注釈テキストが提出されたドキュメントを参照する検索結果を含み、検索結果は、1つ以上のエンティティに関するユーザーの注釈テキストとスコアに基づいてランク付けされます。 そして、検索エンジンによってランク付けされた検索結果のセットを、少なくとも部分的に、に対応する複数のトピックの中からユーザによって選択された1つまたは複数のトピックの特定のエンティティに関するユーザのスコアに基づいて提供する。インタラクティブコントロール。
この新しい主張によれば、注釈テキストと1つ以上のエンティティ(それらの結果に注釈を付けた可能性がある)に関するユーザーのスコアに基づいてランク付けされている検索結果を指摘しています。
カスタム検索エンジンのサイトに注釈を付ける動作を説明するGoogleサポートページがあるかどうかを確認したかったので、次のページを見つけました:注釈:検索するサイトの定義
GoogleCSEトラストランク特許からの持ち帰り
これは、サイトにカスタム検索エンジンを設定し、そのサイト内の結果に注釈ラベルを作成する良い理由かもしれません。 それを行うことに加えて、人々があなたへのリンクのようなことをするのに十分なCSEであなたのサイトを信頼したり、あなたのサイトを信頼できるものとしてリストしたりする可能性を高めることには価値があります。
トラストメトリックと検索
グーグルが信頼性、および検索者とサイト所有者の間の信頼できる関係を見つけようとするかもしれないいくつかの方法があります。 品質評価者ガイドラインのEATの説明に例があります。 PageRankの新しいバージョンでは、信頼できるサイトのシードセットからの距離に基づいてページをランク付けしている可能性があります。 知識ベースの信頼スコア。これは、正確さが人気よりも価値がある場合に役立つ可能性があります。 または、検索者がある程度の信頼を示した可能性のある人々からGoogleのカスタム検索エンジンで作成された注釈に基づいています。
あなたのウェブサイトへの信頼を築くことは、あなたのサイトが検索結果でどのようにランク付けされるかよりも価値があります。 あなたのサイトが人々に信頼されているものである場合、彼らは人々にあなたのページを紹介し、あなたのページにリンクし、あなたを信頼できる専門家として引用するかもしれません。
信頼を築くための1つのステップは、人々があなたにどれだけの信頼を置くかを決定できる基盤を構築し、合理的で知識豊富なコンテンツでその基盤をサポートすることです。 信頼を築くには多大な労力が必要であり、信頼はすぐに消えてしまう可能性がありますが、検索エンジンやWebページへの訪問者が価値を認めていることは確かです。

