Googleのフレーズベースのインデックスが更新されました
公開: 2018-06-06Googleは本日最も重要な特許の1つを更新しました

フレーズベースのインデックス作成がカバーするもの
ページが「米国大統領」などのトピックをカバーしている場合、「ホワイトハウス」や「ローズガーデン」など、ページの内容を予測すると言える意味のあるフレーズがそのページに含まれている可能性があります。 」または「記者会見」または「国務長官」。 そのようなフレーズがページに表示されている場合、それらはそのページのトピックに関するヒントである可能性があります。これは、Googleのフレーズベースのインデックス作成がどのように機能するかを説明しています。 これは、ページの意味を示すためにセマンティックテーマを使用していると言えるアプローチです。 それは、ある用語で上位にランク付けされたページで同時に発生する意味のあるフレーズを理解し、索引付けすることによってそれを行います。
Googleが特許を取得しているという理由だけで…フレーズベースのインデックスが更新されました
Matt Cuttsは約5年前にこのビデオを公開しましたが、Googleが何かについて特許を取得しているという理由だけで、彼はその中で私たちに語っています。 それは彼らがそれを使うという意味ではありません
しかし、グーグルが特許の更新に進むとき、彼らはそれを使うかもしれません
私はグーグルからの多くの特許を見ています、そしてそれらが今日与えられたフレーズベースの索引付け更新された特許を使用しているかもしれないことを私たちに告げるいくつかの議論をすることができます。
1.アンナパターソンに付与され、フレーズベースのインデックス作成を含むプロセスについてGoogleに割り当てられた20を超える関連特許があります。
2.この特許は重要なもののようであり、私がかつてこれまでで最も重要な10のSEO特許の1つと呼んだものです。
10の最も重要なSEO特許、パート5 –フレーズベースのインデックス作成
3.特許の背後にあるプロセスは、2004年に特許庁に提出されたときに最初に明らかになり、スパム対策やスニペット生成などの機能を追加する少なくとも20の特許をプロセスに追加してきました。 Googleのインデックスにどのように実装される可能性があるかについての詳細を教えてください。 私が最初にその特許について書いたのは2006年の投稿で、Move over PageRank:Googleはフレーズを見ていますか?
4.継続特許とは、特許の説明が変更されていないが、特許の保護を目的としたプロセスの変更を反映するために、特許のクレームが更新されたバージョンの特許です。 特許の出願日は元の出願日のままですが、特許の背後にあるプロセスを使用することから他の人を除外する機能は、新しいクレームに基づいています。 特許のクレームは2004年から2018年に大幅に変更されました。これらのクレームを変更する重要な理由の1つは、特許の背後にある実際のプロセス(特許が使用されている場合)を反映することです。
元のクレームと今日付与されたバージョンの特許の最初の3つのクレームを比較する価値があります。 オリジナルの最初の3つのクレームは次のとおりです。
クエリに応答してドキュメントコレクション内のドキュメントを選択する方法。この方法は、以下を含む。 クエリ内の複数のフレーズを識別する。少なくとも1つのフレーズは複数の単語のフレーズである。 識別されたフレーズの少なくとも1つのフレーズ拡張子を識別し、クエリ内のフレーズとフレーズ拡張子を含むセットから1つのフレーズを含むドキュメントコレクションからドキュメントを選択します。
文書を選択することは、識別された句の投稿リストと識別された句の句拡張の投稿リストを組み合わせて結合された投稿リストを形成すること、および結合された投稿リストに現れる文書を選択することとを含む、請求項1に記載の方法。他の識別されたフレーズの投稿リスト。
クエリに応答してドキュメントコレクション内のドキュメントを選択する方法。この方法は、以下を含む。 クエリ内の不完全なフレーズを特定する。 不完全なフレーズをフレーズ拡張子に置き換え、フレーズ拡張子を含むドキュメントコレクションからドキュメントを選択します。
以前の主張とそれに続く新しい主張とは異なるように見えるのは、フレーズベースのインデックス作成が現在どのようにページをランク付けするかについてのより多くの情報を提供することです。
主張されているのは:
1.インターネット検索エンジンのフレーズベースのインデックスから、最初のフレーズを含むインターネット経由で利用可能なドキュメントのコレクションからドキュメントのリストを取得することを含む、コンピュータで実装された方法。最初のフレーズはクエリに関連している。 ; リスト内の各ドキュメントについて:ドキュメントのリスト内の各ドキュメントのインデックスに格納されている関連フレーズ情報を使用して、ドキュメントに最初のフレーズの1つ以上の関連フレーズが含まれているかどうかを判断します。ここで、各関連フレーズには実際の同時発生があります。関連するフレーズとドキュメントコレクション内の最初のフレーズの予想される同時発生率を超える、関連するフレーズとドキュメントコレクション内の最初のフレーズの割合。 各ドキュメントに対して決定された関連フレーズの数に基づいてリスト内のドキュメントをランク付けします。これにより、関連フレーズが多いドキュメントは、関連フレーズが少ないドキュメントよりも上位にランク付けされます。 クエリの結果に含める最高ランクのドキュメントの少なくとも一部を選択します。
文書が第1の句の1つまたは複数の関連する句を含むかどうかを決定することは、第1の句の投稿リストへのアクセス、投稿リストで識別される各文書についての表示を含む投稿リストを含む、請求項1に記載の方法。ドキュメントに存在する関連フレーズの数の。
【請求項3】クエリ用語の頻度が低いが第1の句に関連する複数の句を有する文書は、クエリ用語の頻度が高いが関連する句がない文書よりも上位にランク付けされる、請求項1に記載の方法。
フレーズベースのインデックス更新された特許は、次の場所にあります。
情報検索システムにおけるフレーズベースの検索
発明者:アンナL.パターソン
譲受人:Google LLC
米国特許:9,990,421
付与:2018年6月5日
提出日:2017年2月2日
概要
情報検索システムは、フレーズを使用して、ドキュメントのインデックス作成、取得、整理、および説明を行います。 ドキュメント内の他のフレーズの存在を予測するフレーズが識別されます。 次に、含まれているフレーズに従ってドキュメントにインデックスが付けられます。 関連するフレーズとフレーズ拡張子も識別されます。 クエリ内のフレーズが識別され、ドキュメントの取得とランク付けに使用されます。 フレーズは、検索結果内のドキュメントをクラスター化し、ドキュメントの説明を作成し、検索結果とインデックスから重複するドキュメントを削除するためにも使用されます。
私は約1年前に、フレーズベースのインデックス作成に焦点を当てた投稿を書きました。これは、Googleの転置インデックスがフレーズを含むように更新された方法を示す特許をカバーしています。これは非常に高額になります。着手しますが、フレーズベースのインデックス作成に関するこの更新された最初の特許の方法は、はるかに効果的に機能します。
また、2016年に、ドキュメントとアンカーテキストで関連する単語を使用したテーマ別モデリングと呼ばれるものを作成しました。 ボディヒット(ページのテキスト内の関連フレーズ)とアンカーヒット(関連フレーズが生成されたページからポイントされたアンカーテキストとして使用される関連フレーズ)の使用に基づいて、検索結果でページがどのようにブーストされるかについて説明します。 )この最初のフェーズベースのインデックス作成特許でランキングがより詳細に定義されているため、フレーズベースのインデックス作成に関する他の特許も更新される可能性があります。
フレーズベースのインデックス作成は、テストや調査を行うのに十分な興味をそそるものに見えますか?

