Googleが検索者の以前のクエリを見てクエリの書き換えを行う方法
公開: 2019-08-24マッドビルスタジアム(マイティケーシーが打ち負かされた場所)には何人の人がいますか?
グーグルは今週初めにクエリの書き直しを含む新しい特許を取得した。 これは、GoogleのHummingbirdと同じようには機能せず、GoogleのRankbrainがどのように機能するかとは異なります。
検索者が検索者の情報ニーズの状況に合ったページを返すことで検索する可能性のあるクエリの書き換えに関する特許を見てきました。 これらは、同義語を使用してクエリを書き換えることに関するGoogleのHummingbirdアップデートおよびその他のGoogle特許の背後にあるアイデアです。
下のハミングバード特許の図では、シカゴスタイルピザの「場所」という単語を「レストラン」に書き換えることができます。これは、Googleがクエリとして回答するのが簡単です。

私の投稿で、Hummingbirdが使用するクエリ書き換えアプローチを説明する特許について書きました。GoogleHummingbird特許? その投稿では、GoogleがHummingbird Updateを発表する2週間前に付与されたGoogle特許について書きました。これは、クエリの書き換えのいくつかの例を発表と共有していました。 特許は、同時発生する用語に基づく同義語の識別でした。
Hummingbirdを発表したイベントで、彼らは更新について次のように述べました。
特に、Googleは、Hummingbirdがクエリ内の各単語にもっと注意を払い、特定の単語ではなく、クエリ全体(文全体、会話、または意味)が考慮されるようにしていると述べました。 目標は、ほんの数語に一致するページではなく、意味に一致するページの方がうまくいくことです。
〜FAQ:新しいGoogleの「ハチドリ」アルゴリズムのすべて
「シカゴスタイルピザに最適な場所はどこですか」というクエリで、この特許は、「場所」という単語を「レストラン」という単語に置き換えることができ、検索エンジンが答えやすくなることを示しています。
この新しい特許は、検索者自身の単語を調べてクエリを書き直す可能性があります。 それは、彼らが見つけたいものを見つけるのを助けるために、彼らが以前に実行したかもしれないどんなクエリを見るかもしれません。 特許の背後にあるプロセスの概要を示し、次に、以前のクエリが検索者のクエリの書き直しにどのように役立つかについての例を示します。
以前のクエリを使用したクエリの書き換え
これらは、その背後にあるプロセスを詳述する、新しく付与された特許で特定されたステップです。
- 検索エンジンは検索者からクエリを受け取ります
- 検索エンジンは、同じセッション中に同じ検索者から以前のクエリをいくつか受け取った可能性があります
- 検索エンジンは、同じサーチャーからの最新の検索クエリと以前の検索クエリに基づいて、多くの候補クエリの書き換えを作成する場合があります
- これらの候補クエリの書き換えは、候補クエリの書き換えに対応する検索結果の分析から書き換えの品質を判断することに基づいてスコアリングされます。
- しきい値を満たすスコアに基づいて、候補クエリの書き換えが選択されます
- 選択した候補クエリの書き換えによる検索結果が検索者に表示されます
この特許は、このクエリ書き換えアプローチに関連するいくつかのオプション機能があることを示しています。 以前のクエリにエンティティを含めることが、この書き換えアプローチの興味深い側面であるのは興味深いことだと思いました。
これらのオプションの手順は、上記の手順を具体化します。
- 候補クエリの書き換えの数を作成することは、元のクエリを以前の各検索クエリと連結することを意味する場合があります
- 以前の各クエリにはタイムスタンプがあり、候補クエリの書き換えのスコアリングの一部には、候補が以前のクエリの古さで書き換える重みを含めることができます。
- これらの数の候補クエリの書き換えを作成するには、検索クエリに類似した複数のユーザーからのクエリのコレクションからクエリを識別することが含まれます。
- 候補クエリの書き換えのスコアリングには、多くのユーザーからのクエリのコレクションに基づいて、各候補クエリの書き換えがどれほど人気があるかを判断することも含まれます。
- 候補クエリの書き換えのそれぞれをスコアリングすることには、特定のタイプの参照用語(エンティティ参照の可能性が高い)が含まれているかどうかを判断することも含まれます。
- 候補クエリリライトのスコアは、候補クエリリライトに特定のタイプのエンティティが含まれていると判断した場合に増やすことができます。
- 各候補クエリの書き換えのスコアリングには、検索クエリに特定のエンティティと高度に相関する用語が含まれているかどうかを判断することも含まれます。
- 候補クエリリライトのスコアは、候補クエリリライトがクエリ用語と高度に相関するエンティティを含むと判断した場合に増加する可能性があります。
- 候補クエリリライトに応答する検索結果の分析に基づいて各候補クエリリライトの品質を決定することは、各候補クエリリライトに応答する検索結果を取得すること、および検索結果の品質を決定することを含む。
このクエリ書き換えアプローチは、クエリ内のすべての単語のコンテキストを理解し、検索者にとって有用な結果を返す可能性が高い方法でそれらを書き換えることではありません。 それは、検索エンジンに同じクエリセッションからの複数のクエリのコンテキストを理解させ、それらが検索者を満足させる答えを提供するのに役立つかどうかを理解させることによって、それを拡張します。 この特許は、この特許のプロセスの背後にある利点は次のとおりであることを示しています。

以前のユーザーセッションクエリを使用してクエリを書き換えると、ユーザーの意図に応じて検索結果が返される可能性が高くなります。
このクエリ書き換え特許は次のとおりです。
セッション情報を使用したクエリの書き換え
発明者:Marcin M.Nowak-PrzygodzkiおよびBehshadBehzadi
譲受人:Google LLC
米国特許:10,387,437
付与:2019年8月20日
提出日:2017年1月13日
概要
自然言語処理のための、コンピューター記憶媒体にエンコードされたコンピュータープログラムを含む方法、システム、および装置。 方法の1つには、ユーザーセッション中にユーザーから検索クエリを受信することが含まれます。 ユーザーセッション中に受信したユーザーによる複数の事前検索クエリの取得。 複数の候補クエリリライトを生成する。ここで、候補クエリリライトは、検索クエリおよびユーザによる複数の以前の検索クエリから導出される。 各候補クエリリライトのスコアリング。各候補リライトのスコアリングには、候補クエリリライトに応答する検索結果の分析に基づいて、各候補クエリリライトの品質を決定することが含まれる。 しきい値を満たすスコアを持つ候補クエリリライトを選択し、選択した候補クエリリライトに応答する検索結果を提供します。
クエリ書き換えテストと要点
私はこの特許にリストされている例からのクエリを試しましたが、それは私のクエリを書き直しませんでした。 私がそれを書いているかどうか、またはあなたが自分で特許に出くわしたかどうかに関係なく、常にこのようなものをテストしていて、それは面白いように聞こえます-Googleが特許の言うことをやっているかどうか、または彼らが彼らを示す何かを実装しているかどうかを確認してくださいそれに向かって動いています。
最近、「企業への質の高い訪問スコアがGoogleローカル検索のランキングに影響を与える可能性がある」という投稿を書きました。質の高い訪問スコアを使用してローカル結果のランキングを上げるかどうかを判断することはできませんが、Googleがそんなこと。 1つ目は、GoogleがGoogle Analytics 360で質の高い訪問情報を披露していることです。2つ目は、Google Webmasterブログの最近の投稿で、Googleがトップ5に入るビジネスに対してさまざまなビジネスカテゴリのバッジを授与することを示しています。 %はそのカテゴリのサイトを訪問しました。 したがって、特許に記載されているプロセスが使用されている兆候を探してください。
この特許の例には、次のクエリを使用した検索が含まれます。
【マッドビルスタジアム】
【マッドビルナイン】
[バラック・オバマ]
次のクエリは次のようになります。
【容量はいくらですか】
そして、それは前のクエリの最初のものを参照します。
そのクエリを最初の前のクエリと連結することに基づく候補クエリの書き換えは、次のようになります。
[マッドビルスタジアムの収容人数は?]
また、最初のクエリで指定されたエンティティのプロパティ(スタジアムの容量)も参照します。これは、書き直されたクエリの候補が高く評価されるオプション機能に適合します。
Googleは、その最後のクエリを最初のクエリと組み合わせて、現時点でマッドビルスタジアムの容量を示す結果を返していません。 繰り返しになりますが、本物のマッドビルスタジアム(ケーシーアットザバットが行われた場所)があるかどうかわからないので、マッドビルスタジアムをリンカーンファイナンシャルフィールド(本物)に置き換えて、同じ一連のクエリを試しました。リンカーンファイナンシャルフィールドのキャパシティも教えてくれません。少なくともまだです。もう一度やり直します。
