Googleがコンテキスト履歴を使用してクエリの意図を予測する方法

公開: 2018-11-29

検索の背後にあるクエリの意図を理解する

Andrea BroderによるWeb検索（pdf）の分類法は、情報クエリ、トランザクションクエリ、およびナビゲーションクエリの違いに関するものです。これらは、クエリ用語のページを最適化するときに知っておくとよいでしょう。

コンセプトやトピックについて人々に教えることを期待していますか？もしそうなら、あなたはそれが情報的なものであるかのように彼らの質問を扱っています。

商品やサービスの販売を目的としたページを作成していますか？次に、クエリをトランザクションであるかのように扱い、何かを購入したり予約したりできるようにします。

誰かが以前に見たことがある、または存在することを期待しているために認識しているページを見つけるのに役立つクエリであり、特定のページが返されることを期待しているクエリは、ナビゲーションクエリと呼ばれます。誰かが特定の製品またはブランドの名前を検索すると、その製品またはブランドのホームページに満足します。

社内のSEOとしてSEOを始めたサイトは、人々がビジネスを組み込むのに役立ちました。そのページは、「デラウェアに組み込む」などの用語で上位にランクされました。情報提供のみのサイトであり、訪問者にデラウェアでの事業を組み込む機会を提供しなかったデラウェア企業部門のWebサイトに続いて、その期間で2番目にランク付けされたサイトであるときにコンバージョンが増加しました。

人々は検索結果で企業部門のサイトを見て、そこにアクセスしてプロセスについて学び、次に検索結果に戻って、私のようなトランザクションサイトにアクセスして組み込むことができます。最高ランクのサイトであることは利点ではなかった例でした。そのようなクエリの背後にある意図を理解することは、それが起こった理由を説明するのに役立ちます。

クエリインテントの詳細

検索とクエリの背後にある意図に関する別の論文は、分類のための単純なモデルです。
D. Irazu Hernandez、Parth Gupta、Paolo Rosso、およびMartha RochaによるユーザーインテントによるWebクエリ（pdf）。これは、これを含む、繰り返す価値のあるクエリインテントに関するいくつかの興味深いステートメントを作成します。

ユーザーの意図に基づくクエリ分類は、クエリの背後にあるニーズについてクエリを分類することを目的としています。 Jansenとブース[4]は、ユーザーの意図を、Web検索エンジンとの相互作用における感情的、認知的、または状況的な目標の表現として定義しています。ユーザーの意図に基づくクエリ分類は、主に2つの問題があるため、従来のテキスト分類とは異なります[2]。まず、Webクエリは通常非常に短いです。第二に、多くのクエリはあいまいであり、クエリが複数のカテゴリに属するよりも一般的です。たとえば、「オペラ劇場のチケット」というクエリの場合、ユーザーがWebサイトを知りたいのか、イベントに参加するためのチケットを購入したいのかを特定するのは困難です。ほとんどの作業には、通常、手動で分類された少量のクエリが含まれます。

その論文は、クエリの意図をよりよく理解するためのいくつかのアイデアとアプローチを提供しますが、私はそれが対処しようとしている問題をどのように組み立てているかが好きでした。先週公開されたGoogleの特許出願では、検索エンジンが検索のコンテキストを理解して、クエリの背後にある検索者の意図をよりよく理解しようとする方法について説明しています。

コンテキストに基づくクエリインテントの予測に関するGoogleの特許

インテントをクエリに関連付けることができるというのは新しい概念ではありません。Googleは、検索ボックスに少数の単語を入力すると、ユーザーが何を検索しているかを理解するためにそうしようとする場合があります。この特許について新しいように思われるのは、Googleがクエリの意図を理解しようとするためにどれだけの努力を払う可能性があるかということです。誰かがランチタイムに「ピザ」という単語をGoogleに入力すると、彼らは食事に興味があり、ピザを買う場所を探しているか、それが配達される可能性があると推測できます。

彼らがピザの歴史をずっと探している可能性は低いでしょう（しかし、そうかもしれません）。ほとんどの検索でそのような仮定を適切なものにするために、どのくらいのコンテキストが必要になるでしょうか。

ほとんどの特許と同様に、Googleからのこの新しい特許は、解決しようとしている問題について教えてくれます。

検索クエリが厳密に調整されていない場合、またはユーザーがクエリ以外の追加情報を提供しない場合、コンピューティングデバイスは大量の情報を返す可能性があります。最も興味深い情報や関連情報のいくつかは、ユーザーが見つけるのが難しいものです。ユーザーはストレスを経験したり、非常に詳細なクエリを入力してコンピューティングデバイスに貴重な時間とリソースを浪費したりして、コンピューティングデバイスに複数の検索を実行させたり、大量の検索結果を選別して、特定のタスクを実行するために必要な情報を取得したりする場合があります。。

その検索者が空腹ですぐにピザを欲しがっている場合、おいしいピザを配達できる近くの場所を特定できれば、検索エンジンに対する満足度が急速に高まる可能性があります。

コンテキストを使用してクエリの意図を予測する

クエリインテントコンテキスト履歴特許フローチャート

クエリインテントを使用すると、検索エンジンが検索から返される検索結果を調整できるため、インテントを満たすための情報が、検索から返される他の情報よりも強調されます。

この特許は、チケットを購入したばかりの映画を検索している人の例を示しています。システムはログデータを調べて、検索者がその映画の将来の上映のチケットをすでに購入していると判断し、「映画の上映時間が他の情報（レビュー、記念品など）よりも低くランク付けされるように結果を調整できる場合があります。、トリビアなど）特定の映画について。」

表示される可能性のある結果をパーソナライズするために実行した以前の検索に関する情報を収集する検索エンジンには精通していますが、ストレスの軽減や時間の浪費の回避を目的としたコンテキストのこの使用法は異なります。

特許出願は、検索エンジンを使用してその情報を分析する人から許可を得た後にのみ、そのような文脈情報を見ることができると私たちに告げています。この特許は、検索者に表示される可能性のある検索結果の順序を変更する可能性のあるコンテキスト情報を使用する方法の追加の例を提供します。

これはまだ係属中の特許出願であり、まだ実装されていない可能性がありますが、将来のある段階である可能性があり、Googleはクエリの背後にある意図を予測するためにコンテキストに注意を払っている可能性があります。時刻、曜日、場所などはすでに使用できます。

この特許は、検索者に関する個人を特定できる情報を明らかにする可能性のある情報など、一部の情報の使用を制限することを示しています。

この新しく公開された特許出願は、次の場所にあります。

特定のコンテキストの検索の意図を予測する
公開番号：20180336200
発行日：2018年11月22日
応募者：Google Inc.
発明者：Yew Jin Lim、Joseph Linn、Yuling Liang、Carsten Steinebach、Wei Lwun Lu、Dong Hyun Kim、James Kun、Lauren Koepnick、Min Yang

概要：

コンピューティングデバイスのグループによって実行されるユーザが開始するアクション、およびコンピューティングデバイスから受信した特定の検索クエリを使用する検索の意図に基づいて決定するコンピューティングシステムが説明される。コンピューティングシステムは、意図に基づいて、意図を満たす情報を強調することにより、検索クエリを使用した検索から得られた検索結果の少なくとも特定の部分を調整する。コンピューティングシステムは、調整された検索結果の表示をコンピューティングデバイスに送信します。

コンテキスト履歴の例

特許出願は、クエリの意図を予測するために使用される可能性のあるさまざまなタイプのコンテキスト情報のいくつかについて説明しています。

ユーザーインタレストグラフまたはその他のタイプのデータ構造
ユーザーに関連付けられた連絡先情報（たとえば、ユーザーの個人的な連絡先情報、およびユーザーの友人、同僚、ソーシャルメディア接続、家族などに関する情報）
履歴の検索
ロケーション履歴
長期および短期のタスク
カレンダー情報
アプリケーションの使用履歴
購入履歴
お気に入り
ブックマーク
その他の情報

これらの個人的な興味のタイプのものに加えて、それらは他の文脈情報を含みます。

コンピューティングデバイスの動作状態について（そしてそれらはここで深く掘り下げます）：

スイッチの位置
バッテリーレベル
デバイスが壁のコンセントに差し込まれているか、または別のデバイスやマシンに動作可能に結合されているかどうか
ユーザー認証情報（たとえば、現在認証されているユーザー、またはデバイスの現在のユーザー）
デバイスが「機内」モード、スタンバイモード、フルパワーモードで動作しているかどうか

コンテキスト情報の他の例：

音響指紋
ビデオ指紋
場所
移動軌跡
方向性
スピード
施設の名前
住所
場所の一種
建物
気象条件
交通状況
カレンダーイベント
場所や時間に関連する会議やその他のイベント
特定の時間に表示されたWebページのアドレス
検索や閲覧履歴など、特定の時間にWebページのデータフィールドに作成された1つ以上のテキストエントリ
特定の時間に行われた製品の購入
製品のウィッシュリスト
製品レジストリ
さまざまな場所と時間でコンピューティングデバイスの存在下でアクセスされた、またはブロードキャストされたオーディオおよび/またはビデオ
さまざまな場所と時間でコンピューティングデバイスによってアクセスされる、またはその存在下で放送されるテレビまたはケーブル/衛星放送
さまざまな場所と時間にコンピューティングデバイスによってアクセスされる他のサービスに関する情報。

この特許には、以前に詳細に書いたモバイルロケーション履歴などの他の種類の情報が表示されます。

特許出願は、そのようなコンテキストにインデックスを付けて、そのようなクエリの検索結果を補足または変更する可能性のあるクエリに関連する可能性のある情報を検索できるようにする方法について説明しています。

また、検索エンジンが検索および検索が実行されるデバイスに関して維持する可能性のあるコンテキスト履歴とは別に、検索履歴を維持する可能性があることも示しています。グーグルは検索の背後にある彼らの意図について検索者に質問しないかもしれないが、彼らが検索結果に何を表示するかを予測する能力を彼らに与えるために彼らが検索の背後にある人々と機械について多くを学ぶことができるかもしれないように聞こえる。

クエリの意図を判断するための機械学習

Googleの特許は、その背後にあるプロセスには多くの情報の収集が含まれることを示しています。不要な情報を除外して予測を行い、「狭いコンテキストを定義して、検索クエリの真の意図を推測できるようにする」ことができます。

この特許は、このタスクを支援するためにディープラーニングをどのように使用するかについても説明しています。

予測モジュールは、入力として受信する機械学習モデル（たとえば、深層学習モデル）を実行する場合があります。検索クエリ（または検索クエリの一部）と、コンテキストモジュールから受信した現在のコンテキストです。機械学習モデルは、現在のコンテキストの検索クエリを使用して、検索の意図を示す指標（ラベルやその他の識別子など）を出力として生成する場合があります。

結論

この特許は、事前定義されたインテント（旅行など）、インテントスコア、およびユーザーデータが関連するクエリインテントについて学習する機械をトレーニングする方法に関する詳細を提供します。

これは特許出願であり、Googleはそのようなコンテキスト履歴を作成し、それに基づいて検索結果を調整することを実装していない可能性があります。また、特許では、そのようなコンテキストデータを分析する前に許可を求める可能性が高いと述べていることに注意してください。

上記で共有したコンテキストの例に基づいてクエリインテントを繰り返すには、次のようにします。

映画のチケットを購入する
その映画の検索を実行します
検索エンジンはあなたの購入履歴に気づきます
同じ映画の他の上映の映画時間を表示する代わりに、検索結果を調整して、雑学クイズや記念品、映画に関するニュースを表示することができます。

Googleは検索履歴と場所の履歴を詳細に追跡していますが、クエリの意図とコンテキスト履歴の使用をこのように理解すると、検索のパーソナライズよりもランキングが大幅に変わる可能性があります。