Googleでのコンテキストに関する私の5番目の投稿:質問の回答へのコンテキストファクトの追加(更新)

公開: 2018-04-03

コンテキストファクトは、エンティティがどのように関連しているかを教えてくれます

最も背の高い米国大統領

Googleは、サイトがコンテキストファクトについて教えてくれる新しい特許のコンテキスト情報をどのように使用できるかの例を提供しています。

この投稿は事実を文脈に入れることについてのものであり、この投稿を始めるときに、Googleでの文脈について書いた他の投稿を指摘する必要があるように感じます。 コンテキストを理解することは重要です。 コンテキストが本当に重要であると考えているGoogleの他の特許があることを知っていると、この投稿に意味が追加されます。 私がコンテキストについて書いた以前の投稿には、次のものがあります。

  • 検索を改善するためのGoogle特許コンテキストベクトル
  • コンテキストは王様:Googleパラメータレス検索
  • Googleがリンクのコンテキストを使用してリンクスパムを特定する方法
  • Googleでのトピック検索結果?

最近のGoogle特許出願によると、人々は「バラク・オバマの身長はどれくらいですか?」とよく尋ねます。 彼らは、その質問の回答にコンテキストファクトを追加すると、回答がさらに役立つ可能性があると指摘しています。

特定の態様では、特定のファクトに関するコンテキスト情報には、他の同様のファクトの中でファクトをランク付けすることが含まれる場合があります。 たとえば、バラク・オバマの身長が6フィート1インチであることを知っておくと役立つ場合がありますが、バラク・オバマが9番目に高い米国大統領であることを知っておくと役立つ場合があります。 そのため、バラク・オバマの身長を他の米国大統領と比較する方法に加えて、バラク・オバマの身長を提供することができます。

彼らは、それらの事実のスコアリングに基づいてコンテキストファクトを選択する可能性があり、どのようにして最も高い大統領であるかなどのリストを作成する可能性があると語っています。

これらのコンテキストファクトのスコアの一部は、最近の検索クエリが特定のエンティティを参照する頻度などに部分的に依存する場合があります。 そのエンティティに関するデータに対応する自然言語テキストの生成が含まれる場合があります。

コンテキストファクトおよび関連エンティティへの関心は、クエリログから知ることができます

彼らが特許で提供する例は、「構造化された事実がより広いグループ内でどのようにランク付けされるか」を調査します。また、「より広いグループ内でランク付けされる他の関連エンティティを提供する」こともできます。

このアプローチの価値の1つは、検索クエリに表示される情報を使用してコンテキストファクトをスコアリングする場合、「クエリ検索に関連する情報の知識ベースを徹底的に検索する」よりも「計算の複雑さ」が少なくて済むことです。 これは、このアプローチが「最近の検索クエリで頻繁に発生しない「人気のない」データを除外して、コンテキストファクトを効率的かつ正確に判断できる」ことを意味します。

したがって、結果が示す可能性のあるコンテキストファクトは、エンティティについて、および関連するエンティティについて人々が検索しているものに関連している可能性があります。 特許出願は次のとおりです。

コンテキストファクトの提供
パブ。 番号:WO / 2018/052685
国際出願番号:PCT / US2017 / 048459
発行日:2018年3月22日
国際出願日:2017年8月24日
発明者:AkashNanavatiとAndrewHuse Helmer

概要:

一態様では、方法は、エンティティのリストを受信することを含み、各リストは、(i)関連付けられたスコアを有し、(ii)それぞれのコンテキストファクトに関連付けられ、(iii)エンティティのサブセットをランク付けし、各リストについてリスト上のエンティティごとに、(i)エンティティ、(ii)リストに関連付けられたコンテキストファクト、(iii)コンテキストファクトのエンティティのランク、および(iv)を参照するデータ構造を生成するエンティティの)リストのスコア。 この方法はまた、特定のエンティティを識別するデータの受信、特定のエンティティを参照する特定のデータ構造の選択、および(i)特定のエンティティを参照する特定のデータ構造に関連するコンテキストファクトを示すデータを出力のために提供することを含むことができる。 (ii)特定のエンティティを参照する特定のデータ構造に関連付けられたコンテキストファクトのエンティティのランク。

クエリログとコンテキストファクトの持ち帰り

クエリに基づいて関連するファクトをスコアリングするこのアプローチは、Googleが主題に関するオントロジーを構築している可能性があることを思い出させます。 その投稿で見つかったクエリパターンの質問について、「バラクオバマの身長は?」などと書きました。 私が今日書いている特許では、オバマ大統領が9番目に高い大統領であったことがわかります。 したがって、クエリログを使用して主題に関するオントロジーを構築するプロセスには、それらの主題に関連する可能性のあるファクトのランク付けも含まれているようです。その情報を回答に含めるか、カルーセルのような他のフォーメーションを含めることができます。

カルーセルで最も背の高い米国大統領

この特許は、これらのコンテキストファクトを、カルーセルで見られるような関連エンティティとどのように組み合わせることができるかを指摘しています。

関連する各エンティティには、関連するファクトを含めることができます。 コンテキストファクトに対応するリストは、それぞれのリストの関連エンティティのそれぞれに対応する関連エンティティおよび関連ファクトとともに提供することができます。 いくつかの態様では、コンテキストファクトを表示するために、ブラウザインターフェースの関連エンティティ領域1 14に、所定の数の関連エンティティを提供することができる。 提供される関連エンティティの数は、コンテキストファクト、コンテキストファクト、関連エンティティの総数、またはそれらの任意の組み合わせに関連付けられたリストに基づくことができます。 たとえば、コンテキストファクトのリスト領域112に「最も高い米国大統領」が含まれている場合、関連エンティティ領域1 14には、エイブラハムリンカーン、リンドンB.ジョンソン、トーマスジェファーソン、フランクリンDの4人の最も高い米国大統領を含めることができます。 。ルーズベルトとそれぞれに関連する事実、またはこの場合はそれぞれの高さ。

検索結果の関連エンティティについては、知識ベースの検索の関連エンティティスコアの投稿に書いています。 その投稿で私が書いた特許は関連するエンティティのスコアについて話し、これはファクトスコアと関連するエンティティのスコアについて話します。 それらは私が将来エンティティについて書いたときに私が関連するエンティティと関連する事実について学び始めなければならないかもしれないと私に信じさせます。 そして、そのGoogleは、エンティティとファクトの関係、およびそれらに関連付けられている可能性のあるクエリパターンを理解しようとしている可能性があります。

追加:コンテキストファクトに関するこの特許は、2019年5月14日に、コンテキストファクトの提供という名前で付与されました。 Google Shows Us How It Uses Entity Extractions for Knowledge Graphsに書いたGoogle特許を思い出しました。これは、エンティティのコンテキスト(それらに関連する事実)を理解し、信頼スコアでそれらをスコアリングして、それらがどれほど正しいかを教えてくれます。事実かもしれません。

最終更新日:2019年5月14日