欠落している事実の見積もりを説明する質問応答

公開: 2019-06-19

Googleは検索結果で見積もりの​​説明を開始しますか?

検索者がGoogleの検索ボックスで尋ねる質問に対してGoogleが表示する回答の数が増えています。 そして、Googleはそのような質問に答えたいという声明を出しました。これは、2005年のGoogleブログの投稿を指摘する「Googleが直接回答を表示し始めたとき」で書きました。

2017年のアルファベットの財務諸表で、Googleは、検索者が一連のドキュメントを調べてそれらの質問に対する回答を見つける必要なしに、質問への回答を開始したいと言われました。

検索結果に10個の青いリンクを表示するだけでなく、音声検索を使用して質問を話している場合でも、直接回答を提供できるようになりました。これにより、探しているものをすばやく、簡単に、より自然に見つけることができます。 。

このような質問への回答のソースには、質問されたエンティティが欠落している場合や、一部のエンティティに関する誤った事実が含まれている場合があります。 新たに付与されたGoogle特許は、一部のデータソースに存在する問題について説明しており、これらのソースを使用して質問に回答することを妨げる可能性があります。

グラフベースのデータストアなどの知識のリレーショナルモデルを使用して、検索クエリに対する回答を提供できます。 このようなモデルは、実世界のエンティティ(人、場所、物)と、これらのエンティティに関する事実をグラフノードとノード間のエッジの形式で記述します。 このようなグラフはかなりの量の事実を表している可能性がありますが、最大のグラフでさえ数千万のエンティティが欠落しているか、一部のエンティティについて誤った事実を持っている可能性があります。 たとえば、特定のエンティティの日付やその他の属性が欠落していることがよくあります。

この特許は、関連する事実に基づいて回答を推測することにより、このような問題を解決することを目的としています(説明可能な見積もりを提供します)。

知識のリレーショナルモデルから欠落している事実は、グラフ内の他の関連する事実に基づいて推測できることがよくあります。 たとえば、検索システムは、結婚の70%で、夫と妻が5歳以内であることを学習する場合があります。 この分布を使用すると、システムは、生年月日は不明であるが妻の生年月日はわかっている男性が、妻の年齢から5年以内である可能性が高いと高い信頼性で推定できます。 この例では、1つの裏付けとなる証拠(特徴と呼ばれる)を使用していますが、配偶者の年齢、欠落または不正確な事実の推定は、多くの場合、より複雑であり、そのような特徴のいくつか、さらには数百に基づくことができます。 一部の実装では、欠落している事実の推定値と、推定値の根拠について人間が読める形式の説明を提供する検索インターフェイスが提供されます。 例えば、検索システムは、複数の特徴の同時分布を使用して、データグラフから直接取得することができないクエリによって要求された情報の推定値を生成することができる。 各機能は、欠落している情報に関連する事実を表す場合があります。 システムは、特徴に対して一連の測定を適用して、どの特徴および特徴の組み合わせが推定に強く影響するかを決定し、クエリ要求者に表示される説明のために少量の特徴を選択することができる。 説明で使用される特徴の数は、特徴の強度またはタイプ、あるいは他の特徴との非線形関係に依存する場合があります。 一実施形態では、システムは、テンプレートを使用して、人間が読める推定の説明を提供することができる。

欠落している事実の見積もりには、その見積もりの​​根拠についての人間が読める説明が付随します。 この特許は、いくつかの事実を推定するための同時確率分布の使用を指摘しています。その説明は、この特許の背後にあるプロセスに組み込まれており、クエリの検索結果の一部として推定とともに含まれると言われています。 したがって、クエリが特定の男性の年齢に関するものであり、彼の妻の誕生日がわかっている場合、彼女の誕生日に基づいて彼の誕生日の推定値を与えることができます。

一態様では、コンピュータシステムは、データグラフおよび命令を格納する少なくとも1つのプロセッサおよびメモリを含み、これらは、少なくとも1つのプロセッサによって実行されると、システムに、第1のエンティティの情報を要求するクエリを受信させ、推定値を生成させる。データグラフの最初のエンティティに関連する2番目のエンティティのデータグラフからの既知の情報を使用して、要求された情報に対して。 指示はまた、見積りを決定するために使用される既知の情報から、見積りに影響を与えるとみなされる既知の情報に基づいて見積りの説明を生成し、説明および見積りをその一部として提供するようにする指示を含み得る。クエリの検索結果。 たとえば、最初のエンティティが人であり、2番目のエンティティがその人の配偶者である場合、既知の情報には、配偶者の年齢または誕生日を含めることができます。

そのような推定値が検索者に提供される場合、既知の情報の影響力とその情報の貢献度スコアに基づいて、それらの回答がデータグラフに保持される場合があると言われています。

欠落している事実のアプローチのこの説明的な見積もりの​​利点

この特許は、このプロセスを使用することの利点であると信じていることを教えてくれます。

その1つは、見積もりを説明することで、検索者に「見積もりについての理解と、見積もりを信じるか信じないかの根拠を与えることができ、ユーザーの検索エクスペリエンスを向上させる」ことができるということです。

もう1つは、「影響力のある特徴」と「同時分布モデルで推定できる特徴」に基づいて推定を行うということは、このシステムが「手動で入力または維持されるリスト」に依存しないことを意味します。

事実に関する見積もりの​​説明に関する特許は次のとおりです。

欠落している事実の見積もりの​​説明を提供する
発明者:Gal Chechik、Yaniv Leviathan、Ran El Manor、Yoav Tzur、Eyal Segalis、Efrat Farkash、Yossi Matias
譲受人:GOOGLE LLC
米国特許:10,318,540
付与:2019年6月11日
提出日:2016年12月29日

概要

データグラフから欠落している情報の推定を説明するためのシステムおよび方法が開示されている。 例示的な方法は、第1のエンティティの情報を要求するクエリを受信し、情報の推定値を受信することを含み得、推定値は、同時分布モデルの複数の特徴に基づく。 この方法は、複数の特徴のそれぞれの寄与スコアを決定すること、最も高い寄与スコアを有する特徴の量を選択すること、選択された量の特徴を使用して推定の説明を生成することを含み得る。 クエリの検索結果の一部として説明と見積もりを提供します。

その他の不足している情報

この特許は生年月日の例から始まりますが、他の種類の情報も対象としています。 検索レコードを調べて、過去に人々が何を要求したのか、データグラフに何が欠けているのかを把握することができます。

いくつかの実装形態では、モジュールは予測エンジンを含み得る。 予測エンジンは、要求された情報がデータグラフから欠落していると判断し、欠落している情報の推定値を提供する場合があります。 要求された情報は、クエリで要求される場合もあれば、クエリで頻繁に要求される情報のタイプであると判断される場合もあります。 たとえば、予測エンジンは検索レコードを分析して、クエリ要求者が過去に頻繁に要求した情報の種類(たとえば、生年月日、配偶者、歌や映画のリリース日など)を特定し、この情報を使用してこれらの事実を探すことができます。データグラフで。 もちろん、予測エンジンには、欠落している事実を見つける他の方法も含まれる場合があります。たとえば、エンティティタイプを使用して、エンティティタイプのエンティティが持つ属性を判別し、エンティティタイプのエンティティの欠落している属性を探します。 たとえば、人物エンティティには誕生日がある場合があるため、予測エンジンは、誕生日が欠落している人物であるエンティティなどを検索する場合があります。

追加機能誕生日を予測するために使用されます。

この特許は、生年月日に関する見積もりを説明するのに使用できる他の種類の情報を誇示しています。 これらには次のものが含まれます。

  1. その人の配偶者の年齢。
  2. その人の子供の年齢。
  3. 大学の卒業日。

要点

質問として質問し、テキストによる回答を期待するときに欠落している可能性のある事実の説明を含む見積もりを見たとは言えません。 私はこれらの1つに目を光らせていきます。 グーグルが生年月日以外のことについての見積もりを説明するのを見ることを期待している。