入力のコンテキストに基づいた検索入力の曖昧性解消
公開: 2018-05-15"ねぇグーグル; ニューヨーク州ニューヨーク!"
Googleは、「ニューヨーク、ニューヨーク」というクエリを聞きます。 道順を教えたり、フランクシナトラの歌を演奏したり、観光客向けの検索結果を表示したりしますか? おそらく、それはそのクエリのコンテキストに依存します。
Googleの特許で言われているように:
ユーザー入力は、さまざまな理由であいまいであると識別できます。 一般に、ユーザー入力は、ここで説明する手法を使用して入力を明確にする試みがない場合に、システムが複数の意図された意味を持っていると解釈した場合、あいまいであると識別されます。 たとえば、この例では、ユーザー入力は、入力に対応する可能性のある各コマンドに基づいてあいまいであると識別されます。ユーザー入力「Go To New York、New York」は、地理的な場所(ニューヨーク市)を示すことができます。ニューヨーク州ニューヨーク)、曲(「ニューヨーク州ニューヨーク」の曲)、およびWebページ(ニューヨーク州ニューヨーク市の観光Webページ)。 コマンドは、各コマンドに対応するアプリケーションやサービスのポーリング(たとえば、「Go To [Song]」コマンドに関連付けられた音楽プレーヤーへのクエリ)など、さまざまな手法のいずれかを使用して、入力に対応している可能性があると識別できます。 「ニューヨーク、ニューヨーク」がモバイルコンピューティングデバイス上でアクセス可能な曲であるかどうかを判断するには、各コマンドの許容される用語の1つ以上のグループにアクセスします(たとえば、コマンド「Go To [地理的位置]」)など。
それらのクエリのコンテキストに基づいて検索入力を明確にします
Googleは、検索クエリに明確な回答を提供するために、検索クエリへの入力を提供してきました。 この最近付与されたGoogle特許は、クエリのコンテキストを調べて、ユーザー入力の曖昧さを解消し、結果が曖昧にならないようにします。
特許が私たちに告げているように、これはその目的です:
このドキュメントで説明する手法では、あいまいなユーザー入力を明確にするために、携帯電話(スマートフォン、アプリ電話など)などのコンピューティングデバイスのコンテキストが考慮されます。 あいまいなユーザー入力とは、関連する明確な情報がない場合に、コンピューティングデバイスまたはコンピューティングデバイス(たとえば、コンピューティングデバイスが電子通信しているサーバーシステム)によって、 1つのクエリまたはコマンド。 あいまいな入力は、一部には同音異義語が存在するため、また一部には音声からテキストへのプロセッサが、発音は異なるが互いに類似しているように聞こえる単語を区別するのが難しい場合があるため、音声入力で特に一般的です。 たとえば、ユーザーがモバイルコンピューティングデバイスに「帆/セール情報を検索」と言った場合、この音声入力は「帆情報を検索」コマンド(たとえば、帆船の帆に関する情報)に対応する可能性があるため、あいまいになる可能性があります。 )またはコマンド「販売情報の検索」(商品の販売に関する情報)。 特に特定の方言では、「販売」と「販売」が同じように聞こえるため、デバイスは入力が「販売情報の検索」であると判断する場合もあります。
この検索入力の曖昧性解消はどのように機能しますか?
この特許は、曖昧なユーザー入力は、ユーザー入力自体とは別のモバイルコンピューティングデバイス(および/またはモバイルコンピューティングデバイスのユーザー)に関連付けられたコンテキストに基づいて明確化できることを示しています。
- モバイルコンピューティングデバイスが配置されている物理的な場所(例:自宅、職場、車など)
- モバイルコンピューティングデバイスの動き(たとえば、加速、静止など)
- モバイルコンピューティングデバイスでの最近のアクティビティ(例:ソーシャルネットワークアクティビティ、送受信された電子メール、発信/受信された電話など)
コンテキストに基づいて明確化される検索入力の例には、次のものが含まれます。
1.ドッキングされているデバイスは、ドックとデバイスが互いに一致する物理的な電気接点を介して、またはドックとドック間の電子通信(BluetoothまたはRFIDを介して)を介してなど、ドックのタイプを判別できます。端末。 それは、そのような決定に基づいて、それが「車内」または「自宅」のような文脈にあるかどうかを判断することができます。 そのための、
…デバイスは、「方向」などの音声入力を明確にします。この用語は、「車内」のコンテキストでは地理的な方向(たとえば、運転方向)として解釈でき、ハウツー方向(たとえば、料理用)では「在宅」モード。
別の例では、モバイルコンピューティングデバイスで、複数のコマンドを示し得る曖昧なユーザ入力を受信すると、モバイルコンピューティングデバイスが現在どこにあるかを示すことができるモバイルコンピューティングデバイスに関連する現在のコンテキストを決定することができる。 これは、そのコンテキストに基づいて提供される結果に影響を与える可能性があります。
コンテキストに基づいて検索入力を明確にすることの利点
この特許は、特許に記載されているプロセスに従うことの利点を次のように示しています。
ユーザーが目的のタスクに入力を提供するためのすべての形式に従う必要なしに、目的のタスクを実行するようにモバイルコンピューティングデバイスに指示することをユーザーに許可します。 モバイルコンピューティングデバイスによって提供される機能が増加するにつれて、ユーザーは、入力が意図された機能に適切に関連付けられるように、より高い特異性で入力を提供する必要がある場合があります。 ただし、そのような特異性は煩雑で覚えにくい場合があります。 このドキュメントで説明されている方法、システム、手法、およびメカニズムにより、ユーザーは、機能に正式に必要とされるよりも低い特異性を使用して入力を提供できますが、それでも目的の機能にアクセスできます。
特許は次のとおりです。
コンテキストに基づいて入力を明確にする
発明者:ジョン・ニコラス・ジトコフとマイケル・J・ルボー
譲受人:Google LLC
米国特許:9,966,071
付与:2018年5月8日
提出日:2016年7月1日
概要
一実施形態では、コンピュータ実装方法は、モバイルコンピューティングデバイスで、複数のコマンドのうちの2つ以上を示す曖昧なユーザ入力を受信することを含む。 そして、モバイルコンピューティングデバイスが現在どこにあるかを示す、モバイルコンピューティングデバイスに関連する現在のコンテキストを決定する。 この方法は、モバイルコンピューティングデバイスに関連する現在のコンテキストに基づいて複数のコマンドからコマンドを選択することによって曖昧なユーザ入力を明確にし、選択されたコマンドの実行に関連する出力をモバイルコンピューティングデバイスによって提供させることをさらに含むことができる。 。
今朝、「Hey Google」で始まるGoogleスピーカー(デバイス)と話し合いましたが、最近のGoogle I / O会議で発表された変更をGoogleが行った後、そのホットな言葉を言う必要はありませんでした。 私はスポーツのスコアを尋ね、それからそれらについて質問しました。 スピーカーバージョンのGoogleNowを操作する最善の方法をまだ学んでいますが、興味深いものです。 (何か役立つものを求めたら、お願いしますか?)この特許からこの一節を読み始めたとき、私の朝の会話が思い浮かびました。

このドキュメントでは、モバイルコンピューティングデバイス(モバイル機能電話、スマートフォン(iPhone、BLACKBERRYなど)、携帯情報端末(PDA)、ポータブルメディアプレーヤーなど)でのあいまいなユーザー入力を明確にするための手法、方法、システム、およびメカニズムについて説明します。 、iPod)など)。 モバイルコンピューティングデバイスによって提供される機能が増加するにつれて、モバイルコンピューティングデバイスによって認識されるコマンドの数も増加する可能性があります。 例えば、モバイルコンピューティングデバイス上の各機能は、ユーザが入力、話す、ジェスチャーなどを行うことができる1つまたは複数の対応するコマンドを登録して、その機能をモバイルコンピューティングデバイス上で起動させることができる。 ただし、認識されるコマンドの数が増えると、コマンドが収束し、ユーザー入力が複数のコマンドのどれに対応することを意図しているかを区別することが難しくなる可能性があります。 問題は音声入力で拡大します。 たとえば、大きなバックグラウンドノイズが発生する音声入力は、正確に解釈するのが難しい場合があり、その結果、モバイルコンピューティングデバイスによって認識される複数のコマンドにマッピングされる可能性があります。 たとえば、音声入力の「例」は、とりわけ「卵のサンプル」、「例」、または「試験のプル」として解釈できます。 別の例として、コマンド「go-to」は、マッピングアプリケーションの場合は「goto [geographic location]」を表し、メディアプレーヤーの場合は「goto [artist / album / song]」を表す場合があります。
Googleから最高の結果を得るために、デバイスやスピーカー、モバイルデバイスとの最適なやり取りの方法を学ぼうとしているので、Googleはまた、私たちとのやり取りの最善の方法を学び、私たちが求めたときに確実に理解されるように努めています。なにか。 検索入力の曖昧性解消に関するこの特許は、その方向にいくつかのステップを踏みます。 それが私たちに言うように:
ここで説明する手法を使用すると、あいまいなユーザー入力の受信に応じて、モバイルデバイス(および/またはモバイルコンピューティングデバイスのユーザー)の現在のコンテキストを決定し、使用してあいまいなユーザー入力を明確にすることができます。 モバイルコンピューティングデバイスの現在のコンテキストは、モバイルコンピューティングデバイスおよび/またはモバイルコンピューティングデバイスのユーザに関連する様々な情報を含むことができる。 コンテキストはデバイスの外部にあり、現在の物理的な場所(たとえば、自宅、職場、車、ワイヤレスネットワーク「testnet2010」の近くにあるなど)、方向、速度など、デバイス周辺のリアルタイムのステータスを表す場合があります。デバイスが移動する速度(たとえば、時速20マイルで北に向かう)、現在の地理的位置(たとえば、10番街とマルケットアベニューの角)、および周囲のノイズ(たとえば、低音のハム、音楽、等。)。 コンテキストは、今後および/または最近のカレンダーの予定(たとえば、2010年7月29日の午後2時30分にジョンと会う)、デバイスの時計の日時(たとえば、 、2010年7月29日の午後2時)、最近のデバイスアクティビティ(たとえば、2時30分の会議に関してジョンに送信された電子メール)、およびモバイルコンピューティングデバイスのカメラからの画像。
私はよく電話を使って場所に移動し、電話に話しかけたり、移動先を変更したりします。たとえば、元の目的地を通り過ぎて最初に別の店舗に行くことにした場合などです。ナビゲーションをオフにして、最初の目的地に戻るためにUターンするように指示するのをやめさせたいと思います。
この特許は、ここで私たちに教えてくれるように、コンテキストに基づいてデバイスがどのように機能するかに影響を与える可能性があるものについていくつかの興味深いアイデアを提示しているため、時間をかけて検討する価値があります。
あいまいなユーザー入力が識別されると、ステップBでモバイルデバイスの現在のコンテキストを決定できます。 現在のコンテキストは、入力が受信されたときのモバイルコンピューティングデバイスおよび/またはモバイルコンピューティングデバイスのユーザの現在の状態および/または周囲を説明する情報を含む。 たとえば、現在のコンテキストには、周囲の物理環境(たとえば、利用可能なネットワーク、他の近くのコンピューティングデバイスへの接続、地理的位置、気象条件、近く)に関する情報など、モバイルコンピューティングデバイスとユーザーに関連するさまざまな情報を含めることができます。ビジネス、周囲ノイズの量、周囲光のレベル、モバイルデバイスのカメラによってキャプチャされた画像など)、モバイルコンピューティングデバイスの現在の状態(たとえば、速度、タッチスクリーン入力のアクティブ化、オーディオ入力のアクティブ化、呼び出し音)オン/オフなど)、時間と日付の情報(たとえば、時刻、日付、カレンダーの予定、曜日など)、ユーザーアクティビティ(たとえば、最近のユーザーアクティビティ、習慣的なユーザーアクティビティ)など。現在の状況は、モバイルコンピューティングデバイスに対してローカルおよび/またはリモートであるデータおよびセンサーを使用して、モバイルコンピューティングデバイスによって決定することができる。
コンテキストに応じた検索入力の曖昧性解消を含む変更
かつて、クエリ用にページを最適化したとき、それはデスクトップコンピューターまたはラップトップコンピューターを使用して机に座っている誰かによって実行されたクエリであった可能性があります。 今では、車の中、バスや電車の中、店の通路や喫茶店にいる人かもしれません。 彼らが「ニューヨーク、ニューヨーク」を検索するとき、それは彼らが交通の道順を知りたい、歌を聞いている、またはウェブページを読んでダウンタウンで何が起こっているのかを知るためかもしれません。
彼女がマンハッタンの学校に通ったときに姉を訪ねたのを覚えています。彼女は、その日に街でお祭りが行われているかどうかを調べるように提案しました。 彼女は電話を取り、411をダイヤルし、オペレーターに尋ねました。 これは、調べるために使用するワールドワイドウェブが存在する約5年前であり、彼女はオペレーターから回答を得ました。それは私を非常に驚かせました。 私はその情報源からそれらの答えを期待していませんでした。 私は今、それらについて教えてくれるWebページを見つけることができると期待していましたが、将来、コンピューターや携帯電話を使用してそのような情報を見つけることができるとは期待していませんでした。 世界は変化しています。
モバイルデバイスと検索エンジンがもたらす変化にどの程度備えていますか?
