基於輸入上下文消除搜索輸入的歧義

已發表: 2018-05-15

“嘿谷歌; 紐約,紐約!”

谷歌聽到“紐約,紐約”的查詢。 它是否提供方向、播放 Frank Sinatra Song 或顯示旅遊風格的搜索結果? 這可能取決於該查詢的上下文。

正如我們在 Google 專利中所說:

由於多種原因,用戶輸入可能被識別為不明確的。 通常,如果系統將用戶輸入解釋為具有多個可能的預期含義,而沒有嘗試使用此處描述的技術來消除輸入的歧義,則用戶輸入被識別為歧義。 例如,在本示例中,基於可能對應於輸入的每個命令,用戶輸入被識別為不明確的——用戶輸入“去紐約,紐約”可以指示地理位置(紐約市)。 York, NY)、一首歌(歌曲“New York, New York”)和一個網頁(紐約州紐約市的旅遊網頁)。 可以使用多種技術中的任一種將命令識別為可能對應於輸入,例如輪詢對應於每個命令的應用程序和/或服務(例如,查詢與命令“轉到[歌曲]”相關聯的音樂播放器以確定“紐約,紐約”是否是移動計算設備上的可訪問歌曲),訪問每個命令的一組或多組允許的術語(例如,訪問命令“轉到[地理位置]”)等。

根據這些查詢的上下文消除搜索輸入的歧義

Google 一直在為搜索查詢提供輸入,以便為搜索查詢提供明確的答案。 這項最近獲得授權的谷歌專利著眼於查詢的上下文,試圖消除用戶輸入的歧義,使結果不模糊。

正如專利告訴我們的,這是它的目的:

在本文檔中描述的技術中,考慮了諸如移動電話(例如,智能手機或應用電話)之類的計算設備的上下文以消除歧義的用戶輸入。 不明確的用戶輸入是在沒有相關消歧信息的情況下,將被計算設備或計算設備(例如,由計算設備與之進行電子通信的服務器系統)解釋為對應於超過一個查詢或命令。 歧義輸入對於口語輸入可能特別常見,部分原因是存在同音字,部分原因是語音到文本處理器可能難以區分發音不同但聽起來彼此相似的單詞。 例如,如果用戶對移動計算設備說“搜索帆/銷售信息”,則該語音輸入可能不明確,因為它可能對應於“搜索帆信息”命令(例如,關於帆船的帆的信息) ) 或命令“搜索銷售信息”(有關商品銷售的信息)。 設備甚至可以確定輸入是“搜索銷售信息”,因為“銷售”和“銷售”聽起來很相似,尤其是在某些方言中。

這個搜索輸入消歧如何工作?

該專利告訴我們,模糊的用戶輸入可以基於與移動計算設備(和/或移動計算設備的用戶)相關聯的上下文與用戶輸入本身分開來消除歧義,例如:

  1. 移動計算設備所在的物理位置(例如,家、工作場所、汽車等)
  2. 移動計算設備的運動(例如,加速、靜止等)
  3. 移動計算設備上的近期活動(例如,社交網絡活動、發送/接收的電子郵件、撥打/接收的電話等)

基於上下文消除歧義的搜索輸入的示例可以包括

1. 對接的設備可以確定其所在的塢站類型,例如通過塢站和設備上相互匹配的物理電觸點,或通過塢站和設備之間的電子通信(例如,通過藍牙或 RFID)設備。 基於這樣的判斷,這可以告訴它是在“車內”還是“家中”的上下文中。 正因為如此,

……然後該設備可以消除語音輸入的歧義,例如“方向”,其中該術語可以解釋為“車內”上下文中的地理方向(例如,駕駛方向),以及“車內”上下文中的操作指南(例如,用於烹飪) “在家”模式。

2.在另一示例中,在移動計算設備處接收可指示多個命令的模糊用戶輸入可使其確定與移動計算設備相關聯的可指示移動計算設備當前位於何處的當前上下文。 這可能會影響基於該上下文提供的結果。

基於上下文消除搜索輸入歧義的優勢

該專利告訴我們遵循專利中描述的工藝的優點是:

允許用戶指示移動計算設備執行所需任務而不要求用戶遵守為所需任務提供輸入的所有手續。 隨著移動計算設備提供的特徵的增加,可能需要用戶以更大的特異性提供他們的輸入,以便輸入與預期特徵適當地相關聯。 但是,這種特殊性可能很麻煩且難以記住。 本文檔中所描述的方法、系統、技術和機制可以允許用戶使用比正式要求的特徵更少的特異性來提供輸入但仍然訪問預期特徵。

該專利是:

根據上下文消除輸入歧義
發明人:John Nicholas Jitkoff 和 Michael J. LeBeau
受讓人:谷歌有限責任公司
美國專利:9,966,071
授予時間:2018 年 5 月 8 日
提交時間:2016 年 7 月 1 日

抽象的

在一個實現中,一種計算機實現的方法包括在移動計算設備處接收指示多個命令中的一個以上的不明確的用戶輸入; 以及確定與移動計算設備相關聯的當前上下文,其指示移動計算設備當前位於何處。 該方法還可以包括通過基於與移動計算設備相關聯的當前上下文從多個命令中選擇一個命令來消除歧義的用戶輸入,並使與所選命令的執行相關聯的輸出由移動計算設備提供.

今天早上我和一個谷歌演講者(設備)討論了一個“嘿谷歌”,但在谷歌最近的谷歌 I/O 大會上宣布了一些變化之後,我沒有要求我說這個熱門詞。 我問了體育成績,然後問了一些關於他們的問題。 我仍在學習如何最好地與我的 Google Now 揚聲器版互動,但這很有趣。 (當我們要求某事時說請有用嗎?)當我開始閱讀這篇專利中的這段話時,我想起了早上的談話:

本文檔描述了用於消除移動計算設備(例如,移動功能電話、智能電話(例如,iPhone、BLACKBERRY)、個人數字助理(PDA)、便攜式媒體播放器(例如, 、iPod)等)。 隨著移動計算設備提供的功能增加,移動計算設備識別的命令數量也會增加。 例如,移動計算設備上的每個特徵可以註冊一個或多個相應的命令,用戶可以鍵入、說話、手勢等來使該特徵在移動計算設備上啟動。 然而,隨著識別的命令數量的增加,命令會收斂,並且更難以區分用戶輸入的多個命令中的哪一個。 語音輸入的問題被放大了。 例如,提供有響亮背景噪聲的語音輸入可能難以準確解釋,因此可能映射到移動計算設備識別的不止一個命令。 例如,語音輸入“example”可以被解釋為“egg sample”、“example”或“exam pull”等。 作為另一個示例,命令“go-to”可以表示地圖應用程序的“前往[地理位置]”,以及媒體播放器的“前往[藝術家/專輯/歌曲]”。

在我們努力學習如何最好地與我們的設備、揚聲器和移動設備互動以從 Google 獲得最佳結果的同時,Google 也在努力學習如何最好地與我們互動,並確保我們在提出要求時被理解某物。 這項關於消除搜索輸入歧義的專利朝著這個方向邁出了幾步。 正如它告訴我們的那樣:

使用這裡描述的技術,響應於接收到歧義的用戶輸入,移動設備(和/或移動計算設備的用戶)的當前上下文可以被確定並且用於消除歧義的用戶輸入。 移動計算設備的當前上下文可以包括與移動計算設備和/或移動計算設備的用戶相關聯的各種信息。 上下文可以在設備外部並表示設備周圍的實時狀態,例如當前物理位置(例如,家、工作場所、汽車、位於無線網絡“testnet2010”附近等)、方向和速率設備行駛的速度(例如,以每小時 20 英里的速度向北行駛)、當前的地理位置(例如,在第 10 街和馬凱特大道的拐角處)和環境噪音(例如,低沉的嗡嗡聲、音樂、等等。)。 上下文也可以是設備內部的,例如即將到來的和/或最近的日曆約會(例如,在 2010 年 7 月 29 日下午 2:30 與約翰會面)、設備中時鐘上的時間和日期(例如,2010 年 7 月 29 日下午 2:00)、最近的設備活動(例如,發送給 John 的關於 2:30 會議的電子郵件)以及來自移動計算設備相機的圖像。

我經常使用我的手機導航到一些地方,並希望能夠與我的手機通話,以更改我導航到的位置,例如如果我決定開車經過我原來的目的地先去另一家商店,並且想要關閉導航,讓它停止告訴我掉頭返回第一個目的地。

這項專利值得花時間仔細研究,因為它確實提出了一些有趣的想法,這些想法可能會影響設備基於上下文的工作方式,正如它在這裡告訴我們的那樣:

識別出不明確的用戶輸入後,在步驟B,可以確定移動設備的當前上下文。 當前上下文包括描述在接收到輸入時移動計算設備和/或移動計算設備的用戶的當前狀態和/或周圍環境的信息。 例如,當前上下文可以包括與移動計算設備和用戶有關的各種信息,例如關於周圍物理環境的信息(例如,可用網絡、與附近其他計算設備的連接、地理位置、天氣狀況、附近的業務、環境噪聲的音量、環境光的水平、移動設備的相機捕獲的圖像等)、移動計算設備的當前狀態(例如,速度、觸摸屏輸入激活、音頻輸入激活、鈴聲開/關等)、時間和日期信息(例如,一天中的時間、日期、日曆約會、星期幾等)、用戶活動(例如,最近用戶活動、習慣性用戶活動)等。當前上下文可以由移動計算設備使用位於移動計算設備本地和/或遠程的數據和傳感器來確定。

涉及根據上下文消除搜索輸入歧義的更改

曾幾何時,當您針對查詢優化頁面時,很可能是有人坐在辦公桌前使用台式計算機或膝上型計算機執行的查詢。 現在,它可能是在汽車、公共汽車或火車上,或者在商店的過道或咖啡館裡的某個人。 當他們搜索“紐約,紐約”時,可能是因為他們想要交通路線、聽一首歌或閱讀網頁以了解市中心正在發生的事情。

我記得我姐姐在曼哈頓上學時去看望她,她建議我們看看那天這座城市是否有街頭節日。 她拿起電話撥通了411,詢問接線員。 這大約是在萬維網出現之前的 5 年,她確實從運營商那裡得到了答案,這讓我感到非常驚訝。 我沒想到這些答案來自那個來源。 我希望現在能夠找到一個可以告訴我這些信息的網頁,但沒想到在未來的某一天能夠使用計算機或手機找到這樣的信息。 世界正在發生變化。

對於移動設備和搜索引擎將給我們帶來的變化,您準備好了嗎?