Google 如何使用上下文歷史預測查詢意圖

已發表: 2018-11-29

了解搜索背後的查詢意圖

Andrea Broder 的網絡搜索分類 (pdf) 是關於信息查詢、交易查詢和導航查詢之間的差異。 在針對查詢詞優化頁面時,了解這些很重要。

您是否希望教授人們有關概念或主題的知識? 如果是這樣,您將他們的查詢視為信息查詢。

您是否正在創建一個旨在銷售商品或服務的頁面? 然後,您將他們的查詢視為事務性的,並使他們能夠購買或預訂某物。

用於幫助某人找到他們知道的頁面的查詢,因為他們以前看過它,或者期望它存在,並且他們期望返回給他們的特定頁面,稱為導航查詢。 當有人搜索特定產品或品牌的名稱時,他們會對該產品或品牌的主頁感到滿意。

我開始在一個網站上做 SEO 作為內部 SEO 幫助人們合併業務。 該頁面在諸如“在特拉華州成立公司”之類的詞中排名很高。 當它成為特拉華州公司分部網站之後的該術語排名第二的網站時,它獲得了更多轉化,該網站僅提供信息,不為訪問者提供在特拉華州開展業務的機會。

人們會在搜索結果中看到公司部網站,訪問它並了解流程,然後返回到搜索結果,並訪問交易網站,比如我的,他們可以在那里合並。 這是一個排名最高的網站並不是優勢的例子。 了解此類查詢背後的意圖有助於解釋發生這種情況的原因。

更多關於查詢意圖

另一篇關於搜索和查詢背後意圖的論文是一個簡單的分類模型
Web Queries by User Intent (pdf) 作者:D. Irazu Hernandez、Parth Gupta、Paolo Rosso 和 Martha Rocha。 它對查詢意圖做出了一些值得重複的有趣陳述,包括以下內容:

基於用戶意圖的查詢分類旨在對查詢背後的需求進行分類。 Jansen 和 Booth [4] 將用戶意圖定義為與 Web 搜索引擎交互中的情感、認知或情境目標的表達。 基於用戶意圖的查詢分類與傳統的文本分類不同,主要有兩個問題[2]:第一,Web 查詢通常很短; 其次,許多查詢是不明確的,比一個查詢屬於多個類別是常見的。 例如,對於“歌劇院門票”的查詢,很難確定用戶是想了解網站還是購買門票參加活動。 大多數工作通常涉及手動分類的少量查詢。

雖然那篇論文提供了一些更好地理解查詢意圖的想法和方法,但我喜歡它如何構建它旨在解決的問題。 上週發布的谷歌專利申請描述了搜索引擎如何嘗試理解搜索的上下文,以更好地理解搜索者查詢背後的意圖。

谷歌基於上下文預測查詢意圖的專利

這不是一個新概念,我們可以將意圖與查詢相關聯,Google 可能會嘗試這樣做以了解用戶在搜索什麼,然後在搜索框中輸入一些單詞。 這項專利的新鮮之處在於谷歌可能會付出多少努力來嘗試理解查詢意圖。 當有人在午餐時間在 Google 中輸入“pizza”這個詞時,我們可以猜測他們可能對吃東西感興趣,並且可能正在尋找一個可以在那裡取一些比薩餅,或者可能會送到他們手上的地方。

他們可能不太可能在整個時間段內尋找比薩餅的歷史(但他們可能會。)可能需要多少上下文才能為大多數搜索做出這樣的假設?

像大多數專利一樣,谷歌的這項新專利告訴我們它打算解決的問題:

如果搜索查詢不是嚴格定制的,或者如果用戶沒有提供超出查詢的附加信息的方式,計算設備可能會返回過多的信息; 用戶很難找到一些最有趣或最相關的信息。 用戶可能會感到壓力和/或浪費寶貴的時間和資源,將非常詳細的查詢輸入到計算設備中,導致計算設備執行多次搜索,或篩選大量搜索結果,以獲得完成特定任務所需的信息.

如果該搜索者餓了並且很快想要一些比薩餅,那麼如果搜索引擎能夠確定附近可以提供美味比薩餅的位置,他們對搜索引擎的滿意度可能會迅速提高。

使用上下文來預測查詢意圖

查詢意圖上下文歷史專利流程圖

查詢意圖可用於使搜索引擎能夠調整從搜索返回的搜索結果,因此與從搜索返回的其他信息相比,滿足意圖的信息得到強調。

該專利為我們提供了一個示例,即有人搜索他們剛剛購買了電影票的電影。 系統可能能夠查看日誌數據,並確定搜索者已經購買了該電影未來放映的門票,並且可能會調整結果,以便“電影放映時間的排名低於其他信息(例如,評論、紀念品、瑣事等)關於特定電影。”

我們熟悉搜索引擎收集有關我們執行的先前搜索的信息以個性化我們可能看到的結果,但這種旨在減輕壓力或避免浪費時間的上下文的使用是不同的。

該專利申請告訴我們,只有在獲得使用搜索引擎分析該信息的人的許可後,它才能查看此類上下文信息。 該專利提供了其他示例,說明他們如何使用上下文信息,這些信息可能會改變他們可能向搜索者顯示的搜索結果的順序。

請記住,這仍然是一項待批的專利申請,可能尚未實施,但可能會在未來的某個階段實施,而且 Google 很可能正在關注上下文以預測查詢背後的意圖,並且可以使用諸如一天中的時間、一年中的哪一天和位置之類的東西。

該專利確實告訴我們它將限制某些信息的使用,例如任何可能洩露有關搜索者的個人身份信息的信息。

可以在以下位置找到此新公佈的專利申請:

預測搜索特定上下文的意圖
刊號:20180336200
出版日期:2018 年 11 月 22 日
申請人:谷歌公司
發明人:Yew Jin Lim、Joseph Linn、Yuling Liang、Carsten Steinebach、Wei Lwun Lu、Dong Hyun Kim、James Kun、Lauren Koepnick 和 Min Yang

抽象的:

描述了一種計算系統,其基於由一組計算設備執行的用戶發起的動作,使用從計算設備接收的特定搜索查詢來確定搜索的意圖。 計算系統通過強調滿足意圖的信息,基於意圖調整使用搜索查詢從搜索中獲得的搜索結果的至少特定部分。 計算系統向計算設備發送調整的搜索結果的指示。

上下文歷史示例

該專利申請告訴我們一些可能用於預測查詢意圖的不同類型的上下文信息,包括他們稱為感興趣主題的事物列表,可以通過以下方式找到:

  • 用戶興趣圖或其他類型的數據結構
  • 與用戶相關聯的聯繫信息(例如,用戶的個人聯繫信息以及有關用戶朋友、同事、社交媒體關係、家人等的信息)
  • 搜索歷史
  • 位置記錄
  • 長期和短期任務
  • 日曆信息
  • 應用程序使用歷史
  • 購買記錄
  • 收藏夾
  • 書籤
  • 其他信息

除了這些個人興趣類型的東西之外,它們還包括其他上下文信息。

關於計算設備的運行狀態(他們在這裡深入挖掘。):

  • 開關位置
  • 電池電量
  • 設備是否插入牆上插座或以其他方式可操作地耦合到另一個設備和/或機器
  • 用戶身份驗證信息(例如,當前已通過身份驗證的用戶或設備的當前用戶)
  • 設備是否在“飛行”模式、待機模式、全功率模式下運行

上下文信息的其他示例:

  • 聲紋指紋
  • 視頻指紋
  • 一個位置
  • 運動軌跡
  • 一個方向
  • 一個速度
  • 機構名稱
  • 街道地址
  • 一種地方
  • 建築
  • 天氣狀況
  • 交通狀況
  • 一個日曆事件
  • 與地點和/或時間相關的會議或其他事件
  • 在特定時間查看的網頁地址
  • 在特定時間在網頁的數據字段中輸入的一個或多個文本條目,包括搜索或瀏覽歷史記錄
  • 在特定時間購買的產品
  • 產品願望清單
  • 產品註冊
  • 由計算設備在不同地點和時間訪問或廣播的音頻和/或視頻
  • 電視或有線/衛星廣播由計算設備在不同地點和時間訪問或在該計算設備存在的情況下廣播
  • 有關計算設備在不同位置和時間訪問的其他服務的信息。

我們看到該專利中出現了其他類型的信息,例如移動位置歷史記錄,我之前已經詳細介紹過。

該專利申請告訴我們它可以如何索引此類上下文,以使其能夠搜索可能與查詢相關的信息,從而補充或修改此類查詢的搜索結果。

它還告訴我們,它可能維護搜索歷史,與搜索引擎可能維護的有關搜索和運行搜索的設備的上下文歷史分開。 谷歌可能不會詢問搜索者搜索背後的意圖,但聽起來他們可能能夠了解搜索背後的人和機器,從而使他們能夠預測搜索結果中顯示的內容。

機器學習確定查詢意圖

一項谷歌專利告訴我們其背後的過程涉及收集大量信息。 它可以在過濾掉不必要的信息後進行預測,以便它可以“定義一個狹窄的上下文,從而可以推斷出搜索查詢的真實意圖”。

該專利還告訴我們如何使用深度學習來幫助完成這項任務:

預測模塊可以執行接收作為輸入的機器學習模型(例如,深度學習模型):搜索查詢(或搜索查詢的一部分)和從上下文模塊接收的當前上下文。 機器學習模型可以使用當前上下文的搜索查詢生成搜索意圖的指示(例如標籤或其他標識符)作為輸出。

結論

該專利提供了有關預定義意圖(如旅行)和意圖分數的詳細信息,以及用戶數據如何訓練機器學習有關查詢意圖的信息。

這是一項專利申請,谷歌可能沒有實現創建此類上下文歷史並根據它們調整搜索結果。 此外,請記住,該專利表示他們可能會在分析此類上下文數據之前請求許可。

根據我上面分享的上下文示例重複查詢意圖:

  1. 你買電影票
  2. 你搜索那部電影
  3. 搜索引擎會注意到您的購買記錄
  4. 您的搜索結果可能會調整為向您顯示有關該電影的瑣事、紀念品和新聞,而不是向您顯示同一部電影的其他放映時間

雖然谷歌正在深入跟踪搜索歷史和位置歷史,但這種對查詢意圖的理解和上下文歷史的使用可能比搜索個性化更能改變排名。