Google 如何選擇 How-to 查詢的答案
已發表: 2020-03-12Google 如何響應 How-To 查詢
https://gofishdigital.com/google-how-to-queries/
谷歌已經發布了一項關於他們如何處理 how-to 查詢的專利
請務必閱讀 Google 開發人員關於如何使用 HowTo 結構化數據的頁面,以獲取有關 Google 如何建議開發人員實施 How-to Structured Markup 的具體信息。 該頁面為我們定義了 How-to 標記的目的:
操作指南會引導用戶完成一組步驟來完成任務,並且可以展示視頻、圖像和文本。 例如,“如何系領帶”或“如何為廚房後擋板鋪瓷磚”。 如果必須按順序閱讀 howto 中的每個步驟,這是一個好跡象,表明 HowTo 結構化數據可以使您的內容受益。 當 how-to 是頁面的主要焦點時,HowTo 結構化數據是合適的。
谷歌已獲得一項關於“How-to”查詢的專利,看起來值得分享以炫耀他們可能會考慮炫耀 How-to 查詢的答案。
正如專利的描述立即告訴我們的那樣:
本規範通常旨在提供基於對許多來源的分析來完成任務的分步說明。
開發者的頁面沒有包含專利包含的一些信息,它告訴我們谷歌如何分析許多來源以提供“基於對這些來源的分析完成任務的分步說明”。
這是響應 Google 的 how-to 查詢過程背後的 How-to:
- 可以識別與執行任務相關的操作方法查詢和與操作方法查詢相關的源
- 可以確定可以使用戶能夠執行任務的步驟
- 步驟的確定可以基於對與 how-to 查詢相關的來源的分析
- 可以確定來源的置信度
- 這些步驟可能與數據庫中的 how-to 查詢相關聯
- 可以響應搜索者提交的操作方法查詢(或類似查詢)向搜索者提供這些步驟
- 對與 how-to 查詢相關的來源的分析可以包括比較不同步驟集的組件和識別共同元素以確定步驟集
更詳細地說,how-to 查詢過程的步驟包括:
- 確定與執行任務相關的操作方法查詢
- 識別響應 how-to 查詢的源
- 確定多個已識別來源中的一個或多個的置信度量,給定來源的置信度量指示給定來源在為如何查詢的任務提供步驟方面的有效性
- 根據已識別來源的置信度確定執行任務的步驟
- 將步驟與操作方法查詢相關聯並存儲響應操作方法查詢而提供的步驟
此過程背後的一些附加功能可能包括:
在查找來源時,一個可能是用戶手冊,並且該用戶手冊可被視為來源之一。 執行任務的一組步驟可以基於用戶手冊。
How-to 查詢中響應背後的步驟
響應 how-to 查詢的方法可能進一步涉及:
- 從多個來源確定步驟
- 識別每組步驟中的步驟
- 根據這些步驟確定執行任務的步驟
- 確定來自源的步驟之間的相似性度量
- 根據相似性度量確定要顯示的步驟
相似性度量可以基於:
- 關鍵字匹配
- 詞組匹配
- 解析樹匹配
- 分佈相似度分數
- 編輯距離分數
在一些實施方式中,該方法還可以包括:
- 為每組步驟中的每個步驟確定一個表示該步驟置信度的相關性分數
- 根據相關性分數從一組步驟中識別一個或多個步驟
如何在 How-To 查詢響應中選擇步驟
可以基於源的置信度度量從源中選擇所示出的執行任務的步驟。
一個來源的置信度量可能基於:
- 給定來源的排名
- 訪問給定來源的頻率
- 給定來源的鏈接數
- 給定來源的凝聚力
- 與給定來源相關的用戶反饋
可以為響應於提交的查詢而提供的一組步驟確定質量度量。
還可以基於搜索者的查詢表明希望接收用於完成由查詢所指示的任務的步驟的置信度來為提交的查詢確定查詢分數; 並且決定顯示響應查詢的步驟將滿足搜索者的需要。
該方法還可以包括:
- 確定執行任務所需的一項或多項技能水平
- 執行任務的持續時間
- 執行任務所需的工具列表
- 執行任務所需的材料清單。
可以在以下位置找到有關響應操作方法查詢的專利:
確定響應 how-to 查詢的一組步驟
發明人:Kerwell Liao、Nikhil Sharma、LaDawn Risenmay Jentzsch 和 Jennifer Ellen Fernquist
受讓人:GOOGLE LLC
美國專利:10,585,927
授予時間:2020 年 3 月 10 日
提交時間:2017 年 3 月 2 日
抽象的
與基於對多個來源的分析提供用於完成任務的步驟相關的方法和裝置。 可以識別與執行任務相關的操作方法查詢和與操作方法查詢相關的多個源。 與執行任務相關的一組步驟可以基於與如何查詢相關的多個源的分析來確定,可選地包括確定多個源的置信度度量。 該組步驟可以與數據庫中的操作方法查詢相關聯。 該組步驟可以響應於用戶提交的操作方法查詢而提供給用戶。 在一些實施方式中,對與操作方法查詢相關的多個源的分析可以包括比較不同步驟集合的組件並識別共同元素以確定步驟集合。
How-to 查詢中的任務術語和查詢術語
該專利指出了他們所稱的任務術語和查詢術語的一些示例:
- “如何從衣服中去除焦油”是一個操作方法查詢,其中包括任務術語(“從衣服中去除焦油”),用於識別從衣服中去除焦油的任務,並包括表示希望從衣服中去除焦油的查詢術語(“如何”)可用於去除衣服上的焦油的信息。
- “我如何更換汽車輪胎”是一個操作方法查詢,包括識別更換汽車輪胎任務的任務術語(“更換汽車輪胎”)並包括指示需要可用於更換汽車輪胎的信息。
Google 如何識別 How-to 查詢
1. 關鍵術語或關鍵短語的使用——這些可能包含在查詢中。 例如,查詢的前綴可以與一個或多個查詢詞匹配,例如:
- “如何”
- “我如何”
- “怎麼樣”
- “有人知道嗎”
- “我在哪裡可以找到指示”
- “我在哪裡可以得到指示”
- “誰能告訴我”
- “教我”
- “告訴我怎麼做”
- “如何”
- “在哪裡”
- “指示”
- “?”
2. 使用帶有查詢詞的前綴和該前綴後面的附加詞,這可能涉及將查詢詞與查詢詞匹配以及將查詢詞與任務詞匹配。 例如:
- 查詢“更換漏氣的輪胎?” 基於術語“更換漏氣輪胎”與任務短語“更換漏氣輪胎”的匹配以及術語“?”的匹配,可以將其識別為操作方法查詢。 到查詢詞“?”
- 查詢“remove tar instructions”可以基於術語“remove tar”與任務短語“removing tar”的匹配以及術語“instructions”與查詢術語“instructions”的匹配而被識別為how-to查詢

3.可以使用查詢詞與查詢詞和/或任務詞之間的精確匹配和/或軟匹配。
可以經常包括在操作方法查詢中的關鍵術語和關鍵短語(包括任務術語和/或查詢術語)可以存儲在內容數據庫中。
任務術語可以根據以下條件確定:
- 詞性標註
- 語義分析
- 句法分析
- 其他技術
4. 查詢中包含的查詢詞和任務詞的頻率可用於確定查詢是否為操作方法查詢。

與查詢中的關鍵術語的頻率和/或跨另一文檔語料庫的頻率相關的數據可以可選地存儲在內容數據庫中並且用於確定查詢是如何做的查詢。
- 如果任務術語“從頭開始製作蛋糕”在過去的查詢中出現的頻率至少達到閾值水平,則“如何從頭開始製作蛋糕”可能僅被標識為操作方法查詢。
5. 提交查詢的頻率可用於決定查詢是否為操作方法查詢。
該頻率可以存儲在內容數據庫中。 如果已以至少閾值頻率水平提交查詢,則可以將查詢標識為操作方法查詢。
- “我如何從頭開始製作蛋糕”可以被視為一個如何查詢,如果它及其變體在過去的幾個查詢中滿足查詢的閾值級別。
6. 類似的 how-to 查詢可能會相互關聯
I相似的how-to查詢之間的關聯可以存儲在內容數據庫中。 類似的 how-to 查詢是表示需要信息來執行類似任務的查詢,例如:
- “如何去除衣服上的焦油”
- “我怎樣才能去除衣服上的焦油?”
- “如何去除織物上的焦油”
- “去除焦油污漬”
- “染色剋星-焦油”
可以通過比較各自的查詢術語和/或來自它們的任務術語來識別類似的操作方法查詢。
7. 與 how-to 查詢相關的搜索結果和/或搜索結果文檔的分析
可以分析響應查詢的SERP以確定搜索結果是否具有提供與執行由查詢標識的任務相關的步驟的文檔。
因此,可以分析排名第一的 N 個搜索結果,以查看其中的閾值數量是否包括有關執行由查詢標識的任務的步驟。
可以確定那些搜索結果中的頁面具有查詢的最高選擇評級,也可以分析該查詢以查看其是否提供關於執行由查詢標識的任務的步驟。
8. 類似的查詢可能會使用一些額外的方法
這些可能涉及:
- 關鍵字匹配
- 詞組匹配
- 短語的上下文相似度匹配
9.術語之間的相似性可以通過其他方式確定
這些可以包括:
外部資源(如詞彙數據庫)中術語之間的語義距離或路徑長度。 詞彙數據庫可以包括關鍵術語和/或短語,包括單詞、名詞、形容詞、動詞、副詞等以及它們的概念和/或語義相互關係。 在一些實施方式中,可以基於關鍵術語和/或短語的含義和/或它們與其他關鍵術語和/或短語的句法關係來對關鍵術語和/或短語進行分組。 在一些實現中,諸如內容數據庫之類的數據庫可以包括分佈相似的查詢詞和/或任務詞以及它們對應的分佈相似度分數。 例如,通常出現在相似上下文中的短語可能被認為具有相似的含義。 例如,在文檔集合(例如 HTML 網頁)中與與第二短語的單詞相同的詞共同出現的第一短語可以被認為在分佈上與第二短語相似。 將兩個或更多個查詢標識為相似可以在本文描述的方法的一個或多個步驟中使用。 例如,在確定查詢的集體頻率是否足夠大以構成將此類查詢標識為操作方法查詢並確定執行由此類查詢標識的任務的一組步驟時,可以對查詢進行分組。 此外,例如,用於確定步驟集合和/或與此類源相關聯的任何排名的源的標識可以基於多個類似查詢中的每一個的源的排名。 此外,例如,將一組步驟與如何做查詢相關聯可以包括將這組步驟與類似的如何做查詢相關聯。
一些其他類型的操作方法查詢
該專利描述了搜索者可能會搜索 How-to 查詢的其他一些情況。 這些可以包括:
- 在車輛上安裝更換零件
- 安裝複雜的軟件
- 執行與搜索相關的任務(“我如何在城市中找到新房子?)
- 與地圖相關的位置查詢
與來源相關的置信度措施
源的置信度度量可以指示該源在提供正確步驟以完成特定操作方法查詢方面的有效性。
一個來源的置信度量可能基於:
- 給定源的及時性(指示上次更新源的時間戳。)
- 鏈接到給定來源的文檔數量(表明來源的流行度或權威價值)
- 來自給定源的傳出鏈接數(表示源的全面性。)
- 如果基於傳出鏈接,也可以基於傳出鏈接的選擇率
- 分析給定來源的凝聚力
- 給定來源與操作方法查詢標識的任務的關聯程度
- 錨文本證據(如果頁麵包含帶有錨文本的鏈接,該鏈接與頁面上涵蓋的任務的信息相似。)
- 訪問給定來源的頻率
- 對給定源的信息噪聲比的分析。 這種干擾可能包括 HTML 標籤、空白、無關鏈接、贊助廣告或覆蓋無關內容的內容
- 為完成 how-to 查詢任務提供的步驟數(步驟數越多可能表示全面性。)
- 基於與給定來源相關聯的作者和/或出版商(例如,如果操作方法查詢與技術任務相關,那麼作者和/或出版商是否是此類技術任務的公認權威?)
- 基於作者的來源和作者的屬性,例如適當的技術資格和/或經驗,以提供與 how-to 查詢相關的權威信息)
- 此處討論的技術可以隨意組合
其他方法
- 操作方法查詢可以使用在描述如何執行任務的說明手冊中找到的答案,並且該手冊可能具有最高的置信度度量作為執行任務的步驟的來源
- 一個或多個來源(排名靠前的來源)可用於包括執行任務的步驟,其中一些步驟來自一個來源,一些來自另一個來源
- 一些額外的步驟可能作為可選的
- 某些步驟可能會顯示並標記為不太理想
- 信息可以在一段而不是一組步驟中顯示
- 自然語言處理技術可用於將段落或其他文本段分割成執行至少一部分任務的步驟

該專利還提供了有關考慮步驟的相似性的信息,這些步驟可能包含在響應操作方法查詢的任務完成中,以及有關步驟的相關性分數的信息。 步驟的相關性分數可以部分地基於識別該步驟的源的置信度度量。 因此,來自備受推崇的技術手冊的步驟可能具有更高的相關性分數。
一組步驟的相關性分數可以基於識別對應於執行任務所需的一組步驟的步驟的源數量。
完成任務的各個步驟可能基於置信度評級,例如“高置信度”、“中等置信度”。 和“信心不足”。 (基於這些步驟在源中出現的頻率,表明一個步驟是必需的步驟。
因此,步驟的相關性可能基於來源的置信度和包括這些步驟的來源數量。
這些步驟必須滿足閾值相關性分數才能作為內容數據庫中的步驟被包括在內,這些步驟可能來自對 how-to 查詢的回答。
如何查詢答案的屬性
響應於如何查詢,與一組步驟相關聯的屬性可以被識別並與那些步驟一起顯示。 示例可以包括:
- 一組步驟的標題(例如,“如何更換汽車輪胎”)
- 技能水平(例如,達到駕駛年齡的人)
- 估計所需時間(例如,二十五分鐘)
- 所需工具(例如千斤頂和扳手)
- 執行任務所需的材料
- 與確定的一組步驟相關聯的一個或多個來源(例如,用戶手冊)
- 一個或多個警告聲明(例如,將汽車停在水平面上,在輪胎後面放置止動器以防止滾動,應用手製動器)。
源可以包括該組步驟所基於的和/或被識別為符合一個或多個步驟的源。
該專利包括有關可能與步驟相關聯的屬性的更多詳細信息,以及每個步驟的質量度量以及可能與一組步驟相關聯的每個屬性。
它還告訴我們可能與步驟相關的標籤,例如“最佳猜測”和“最高置信度”或“最低置信度”。
How-to 查詢要點
我已經包含了這項專利的許多不同方面,但它有很多細節,我沒有捕捉到所有內容。
閱讀專利以了解推薦的內容,希望這篇文章能讓您更輕鬆地瀏覽專利。
在專利背後的過程中,我發現非常有趣的一件事是,在比較有關任務的不同信息源以及完成這些任務的步驟方面需要付出多少努力。
我認為這有助於理解為什麼某些答案可能比其他答案更好。
