Google 是否使用 Schema 為精選片段編寫答案段落?
已發表: 2019-01-25回答段落和精選片段
直到現在,關於特色片段的這個問題還沒有答案,專利授權說可以根據顯示存在結構化數據(例如模式)和非結構化數據的分數來選擇答案段落(如散文段落)提供答案。
谷歌上週獲得了一項專利,描述了在問答方面的搜索引擎查詢處理。

該專利告訴我們是什麼讓問答精選片段的結果與眾不同且獨一無二:
搜索系統的用戶經常搜索特定問題的答案,而不是資源列表。 例如,用戶可能想知道特定地點的天氣如何、股票的當前報價、州的首都等。當收到問題形式的查詢時,一些搜索引擎可能會執行響應查詢的問題格式的專門搜索操作。 例如,一些搜索引擎可以以“答案”的形式提供響應於此類查詢的信息,例如以問題的“一個框”的形式提供的信息。
我想起了我在 2006 年寫的關於 Google 字典結果的文章“查看 Google 定義”。 對單框類型答案的提及也讓我想起了谷歌的單框專利,它告訴我們谷歌在決定返回單框結果時可能會查看的大量數據。 我在 2017 年谷歌更新他們的單盒專利的帖子中寫了一篇關於單盒專利的更新。
什麼是候選答案段落?
這項關於谷歌問答的新專利引入了候選答案段落的概念,他們在這個候選答案段落專利的開頭為我們定義了這個概念:
一些問題查詢更適合解釋性答案,也稱為“長答案”或“答案段落”。 例如,對於問題查詢[為什麼天是藍色的],解釋瑞利散射的答案很有幫助。 可以從包括與問題和答案相關的文本(例如段落)的資源中選擇這樣的答案段落。 對文本的部分進行評分,並選擇得分最高的部分作為答案。
了解 Google 如何對答案段落進行評分可能會增加您在頁面上創建答案段落的機會,Google 可能會用它來回答諸如 [為什麼天是藍色的?]
谷歌如何對答案段落進行評分?
首先,谷歌查看收到的查詢,看看它似乎在尋找什麼類型的響應。 它是一個正在尋找特色片段和“確定響應查詢的數據識別資源”的問題查詢嗎?

可以根據以下因素對答案來自的數據資源進行評分:
該資源包含多個段落,每個段落都是有資格作為答案包含在內的內容。
可以根據“選擇標準”來判斷這些段落,該標準可能會著眼於:
- 是否有響應查詢的結構化數據(如架構)和非結構化內容(如網頁上的文本)。 作為答案。
- 資源是否與除了回答段落之外可能包含的搜索結果分開和不同?
為什麼 Google 的答案段落需要結構化和非結構化內容?
該專利將此要求稱為專利背後的工藝優勢。
通過要求兩者,谷歌告訴我們非結構化內容允許搜索者接收“散文類型的解釋”,而結構化內容允許返回事實信息,這意味著答案可以是散文和事實的組合,這可以與搜索者試圖找到的內容非常相關。

使用答案段落解決搜索者的信息需求
該專利告訴我們,當他們對候選答案段落進行評分時,他們會查看依賴查詢和查詢獨立的信號。
查詢相關信號是基於段落與查詢中用於查找段落的術語的相關程度的信號。 因此,一個關於拉米·馬利克在電影《波西米亞狂想曲》中演唱的問題是否會根據查詢相關信號獲得更高的分數,如果它提到演員、電影,並且是關於他唱歌的。
查詢獨立信號是那些查看與查詢術語相關性之外的其他事物的信號,例如指向段落所在頁面的鏈接數量,或者如果問題涉及非常及時的新聞,該頁面可能有多新鮮和及時(例如《波西米亞狂想曲》贏得金球獎最佳劇情片。)
該專利表示,這種基於查詢相關和查詢無關信號的評分告訴我們:
可以基於最相關資源的集合對查詢相關信號進行加權,這傾向於顯示比在更大的資源語料庫上評分的段落更相關的答案段落。 這反過來又減少了處理要求,並在查詢時方便地進行評分分析。
較早的專利談到為包含問題的查詢提供答案時說,他們正在尋找來自高權威網站的答案,但沒有提供那麼多的細節。 我在帖子中寫了其中之一,直接答案 - 意圖查詢的自然語言搜索結果。 很難相信我是五年前寫的。 從那以後,我一直在等待某件事說 Google 可能正在查看結構化數據以尋找這些問題的答案。
這項新授予的專利最初於 2015 年提交。通過告訴我們,在我們的頁面上使用結構化數據會增加顯示精選摘要的機會,這為在您的網站上包含結構化數據提供了另一個很好的理由。
該專利是:
候選人回答段落
發明人:Steven D. Baker、Srinivasan Venkatachary、Robert Andrew Brennan、Per Bjornsson、Yi Liu、Nitin Gupta、Diego Federici 和 Lingkun Chu
受讓人:谷歌有限責任公司
美國專利:10,180,964
授予時間:2019 年 1 月 15 日
提交時間:2015 年 8 月 12 日
抽象的
用於生成候選答案段落的方法、系統和裝置,包括在計算機存儲介質上編碼的計算機程序。 在一個方面,一種方法包括接收被確定為識別被確定為響應於該查詢的資源的問題查詢數據的查詢; 對於排名靠前的資源子集中的每個資源:識別資源中的多個通道單元; 將一組段落單元選擇標準應用於段落單元,每個段落單元選擇標準指定將段落單元包含在候選答案段落中的條件,其中段落單元選擇標準的第一子集應用於結構化內容,而第二子集段落單元選擇標準適用於非結構化內容; 從滿足該組文章單元選擇標準的文章單元中生成一組候選答案文章。
添加於 2020 年 10 月 15 日 - 如果您對 Google 如何在頁面上查找問題和對這些問題的答案感興趣,我還寫了一些關於答案段落的其他帖子,這些文章值得一讀,並對答案段落進行評分以確定將哪些作為精選片段顯示。 以下是這些帖子:
- 2020 年 9 月 23 日 - 精選摘要答案得分排名信號
- 2020 年 10 月 9 日 - 按上下文調整精選摘要答案
- 2020 年 10 月 14 日 - 對答案段落評分的加權答案條款
