如何選擇和創建豐富的結果(授予)

已發表: 2018-09-25

於 2019 年 12 月 17 日添加此帖子所涉及的專利已於今天獲得授權,可在與用戶搜索查詢相關的豐富結果中找到

Google 圖書索引的歷史

在 1999 年 Google 的第一個語義搜索發明獲得專利中,我寫了關於 Google 創始人 Sergey Brin 的一項發明,關於一種稱為 DIPRE(雙迭代模式關係擴展)的算法。 它首先列出了五本書,以及有關這些書的信息,例如:

  • 出版商
  • 出版資料
  • 長度
  • 作者

它使用爬蟲在網絡上搜索列出這些書籍的站點,在找到它們並為它們索引相關信息後,它會收集可能在同一站點上列出的其他書籍的事實。

因此,當 Google 推出另一項關於收集有關書籍的類似信息並在富媒體搜索結果中顯示該信息的專利時,這並不令人意外。

超過 10 個藍色鏈接; 谷歌顯示豐富的結果

那個新專利還沒有被授予,但之前的申請已經在 2015、2013 和 2010 年提交過。該專利是關於谷歌如何在 SERPS 中顯示信息豐富的結果,它讓我想起了谷歌博客2009 年發布的您可能以前看過的帖子:

介紹富媒體搜索結果

我見過的最接近豐富結果的專利是 Google 提出的關於豐富結果的專利,它為我們提供了引人注目的搜索結果,但並不是豐富的摘要。

Rich Results 上有一個 Google 自定義搜索幫助頁面,它告訴我們更多有關如何為諸如抓取您的網站、“評論、人員資料、產品、食譜、音樂和事件”等內容獲取豐富網頁摘要的信息。

但這似乎是我最早看到的有關 Google 富搜索結果的內容之一,它是關於炫耀有關書籍的其他信息。 該專利以這種方式告訴我們產生這種結果的動機:

搜索引擎的用戶經常尋找關於特定實體的信息,例如一本書,而不是單個資源的列表。

豐富的結果專注於滿足信息需求

該專利描述了它如何滿足這種信息需求,如下所示:

本規範描述了與響應於搜索查詢呈現豐富結果相關的技術,其中確定查詢與特定書籍或其他出版物有關。 豐富的結果是與查詢相關的內容的格式化呈現,其中包含來自多個信息集合的信息片段。 例如,富媒體搜索結果可能包含指向發布者網站、賣家網站或信息網站的鏈接。 富媒體搜索結果還可以包括關於出版商、出版年份、書中頁數以及書中的摘錄或概要的信息。

這也是詳細描述資源如何評分的信息來源,以便它顯示為對查詢的響應,該查詢可能會在​​請求有關特定書籍的更多信息時顯示豐富的結果。

  1. 從圖書資源中獲取響應查詢的搜索結果
  2. 確定排名第一的第一個結果的分數,該分數滿足相對於其他發表結果的相應分數的閾值
  3. 為第一發布結果生成富媒體搜索結果,包括第一發布結果和一個或多個網絡資源的數據,並將富媒體搜索結果與發布搜索結果一起提供

豐富的結果來自哪裡

該專利對作為豐富片段來源的網站有一些要求,它為我們列出了這些要求,如下所示:

  1. 如果第一出版結果的分數至少是出版物搜索結果排序中排名第二的圖書搜索結果的分數的閾值倍數,則該分數滿足閾值。 如果第一出版結果的分數至少是圖書搜索結果排序中排名第三或第四的出版物搜索結果的分數的閾值倍數,則該分數滿足閾值。
  2. 生成富媒體結果還包括獲取出版物的價格信息以及將價格信息包括在富媒體結果中。 價格信息將從具有 ISBN 的產品語料庫中獲得,並接收對應於 ISBN 的書籍的價格。
  3. 為產品語料庫提供 ISBN 包括從與第一次發布結果相關聯的數據中獲取 ISBN。
  4. 生成豐富的結果包括使用來自網絡資源的數據更正來自書籍資源語料庫的數據。 校正來自書籍資源語料庫的數據包括將來自書籍資源語料庫的數據與來自網絡資源的數據的一個或多個變體進行比較,並為豐富的結果選擇最流行的變體。
  5. 因此,看起來 Book Rich Results 背後的目的之一是提供對可能有興趣購買搜索書籍的人有用的信息。 最後一部分涉及使用來自網絡上的來源的事實信息,使用最流行的可用信息來更正有關這本書的數據。

    顯示在富媒體搜索結果中的信息

    一本書的 Rich Results 可能包含一些特定信息,例如:

    • 一個發布片段。 摘要是出版物摘錄或出版物摘要。
    • 該出版物的一名或多名作者。 更正來自書籍資源的語料庫的數據還包括使用來自網絡資源的數據更正出版物的一個或多個作者。
    • 指向出版物預覽的鏈接。
    • 相關網站的鏈接。
    • 鏈接到書商網站。
    • 出版物的出版商信息。 出版商的信息包括到出版物出版商網站的鏈接。 該方法還包括使用來自網絡資源的數據來校正發布者信息。
    • 圖書豐富結果的優勢

      許多專利告訴我們他們打算解決的問題,以及他們可能使用的流程。 在專利的描述部分,他們有時會列出遵循他們努力保護的專利過程可能涉及的優勢,這個豐富的結果專利也告訴我們它提供的優勢:

      1. 可以向用戶提供有關出版物的相關信息,以響應他們的查詢。
      2. 通過提供對與搜索查詢中引用的出版物相關的信息的輕鬆訪問的界面,可以為用戶提供更豐富的搜索體驗。
      3. 用戶可以輕鬆找到與其搜索查詢相關的出版物信息和網站。
      4. 可以為用戶提供方便的方式來購買他們搜索過的出版物。

      該專利的更新版本可以在這裡找到:

      與用戶搜索查詢相關的豐富結果
      美國專利申請:20180253498
      申請日期:2018年8月5日
      出版日期:2018 年 6 月 9 日
      申請人:GOOGLE LLC
      發明人:Matthew K. Gray、Gregory H. Plesur 和 Garrett H. Rooney

      抽象的:

      用於響應查詢觸發豐富結果的方法、系統和裝置,包括編碼在計算機存儲介質上的計算機程序。 在一個方面,一種方法包括接收查詢。 從第一語料庫獲得一個或多個搜索結果。 如果相對於其他搜索結果滿足閾值,則基於排名第一的搜索結果的分數觸發富搜索結果。 富搜索結果填充有關於從第二個語料庫獲得的排名第一的搜索結果的附加元數據。 為響應查詢而提供豐富的結果。

      Rich Results 專利的額外收穫

      如果您想查看專利的描述,則會有更詳細的說明。 例如,它告訴我們可能在 Web 上找到的有關書籍的資源可能包括:

        出版商的網站
      • 書評網站
      • 圖書銷售網站
      • 書籍概要網站
      • 它還告訴我們,關於出版物的信息可能取自多個這些資源,而富媒體搜索結果可能會將這些信息合併為出版物的富媒體搜索結果。

        該專利提供了查詢“最後一位中國廚師”的豐富結果示例。

        請注意,除了有關出版物本身的信息外,還有指向可能提供該書的書商和其他網站(例如出版商的網站)的鏈接。

        最後的中國廚師書豐富的成果

        該專利告訴我們搜索結果的索引和聚類以及發布索引,我認為關於富搜索引擎的這一部分值得分享,因為它告訴我們何時可能觸發某些富搜索結果以響應某些查詢:

        富結果引擎可以比較多個語料庫中的信息,以提高富結果中提供的信息的數據質量。 例如,富搜索引擎可以通過比較多個語料庫中書名的變體大小寫並選擇最流行的變體來確定書名的正確大小寫。 富結果引擎還確定是否應觸發富結果作為對發布查詢的響應的一部分。 例如,富媒體搜索引擎可能僅針對滿足特定流行度閾值的出版物觸發富媒體搜索結果。

        有關觸發富媒體搜索結果的受歡迎程度閾值的更多信息:

        搜索系統確定富搜索結果是否應該被觸發並與搜索結果一起呈現(320)。 在一些實施方式中,當書籍結果中排名第一的結果的得分顯著高於任何其他書籍結果時,搜索系統觸發豐富結果。

        除了觸發富媒體結果的特定查詢詞之外,來自可能與圖書結果中排名第一的結果相關聯的圖書資源的元數據記錄的信息可以確定富媒體結果是響應查詢而出現的。

        如果您對響應查詢而出現的富搜索結果背後的所有方面感興趣,包括如何僅針對某些查詢觸發富搜索結果(使用閾值),以及有關特定書籍的信息可能如何聚類,請通讀推薦整個專利。

        我不確定 Google 是否會為大多數圖書顯示富媒體搜索結果。 他們正在為他們顯示有關搜索的知識面板。 但我認為,這項專利背後的一些想法,比如穀歌如何查看資源庫以糾正富媒體搜索結果的事實,可能會被用於其他富媒體搜索結果。

        知識面板作為豐富結果的替代方案

        谷歌可能決定為書籍顯示知識面板,而不是豐富的結果,這將是一個業務流程決策,當涉及到它可能會顯示答案的其他類型的實體時,它可能會面臨這一業務流程決策。 這是《太陽照常升起》這本書的知識面板,其中包含該專利告訴我們豐富的結果將包含的許多內容:

        書籍知識面板