Google 如何使用評論來了解實體屬性

已發表: 2018-09-06

實體屬性海報

關於實體屬性

當我們看到谷歌談論不同實體的屬性時,他們通常將這些稱為實體屬性,並經常在鍵/值對中定義它們。 例如,亞伯拉罕·林肯的身高為 6'4"。 Alphabet 是一家總部位於加利福尼亞州山景城的控股公司。 保羅紐曼有一雙藍眼睛。 Fortnite 是一款多人遊戲。

一些在線評論專門針對產品、產品創建者和/或產品供應商等實體。 這些評論可能包含有關搜索者可能感興趣的實體屬性的信息。上週授予 Google 的一項專利告訴我們,它可能會從搜索者可能感興趣的評論中收集有關實體屬性的信息,以及他們如何做到這一點。 這很重要,因為正如專利告訴我們的:

這些類型的用戶評論可能包括關於實體的信息,這些信息可能尚未由實體本身提供或生成。

關於實體屬性的信息從評論到 Google 的索引

這個涉及實體屬性的過程可能涉及:

(1) 基於用戶查詢語料,識別一個或多個觀察到的用戶興趣類別;
(2)檢測,在一個或與產品相關聯的更多用戶評論,文本的一個或多個段相關的一個或多個類別觀察到的用戶興趣;
(3) 並基於檢測、索引,在可搜索的數據庫中,對觀察到的用戶興趣的一個或多個類別的產品。

所以。 搜索引擎可以查看有關實體的查詢以識別搜索者可能對這些實體的哪些內容感興趣,並使用這些查詢來識別搜索者可能感興趣的評論中的文本,並將該文本編入索引,以便搜索者可以找到該實體的答案他們對產品、產品製造商和產品供應商等實體的查詢。

谷歌可能會計算詢問某些實體屬性的查詢數量,以了解對這些查詢的答案有多少興趣,或者用戶可能對它們感興趣。

機器學習可用於識別查詢是對產品本身還是產品製造商感興趣。

上週授予的實體屬性專利可在以下網址找到:

分析用戶評論以確定實體屬性
發明人:Advay Mengle、Jindong Chen、Charmaine Cynthia Rose D'Silva 和 Anna Patterson
受讓人:GOOGLE LLC
美國專利:10,061,767
授予日期:2018 年 8 月 28 日
提交時間:2017 年 6 月 16 日

抽象的

在此描述了用於將用戶評論或其部分分類為與各種實體相關的方法和裝置,以及用於將包含在那些用戶評論或其部分中的提取的文本的描述性片段與基於分類的實體相關聯。 在各種實現中,可以基於用戶查詢的語料庫來識別觀察到的用戶興趣的一個或多個類別。 可以在與產品相關聯的一個或多個用戶評論中檢測與觀察到的用戶興趣的一個或多個類別相關的一個或多個文本段。 基於該檢測,可以在可搜索的數據庫中根據觀察到的用戶興趣的一個或多個類別對產品進行索引。 在一些實施方式中,可搜索數據庫可由一個或多個遠程客戶端設備訪問,並且可由觀察到的用戶興趣的一個或多個類別搜索以提供要由一個或多個遠程客戶端設備呈現的搜索結果。

如本專利所述,用戶評論可能來自以下來源:

  • 博客
  • 社交網絡帖子
  • 電子郵件
  • 為網站或印刷出版物(如雜誌或報紙)撰寫的文章
  • 發佈到在線供應商或市場的用戶評論部分
  • 提交給各種現有用戶評論交換所的用戶評論

然後可以基於它們可能涵蓋的興趣類別以及它們可能包含與之相關的信息的實體來對這些評論進行分類。 有趣的是,這項專利告訴我們機器學習如何成為採取這些步驟所涉及的過程的一部分。

在一些實現中,實體中的一個或多個“興趣類別”可用於將用戶評論和/或其部分分類為與特定實體相關。 用戶評論中對應於這些類別(例如,足夠相似)的詞或短語的檢測可被解釋為用於將用戶評論或其一部分分類為與實體相關的信號。 興趣類別可以有多種形式,例如預測興趣類別和觀察興趣類別。 在各種實現中,類別引擎可以維護類別的索引,分類器引擎可以使用該索引來對用戶評論和/或其部分進行分類。

如果您是網絡遊戲迷,該專利提供了幾個示例,重點介紹了該專利背後的流程是如何運作的:

相比之下,觀察到的興趣的類別可以例如通過類別引擎基於在用戶活動中觀察到的模式來確定,例如在多個(或語料庫)用戶查詢之間。 例如,繼續以應用程序的在線市場為例,多個用戶可以使用相同或相似的術語或短語來搜索應用程序。 如果足夠多的用戶提交包含特定詞或短語(或其類似變體)的查詢,則類別引擎可將這些詞或短語視為構成觀察到的興趣的類別並且可相應地更新索引。 因此,如果有足夠多的用戶在在線市場中搜索“大型多人在線角色扮演遊戲”或“MMORPG”,則可以建立 MMORPG 類別。

還描述了涉及從評論中提取文本的過程,包括不同實體之間的比較(例如“產品 X 比產品 Y 好”)。

該專利確實非常關注如何從評論中提取信息和特定的單詞和短語,並對查詢做出響應,例如如果有很多關於“具有強大光學變焦功能的相機”的查詢,信息可能會被提取出來回答特定相機的查詢。 此類信息可能來自用戶對相機的評論。

我們得到了有關此類提取的含義的提示:

圖引擎可以使用這些新關聯的實體屬性和/或分數來執行各種動作。 例如,在一些實施方式中,圖形引擎可以與搜索引擎(未描繪)接口並且可以基於與那些一個或多個實體相關聯的一個或多個描述性文本段來索引一個或多個實體,例如,通過描述性文本關聯引擎。

使用評論來了解實體屬性

有趣的是,Google 可能會使用用戶生成的內容(例如產品評論)來了解這些產品、這些產品的製造商以及這些產品的分銷商。

我們已經看到 Google 對產品、企業和地點的評論很感興趣,因為搜索者一直在搜索這些東西。 我們還看到谷歌談論他們如何使用評論來了解有關實體的情緒。 這項專利使這種興趣更進了一步,不僅僅是向搜索者提供評論或指出充滿情感的句子。 它試圖了解正在審查的事物,以便將特定興趣與回答這些問題的信息相匹配。

該專利告訴我們可以在網上找到評論的位置,如何對評論中的文本進行分類和提取,如何眾包搜索者查詢的興趣以了解這些搜索者可能有興趣學習的內容,以及搜索引擎可以向搜索者展示響應有關特定實體屬性的興趣的信息。

也許評論是了解有關實體屬性的信息的好地方,這些實體不會自己共享這些信息。 你怎麼認為?