Google 安全搜索結果專利和重新排名或刪除結果

已發表: 2018-10-11

Google 如何使用安全搜索結果過濾器來處理不當、敏感或冒犯性的搜索結果?

搜索者在互聯網上可能遇到的問題之一是對他們不希望看到或也不願意暴露其他人的內容感到驚訝。 谷歌最近授予的一項專利告訴我們搜索引擎為保護搜索者免受此類內容所做的努力。 正如他們在該專利中所說的那樣:

互聯網用戶可以使用搜索引擎搜索各種類型的內容。 互聯網內容可能包括敏感或令人反感的內容,例如色情、血腥圖像和暴力內容。 在某些情況下,用戶可能會不自覺地接觸到不適當的敏感或攻擊性內容。 因此,可能需要限制對 Internet 上可用的不適當敏感或攻擊性內容的暴露。

該專利多次提到安全搜索結果,我記得聽說谷歌的馬特卡茨在成為谷歌垃圾郵件負責人之前負責谷歌顯示安全搜索結果。 我想知道是否有關於安全搜索結果的專利,或者他是否可能與此有關,但我沒有看到。 這個提到安全搜索結果的次數太多了,我可能會將其視為 Google 的安全搜索結果專利。

Google 安全搜索結果專利背後的目的是保護使用 Google 搜索引擎的搜索者免受他們可能不想看到的內容的影響:

本公開總體描述了一種用於將分類器應用於搜索查詢和搜索結果以提供搜索體驗的方法和系統,其中保護用戶免於暴露於不適當的攻擊性或敏感內容。

這種安全的搜索結果分類器究竟是如何工作的?

1) 響應查詢,搜索引擎將返回一組初步的 SERP。
2) 查詢由分類器分類,以確定它是否包含一個或多個與受保護人群相關的術語或與敏感或攻擊性內容(例如色情或暴力內容)相關的術語。
3)初步結果也進行分類,以確定它們是否包含敏感或令人反感的內容
4) 將搜索結果返回給搜索者,以便不向搜索者顯示不適當的敏感或攻擊性內容。

搜索者確實收到了一個指示,表明搜索查詢被分類為包括以下查詢詞

(i) 不太可能與特定類別的人有關,
(ii) 可能與特定類別的人有關,或
(iii) 可能與特定類別的人有關,並包含敏感或冒犯性的術語。

此外,他們將被告知搜索結果被歸類為可能包括

(i) 非敏感和非攻擊性內容,或
(ii) 敏感或令人反感的內容。

從搜索結果的候選集中,選擇安全搜索結果的展示集,該展示集將至少顯示在
(I) 表明搜索查詢被歸類為包括以下查詢詞

(i) 不太可能與特定類別的人有關,
(ii) 可能與特定類別的人有關,或
(iii) 可能與特定類別的人有關,並包含敏感或冒犯性的術語,以及

(二)搜索結果被歸類為可能的指示,包括:

(i) 非敏感和非攻擊性內容,或
(ii) 敏感或令人反感的內容。 響應於搜索查詢,提供搜索結果的呈現集合的一個或多個搜索結果以供輸出。

對於其中一些結果,有一類特定的人受到影響,其中包括具有至少一個共同人口統計特徵的一群人。

在某些結果中,敏感或冒犯性術語可能包括與色情、暴力、血腥和惡搞中的一種或多種相關的術語。 敏感或攻擊性內容包括與色情、暴力、血腥和惡搞中的一項或多項相關的圖像、視頻或數據。

在一些情況下,從搜索結果的候選集合中選擇安全搜索結果的呈現集合包括以下一個或多個動作:

在某些情況下,搜索結果在搜索結果候選集中的排名基於

(i) 用於獲得搜索結果的搜索查詢被歸類為可能與特定人群相關的指示,以及
(ii) 表明搜索結果被歸類為可能包含敏感或令人反感的內容。

在某些情況下,可以過濾搜索結果候選集中的搜索結果,以基於以下條件從搜索結果呈現集中移除搜索結果

(i) 用於獲取搜索結果的搜索查詢被歸類為可能與特定人群相關並包括敏感或攻擊性術語的指示,以及
(ii) 表明搜索結果被歸類為可能包含敏感或令人反感的內容。

在一些情況下,可以選擇安全搜索結果候選集中的搜索結果以包括在搜索結果呈現集中,而無需修改搜索結果的排名或基於搜索查詢使用的指示過濾搜索結果獲得搜索結果被歸類為不太可能與特定類別的人相關,並且可能包括非敏感和非攻擊性術語。

在一些情況下,從搜索結果的候選集合中選擇搜索結果的呈現集合包括以下一個或多個動作:

(1)在某些情況下,可以選擇搜索結果候選集合中的搜索結果包含在搜索結果呈現集合中,而無需修改搜索結果的排序或基於搜索結果的指示過濾搜索結果。用於獲取搜索結果的查詢被歸類為不太可能與特定類別的人相關,並且可能包含敏感或冒犯性的術語。

(2)在某些情況下,可以根據用於獲得搜索結果的搜索查詢被歸類為可能的指示,對搜索結果候選集中的搜索結果進行過濾,以將搜索結果從搜索結果呈現集中移除與特定類別的人有關,並且可能包括敏感或冒犯性的術語。

(3)在某些情況下,計算機實現的方法的動作還可以包括為搜索結果候選集中的每個搜索結果對應的文檔生成相關性分數,確定候選集中每個搜索結果的排名。搜索結果,以及接收包括用戶設備的一個或多個屬性的用戶會話數據。

相關性分數指示文檔與搜索查詢的相關性。 從搜索結果的候選集合中選擇搜索結果的呈現集合還包括基於包括用戶設備的一個或多個屬性的用戶會話數據修改搜索結果的候選集合中的一個或多個搜索結果的排名。 .

在一些情況下,從搜索結果的候選集合中選擇搜索結果的呈現集合可以包括,對於對應於搜索結果的每個文檔,至少基於搜索結果的指示為文檔分配標籤被歸類為包含敏感或令人反感的內容,並根據分配的標籤確定過濾搜索結果或修改搜索結果的排名。 標籤指示文檔中包含的主題。

可以製作所有這些過濾或夾雜物的專利描述於:

保護用戶免受不適當的敏感或攻擊性搜索結果的影響
發明人:Matthias Heiler、Michael Schaer、Nikola Todorovic、Robin Nittka、Thomas Fischbacher 和 Laura Dragoi;
受讓人:谷歌有限責任公司
美國專利:10,083,237
授予日期:2018 年 9 月 25 日
提交時間:2015 年 8 月 31 日

抽象的

描述了一種用於提供搜索體驗的系統和方法,其中保護用戶免於暴露於不適當的攻擊性或敏感內容。 搜索系統可以對搜索查詢和響應於該搜索查詢獲得的候選搜索結果進行分類。 基於搜索查詢和搜索結果的分類,候選搜索結果可以被修改以生成向用戶呈現的一組搜索結果,使得呈現的搜索結果不包括不適當的敏感或攻擊性內容。

安全搜索結果專利下的一些定義

該專利為我們定義了“敏感或攻擊性內容”,指但不限於色情、血腥圖片和暴力內容。

它還將“不適當的敏感或攻擊性內容”定義為敏感或攻擊性內容的子類別,可能包括以下內容:

  • 幫派招募內容
  • 暴力煽動內容
  • 嘲笑特定人口群體或煽動對特定人口群體的仇恨的內容
  • 惡搞內容

“它通常也可能指任何非法、濫用或對受保護類別的互聯網用戶非常反感的內容。”

該專利還告訴我們,它旨在保護可能對某些搜索結果敏感的搜索者:

該受保護類別的用戶可以包括具有至少一個共同人口統計特徵並且可能需要針對不適當的敏感或攻擊性互聯網內容進行保護的任何人群。

青少年作為受保護群體如何對待內容

安全搜索結果專利的描述以一個針對青少年的搜索結果示例開始,以響應諸如“為什麼青少年加入群組”之類的查詢。 搜索引擎接收該查詢,獲得一組搜索結果,以響應該查詢進行顯示。

搜索引擎還接收若干分類信號,並根據分類信號從候選搜索結果集中選擇一組搜索結果呈現給子搜索者。

其中一個名為“Teen Recruitment”的搜索結果的相關性得分為96,並被分配了一個標籤,表明“Teen Recruitment”對應的搜索結果文檔包括可以呈現給包括兒童用戶在內的所有用戶的內容,並且不包含敏感或攻擊性內容。

另一個結果名為“青少年幫派招聘人員”,相關性得分為 87,並分配了標籤“v”,表明與“青少年幫派招聘人員”對應的搜索結果文檔可能包含暴力內容或令人不安的圖片。

其他一些搜索結果的標題分別為“新聞:青少年組”和“兒童組”,相關性得分分別為 79 和 34,並帶有指定的標籤,表明搜索結果文檔對應於“新聞:青少年組”和“組”兒童”,並且它們可能包含可以呈現給所有用戶(包括兒童用戶)的內容,並且不包含敏感或冒犯性的內容。

基於所使用的分類信號,一些結果可能會被批准,一些可能會被刪除,而另一些可能會在呈現給兒童搜索者之前重新排序。

某些結果可能會重新排名以在搜索結果中顯示得更高,例如關於“新聞:青少年組”的結果。

某些結果可能會重新排名較低,例如關於“青少年幫派招募人員”的結果可能包含與青少年相關的暴力內容。

安全搜索結果專利告訴我們,這種方法的重點是:

所選的搜索結果集然後在用戶設備處作為搜索結果的呈現集輸出,使得兒童用戶可以享受安全的搜索體驗而不會暴露於不適當的敏感或攻擊性內容。

其他受保護組和其他過濾器

安全搜索結果專利為其他組提供了其他示例,例如關於

(i) 相關性得分為 96 的“專利代理人惡搞”和一個標籤,表明與名為“專利代理人惡搞”的搜索結果相關的文檔可能包含不適當的敏感或攻擊性內容,例如與受保護人群相關的惡搞內容(例如,專利代理人)。

(ii) 相關性得分為 92 的“Pranks on IP 從業者”和一個標籤,表明與搜索結果相關的標題為“Pranks on IP 從業者”的文檔可能包含不適當的敏感或冒犯性內容,例如針對受保護群體的侮辱性笑話人;

(iii)“專利代理人趣事”相關性得分為89,標籤表明與“專利代理人趣事”搜索結果相關的文檔不可能包含任何敏感或攻擊性內容; 和

(iv) 相關性得分為 74 的“幽默律師”和一個標籤,表明與名為“幽默律師”的搜索結果相關聯的文檔可能不包含任何敏感或攻擊性內容。

該專利告訴我們這些查詢中的哪些內容可能已被刪除或重新排名。

該專利還包括其他示例,涵蓋政治笑話、政治模因和政治醜聞等內容。

它還提供了有關搜索引擎如何識別要過濾的內容的更多詳細信息。

安全搜索結果專利的最大收穫

我之前沒有看到谷歌說過基於提供涉及受保護群體的安全搜索結果來刪除或重新排列搜索結果的任何內容。 我確實記得在針對 Google 的法律案件中,聯邦法院在 2003 年裁定 PageRank 受到第一修正案的言論保護。