與 Paul Haahr 的問答，Google 的排名工程師，SMX West 2016

已發表: 2021-10-08

最近，搜索引擎優化行業從一位谷歌員工那裡獲得了罕見的透明度和洞察力。特別是他們排名工程部門的成員：直接為 Google 的算法做出貢獻的人。

Paul Haahr 是 Google 過去 14 年的軟件工程師，他在 3 月的 SMX West 上從他作為排名工程師的角度介紹了 Google 的工作原理。幾篇報導：

完整視頻在這裡。
我的報導和想法在這裡。
Rae Hoffman 在這裡的報導（不要錯過評論！）。
理查德·巴克斯特 (Richard Baxter) 的完整演講稿。

這篇文章將介紹 Danny Sullivan 在演講後由 Paul 主持的問答，Google 的網站站長趨勢分析師 Gary Iylles 也加入了他的行列。完整視頻如下：

問答環節共提出 16 個問題。讓我們一次拿一個。

注意：我將根據我自己的理解來解釋答案。如果您想觀看完整的答案，我建議您觀看視頻。每個問題都嵌入了 Danny 提出問題的視頻。

1.分片在各個地方都是整體索引的一部分嗎？

索引是所有分片的總和。

谷歌擁有一個由非常大的機器組成的龐大網絡，他們選擇分片大小來填充這些非常大的機器。聽起來分片是谷歌處理規模問題的方式，使索引的大小易於管理。

2. RankBrain 如何適應這一切？

RankBrain 在算法中提供了某些信號子集（不清楚是哪些信號）。
RankBrain 是一個機器學習（深度學習？保羅糾正自己為深度學習）系統，在如何組合信號和理解文檔方面有自己的想法。
Google 了解 RankBrain 的工作原理（經過很多努力），但他們不了解它究竟在做什麼。
RankBrain 使用了谷歌發布的關於深度學習的大部分內容。
RankBrain 正在做的一層是 word2vec 和詞嵌入。
RankBrain 在查詢生命週期的後期檢索後階段之後啟動。（保羅將此稱為“盒子”）。

3. RankBrain 如何知道一個頁面的權限？它如何知道質量？

RankBrain 擁有強大的訓練數據，旨在改進此功能。除了查詢和網頁之外，它還能看到信號。

對我來說，聽起來好像 RankBrain 不需要確定頁面的權威或質量。它已經提供了這些信息。

4. 谷歌在測試排名算法優化時有哪些轉化目標？是否有一致的目標來衡量所有更新？

谷歌曾經有一個名為“下一頁率”的指標，它基本上衡量人們點擊進入第二頁結果的頻率。作為第一頁的概念並不是很好的結果。然而，這很容易被遊戲/操縱。

具體來說，空白會降低人們點擊搜索第二頁的可能性。

【視頻中的剪輯場景】

注意：稍後在 8:50 標記處提出了類似的問題。向下滾動到問題 #8 以查看視頻和回复。

5. 您要做的第一件事是確定查詢是否包含實體。那是你五年前做的事嗎？

這與知識圖譜和知識面板同時開始。這是這些過程的關鍵。

谷歌在 2011 年推出知識圖譜之前並沒有這樣做。

6. 如果有人登錄了任何Google 應用，您是否通過收集的信息進行區分？使用 Google Now 和 Google Chrome 會影響搜索嗎？

真正的問題是您是否已登錄。

如果您已登錄，Google 會引入搜索個性化功能。 Google 希望根據您的興趣以及 Google 即時卡片中顯示的內容為用戶提供一致的搜索體驗。

只要您已登錄，並且未關閉搜索個性化，您的搜索體驗就會有個性化。

與書籤相比，您更有可能在您的設備上進行搜索。

7. 谷歌是否在一天中的不同時間為同一查詢提供不同的結果？當地地圖似乎隨著營業時間而變化。

保羅和加里都不確定，儘管他們似乎都認為營業時間不會影響查詢。

如果商家關門，谷歌會強調顯示關門時間（和營業時間），但兩者似乎都不認為營業時間會影響搜索結果中是否顯示地圖。

僅僅因為企業關閉（或接近關閉）並不意味著搜索者對其物理位置不感興趣。

8. 谷歌如何確定人類評估者實驗中的積極或消極變化？是否有通過查詢生成的贏家/輸家報告？

谷歌對每個實驗都有一份總結報告，根據一系列不同的指標（根據實驗而異），實驗如何執行，所有這些都包括所涉及的每個查詢。

有輸贏的分類。在前面提到的例子中——顯示地圖的肥料查詢——它被歸類為勝利。人類審查指標和結果。然而，在這種情況下，保羅稱自己為抓住了被報告為勝利的糟糕結果。

保羅指出，人類評估者總體上是偉大的，但確實會犯錯誤。具體來說，人類評估者會對某些功能感到興奮，即使這些功能沒有增加價值。

9. 熊貓和企鵝怎麼了？

保羅沒有答案。他確實指出熊貓和企鵝都被計入了評分和檢索“盒子”。

丹尼將焦點轉移到加里身上，加里因在過去六個月中反复說企鵝快推出而臭名昭著。事實上，加里說企鵝將在新年（2016 年 1 月）之前推出。

顯然，加里的預測並沒有實現。

加里報告說他已經放棄報導企鵝號將推出的時間。他知道工程師們正在專門從事這項工作，但在犯了 3 次錯誤之後，他不願意說出日期或時間表。

Paul 再次提到了啟動新排名信號和算法的漫長迭代周期。

10：你談到了一項耗時兩年的發布。那是企鵝嗎？

保羅討論的兩年發布不是企鵝。

此次發布是一次半排名半功能的發布。這是他們第一次嘗試拼寫更正，佔據了一半以上的 SERP，顯示了拼寫錯誤的結果，而不是“你是不是意思”功能。

該功能的第一次啟動迭代需要大量重寫（大概是為了適應算法）。

11：您提到了特定作者的專業知識。您如何識別和跟踪主題的作者權限？

保羅不能在這裡詳述。但是，實驗中的人工評估員的任務是手動為他們看到的頁面執行此操作。谷歌將他們自己的指標與人工評估者的發現進行比較，從而驗證（或使）他們自己的指標無效。

12：作者權威是用作直接還是間接排名因素？

沒有簡單的答案：保羅不能說是或否。這比問題所暗示的要復雜。

13：我們應該繼續為 rel=author 煩惱嗎？

Gary 說至少有一個團隊會繼續考慮使用 rel=author 標籤。

Gary 不建議為新頁面創建標籤，但也不建議從舊頁面中提取 rel=author 標籤。標籤不會傷害任何東西，將來可能會用於某些事情。

14：您如何避免質量評估者產生品牌熟悉度偏見？

在實驗之前，人類評估者被要求做研究，但保羅承認他們經常有偏見。

保羅說，有一些衡量標準旨在抵消這種偏見，而這些衡量標準並不在質量信號中。

有趣的是，保羅漫不經心地說： “我還沒有開始仔細研究我們實際查看的所有指標。”

這意味著，在實驗中，除了相關性和質量之外，還有許多指標。

保羅指出，有很多小網站都獲得了質量評級，“因為評級員做得很徹底。他們似乎很擅長解決這個問題。”

15：點擊率（CTR）是排名信號嗎？

Paul 確認 CTR 用於實驗以及個性化。

但是，在任何情況下使用該指標都具有挑戰性。

加里插話說，即使是受控群體，也很難正確解釋參與度。

保羅同意許多已經完成的實驗都具有誤導性的實時指標。他引用的例子是片段，以及問題#4 中提到的“下一頁率”。

保羅還引用了一個長期運行的實時實驗，該實驗在搜索結果中交換了結果 #2 和 #4。它是隨機的，僅適用於 0.02% 的用戶。結果？更多的人點擊了#1 結果。保羅解釋了這一點：

“他們看到#1——他們不知道他們是否喜歡它——他們看兩個，這確實比#2糟糕得多，他們放棄了，因為本應在#4的結果卻是實際上在#2 的時候太糟糕了，他們點擊了#1。”
— Paul Haahr 在 SMX West 2016 上，解釋了導致非常規點擊指標的 Google 現場實驗。

保羅引用的另一個有趣的偏見是，第 10 位的點擊次數比第 8 位和第 9 位加起來要“多得多”。為什麼？因為它是下一頁之前的最後一個結果，沒有人想點擊到下一頁。

即便如此，#10 的表現也比位置 #7 差。

這一切的重點是什麼？ CTR 是一個極難使用的信號，通常是奇怪的偏見和不可預測的人類行為的結果。

16：你現在在讀什麼？

保羅讀“很多新聞，很少讀書”。他還在舊金山和山景城之間的通勤途中聽了很多有聲讀物。

保羅提到的書：

Garth Risk Hallberg 的城市著火
和辛克萊劉易斯的這不可能發生在這裡。

......這是一個包裝！

問題？註釋？想法？把它們留在下面！

與 Paul Haahr 的問答，Google 的排名工程師，SMX West 2016

1.分片在各個地方都是整體索引的一部分嗎？

2. RankBrain 如何適應這一切？

3. RankBrain 如何知道一個頁面的權限？ 它如何知道質量？

4. 谷歌在測試排名算法優化時有哪些轉化目標？ 是否有一致的目標來衡量所有更新？

5. 您要做的第一件事是確定查詢是否包含實體。 那是你五年前做的事嗎？

6. 如果有人登錄了任何Google 應用，您是否通過收集的信息進行區分？ 使用 Google Now 和 Google Chrome 會影響搜索嗎？

7. 谷歌是否在一天中的不同時間為同一查詢提供不同的結果？ 當地地圖似乎隨著營業時間而變化。

8. 谷歌如何確定人類評估者實驗中的積極或消極變化？ 是否有通過查詢生成的贏家/輸家報告？