Google 的工作原理:Google 排名工程師的故事 - SMX West 2016 的報導和分析

已發表: 2021-10-08

你好朋友。 我們不時在 Linkarati 上報導我們認為值得分享和放大的新聞、趨勢或演示。

今天,我偶然發現了 Rae Hoffman 的一條引人注目的推文:

該鏈接指向 SMX 的視頻,該視頻是在 Google 工作了 14 年的軟件工程師 Paul Haahr,他在 SMX West 2016 上從他作為 Google 排名工程師的角度介紹了 Google 的工作方式。

正如介紹 Paul 的 Danny Sullivan 所說,Paul 的頭銜並不反映他是Google 排名團隊高級領導層的一員

作為 SEO,這應該會讓您心跳加速。

丹尼重申我們(搜索引擎優化社區)有保羅在場是多麼幸運。 從她的推文中可以看出,Rae 堅信這是每個 SEO 都需要深入觀察並做筆記的事情。 我有什麼資格爭論?

我經常發現,撰寫演講報導比做筆記能教會我更多的東西,因為我必須更進一步,寫下其他人可以理解和欣賞的筆記。 它又增加了一層批判性思維。

我決定這樣做,以便自己更好地理解材料並幫助您更快地消化演示文稿。 雙贏,對吧? 注意:Rae 在這裡有她自己的筆記和報導。

我建議您跟隨視頻,該視頻將貫穿始終。 下面我還嵌入了來自 Slideshare 的 Paul 演示文稿,我將剪輯並發布靜止圖像以配合我的報導。

Google 的工作原理:來自Search Marketing Expo - SMX 的Paul Haahr 的排名工程師觀點

坐下來,享受,讓我知道你的想法。

讓我們進入它。

注意:Emanuele Vaccari 將這篇文章翻譯成意大利語,以及他自己的一些想法。 你可以在這裡看到他翻譯的帖子。

谷歌排名工程師做什麼

實際上,我將立即打破我自己的報導規則之一併忽略時間順序(但僅限於現在 - 我將在本節之後按時間順序瀏覽演示文稿)。

在我看來,保羅在整個演講中嵌入了一個主題,這是他演講的支柱。 這個主題是“排名工程師做什麼?” .

根據 Paul 的說法,這個答案有四個版本,每個版本都略微改進了排名工程師的角色:

  1. 為那些 [Google 的搜索] 服務器編寫代碼。 資料來源:幻燈片 16
  2. 尋找新的信號。 以新方式組合舊信號。 資料來源:幻燈片 19
  3. 針對我們的指標進行優化 [相關性/搜索者意圖和質量]。 來源:幻燈片 24
  4. 將具有良好評級的結果 [來自現場實驗和人類評估者] 提升。 將評分不佳的結果向下移動。 資料來源:幻燈片 55

請注意,括號 [ ] 表示我自己的感嘆,以澄清(不完美)保羅的幻燈片。

那麼谷歌排名工程師是做什麼的? 我收到的主要結論確保搜索實際上對用戶(人類)有所改進。 他們是如何做到的? 通過讓Google 更好地匹配搜索質量評級指南

後來 Paul 發給 Rae 的一條推文再次強調了搜索質量評級指南的重要性,並且 SEO 確實應該閱讀整個文檔:

保羅演講中我最喜歡的一句話是他在 16 點 08 分談論 Google 的搜索質量評級指南。 引文本身來自演示文稿第 32 頁幻燈片中的 16:48 分鐘標記。 保羅說:

“如果你想知道谷歌為什麼要做某事,答案通常是讓它[搜索]看起來更像評估者指南所說的那樣。”

Paul Haahr,Google 排名工程師,SMX West 2016

這是一個強有力的聲明。 保羅總結了谷歌的所有變化,試圖更好地匹配他們發布的搜索質量評級指南! 長話短說:你想了解谷歌嗎? 去閱讀他們的質量指南。

好的,讓我們進入保羅演講的時間順序。

今日谷歌搜索

根據保羅的說法,今天的谷歌搜索有兩個主題:

  1. 移動優先
  2. 特徵

移動正在引領搜索查詢,而谷歌越來越多地考慮移動優先。 這對於 SEO 來說並不是新信息,但這是 Paul 強調要強調的。

保羅強調的第二點是功能的重要性,尤其是在移動設備中。

Google_features_slide.png

幻燈片四

有趣的是,保羅在總結今天的搜索時說:

“我們越來越多地進入一個世界,在這個世界中,搜索被視為生活各個方面的助手。”

Paul Haahr,Google 排名工程師,SMX West 2016

Google 搜索的工作原理

以前所有的 Google 都是 10 個藍色鏈接。 保羅將 10 個藍色鏈接時代的排名問題分解為“我們展示什麼文件?我們以什麼順序展示它們?”

Google_10_blue_links_ranking.png

幻燈片七

有趣的是:保羅花了一點時間澄清他永遠不會觸及廣告的話題。 具體來說,保羅說:

“廣告很棒,它們讓我們賺了很多錢,對廣告商來說效果很好。但我的工作,我們被明確告知“不要考慮對廣告的影響,不要考慮對收入的影響——只想著幫助用戶。”

Paul Haahr,Google 排名工程師,SMX West 2016

聽到關於教會和國家明確分離的消息很有趣 - 對不起,有償和有機。

查詢的生命週期

Paul 對排名的解釋從查詢的生命週期開始,以解釋搜索的工作原理。 搜索引擎有兩個部分:

  1. 提前(在查詢之前)
  2. 查詢處理。

查詢前:

  • 爬網
  • 分析抓取頁面
    • 提取鏈接(搜索的經典版本)
    • 渲染內容(Javascript、CSS - Paul 強調了這一點的重要性。)
    • 註釋語義
  • 建立索引
    • 鏈接一本書的索引
    • 對於每個單詞,它出現的頁面列表
    • 分成數百萬頁
      • 這些頁面被稱為“分片”
      • Web 索引的 1000 個分片
    • 加上每個文檔的元數據。

資料來源:幻燈片 10 和 11。

查詢處理(當有人使用搜索時):

  • 查詢理解和擴展
    • 查詢是否命名已知實體?
    • 有沒有有用的同義詞?
    • 上下文很重要
  • 檢索和評分
    • 將查詢發送到所有分片
    • 每個分片:
      • 查找匹配頁面
      • 計算查詢+頁面的分數
      • 按分數發回前 N 頁
    • 合併所有首頁
    • 按分數排序
  • 檢索後調整
    • 主機集群(有多少頁面來自同一域)、附加鏈接
    • 是否有太多重複?
    • 垃圾郵件降級、手動操作適用

來源:幻燈片 12、13、14 和 15。

谷歌評分信號

Paul 指的是表示查詢和頁面之間匹配的單個數字。

這是基於評分信號,它基於兩個類別:

  1. 基於頁面的評分信號
  2. 根據查詢對信號進行評分。

Google_Scoring_signals.png

幻燈片十八

保羅在這裡引用了排名工程師工作的第二個版本:尋找新信號,或以新方式組合舊信號。 保羅將其描述為“艱難而有趣”。

排名的關鍵指標:相關性、質量、結果時間

保羅強調相關性是搜索結果中的一個關鍵指標。 相關性基本上被解釋為“匹配用戶意圖”。

保羅將相關性稱為“我們的頂線指標”和“重要的內部指標”。

還有另外兩個:質量和結果時間(越快越好)。 在這次演講中,相關性和質量是重點。

倒數排名權重

CTR(點擊率)經常在 SEO 中討論,特別是對於搜索排名。 成為有機排名第一與排名第二的價值是什麼? 與排名第四? 這經常被討論和辯論。 保羅從價值的角度解釋了谷歌的觀點。

他將這個想法定義為“相互排名權重”:

reciprocal_rank_weighting.png

幻燈片二十三

需要明確的是,Paul 不是在討論點擊率。 相反,它是一個評估整個搜索頁面的內部指標。

這個想法代表了每個職位價值 50% 的貶值,排名第一的價值是排名第十的價值的十倍。

相當迷人。

這讓保羅進入了谷歌排名工程師所做的第三個版本:優化我們的指標 [相關性和質量]。

ranking_engineers_optimize_metrics.png

幻燈片二十四

Google 如何評價搜索結果?

保羅解釋說,谷歌有兩種方式分析特定結果的功效:

  1. 現場實驗
  2. 人類評估者。

視頻如下:

現場實驗

Google 對實際流量運行實時 A/B 測試,然後查找點擊模式的變化。

“我們進行了很多實驗。如果您在 Google 上進行搜索並且您至少沒有參與一項實驗,這種情況是非常罕見的。”

Paul Haahr,Google 排名工程師,SMX West 2016

保羅花一點時間解釋解釋現場實驗是一項艱鉅的任務。

他的主要示例(如下)是帶有答案框的結果。 傳統上,如果搜索者點擊進入網站,這將被視為一個好的結果。 但是,如果搜索者看到了答案,感到滿意並關閉了呢? 傳統上,這會被評為糟糕的結果,但在這種情況下,它實際上可能是一個好結果。

Interpreting_live_search_experiments.png

幻燈片三十

保羅的例子的重點是展示分析搜索者滿意度是多麼具有挑戰性。

Google 的人工評分實驗

這部分最重要的一點是這裡再次強調移動優先大多數人類評估實驗都在智能手機上進行

人類評估者實驗的工作原理如下:

  1. 顯示真人實驗搜索結果
  2. 詢問結果有多好(相關性和質量的滑動率)
  3. 評分者的綜合評分

同樣,非常重要的是要注意谷歌已經發布了他們的搜索質量評估指南。

說真的,看那個剪輯。

搜索質量評估員評級示例

Paul 開始在 16:56 標記處查看搜索質量評級實驗的示例和屏幕截圖

我建議觀看這部分的視頻,因為保羅在很大程度上依賴於幻燈片。 接下來,演示的這一部分從幻燈片 33 開始。

判斷結果的兩個尺度:相關性和質量

Google 為評估者提供了兩種衡量結果質量的標準:

  1. 滿足的需求(相關性)
  2. 頁面質量

Judging_search_results.png

幻燈片三十五

移動優先實驗

保羅還強調移動優先。

他們通過五種方式實現這一目標:

  1. 所有相關說明都是關於移動用戶的需求。
  2. 在實驗中,移動查詢的使用量是原來的兩倍。
  3. 用戶的位置包含在實驗中。
  4. 該工具顯示移動用戶體驗。
  5. 評分者使用他們的智能手機訪問網站。

我不能強調這是多麼重要。 谷歌顯然是在把重點放在移動設備上。 這裡沒有中間立場。

需求滿足評級 - 相關性評級

有五種不同類別的相關性,定義為“滿足需求”:

  1. 完全滿足
  2. 高度滿足
  3. 適度滿足
  4. 稍微滿足
  5. 未能見面。

重要的是要注意,評分者不會只用五個選項進行判斷:他們會看到一個滑動量表,可以落在任何這些評級之間的任何位置。

從幻燈片 41 開始,Paul 介紹了每個評級的示例:

Google 的工作原理:來自Search Marketing Expo - SMX 的Paul Haahr 的排名工程師觀點

這是隨附的視頻:

重要的收穫:

  1. “完全滿足”僅在查詢明確且結果可以完全滿足用戶對查詢的意圖時才存在。
  2. “高度滿足”有時需要兩個特定的、獨立的結果才能滿足用戶意圖。
  3. “適度滿足”通常是很好的信息。
  4. “稍微滿足”是可以接受的,但不是很好的信息,希望能顯示更好的結果。
  5. “未能見面”是可笑的,保羅引用搜索錯誤返回糟糕的結果。

頁面質量評級

谷歌著眼於三個重要的概念來描述頁面的質量:

  1. 專業知識
  2. 權威
  3. 可信度。

質量等級由高到低。

高質量頁面:

  • 令人滿意的高質量主要內容。
  • 專業知識、權威和信任是明確的。
  • 該網站具有良好的聲譽。

high_quality_pages_according_to_Google.png

幻燈片五十

低質量頁面:

  • 內容質量低
  • 主要內容不多
  • 沒有顯示專業知識或權威
  • 該網站的聲譽不佳
  • 次要內容(廣告)分散注意力。

Low_quality_pages_according_to_Google.png

幻燈片五十一

優化搜索質量指標

數百名計算機科學家從事等級工程。 他們專注於指標和信號,不斷進行實驗,進行大量更改——所有這些都是為了讓 Google 的搜索結果更好(並更準確地反映搜索質量評估指南)。

開發過程對於軟件開發過程來說是相當標準的。

Google_ranking_development_process.png

幻燈片五十四

重要亮點:

  1. 該過程可能需要數周到數月的時間來測試代碼。
  2. 定量分析師(基本上是統計學家)審查數據。 他們讓排名工程師保持誠實,對變化提供大部分無偏見的分析。
  3. 啟動審查小組審查項目摘要,審查文檔和報告,並討論排名變化的優點。
  4. 實際推送更新可能快也可能慢,這取決於代碼為算法準備的程度。

排名工程師創建這些更新主要是為了將評級良好的結果向上移動,並將評級不佳的結果向下移動。

開發過程中出了什麼問題

保羅談到兩類問題:

  1. 系統性差評。
  2. 不捕捉他們關心的概念的指標。

系統性差評

保羅以[德州農場肥料]為例。 原來這是一個肥料品牌,但谷歌卻退回了製造商。 人們不太可能真正想要製造商的地圖,而是更願意看到實際產品。 然而,人類評估者始終認為這是“高度滿足需求”的結果。

這實際上導致了添加更多地圖的模式,這實際上創建了評分很高的結果,但實際上卻是糟糕的實時搜索體驗。

缺少指標

保羅引用了谷歌在 2008-2011 年的質量問題。 具體來說,內容農場的問題。

內容農場可以產生低質量、高度相關的內容。 這導致了高評價的結果,但實際上質量很低。 內容農場導致谷歌在他們的人類評級實驗中實施第二個滑塊,判斷結果的質量。

聽到 Paul 討論內容農場的問題和對搜索質量的影響,以及如何實施另一個衡量搜索結果有效性的指標來克服這個問題,這絕對令人著迷。

同樣令人著迷的是這裡沒有提到 Panda,這就是 Google 在算法上處理內容農場的方式。

根據 Paul 的說法,缺少指標的解決方案是修復評估者指南或開發新指標(在必要時)。

fix_rater_guidlines_and_develop_new_metrics.png

幻燈片六十七

這就是保羅演講的全部內容!

最後的想法和要點

最後總結一下這篇長文。

  1. 我會盡快閱讀《搜索質量評估者指南》。 你也應該。 保羅強調搜索排名中所做的所有更改都應反映該文件。 想了解谷歌排名? (作為 SEO,答案應該是響亮的“是!”)然後閱讀該文檔。
  2. 谷歌確實是移動優先。 所有人類評估者實驗都非常強調移動優先體驗,其程度令人驚訝。
  3. 幾乎每一次搜索都包含一個實時實驗。
  4. 相關性是 Google 的第一大指標。 他們將“相關性”定義為在搜索中滿足用戶(人類)需求。 如果您想獲得更高的排名,請考慮滿足搜索者的期望和需求。
  5. 谷歌對第一個結果的重視程度要高得多。 每個後續結果都會降低前一個結果值的 50%。 結果#1 考慮的價值是結果#10 的十倍。

我敢肯定還有其他重要的收穫,但我的大腦正式被炸了。 歡迎提供反饋——希望你喜歡報導。