Google 的工作原理:Google 排名工程師的故事 - SMX West 2016 的報導和分析
已發表: 2021-10-08你好朋友。 我們不時在 Linkarati 上報導我們認為值得分享和放大的新聞、趨勢或演示。
今天,我偶然發現了 Rae Hoffman 的一條引人注目的推文:
如果你看到這個 https://t.co/JN9T1IOBjc 並且沒有花時間看它並這樣做,祝你的 SEO 職業生涯好運 pic.twitter.com/YliYKcSFdq
- Rae Hoffman (@sugarrae),2016 年 3 月 31 日
該鏈接指向 SMX 的視頻,該視頻是在 Google 工作了 14 年的軟件工程師 Paul Haahr,他在 SMX West 2016 上從他作為 Google 排名工程師的角度介紹了 Google 的工作方式。
正如介紹 Paul 的 Danny Sullivan 所說,Paul 的頭銜並不反映他是Google 排名團隊高級領導層的一員。
作為 SEO,這應該會讓您心跳加速。
丹尼重申我們(搜索引擎優化社區)有保羅在場是多麼幸運。 從她的推文中可以看出,Rae 堅信這是每個 SEO 都需要深入觀察並做筆記的事情。 我有什麼資格爭論?
我經常發現,撰寫演講報導比做筆記能教會我更多的東西,因為我必須更進一步,寫下其他人可以理解和欣賞的筆記。 它又增加了一層批判性思維。
我決定這樣做,以便自己更好地理解材料並幫助您更快地消化演示文稿。 雙贏,對吧? 注意:Rae 在這裡有她自己的筆記和報導。
我建議您跟隨視頻,該視頻將貫穿始終。 下面我還嵌入了來自 Slideshare 的 Paul 演示文稿,我將剪輯並發布靜止圖像以配合我的報導。
坐下來,享受,讓我知道你的想法。
讓我們進入它。
注意:Emanuele Vaccari 將這篇文章翻譯成意大利語,以及他自己的一些想法。 你可以在這裡看到他翻譯的帖子。
谷歌排名工程師做什麼
實際上,我將立即打破我自己的報導規則之一併忽略時間順序(但僅限於現在 - 我將在本節之後按時間順序瀏覽演示文稿)。
在我看來,保羅在整個演講中嵌入了一個主題,這是他演講的支柱。 這個主題是“排名工程師做什麼?” .
根據 Paul 的說法,這個答案有四個版本,每個版本都略微改進了排名工程師的角色:
- 為那些 [Google 的搜索] 服務器編寫代碼。 資料來源:幻燈片 16
- 尋找新的信號。 以新方式組合舊信號。 資料來源:幻燈片 19
- 針對我們的指標進行優化 [相關性/搜索者意圖和質量]。 來源:幻燈片 24
- 將具有良好評級的結果 [來自現場實驗和人類評估者] 提升。 將評分不佳的結果向下移動。 資料來源:幻燈片 55
請注意,括號 [ ] 表示我自己的感嘆,以澄清(不完美)保羅的幻燈片。
那麼谷歌排名工程師是做什麼的? 我收到的主要結論是:確保搜索實際上對用戶(人類)有所改進。 他們是如何做到的? 通過讓Google 更好地匹配搜索質量評級指南。
後來 Paul 發給 Rae 的一條推文再次強調了搜索質量評級指南的重要性,並且 SEO 確實應該閱讀整個文檔:
.@sugarrae 很高興你喜歡。 為了透明度,我認為評估者指南實際上很重要。 閱讀它們了嗎? https://t.co/llmUQJbkQ8
— 保羅·哈爾 (@haahr),2016 年 3 月 31 日
保羅演講中我最喜歡的一句話是他在 16 點 08 分談論 Google 的搜索質量評級指南。 引文本身來自演示文稿第 32 頁幻燈片中的 16:48 分鐘標記。 保羅說:
“如果你想知道谷歌為什麼要做某事,答案通常是讓它[搜索]看起來更像評估者指南所說的那樣。”
Paul Haahr,Google 排名工程師,SMX West 2016
這是一個強有力的聲明。 保羅總結了谷歌的所有變化,試圖更好地匹配他們發布的搜索質量評級指南! 長話短說:你想了解谷歌嗎? 去閱讀他們的質量指南。
好的,讓我們進入保羅演講的時間順序。
今日谷歌搜索
根據保羅的說法,今天的谷歌搜索有兩個主題:
- 移動優先
- 特徵
移動正在引領搜索查詢,而谷歌越來越多地考慮移動優先。 這對於 SEO 來說並不是新信息,但這是 Paul 強調要強調的。
保羅強調的第二點是功能的重要性,尤其是在移動設備中。

幻燈片四
有趣的是,保羅在總結今天的搜索時說:
“我們越來越多地進入一個世界,在這個世界中,搜索被視為生活各個方面的助手。”
Paul Haahr,Google 排名工程師,SMX West 2016
Google 搜索的工作原理
以前所有的 Google 都是 10 個藍色鏈接。 保羅將 10 個藍色鏈接時代的排名問題分解為“我們展示什麼文件?我們以什麼順序展示它們?”

幻燈片七
有趣的是:保羅花了一點時間澄清他永遠不會觸及廣告的話題。 具體來說,保羅說:
“廣告很棒,它們讓我們賺了很多錢,對廣告商來說效果很好。但我的工作,我們被明確告知“不要考慮對廣告的影響,不要考慮對收入的影響——只想著幫助用戶。”
Paul Haahr,Google 排名工程師,SMX West 2016
聽到關於教會和國家明確分離的消息很有趣 - 對不起,有償和有機。
查詢的生命週期
Paul 對排名的解釋從查詢的生命週期開始,以解釋搜索的工作原理。 搜索引擎有兩個部分:
- 提前(在查詢之前)
- 查詢處理。
查詢前:
- 爬網
- 分析抓取頁面
- 提取鏈接(搜索的經典版本)
- 渲染內容(Javascript、CSS - Paul 強調了這一點的重要性。)
- 註釋語義
- 建立索引
- 鏈接一本書的索引
- 對於每個單詞,它出現的頁面列表
- 分成數百萬頁
- 這些頁面被稱為“分片”
- Web 索引的 1000 個分片
- 加上每個文檔的元數據。
資料來源:幻燈片 10 和 11。
查詢處理(當有人使用搜索時):
- 查詢理解和擴展
- 查詢是否命名已知實體?
- 有沒有有用的同義詞?
- 上下文很重要
- 檢索和評分
- 將查詢發送到所有分片
- 每個分片:
- 查找匹配頁面
- 計算查詢+頁面的分數
- 按分數發回前 N 頁
- 合併所有首頁
- 按分數排序
- 檢索後調整
- 主機集群(有多少頁面來自同一域)、附加鏈接
- 是否有太多重複?
- 垃圾郵件降級、手動操作適用
來源:幻燈片 12、13、14 和 15。
谷歌評分信號
Paul 指的是表示查詢和頁面之間匹配的單個數字。
這是基於評分信號,它基於兩個類別:
- 基於頁面的評分信號
- 根據查詢對信號進行評分。

幻燈片十八
保羅在這裡引用了排名工程師工作的第二個版本:尋找新信號,或以新方式組合舊信號。 保羅將其描述為“艱難而有趣”。
排名的關鍵指標:相關性、質量、結果時間
保羅強調相關性是搜索結果中的一個關鍵指標。 相關性基本上被解釋為“匹配用戶意圖”。
保羅將相關性稱為“我們的頂線指標”和“重要的內部指標”。
還有另外兩個:質量和結果時間(越快越好)。 在這次演講中,相關性和質量是重點。
倒數排名權重
CTR(點擊率)經常在 SEO 中討論,特別是對於搜索排名。 成為有機排名第一與排名第二的價值是什麼? 與排名第四? 這經常被討論和辯論。 保羅從價值的角度解釋了谷歌的觀點。
他將這個想法定義為“相互排名權重”:

幻燈片二十三
需要明確的是,Paul 不是在討論點擊率。 相反,它是一個評估整個搜索頁面的內部指標。
這個想法代表了每個職位價值 50% 的貶值,排名第一的價值是排名第十的價值的十倍。

相當迷人。
這讓保羅進入了谷歌排名工程師所做的第三個版本:優化我們的指標 [相關性和質量]。

幻燈片二十四
Google 如何評價搜索結果?
保羅解釋說,谷歌有兩種方式分析特定結果的功效:
- 現場實驗
- 人類評估者。
視頻如下:
現場實驗
Google 對實際流量運行實時 A/B 測試,然後查找點擊模式的變化。
“我們進行了很多實驗。如果您在 Google 上進行搜索並且您至少沒有參與一項實驗,這種情況是非常罕見的。”
Paul Haahr,Google 排名工程師,SMX West 2016
保羅花一點時間解釋解釋現場實驗是一項艱鉅的任務。
他的主要示例(如下)是帶有答案框的結果。 傳統上,如果搜索者點擊進入網站,這將被視為一個好的結果。 但是,如果搜索者看到了答案,感到滿意並關閉了呢? 傳統上,這會被評為糟糕的結果,但在這種情況下,它實際上可能是一個好結果。

幻燈片三十
保羅的例子的重點是展示分析搜索者滿意度是多麼具有挑戰性。
Google 的人工評分實驗
這部分最重要的一點是這裡再次強調移動優先,大多數人類評估實驗都在智能手機上進行。
人類評估者實驗的工作原理如下:
- 顯示真人實驗搜索結果
- 詢問結果有多好(相關性和質量的滑動率)
- 評分者的綜合評分
同樣,非常重要的是要注意谷歌已經發布了他們的搜索質量評估指南。
說真的,看那個剪輯。
搜索質量評估員評級示例
Paul 開始在 16:56 標記處查看搜索質量評級實驗的示例和屏幕截圖
我建議觀看這部分的視頻,因為保羅在很大程度上依賴於幻燈片。 接下來,演示的這一部分從幻燈片 33 開始。
判斷結果的兩個尺度:相關性和質量
Google 為評估者提供了兩種衡量結果質量的標準:
- 滿足的需求(相關性)
- 頁面質量

幻燈片三十五
移動優先實驗
保羅還強調移動優先。
他們通過五種方式實現這一目標:
- 所有相關說明都是關於移動用戶的需求。
- 在實驗中,移動查詢的使用量是原來的兩倍。
- 用戶的位置包含在實驗中。
- 該工具顯示移動用戶體驗。
- 評分者使用他們的智能手機訪問網站。
我不能強調這是多麼重要。 谷歌顯然是在把重點放在移動設備上。 這裡沒有中間立場。
需求滿足評級 - 相關性評級
有五種不同類別的相關性,定義為“滿足需求”:
- 完全滿足
- 高度滿足
- 適度滿足
- 稍微滿足
- 未能見面。
重要的是要注意,評分者不會只用五個選項進行判斷:他們會看到一個滑動量表,可以落在任何這些評級之間的任何位置。
從幻燈片 41 開始,Paul 介紹了每個評級的示例:
這是隨附的視頻:
重要的收穫:
- “完全滿足”僅在查詢明確且結果可以完全滿足用戶對查詢的意圖時才存在。
- “高度滿足”有時需要兩個特定的、獨立的結果才能滿足用戶意圖。
- “適度滿足”通常是很好的信息。
- “稍微滿足”是可以接受的,但不是很好的信息,希望能顯示更好的結果。
- “未能見面”是可笑的,保羅引用搜索錯誤返回糟糕的結果。
頁面質量評級
谷歌著眼於三個重要的概念來描述頁面的質量:
- 專業知識
- 權威
- 可信度。
質量等級由高到低。
高質量頁面:
- 令人滿意的高質量主要內容。
- 專業知識、權威和信任是明確的。
- 該網站具有良好的聲譽。

幻燈片五十
低質量頁面:
- 內容質量低
- 主要內容不多
- 沒有顯示專業知識或權威
- 該網站的聲譽不佳
- 次要內容(廣告)分散注意力。

幻燈片五十一
優化搜索質量指標
數百名計算機科學家從事等級工程。 他們專注於指標和信號,不斷進行實驗,進行大量更改——所有這些都是為了讓 Google 的搜索結果更好(並更準確地反映搜索質量評估指南)。
開發過程對於軟件開發過程來說是相當標準的。

幻燈片五十四
重要亮點:
- 該過程可能需要數周到數月的時間來測試代碼。
- 定量分析師(基本上是統計學家)審查數據。 他們讓排名工程師保持誠實,對變化提供大部分無偏見的分析。
- 啟動審查小組審查項目摘要,審查文檔和報告,並討論排名變化的優點。
- 實際推送更新可能快也可能慢,這取決於代碼為算法準備的程度。
排名工程師創建這些更新主要是為了將評級良好的結果向上移動,並將評級不佳的結果向下移動。
開發過程中出了什麼問題
保羅談到兩類問題:
- 系統性差評。
- 不捕捉他們關心的概念的指標。
系統性差評
保羅以[德州農場肥料]為例。 原來這是一個肥料品牌,但谷歌卻退回了製造商。 人們不太可能真正想要製造商的地圖,而是更願意看到實際產品。 然而,人類評估者始終認為這是“高度滿足需求”的結果。
這實際上導致了添加更多地圖的模式,這實際上創建了評分很高的結果,但實際上卻是糟糕的實時搜索體驗。
缺少指標
保羅引用了谷歌在 2008-2011 年的質量問題。 具體來說,內容農場的問題。
內容農場可以產生低質量、高度相關的內容。 這導致了高評價的結果,但實際上質量很低。 內容農場導致谷歌在他們的人類評級實驗中實施第二個滑塊,判斷結果的質量。
聽到 Paul 討論內容農場的問題和對搜索質量的影響,以及如何實施另一個衡量搜索結果有效性的指標來克服這個問題,這絕對令人著迷。
同樣令人著迷的是這裡沒有提到 Panda,這就是 Google 在算法上處理內容農場的方式。
根據 Paul 的說法,缺少指標的解決方案是修復評估者指南或開發新指標(在必要時)。

幻燈片六十七
這就是保羅演講的全部內容!
最後的想法和要點
最後總結一下這篇長文。
- 我會盡快閱讀《搜索質量評估者指南》。 你也應該。 保羅強調搜索排名中所做的所有更改都應反映該文件。 想了解谷歌排名? (作為 SEO,答案應該是響亮的“是!”)然後閱讀該文檔。
- 谷歌確實是移動優先。 所有人類評估者實驗都非常強調移動優先體驗,其程度令人驚訝。
- 幾乎每一次搜索都包含一個實時實驗。
- 相關性是 Google 的第一大指標。 他們將“相關性”定義為在搜索中滿足用戶(人類)需求。 如果您想獲得更高的排名,請考慮滿足搜索者的期望和需求。
- 谷歌對第一個結果的重視程度要高得多。 每個後續結果都會降低前一個結果值的 50%。 結果#1 考慮的價值是結果#10 的十倍。
我敢肯定還有其他重要的收穫,但我的大腦正式被炸了。 歡迎提供反饋——希望你喜歡報導。
