Google 的工作原理:Google 排名工程师的故事 - SMX West 2016 的报道和分析
已发表: 2021-10-08你好朋友。 我们不时在 Linkarati 上报道我们认为值得分享和放大的新闻、趋势或演示。
今天,我偶然发现了 Rae Hoffman 的一条引人注目的推文:
如果你看到这个 https://t.co/JN9T1IOBjc 并且没有花时间看它并这样做,祝你的 SEO 事业好运 pic.twitter.com/YliYKcSFdq
- Rae Hoffman (@sugarrae),2016 年 3 月 31 日
该链接指向 SMX 的视频,该视频是在 Google 工作了 14 年的软件工程师 Paul Haahr,他在 SMX West 2016 上从他作为 Google 排名工程师的角度介绍了 Google 的工作方式。
正如介绍 Paul 的 Danny Sullivan 所说,Paul 的头衔并不反映他是Google 排名团队高级领导层的一员。
作为 SEO,这应该会让您心跳加速。
丹尼重申我们(搜索引擎优化社区)有保罗在场是多么幸运。 从她的推文中可以看出,Rae 坚信这是每个 SEO 都需要深入观察并做笔记的事情。 我有什么资格争论?
我经常发现,撰写演讲报道比做笔记能教会我更多的东西,因为我必须更进一步,写下其他人可以理解和欣赏的笔记。 它又增加了一层批判性思维。
我决定这样做,以便自己更好地理解材料并帮助您更快地消化演示文稿。 双赢,对吧? 注意:Rae 在这里有她自己的笔记和报道。
我建议您跟随视频,该视频将贯穿始终。 下面我还嵌入了来自 Slideshare 的 Paul 演示文稿,我将剪辑并发布静止图像以配合我的报道。
坐下来,享受,让我知道你的想法。
让我们进入它。
注意:Emanuele Vaccari 将这篇文章翻译成意大利语,以及他自己的一些想法。 你可以在这里看到他翻译的帖子。
谷歌排名工程师做什么
实际上,我将立即打破我自己的报道规则之一并忽略时间顺序(但仅限于现在 - 我将在本节之后按时间顺序浏览演示文稿)。
在我看来,保罗在整个演讲中嵌入了一个主题,这是他演讲的支柱。 这个主题是“排名工程师做什么?” .
根据 Paul 的说法,这个答案有四个版本,每个版本都略微改进了排名工程师的角色:
- 为那些 [Google 的搜索] 服务器编写代码。 来源:幻灯片 16
- 寻找新的信号。 以新方式组合旧信号。 资料来源:幻灯片 19
- 针对我们的指标进行优化 [相关性/搜索者意图和质量]。 来源:幻灯片 24
- 将具有良好评级的结果 [来自现场实验和人类评估者] 提升。 将评分不佳的结果向下移动。 资料来源:幻灯片 55
请注意,括号 [ ] 表示我自己的感叹,以澄清(不完美)保罗的幻灯片。
那么谷歌排名工程师是做什么的? 我收到的主要结论是:确保搜索实际上对用户(人类)有所改进。 他们是如何做到的? 通过让Google 更好地匹配搜索质量评级指南。
后来 Paul 发给 Rae 的一条推文再次强调了搜索质量评级指南的重要性,并且 SEO 确实应该阅读整个文档:
.@sugarrae 很高兴你喜欢。 为了透明度,我认为评估者指南实际上很重要。 阅读它们了吗? https://t.co/llmUQJbkQ8
— 保罗·哈尔 (@haahr),2016 年 3 月 31 日
保罗演讲中我最喜欢的一句话是他在 16 点 08 分谈论 Google 的搜索质量评级指南。 引文本身来自演示文稿第 32 页幻灯片中的 16:48 分钟标记。 保罗说:
“如果你想知道谷歌为什么要做某事,答案通常是让它[搜索]看起来更像评估者指南所说的那样。”
Paul Haahr,Google 排名工程师,SMX West 2016
这是一个强有力的声明。 保罗总结了谷歌的所有变化,试图更好地匹配他们发布的搜索质量评级指南! 长话短说:你想了解谷歌吗? 去阅读他们的质量指南。
好的,让我们进入保罗演讲的时间顺序。
今日谷歌搜索
根据保罗的说法,今天的谷歌搜索有两个主题:
- 移动优先
- 特征
移动正在引领搜索查询,而谷歌越来越多地考虑移动优先。 这对于 SEO 来说并不是新信息,但这是 Paul 强调要强调的。
保罗强调的第二点是功能的重要性,尤其是在移动设备中。

幻灯片四
有趣的是,保罗在总结今天的搜索时说:
“我们越来越多地进入一个世界,在这个世界中,搜索被视为生活各个方面的助手。”
Paul Haahr,Google 排名工程师,SMX West 2016
Google 搜索的工作原理
所有的谷歌过去都是 10 个蓝色链接。 保罗将 10 个蓝色链接时代的排名问题分解为“我们展示什么文件?我们以什么顺序展示它们?”

幻灯片七
有趣的是:保罗花了一点时间澄清他永远不会触及广告的话题。 具体来说,保罗说:
“广告很棒,它们让我们赚了很多钱,对广告商来说效果很好。但我的工作,我们被明确告知“不要考虑对广告的影响,不要考虑对收入的影响——只想着帮助用户。”
Paul Haahr,Google 排名工程师,SMX West 2016
听到关于教会和国家明确分离的消息很有趣 - 对不起,有偿和有机。
查询的生命周期
Paul 对排名的解释从查询的生命周期开始,以解释搜索的工作原理。 搜索引擎有两个部分:
- 提前(在查询之前)
- 查询处理。
查询前:
- 爬网
- 分析抓取页面
- 提取链接(搜索的经典版本)
- 渲染内容(Javascript、CSS - Paul 强调了这一点的重要性。)
- 注释语义
- 建立索引
- 链接一本书的索引
- 对于每个单词,它出现的页面列表
- 分成数百万页
- 这些页面被称为“分片”
- Web 索引的 1000 个分片
- 加上每个文档的元数据。
资料来源:幻灯片 10 和 11。
查询处理(当有人使用搜索时):
- 查询理解和扩展
- 查询是否命名已知实体?
- 有没有有用的同义词?
- 上下文很重要
- 检索和评分
- 将查询发送到所有分片
- 每个分片:
- 查找匹配页面
- 计算查询+页面的分数
- 按分数发回前 N 页
- 合并所有首页
- 按分数排序
- 检索后调整
- 主机集群(有多少页面来自同一域)、附加链接
- 是否有太多重复?
- 垃圾邮件降级、手动操作适用
来源:幻灯片 12、13、14 和 15。
谷歌评分信号
Paul 指的是表示查询和页面之间匹配的单个数字。
这是基于评分信号,它基于两个类别:
- 基于页面的评分信号
- 根据查询对信号进行评分。

幻灯片十八
保罗在这里引用了排名工程师工作的第二个版本:寻找新信号,或以新方式组合旧信号。 保罗将其描述为“艰难而有趣”。
排名的关键指标:相关性、质量、结果时间
保罗强调相关性是搜索结果中的一个关键指标。 相关性基本上被解释为“匹配用户意图”。
保罗将相关性称为“我们的顶线指标”和“重要的内部指标”。
还有另外两个:质量和结果时间(越快越好)。 在这次演讲中,相关性和质量是重点。
倒数排名权重
CTR(点击率)经常在 SEO 中讨论,特别是对于搜索排名。 成为有机排名第一与排名第二的价值是什么? 与排名第四? 这经常被讨论和辩论。 保罗从价值的角度解释了谷歌的观点。
他将这个想法定义为“相互排名权重”:

幻灯片二十三
需要明确的是,Paul 不是在讨论点击率。 相反,它是一个评估整个搜索页面的内部指标。
这个想法代表了每个职位价值 50% 的贬值,排名第一的价值是排名第十的价值的十倍。

相当迷人。
这让保罗进入了谷歌排名工程师所做的第三个版本:优化我们的指标 [相关性和质量]。

幻灯片二十四
Google 如何评价搜索结果?
保罗解释说,谷歌有两种方式分析特定结果的功效:
- 现场实验
- 人类评估者。
视频如下:
现场实验
Google 对实际流量运行实时 A/B 测试,然后查找点击模式的变化。
“我们进行了很多实验。如果您在 Google 上进行搜索并且您至少没有参与一项实验,这种情况非常罕见。”
Paul Haahr,Google 排名工程师,SMX West 2016
保罗花一点时间解释解释现场实验是一项艰巨的任务。
他的主要示例(如下)是带有答案框的结果。 传统上,如果搜索者点击进入网站,这将被视为一个好的结果。 但是,如果搜索者看到了答案,感到满意并关闭了呢? 传统上,这会被评为糟糕的结果,但在这种情况下,它实际上可能是一个好结果。

幻灯片三十
保罗的例子的重点是展示分析搜索者满意度是多么具有挑战性。
Google 的人工评分实验
这部分最重要的一点是这里再次强调移动优先,大多数人类评估实验都在智能手机上进行。
人类评估者实验的工作原理如下:
- 显示真人实验搜索结果
- 询问结果有多好(相关性和质量的滑动率)
- 评分者的综合评分
同样,非常重要的是要注意谷歌已经发布了他们的搜索质量评估指南。
说真的,看那个剪辑。
搜索质量评估员评级示例
Paul 开始在 16:56 标记处查看搜索质量评级实验的示例和屏幕截图
我建议观看这部分的视频,因为保罗在很大程度上依赖于幻灯片。 接下来,演示的这一部分从幻灯片 33 开始。
判断结果的两个尺度:相关性和质量
Google 为评估者提供了两种衡量结果质量的标准:
- 满足的需求(相关性)
- 页面质量

幻灯片三十五
移动优先实验
保罗还强调移动优先。
他们通过五种方式实现这一目标:
- 所有相关说明都是关于移动用户的需求。
- 在实验中,移动查询的使用量是原来的两倍。
- 用户的位置包含在实验中。
- 该工具显示移动用户体验。
- 评分者使用他们的智能手机访问网站。
我不能强调这是多么重要。 谷歌显然是在把重点放在移动设备上。 这里没有中间立场。
需求满足评级 - 相关性评级
有五种不同类别的相关性,定义为“满足需求”:
- 完全满足
- 高度满足
- 适度满足
- 稍微满足
- 未能见面。
重要的是要注意,评分者不会只用五个选项进行判断:他们会看到一个滑动量表,可以落在任何这些评级之间的任何位置。
从幻灯片 41 开始,Paul 介绍了每个评级的示例:
这是随附的视频:
重要的收获:
- “完全满足”仅在查询明确且结果可以完全满足用户对查询的意图时才存在。
- “高度满足”有时需要两个特定的、独立的结果才能满足用户意图。
- “适度满足”通常是很好的信息。
- “稍微满足”是可以接受的,但不是很好的信息,希望能显示更好的结果。
- “未能见面”是可笑的,保罗引用搜索错误返回糟糕的结果。
页面质量评级
谷歌着眼于三个重要的概念来描述页面的质量:
- 专业知识
- 权威
- 可信度。
质量等级由高到低。
高质量页面:
- 令人满意的高质量主要内容。
- 专业知识、权威和信任是明确的。
- 该网站具有良好的声誉。

幻灯片五十
低质量页面:
- 内容质量低
- 主要内容不多
- 没有显示专业知识或权威
- 该网站的声誉不佳
- 次要内容(广告)分散注意力。

幻灯片五十一
优化搜索质量指标
数百名计算机科学家从事等级工程。 他们专注于指标和信号,不断进行实验,进行大量更改——所有这些都是为了让 Google 的搜索结果更好(并更准确地反映搜索质量评估指南)。
开发过程对于软件开发过程来说是相当标准的。

幻灯片五十四
重要亮点:
- 该过程可能需要数周到数月的时间来测试代码。
- 定量分析师(基本上是统计学家)审查数据。 他们让排名工程师保持诚实,对变化提供大部分公正的分析。
- 启动审查小组审查项目摘要,审查文档和报告,并讨论排名变化的优点。
- 实际推送更新可能快也可能慢,这取决于代码对算法的准备程度。
排名工程师创建这些更新主要是为了将评级良好的结果向上移动,并将评级不佳的结果向下移动。
开发过程中出了什么问题
保罗谈到两类问题:
- 系统性差评。
- 不捕捉他们关心的概念的指标。
系统性差评
保罗以[德州农场肥料]为例。 原来这是一个肥料品牌,但谷歌却退回了制造商。 人们不太可能真正想要制造商的地图,而是更愿意看到实际产品。 然而,人类评估者始终将其评为“高度满足需求”的结果。
这实际上导致了添加更多地图的模式,这实际上创建了评分很高的结果,但实际上却是糟糕的实时搜索体验。
缺少指标
保罗引用了谷歌在 2008-2011 年的质量问题。 具体来说,内容农场的问题。
内容农场可以产生低质量、高度相关的内容。 这导致了高评价的结果,但实际上质量很低。 内容农场导致谷歌在他们的人类评级实验中实施第二个滑块,判断结果的质量。
听到保罗讨论内容农场的问题和对搜索质量的影响,以及如何实施另一个衡量搜索结果有效性的指标来克服这个问题,这绝对令人着迷。
同样令人着迷的是这里没有提到熊猫,这就是谷歌在算法上处理内容农场的方式。
根据 Paul 的说法,缺少指标的解决方案是修复评估者指南或开发新指标(在必要时)。

幻灯片六十七
这就是保罗演讲的全部内容!
最后的想法和要点
最后总结一下这篇长文。
- 我会尽快阅读《搜索质量评估者指南》。 你也应该。 保罗强调搜索排名中所做的所有更改都应反映该文件。 想了解谷歌排名? (作为 SEO,答案应该是响亮的“是!”)然后阅读该文档。
- 谷歌确实是移动优先。 所有人类评估者实验都非常强调移动优先体验,其程度令人惊讶。
- 几乎每一次搜索都包含一个实时实验。
- 相关性是 Google 的第一大指标。 他们将“相关性”定义为在搜索中满足用户(人类)需求。 如果您想获得更高的排名,请考虑满足搜索者的期望和需求。
- 谷歌对第一个结果的重视程度要高得多。 每个后续结果都会降低前一个结果值的 50%。 结果#1 考虑的价值是结果#10 的十倍。
我敢肯定还有其他重要的收获,但我的大脑正式被炸了。 欢迎提供反馈——希望你喜欢报道。
