Google 的工作原理:Google 排名工程师的故事 - SMX West 2016 的报道和分析

已发表: 2021-10-08

你好朋友。 我们不时在 Linkarati 上报道我们认为值得分享和放大的新闻、趋势或演示。

今天,我偶然发现了 Rae Hoffman 的一条引人注目的推文:

该链接指向 SMX 的视频,该视频是在 Google 工作了 14 年的软件工程师 Paul Haahr,他在 SMX West 2016 上从他作为 Google 排名工程师的角度介绍了 Google 的工作方式。

正如介绍 Paul 的 Danny Sullivan 所说,Paul 的头衔并不反映他是Google 排名团队高级领导层的一员

作为 SEO,这应该会让您心跳加速。

丹尼重申我们(搜索引擎优化社区)有保罗在场是多么幸运。 从她的推文中可以看出,Rae 坚信这是每个​​ SEO 都需要深入观察并做笔记的事情。 我有什么资格争论?

我经常发现,撰写演讲报道比做笔记能教会我更多的东西,因为我必须更进一步,写下其他人可以理解和欣赏的笔记。 它又增加了一层批判性思维。

我决定这样做,以便自己更好地理解材料并帮助您更快地消化演示文稿。 双赢,对吧? 注意:Rae 在这里有她自己的笔记和报道。

我建议您跟随视频,该视频将贯穿始终。 下面我还嵌入了来自 Slideshare 的 Paul 演示文稿,我将剪辑并发布静止图像以配合我的报道。

Google 的工作原理:来自Search Marketing Expo - SMX 的Paul Haahr 的排名工程师观点

坐下来,享受,让我知道你的想法。

让我们进入它。

注意:Emanuele Vaccari 将这篇文章翻译成意大利语,以及他自己的一些想法。 你可以在这里看到他翻译的帖子。

谷歌排名工程师做什么

实际上,我将立即打破我自己的报道规则之一并忽略时间顺序(但仅限于现在 - 我将在本节之后按时间顺序浏览演示文稿)。

在我看来,保罗在整个演讲中嵌入了一个主题,这是他演讲的支柱。 这个主题是“排名工程师做什么?” .

根据 Paul 的说法,这个答案有四个版本,每个版本都略微改进了排名工程师的角色:

  1. 为那些 [Google 的搜索] 服务器编写代码。 来源:幻灯片 16
  2. 寻找新的信号。 以新方式组合旧信号。 资料来源:幻灯片 19
  3. 针对我们的指标进行优化 [相关性/搜索者意图和质量]。 来源:幻灯片 24
  4. 将具有良好评级的结果 [来自现场实验和人类评估者] 提升。 将评分不佳的结果向下移动。 资料来源:幻灯片 55

请注意,括号 [ ] 表示我自己的感叹,以澄清(不完美)保罗的幻灯片。

那么谷歌排名工程师是做什么的? 我收到的主要结论确保搜索实际上对用户(人类)有所改进。 他们是如何做到的? 通过让Google 更好地匹配搜索质量评级指南

后来 Paul 发给 Rae 的一条推文再次强调了搜索质量评级指南的重要性,并且 SEO 确实应该阅读整个文档:

保罗演讲中我最喜欢的一句话是他在 16 点 08 分谈论 Google 的搜索质量评级指南。 引文本身来自演示文稿第 32 页幻灯片中的 16:48 分钟标记。 保罗说:

“如果你想知道谷歌为什么要做某事,答案通常是让它[搜索]看起来更像评估者指南所说的那样。”

Paul Haahr,Google 排名工程师,SMX West 2016

这是一个强有力的声明。 保罗总结了谷歌的所有变化,试图更好地匹配他们发布的搜索质量评级指南! 长话短说:你想了解谷歌吗? 去阅读他们的质量指南。

好的,让我们进入保罗演讲的时间顺序。

今日谷歌搜索

根据保罗的说法,今天的谷歌搜索有两个主题:

  1. 移动优先
  2. 特征

移动正在引领搜索查询,而谷歌越来越多地考虑移动优先。 这对于 SEO 来说并不是新信息,但这是 Paul 强调要强调的。

保罗强调的第二点是功能的重要性,尤其是在移动设备中。

Google_features_slide.png

幻灯片四

有趣的是,保罗在总结今天的搜索时说:

“我们越来越多地进入一个世界,在这个世界中,搜索被视为生活各个方面的助手。”

Paul Haahr,Google 排名工程师,SMX West 2016

Google 搜索的工作原理

所有的谷歌过去都是 10 个蓝色链接。 保罗将 10 个蓝色链接时代的排名问题分解为“我们展示什么文件?我们以什么顺序展示它们?”

Google_10_blue_links_ranking.png

幻灯片七

有趣的是:保罗花了一点时间澄清他永远不会触及广告的话题。 具体来说,保罗说:

“广告很棒,它们让我们赚了很多钱,对广告商来说效果很好。但我的工作,我们被明确告知“不要考虑对广告的影响,不要考虑对收入的影响——只想着帮助用户。”

Paul Haahr,Google 排名工程师,SMX West 2016

听到关于教会和国家明确分离的消息很有趣 - 对不起,有偿和有机。

查询的生命周期

Paul 对排名的解释从查询的生命周期开始,以解释搜索的工作原理。 搜索引擎有两个部分:

  1. 提前(在查询之前)
  2. 查询处理。

查询前:

  • 爬网
  • 分析抓取页面
    • 提取链接(搜索的经典版本)
    • 渲染内容(Javascript、CSS - Paul 强调了这一点的重要性。)
    • 注释语义
  • 建立索引
    • 链接一本书的索引
    • 对于每个单词,它出现的页面列表
    • 分成数百万页
      • 这些页面被称为“分片”
      • Web 索引的 1000 个分片
    • 加上每个文档的元数据。

资料来源:幻灯片 10 和 11。

查询处理(当有人使用搜索时):

  • 查询理解和扩展
    • 查询是否命名已知实体?
    • 有没有有用的同义词?
    • 上下文很重要
  • 检索和评分
    • 将查询发送到所有分片
    • 每个分片:
      • 查找匹配页面
      • 计算查询+页面的分数
      • 按分数发回前 N 页
    • 合并所有首页
    • 按分数排序
  • 检索后调整
    • 主机集群(有多少页面来自同一域)、附加链接
    • 是否有太多重复?
    • 垃圾邮件降级、手动操作适用

来源:幻灯片 12、13、14 和 15。

谷歌评分信号

Paul 指的是表示查询和页面之间匹配的单个数字。

这是基于评分信号,它基于两个类别:

  1. 基于页面的评分信号
  2. 根据查询对信号进行评分。

Google_Scoring_signals.png

幻灯片十八

保罗在这里引用了排名工程师工作的第二个版本:寻找新信号,或以新方式组合旧信号。 保罗将其描述为“艰难而有趣”。

排名的关键指标:相关性、质量、结果时间

保罗强调相关性是搜索结果中的一个关键指标。 相关性基本上被解释为“匹配用户意图”。

保罗将相关性称为“我们的顶线指标”和“重要的内部指标”。

还有另外两个:质量和结果时间(越快越好)。 在这次演讲中,相关性和质量是重点。

倒数排名权重

CTR(点击率)经常在 SEO 中讨论,特别是对于搜索排名。 成为有机排名第一与排名第二的价值是什么? 与排名第四? 这经常被讨论和辩论。 保罗从价值的角度解释了谷歌的观点。

他将这个想法定义为“相互排名权重”:

reciprocal_rank_weighting.png

幻灯片二十三

需要明确的是,Paul 不是在讨论点击率。 相反,它是一个评估整个搜索页面的内部指标。

这个想法代表了每个职位价值 50% 的贬值,排名第一的价值是排名第十的价值的十倍。

相当迷人。

这让保罗进入了谷歌排名工程师所做的第三个版本:优化我们的指标 [相关性和质量]。

ranking_engineers_optimize_metrics.png

幻灯片二十四

Google 如何评价搜索结果?

保罗解释说,谷歌有两种方式分析特定结果的功效:

  1. 现场实验
  2. 人类评估者。

视频如下:

现场实验

Google 对实际流量运行实时 A/B 测试,然后查找点击模式的变化。

“我们进行了很多实验。如果您在 Google 上进行搜索并且您至少没有参与一项实验,这种情况非常罕见。”

Paul Haahr,Google 排名工程师,SMX West 2016

保罗花一点时间解释解释现场实验是一项艰巨的任务。

他的主要示例(如下)是带有答案框的结果。 传统上,如果搜索者点击进入网站,这将被视为一个好的结果。 但是,如果搜索者看到了答案,感到满意并关闭了呢? 传统上,这会被评为糟糕的结果,但在这种情况下,它实际上可能是一个好结果。

Interpreting_live_search_experiments.png

幻灯片三十

保罗的例子的重点是展示分析搜索者满意度是多么具有挑战性。

Google 的人工评分实验

这部分最重要的一点是这里再次强调移动优先大多数人类评估实验都在智能手机上进行

人类评估者实验的工作原理如下:

  1. 显示真人实验搜索结果
  2. 询问结果有多好(相关性和质量的滑动率)
  3. 评分者的综合评分

同样,非常重要的是要注意谷歌已经发布了他们的搜索质量评估指南。

说真的,看那个剪辑。

搜索质量评估员评级示例

Paul 开始在 16:56 标记处查看搜索质量评级实验的示例和屏幕截图

我建议观看这部分的视频,因为保罗在很大程度上依赖于幻灯片。 接下来,演示的这一部分从幻灯片 33 开始。

判断结果的两个尺度:相关性和质量

Google 为评估者提供了两种衡量结果质量的标准:

  1. 满足的需求(相关性)
  2. 页面质量

Judging_search_results.png

幻灯片三十五

移动优先实验

保罗还强调移动优先。

他们通过五种方式实现这一目标:

  1. 所有相关说明都是关于移动用户的需求。
  2. 在实验中,移动查询的使用量是原来的两倍。
  3. 用户的位置包含在实验中。
  4. 该工具显示移动用户体验。
  5. 评分者使用他们的智能手机访问网站。

我不能强调这是多么重要。 谷歌显然是在把重点放在移动设备上。 这里没有中间立场。

需求满足评级 - 相关性评级

有五种不同类别的相关性,定义为“满足需求”:

  1. 完全满足
  2. 高度满足
  3. 适度满足
  4. 稍微满足
  5. 未能见面。

重要的是要注意,评分者不会只用五个选项进行判断:他们会看到一个滑动量表,可以落在任何这些评级之间的任何位置。

从幻灯片 41 开始,Paul 介绍了每个评级的示例:

Google 的工作原理:来自Search Marketing Expo - SMX 的Paul Haahr 的排名工程师观点

这是随附的视频:

重要的收获:

  1. “完全满足”仅在查询明确且结果可以完全满足用户对查询的意图时才存在。
  2. “高度满足”有时需要两个特定的、独立的结果才能满足用户意图。
  3. “适度满足”通常是很好的信息。
  4. “稍微满足”是可以接受的,但不是很好的信息,希望能显示更好的结果。
  5. “未能见面”是可笑的,保罗引用搜索错误返回糟糕的结果。

页面质量评级

谷歌着眼于三个重要的概念来描述页面的质量:

  1. 专业知识
  2. 权威
  3. 可信度。

质量等级由高到低。

高质量页面:

  • 令人满意的高质量主要内容。
  • 专业知识、权威和信任是明确的。
  • 该网站具有良好的声誉。

high_quality_pages_according_to_Google.png

幻灯片五十

低质量页面:

  • 内容质量低
  • 主要内容不多
  • 没有显示专业知识或权威
  • 该网站的声誉不佳
  • 次要内容(广告)分散注意力。

Low_quality_pages_according_to_Google.png

幻灯片五十一

优化搜索质量指标

数百名计算机科学家从事等级工程。 他们专注于指标和信号,不断进行实验,进行大量更改——所有这些都是为了让 Google 的搜索结果更好(并更准确地反映搜索质量评估指南)。

开发过程对于软件开发过程来说是相当标准的。

Google_ranking_development_process.png

幻灯片五十四

重要亮点:

  1. 该过程可能需要数周到数月的时间来测试代码。
  2. 定量分析师(基本上是统计学家)审查数据。 他们让排名工程师保持诚实,对变化提供大部分公正的分析。
  3. 启动审查小组审查项目摘要,审查文档和报告,并讨论排名变化的优点。
  4. 实际推送更新可能快也可能慢,这取决于代码对算法的准备程度。

排名工程师创建这些更新主要是为了将评级良好的结果向上移动,并将评级不佳的结果向下移动。

开发过程中出了什么问题

保罗谈到两类问题:

  1. 系统性差评。
  2. 不捕捉他们关心的概念的指标。

系统性差评

保罗以[德州农场肥料]为例。 原来这是一个肥料品牌,但谷歌却退回了制造商。 人们不太可能真正想要制造商的地图,而是更愿意看到实际产品。 然而,人类评估者始终将其评为“高度满足需求”的结果。

这实际上导致了添加更多地图的模式,这实际上创建了评分很高的结果,但实际上却是糟糕的实时搜索体验。

缺少指标

保罗引用了谷歌在 2008-2011 年的质量问题。 具体来说,内容农场的问题。

内容农场可以产生低质量、高度相关的内容。 这导致了高评价的结果,但实际上质量很低。 内容农场导致谷歌在他们的人类评级实验中实施第二个滑块,判断结果的质量。

听到保罗讨论内容农场的问题和对搜索质量的影响,以及如何实施另一个衡量搜索结果有效性的指标来克服这个问题,这绝对令人着迷。

同样令人着迷的是这里没有提到熊猫,这就是谷歌在算法上处理内容农场的方式。

根据 Paul 的说法,缺少指标的解决方案是修复评估者指南或开发新指标(在必要时)。

fix_rater_guidlines_and_develop_new_metrics.png

幻灯片六十七

这就是保罗演讲的全部内容!

最后的想法和要点

最后总结一下这篇长文。

  1. 我会尽快阅读《搜索质量评估者指南》。 你也应该。 保罗强调搜索排名中所做的所有更改都应反映该文件。 想了解谷歌排名? (作为 SEO,答案应该是响亮的“是!”)然后阅读该文档。
  2. 谷歌确实是移动优先。 所有人类评估者实验都非常强调移动优先体验,其程度令人惊讶。
  3. 几乎每一次搜索都包含一个实时实验。
  4. 相关性是 Google 的第一大指标。 他们将“相关性”定义为在搜索中满足用户(人类)需求。 如果您想获得更高的排名,请考虑满足搜索者的期望和需求。
  5. 谷歌对第一个结果的重视程度要高得多。 每个后续结果都会降低前一个结果值的 50%。 结果#1 考虑的价值是结果#10 的十倍。

我敢肯定还有其他重要的收获,但我的大脑正式被炸了。 欢迎提供反馈——希望你喜欢报道。