什么是“软”404 错误,它们会影响我的排名吗?

已发表: 2021-07-19

软 404 错误与常见的 404 错误不同,它可能对您的网站有害。 修复它们很重要,这样您的网站才能从 SEO 的角度表现良好。

哈勒姆 404 错误页面

您可能熟悉 404 错误代码,它告诉您尚未找到您要查找的网页。 但是您是否知道在错误的上下文中使用此错误消息会产生所谓的软 404,这会影响您的 SEO 性能?

营销人员有时会忽略网站的此类技术方面,并期望 Web 开发人员来处理它们。 这可能不利于网站在搜索结果中的表现,这就是 SEO 专家需要与网络开发人员密切合作的原因。

本文将重点介绍一类特定的抓取错误,如果不解决该错误,可以极大地减少搜索引擎(例如 Google 抓取和索引)搜索结果中的页面数量。 在本文中,我们将介绍:

  • 什么是软 404 错误
  • 软 404 错误的问题
  • 如何修复软 404 错误
  • 为什么修复软 404 错误将有助于您的网站性能

什么是软 404 错误?

当网站的服务器返回HTTP 404 标准响应代码以指示它无法找到用户请求的网页 ( URL ) 时,会出现真正的 404 错误消息 这会通知浏览器和搜索引擎该页面不存在。

大多数人不明白的是,页面的内容——“页面未找到”消息——与服务器返回的 HTTP 响应完全无关。 仅仅因为页面显示 404 File Not Found 消息,并不意味着该页面被自动定义为 404 页面。

用谷歌自己的话来说:“这就像一头长颈鹿戴着一个写着‘狗’的名牌。 仅仅因为名称标签上写着它是一只狗,并不意味着它实际上是一只狗。 同样,仅仅因为页面显示 404,并不意味着它返回 404 状态代码。

当不存在的页面(已被删除/移除的页面)向尝试访问它的任何人显示“找不到页面”消息但未能返回 HTTP 404 状态代码时,会发生软 404 错误。 当不存在的页面将用户重定向到不相关的页面(例如主页)而不是返回 HTTP 404 状态代码时,也会发生这种情况。

这里要记住的重要一点是,网页的内容与服务器返回的 HTTP 响应完全无关。

这种区别对于 SEO 很重要,因为它决定了 Google 如何对待页面。 爬行和索引是 Google 的机器人在搜索引擎结果页面中列出您网站的页面之前要经过的一个过程。 当返回真正的 404 错误消息时,Google 的机器人不会花时间抓取页面或将其编入索引。 当返回软 404 错误时,页面仍会被抓取并编制索引。

软 404 错误的问题

如果您的网站为不存在的页面返回 404(或 410)以外的 HTTP 状态代码,则可能会对网站在自然搜索中的性能产生负面影响。 这意味着,如果您的网站有很高比例的软 404 错误,则可能是有害的。 由于未能提供 404 状态代码,您的网站正在告诉搜索引擎他们试图访问的 URL 中有一个真实页面。 因此,您删除的网址(没有内容)将被抓取并编入索引,从而在冗余页面上浪费宝贵的抓取预算。

Google 将抓取预算定义为“Googlebot 可以并且想要抓取的网址数量”。 抓取预算分为抓取率抓取需求:

  • 抓取速度- 旨在帮助 Google 不会太频繁或太快地抓取您的网页并损害您的服务器
  • 抓取需求– Google 想要抓取您的网页的程度。 这取决于您的网页有多受欢迎以及 Google 索引中的内容有多陈旧

谷歌不想在同一个网站上浪费无休止的时间来抓取内容,所以他们在转移到另一个网站之前为他们的网络抓取分配一个“预算”是有意义的。

坚持抓取预算的想法,如果一个网站的软 404 错误比例很高,那么这些页面将被抓取。 抓取这些不存在的页面的过程总是会占用分配给站点的不必要的抓取预算。 由于 Googlebot 花费时间来抓取软 404,因此您的唯一网址可能不会被快速地发现或抓取得那么频繁,从而降低了您网站上重要内容的可见度。

最终,如果您的软 404 百分比很高,那么您不仅会在无意义的页面上浪费抓取预算,还会降低重要页面的可见性。 因此,当软 404 错误得到解决时,网站在自然搜索结果中的性能往往会提高也就不足为奇了。

为了说明您如何评估软 404 问题的严重程度,让我们看一个在 Google Search Console 中显示大量软 404 错误的网站示例。 在下面的示例中,我们看到相关网站报告了 147 个软 404 错误。 这很可能会引起警钟响起,但我们首先需要在上下文中考虑这个数字。

软 404 错误

为此,我们需要检查网站上有多少网页已提交给 Google 进行抓取和索引。 对于此任务,我们将查看相关网站的 XML 站点地图——这是一个网站有多少页面的关键指标。 您可以在Search Console > Sitemaps查看已提交的 XML 站点地图

站点地图

可以在下拉菜单中的 Search Console > Coverage > Find XML sitemap下找到覆盖范围,显示有多少网页被编入索引或有任何问题

覆盖范围 - 正在服务的网页数量

上面的例子表明,谷歌正在索引相关网站的 3.31K 页内容。

查看上面的数据,我们可以看到这个网站有大约 3,409 个页面,所以 107 个软 404 错误现在开始看起来不那么不祥了。 尽管如此,在网站总页面的 3% 以上,107 个软 404 错误仍在浪费分配给该网站的一些抓取预算。 在这种情况下,Google 花费了太多时间来抓取根本不存在的 URL。

如何解决这些问题?

Google 只允许您在 Google Search Console 中导出最多 1000 个网址。 在上面的示例中,报告的错误少于 1000 个,因此可以直接通过 Search Console 下载这些错误。 导出 URL 列表后,您需要评估页面被报告为软 404 的原因。 Google 提供了一些关于他们突出显示为软 404 的 URL 的信息,如下例所示:

Google 关于软 404 错误的信息

在大多数情况下,您会发现网站将在返回“找不到页面”消息的页面上提供200(OK)状态代码 因此,您需要做的第一件事是通过 HTTP 状态代码检查器(例如httpstatus.io )运行选择的软 404 错误页面,以评估这些页面返回的状态代码。

假设下面的示例域向尝试访问它的用户显示 404 页面,但是当我们使用 HTTP 状态代码检查器检查响应代码时,它返回了 HTTP 200 响应。 这是软 404 错误的一个主要示例,因为 HTTP 响应代码向搜索引擎机器人指示该页面存在并且应该被抓取。 但是,服务器返回的页面上没有内容。

检查服务器响应代码

返回 HTTP 200 服务器响应代码的页面。 检查使用:https://httpstatus.io/

在诊断软 404 错误的根本原因时您可能会遇到的另一个问题是不适当的 301/302 重定向。

当页面被永久删除并且您希望将人们发送到更合适的新页面时,应使用 301 重定向。 302 重定向类似于 301,但在页面被临时删除时使用。

一些站长选择将所有已删除的页面重定向到网站首页,而不是提供 404 错误,这完全不合适,并且会混淆搜索引擎机器人 重要的是要强调在您的网站上使用 404 并不是一件坏事。 删除的页面或缺货的产品只能重定向到直接替换。 如果不存在直接替代品,那么您应该提供自定义 404 错误页面以向用户显示替代选项或产品。

我在下面突出显示了触发软 404 错误的不当重定向示例 在这种情况下,网站管理员使用302 重定向将尝试访问已删除页面的任何人重定向,并将这些用户重定向到自定义 404 页面——该页面实际上并不提供 HTTP 404 状态代码。 这将极大地影响搜索引擎如何抓取有问题的网站,因为搜索引擎被指示到别处寻找实际上已被删除的页面。 如果搜索引擎机器人遵循这些指令,他们最终将收到一个 HTTP 200 (OK) 状态代码,用于显示 404 错误消息的页面,这是另一个级别的不良做法。

用于将用户发送到自定义 404 错误页面的 302 重定向示例

用于将用户发送到自定义 404 错误页面的 302 重定向示例

您永远不应该使用重定向来提供 404 错误页面。 相反,当您从网站中删除或删除的任何页面被请求并且没有直接替换时,提供 HTTP 404 响应代码 这将防止您的网站触发大量软 404 错误,并确保搜索引擎只抓取和索引您想要排名的页面。

URL 的状态代码示例

返回 HTTP 404 服务器响应代码的页面。 检查使用: http : //httpstatus.io/

解决软 404 错误会增加我网站的流量吗?

我们曾经为电子商务客户开展的一个技术 SEO 项目的结果非常清楚地说明了为什么您应该始终注意软 404 错误。 我们注意到,与其网站上的页面总数相比,有问题的客户的软 404 错误比例极高。 我们发现这是因为他们的网站提供 404 消息,但没有返回许多已删除产品的 HTTP 404 状态代码,其中有数千个。

一旦我们诊断出问题,我们就与客户的 Web 开发人员联系,以确保他们的服务器返回 HTTP 404 状态代码以及他们从网站上删除的任何产品的“页面未找到”消息。 开发人员按照我们的建议实施了修复,两天后,我们注意到自然流量急剧增加。 它从平均每天 1,400 次会话增加到每天平均 2,600 次。

404状态码分析

故事还没有结束,伙计们。 事实证明,该客户正在使用许多其他在线零售商使用的自定义网站平台——这意味着开发人员构建的其他网站也在同一平台上运行。 因此,当开发人员开始为其平台上的任何已删除页面提供 HTTP 404 状态代码时,使用该平台的其他企业开始报告其自然流量急剧上升。 我只能假设 Web 开发人员为此承担了所有责任,尽管我们经过长达一个月的战斗让他们相信软 404 最初值得解决!

软 404:技术 SEO 的重要性

技术搜索引擎优化是许多营销人员只是模糊地熟悉的东西。 事实上,即使对于 SEO 从业者来说,这通常也是一个容易落入 Web 开发人员手中的领域。 这可能会导致在提高自然搜索可见性方面错失巨大的机会。 网站的技术功能是我认为的 SEO 的组成部分,正如我们在上面的示例中所见,它们对于企业级电子商务网站尤为重要。

TL;DR——太长; 没读

  • 每当页面上显示 404(未找到)错误消息时,服务器应返回 HTTP 404 标准响应代码。
  • 页面的内容(“页面未找到”消息)与服务器返回的 HTTP 响应完全无关。
  • 当不存在的页面(已删除/移除的页面)向尝试访问它的任何人显示“找不到页面”消息但未返回 HTTP 404 状态代码时,会发生软 404 错误。 当删除的页面将用户重定向到不相关的页面(例如网站的主页)时,就会发生这种情况。
  • 报告的软 404 数量需要与网站上可索引页面的总数进行比较——如果软 404/可索引页面的比率很高,则会浪费宝贵的爬网预算,从而对网站在自然搜索中的性能产生负面影响。
  • 解决软 404 问题可以显着提高抓取效率,并确保搜索引擎只花时间抓取您希望它们抓取的页面。
  • 修复软 404 错误可以提高网站在自然搜索中的可见度。

你刚学到新东西吗?

然后加入每月阅读我们专家文章的 80,000 人的行列。
  • 此字段用于验证目的,应保持不变。

如果您需要 SEO 方面的帮助,请随时与我们联系。