避免 URL 参数的 SEO 陷阱

已发表: 2021-07-19

URL 参数是网页地址的一部分,通常在问号 (?)、与号 (&)、等号 (=) 或其他属性之后可见。 参数也可能被称为“查询字符串”,通常用于电子商务网站。如果处理不当,它们可能会在索引您的网站时造成严重的混乱和问题。

不同类型的 URL 参数示例

网站 URL 参数通常用于跟踪会话 ID、产品类别页面过滤器、支持搜索查询等。 参数可能很有价值,但确实会混淆搜索引擎,从而导致页面索引问题和爬行预算浪费。 那么如何避免这种情况呢? 我们来看看下面并介绍以下内容。

URL 参数的 SEO 陷阱:内容

  1. 常见参数问题
  2. 参数何时影响性能的示例
  3. 用于解决参数的 SEO 选项
  4. 确定您是否有参数问题

为什么 URL 结构很重要?

URL 可帮助搜索引擎了解站点的内容和结构。 简洁和描述性的页面 URL 也更有可能从搜索引擎结果中获得点击。 这并不奇怪,因为冗长且参数打包的 URL 对人脑来说更难处理和解释。

1、URL参数常见问题

错误配置的 URL 参数可能会导致一系列问题,从创建重复内容到关键字蚕食以及浪费宝贵的爬网预算。

让我们来看看由 URL 参数引起的最常见的问题。

重复内容

基于网站过滤器生成 URL 参数会产生严重的页面问题,从而影响网站,尤其是电子商务网站的页面排名。 如果您的网站允许用户按价格或功能(颜色、大小等)对内容进行排序,并且这些选项实际上并没有改变页面内容,而只是缩小了结果范围; 那么这可能会妨碍您网站的性能。

理论上,以下 URL 都指向相同的内容:自行车集合。 这里唯一的区别是其中一些页面的组织或过滤方式可能略有不同。 URL 参数部分以问号开头。

  • http://www.example.com/products/bikes.aspx
  • http://www.example.com/products/bikes.aspx ?category=mountain&color=blue
  • http://www.example.com/products/bikes.aspx ?category=mountain&type=womens&color=blue

上面显示的示例是电子商务网站分面导航的典型示例。 分面导航系统是过滤器选项,允许您使用预定义的过滤器选项缩小产品类型或其他属性的范围。 这最终会帮助您找到所需的内容,但在使用参数时可能会导致问题。

自行车网站的分面导航或产品过滤选项示例。每个过滤器选项都会向 URL 字符串添加一个参数。
自行车网站的分面导航或产品过滤选项示例。 每个过滤器选项都会向 URL 字符串添加一个参数。

使用户能够在电子商务网站上缩小品牌、产品类型和尺寸的范围对用户很有帮助,但如果管理不当,则会给搜索引擎带来麻烦。

关键字蚕食

当网站上的多个页面针对相同或相似的关键字时,就会发生关键字蚕食。 在这种情况下,搜索引擎可能很难确定哪个页面最适合对特定搜索查询进行排名。 充其量这可能会导致该术语的“错误”或“不受欢迎”的页面排名,或者它没有排名甚至根本没有排名。

罗利自行车网站上的重复内容示例。两页争夺电动自行车
罗利自行车网站上的重复内容示例。 该网站有两个页面争夺电动自行车

浪费的抓取预算

如果有大量基于参数的 URL 可供索引,搜索引擎最终可能无法有效地抓取您的网站。 如果您考虑不同的过滤选项和不同的组合,则很容易看出问题是如何发生的。 我见过单个页面有 50 多个参数版本的网站,这些网站很难被索引并且因此无法排名。

下面列出了一些不同的 URL 过滤排列,让您了解搜索引擎可以以多快的速度抓取 1000 个不必要的页面。

静态网址: www.example.com/dining-furniture

搜索网址: www.example.com/?q=dining-furniture

品牌过滤网址: www.example.com/dining-furniture?brand=stressless

颜色过滤器 URL: www.example.com/dining-furniture?colour=brown

产品类型过滤器: www.example.com/dining-furniture? type= recliner=stressless

产品类型和品牌过滤器: www.example.com/dining-furniture? type = recliner=stressless

2. 参数问题示例:当一切都出错时

当我最初写这篇文章时,我讨论了由于参数而导致的 Halfords (www.halfords.com) 网站的问题。 我很高兴地说,这些问题大多已得到解决,并且它们的类别页面排名比以前更好,但该网站仍然存在一些问题。

Halfords.com 网站使用URL 参数为自行车类型、品牌、尺寸、款式或儿童或成人受众动态提供产品和搜索过滤结果。 Halfords 的问题是他们的网站没有处理大量动态生成的 URL 参数页面,这些页面最终会创建竞争类别页面供 Google 索引。

为了说明参数 URL 如何损害有机的 Halford 的性能,下面的屏幕截图显示了当时 Google 对“女性自行车”的搜索结果。 对于这次搜索,Halfords 的主要自行车类别出现在搜索结果中,而不是她们的女性自行车类别页面。

由于网站上的 URL 参数问题,Halfords 网站的排名不如 Google。

迪卡侬和 Evans Cycles 对女性自行车类别页面进行排名,这是有道理的,因为这些页面最匹配搜索查询“女性自行车”。 不幸的是,Halfords 未能解决关键字短语的大量重复参数页面,这导致 Google 没有对他们的女式自行车页面进行排名。

为了了解Halfords 问题的严重程度,我在Halfords 域(站点:halfords.com 女式自行车)上运行了一个站点命令搜索,以识别术语女式自行车的竞争页面。 此查询的搜索结果揭示了错误页面排名的原因。

我在 Halfords 站点上进行了站点命令搜索,以识别竞争的女式自行车页面(站点:halfords.com“女式自行车”)。结果显示重复的参数 URL 阻碍了哈尔福德本学期的自然表现。
我在Halfords 站点上进行了站点命令搜索,以识别竞争的女性自行车页面(站点:halfords.com“女性自行车”)。 结果显示,重复的参数 URL 阻碍了Halfords 在本学期的自然表现。

女性自行车有许多重复的参数 URL,上面的屏幕截图包含两个结果,URL 中包含 product_storeId_10001_catalogId_14552_productId_。

可以在网站上找到更多可用于女性自行车查询的 URL。 主导航菜单中的链接带您进入由参数驱动的女子自行车页面。

Halfords 网站上的导航菜单将用户带到参数过滤器页面
Halfords 网站上的导航菜单将用户带到参数过滤器页面

产品类别过滤器选项和其他搜索过滤器选项创建了更多竞争相同术语的页面。 Halfords 错过了自然流量,因为他们没有使用技术 SEO 技术来避免参数问题来帮助 Google 了解要索引哪些页面。

理想情况下,您的页面应该使用搜索引擎友好的 URL 结构,但只要您采取必要的步骤来避免重复和索引问题,您仍然可以使用参数。

事实上,Halfords 有多个关于女子自行车的页面,并且在其页面标题和标题中包含不同的女子自行车,性能让他们望而却步。 这是一个典型的例子,网站只是通过包含两个或更多页面覆盖同一主题来混淆搜索引擎,这意味着搜索引擎将不确定要对哪个页面进行排名。

哈尔福德还有参数问题吗?

如果我们现在使用与 site :halfords.com “womens bikes”相同的站点命令查看该站点,我们可以看到 Halfords 在该术语中的排名很好。

女子自行车搜索结果。哈尔福德类别页面现在排名
女子自行车搜索结果。 哈尔福德类别页面现在排名

但是,如果我们向下滚动搜索引擎结果,我们可以看到他们之前遇到的参数问题并没有完全消失,因为参数页面仍在 Google 的索引中。

我们上次看到的 Halfords 尺寸参数页面仍然被 Google 收录
我们上次发现的 Halfords 尺寸参数页面仍然被 Google 索引。

那么这是为什么呢? 如果我们查看女性自行车参数页面的源代码,它包含一个自引用规范标签,而不是告诉 Google 主要的女性自行车页面是要索引的页面。

女式自行车页面上的规范标签应指向主要的女式自行车页面,但事实并非如此。
女子自行车页面上的 Canonical 标签应该指向主要的女子自行车页面,但它没有这样做。 可以将规范标签设置为始终引用电子商务网站上的主要类别页面,以避免索引问题。 下面我们来看看如何在您的网站上发现问题。

下一节将解释如何解决此类问题以及如何识别它们。

3. 如何识别和避免与 URL 参数相关的陷阱

有许多解决方案可以确保 URL 参数不会在您的网站上引起任何 SEO 问题。 但在您急于实施以下任何修复之前,您需要通过询问以下问题来检查 URL 参数是否可能导致您的网站问题:

  • 在您的网站上使用搜索过滤器时(请参阅分面导航),URL 是否发生变化并且副本是否与原始 URL 上的副本保持一致?
  • 在您的网站上使用搜索过滤器时,URL 是否发生变化并且页面标题和元描述保持不变或包含相同的目标关键字?

如果您对其中一项或两项都回答是,则 URL 参数可能会阻碍您网站在自然搜索中的性能,可能是时候采取行动了。

您可以使用网站抓取工具来确定在您的网站上使用参数的位置和方式。 您可以使用的一些常用工具列表如下:

  • Screaming Frog SEO Spider 爬行工具。 免费版允许您抓取 500 个 URL。 付费版本使您可以将抓取用户代理设置为 Google 并抓取无限的 URL
  • Ahrefs 站点审核工具– 作为每月订阅的一部分包含在内,起价为每月 99 美元
  • Deepcrawl – 强大的云爬取软件,适用于超大型电子商务网站。

规范标签

规范标签用于向搜索引擎表明某些页面应被视为某个 URL 的副本,并且任何排名实际上都应计入规范URL。

规范标签

Web 开发人员可以在应用过滤器之前将一段内容的规范版本设置为类别页面 URL。 这是一个简单的解决方案,可帮助将搜索引擎机器人引导至您真正想要抓取的内容,同时在网站上保留过滤器以帮助用户找到与其需求密切相关的产品。 有关实施 rel=”canonical” 标签的更多信息,请参阅我们关于如何正确使用规范标签的指南。 我们还编写了有关如何在 Magento 电子商务网站上实施规范标签的指南。

4.如何识别是否有参数问题

检查您的网站是否属于这种情况的一种方法是测试您的某个产品类别页面上的一些可用过滤器,以评估过滤产品后内容是否发生显着变化。 例如,假设自行车网站上的原始类别页面的内容包含一两段文字来宣传特定类型的自行车。 然后,当使用分面导航应用过滤器来选择女性自行车时,页面的 URL 会更改为包含查询字符串 (example.com/bikes ?type=female ) – 如果大部分页面内容保持不变,这些如果搜索引擎未明确说明页面之间的关系,则这些页面可能会被 Google 归类为重复内容。

URL参数工具

使用 URL 参数 Google Search Console 中的工具,可向 Google 提供有关如何处理包含特定参数的 URL 的信息。 请在进行更改时谨慎行事,因为您可以轻松地从 Google 的索引中排除错误的页面,这可能会导致严重的流量损失。

在 Google Search Console 中配置 URL 参数
在 Google Search Console 中配置 URL 参数

Bing 网站管理员中心还提供了一个忽略 URL 参数的工具。 您可以在此处找到有关如何使用此工具的指南。

Robots.txt – 禁止查询字符串

robots.txt 文件可以通过阻止搜索引擎抓取搜索查询参数来帮助您纠正重复的内容情况。 但是,在您继续并阻止所有查询字符串之前,我建议确保您禁止的所有内容都是您绝对不想被索引的内容。 在大多数情况下,您只需将以下行添加到您网站的 robots.txt 文件中,即可指定搜索引擎忽略任何基于参数的页面:

Disallow: /*?*

这将禁止任何带有问号的 URL。 显然,这对于确保阻止搜索引擎抓取任何 URL 参数很有用,但您首先需要确保站点的任何其他区域在其 URL 结构中使用参数。

为此,我建议您使用 Screaming Frog 的 SEO 蜘蛛等工具对您的整个网站进行爬网,将您网站的 URL 列表导出到电子表格中,然后在电子表格中搜索任何包含问号的 URL( ?)。

这里要注意的常见事情是使用 URL 参数来提供页面的不同语言变体,这本身就是一个坏主意。 如果是这种情况,您不想阻止搜索引擎通过 robots.txt 抓取这些变体。 相反,您需要考虑实施可行的 URL 结构以定位多个国家/地区。

如果您已经查看了 URL 列表并确认唯一使用 URL 参数的页面是导致重复内容问题的页面,我建议将上述命令添加到您网站的 robots.txt 文件中。

下图显示了我们第一次查看问题时的 Halfords robots.txt 文件。 此时没有任何 URL 参数被阻止。

Halfords.com robots.txt 文件。没有任何有问题的参数页面被阻止
Halfords.com robots.txt 文件。 没有任何有问题的参数页面被阻止

如果我们查看此站点的当前 robots.txt 文件,它会显示某些参数已被阻止。

当前robots.txt文件显示部分参数URL被屏蔽
当前robots.txt文件显示部分参数URL被屏蔽

结论

事实证明,使用分面导航对于在您的网站中寻找特定产品的消费者非常有用,但您需要确保因应用过滤器而生成的任何 URL 不会阻碍您的原始类别页面在自然搜索结果中的性能.

虽然我已经详细介绍了 URL 参数的三个最常见的修复方法,但每个网站平台都略有不同,因此,在开始实施任何解决方案之前,您应该花时间逐案评估每种情况我已经描述过了。

你刚学到新东西吗?

然后加入每月阅读我们专家文章的 80,000 人的行列。
  • 此字段用于验证目的,应保持不变。

如果您在搜索引擎优化 (SEO) 方面需要帮助,请随时与我们联系。