什么是规范标签以及它如何影响 SEO?
已发表: 2019-02-11搜索引擎优化是一个整体复杂的主题,这已经不是什么秘密了。 一旦您深入挖掘,您就会了解到,除了关键字使用、编辑元标记和链接构建等内容之外。 这并不是说这些技术很简单,但至少大多数曾经创建过网站并试图在网络上推广它的人或多或少都知道它们。
但是有些 SEO 问题是大多数普通用户完全不知道的。 同时,它们会影响您的在线知名度并降低您的网站在搜索引擎上的排名。 正如他们所说,无知不是防御。
此类问题之一是重复内容和规范标签的使用。 让我们找出这些术语的含义以及如何使用这些知识来增强您的 SEO。
什么是规范标签?
规范标签(也称为“rel canonical”)是一个 HTML 命令,它告诉搜索引擎给定的网站页面是指定母版页的副本(全部或部分)。 简而言之,可以将规范标签视为对原始内容来源的引用。
该标签看起来像这样rel="canonical" <link>并且通常放置在网页的 HTML 头部。 在<链路>部分包含应被认为是权威页(与原始内容的页面)的页面的URL。
规范标签用于帮助搜索引擎区分原始内容和重复内容,因为后者可能是 Google 和其他搜索引擎惩罚您的网站并在排名中降级的原因。 因此,在对您的网站进行排名时,搜索引擎爬虫会忽略包含重复内容和规范链接的页面。 同时,母版页在 SERP(搜索引擎结果页面)上获得更好的位置。

什么是重复内容?
今天,每个人都知道内容推动了互联网的发展。 如果您拥有网站或博客,您就会知道内容是您最宝贵的资产。 不仅因为它吸引访问者访问您的网站并保持观众参与度,还因为它主要是搜索引擎在对网站进行排名时分析的内容。 只要您的内容独特且质量高,您的网站就会在 SERP 上占据更高的位置,并且更容易找到。
但是,如果您的某些网站页面具有相同或非常相似的内容,搜索引擎可能会认为可疑并降低您的网站排名。 跨多个页面重复的内容称为重复。
你可能在想:我为什么要关心? 我的页面都没有重复。 但是你会惊讶地发现实际上可以有很多。 你只是不知道他们的存在。

重复内容的原因是什么?
重复内容的问题在于我们人类访问网页的方式与搜索引擎如何看待它们之间的差异。 我们过去常常将网站页面视为书籍中的页面。 每个页面都应该填充不同的文本。 几乎没有任何书籍可以在其中找到相同的页面。
但是搜索引擎是从其 URL(或多个 URL)的角度来处理网页的。 换句话说,大多数网站页面都可以从不同的 URL 访问,并且每个 URL 将被视为一个单独的页面。 由于所有 URL 都将指向同一个页面,因此它们后面的内容将被视为重复。
多种原因可能导致内容重复:
- 传输协议/子域变体:您的网站可以通过不同的 URL 访问,例如区域域前缀:如果您有多个版本的单个网站可用于不同的区域(例如网站的移动版本:网站的移动优化版本通常可通过不同的 URL 获得(例如, 如果是这种情况,则需要使用规范标签在原始内容和重复内容之间划一条线。
- 产品页面:对于在线商店来说,重复内容的问题尤其严重,在这种情况下,同一产品的不同变体可能由不同的 URL 路径表示(例如, 复制的内容:有时您需要的不仅仅是一个网站来代表您的内容。 例如,如果您有多个公司分支机构或多个在线资源的联合内容。 在这些情况下,规范化原始(或首选)内容来源是有意义的。
- 内容管理系统的缺陷:使用 CMS 也可能是您网站上出现重复内容页面的一个原因。 这是因为某些系统可能会自动为您的 URL 设置搜索参数、应用错误的标签,并允许通过多个 URL 访问您的页面。
如何规范化页面
有几种不同的方法可以使用规范标签。 每个都有优点和缺点。

使用 Google Search Console
这种方法最简单,需要使用 Google 的专用网站管理员工具。 它提供了一个设置,允许网站所有者指定找到内容规范版本的首选域。
但是,此功能主要适用于具有相似内容和相同 URL 路径但域名不同的页面(例如, yoursite.com/product/t-shirt和anothersite.com/product/t-shirt )。 此外,此方法仅与 Google 相关,而与其他搜索引擎无关。
引入规范标签作为元数据
将规范标签应用到特定页面是最常见的,尽管规范化内容的方法有点棘手。 该标签的格式为<link rel=”canonical” href=”[canonical URL]”>并作为元数据添加到页面的 HTML 头部。
这种方法的主要好处是它使您能够规范化任意数量页面的内容。 但是,向页面添加更多数据会扩大其大小,从而降低加载速度。
此外,如果您的页面的 URL 经常更改,则准确更新规范标记可能会非常困难(尽管某些 CMS 解决方案可以自动为您更新它们)。
设置 301 重定向
如果您希望搜索引擎爬虫仅将一个页面变体视为规范而忽略另一个,您可以考虑配置 301 重定向。 它将自动将搜索引擎和访问者从搜索结果中请求或指定的 URL 转发到首选 URL。
如果需要向搜索引擎显示您页面的特定版本是最重要的,那么这是一个最佳解决方案。 301 重定向通常用于将根域优先于子域,反之亦然(例如, www.yoursite.com与yoursite.com )。
但是,通过使用此方法,您有意识地贬低了其中一个页面版本并拒绝所有潜在访问者访问非规范页面。

最后的提示
明智地使用规范标签可以避免与重复内容相关的麻烦,例如Google 惩罚。 因此,如果您曾经很好地照顾您的网站 SEO,则应该像关键字选择和链接构建一样认真对待规范化。 以下是一些最终提示,可帮助您有效管理规范标签:
- 使用自引用规范标签:将规范标签添加到要优先处理的页面是一种常见做法。 例如,如果您有多个内容相似的页面,例如yoursite.com、www.yoursite.com、https://www.yoursite.com ,并且您想选择yoursite.com作为规范页面,则可以使用此特定页面上的规范链接yoursite.com 。 这种方法通常用于规范化主页,因为人们链接回的主要是主页。
- 避免链式或交叉规范化:确保仅规范化多个页面的一个原始内容来源。 不要规范化页面A>页面B然后页面B>页面A; 或页面 A > 页面 B > 页面 C。否则,搜索引擎可能会选择错误的页面。 正确的规范化方案是:页面 B > 页面 A、页面 C > 页面 A、页面 D > 页面 A 等(假设 A 是规范的)。
- 谨慎使用规范标签:请记住,只有当页面具有相同或非常相似的对应物时,才对页面进行规范化。 如果两个页面之间存在显着差异,并且您将其中一个页面规范化,那么您将另一个页面置于被排除在排名之外的风险之下。 因此,请确保仅在真正需要的地方使用规范标签。
