重复内容:查找和修复重复内容以改进 SEO 的终极指南
已发表: 2019-10-18重复的内容很糟糕。 在您的网站上以全部或部分形式使用相同的内容会导致糟糕的用户体验,并在 Google 的搜索算法中触发危险信号。 在 SEO 的旧时代,重复内容通常被用作在您的网站上获取更多关键字和更多内容的廉价技巧,因此 Google 开发了一个系统来清除违反最佳实践的垃圾邮件发送者。 今天,如果您被发现使用重复的内容,您的域权限可能会受到影响,您的关键字排名可能会下降。
幸运的是,谷歌对这个问题相当公平。 该公司明白,大多数重复内容问题并不是为了廉价提高排名的恶意企图。 实际上,大多数重复内容的实例都是意外或被网站管理员忽视。 尽管如此,在您的网站上有太多重复的内容可能会造成破坏,运行测试以查看您的网站上是否有任何重复内容符合您的最大利益。
介绍
自从我开始涉足 SEO 以来,这个问题一直围绕着论坛和博客。 在某个地方,有人认为在您网站的 A 页面上与您网站的 B 页面上具有相同的内容会导致您的网站在搜索引擎排名中受到惩罚。 这个想法开始渗透到网络营销社区,因为一群垃圾邮件发送者意识到,当他们拥有获得大量搜索流量的一段内容(即一篇文章)时,他们可以用相同的内容,以便从搜索引擎中获取更多流量。 显然,在单个域内的数百个页面上公然复制的同一篇文章是一种恶意尝试,试图在没有实际增加任何价值的情况下获得搜索引擎流量。 谷歌很快就接受了这种方法,并修正了它的算法来检测重复内容并在搜索排名中只显示它的一个版本。 参与这种公然活动的网站被取消索引,并在整个网络营销社区的论坛和博客上大喊大叫。 因此产生了对“重复内容惩罚”的恐惧。
然而,在绝大多数情况下,重复的内容是非恶意的,只是网站碰巧运行的任何 CMS(内容管理系统)的产物。 例如,WordPress(行业标准 CMS)会自动创建“类别”和“标签”页面,其中列出了特定类别或标签内的所有博客文章。 这会在域中创建多个包含相同内容的 URL。
1) 谷歌可能会决定让我“警告”一下,然后选择不索引我 100 个重复帖子中的 99 个,而是保留其中一个索引。 注意:这并不意味着我网站的搜索排名会受到任何影响。
2) 谷歌可能会认为这是在玩弄系统的公然尝试,以至于它从所有搜索结果中完全取消了我的整个网站的索引。 这意味着,即使您直接搜索“Example.com”,Google 也不会找到任何结果。
因此,这两种情况之一肯定会发生。 它是哪一个取决于谷歌确定你的错误有多严重。 用谷歌自己的话来说:
网站上的重复内容不能作为对该网站采取行动的理由,除非重复内容的意图似乎是具有欺骗性和操纵搜索引擎结果。 如果您的网站存在重复内容问题,并且您没有遵循上面列出的建议,我们会很好地选择要在我们的搜索结果中显示的内容版本。
这种类型的非恶意复制相当普遍,特别是因为许多CMS在默认情况下不能很好地处理这种情况。 因此,当人们说拥有此类重复内容会影响您的网站时,并不是因为您可能会受到处罚; 这仅仅是因为网站和搜索引擎的工作方式。
大多数搜索引擎都追求一定程度的多样性; 他们希望在搜索结果页面上向您显示十个不同的结果,而不是十个都具有相同内容的不同 URL。 为此,谷歌试图过滤掉重复的文档,让用户体验到更少的冗余。
那么,当搜索引擎爬虫检测到重复内容时会发生什么? (来自 https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)
Google 如何惩罚重复的内容

谷歌对其重复内容政策持相当开放的态度。 根据他们的报告,如果谷歌遇到同一网页的两个不同版本,或者与其他地方的网站内容明显相似的内容,它会随机选择一个“规范”版本进行索引。 他们给出的例子是这样的:假设您有一个标准网页和同一个网页的打印机友好版本,包含相同的内容。 Google 会随机选择这些页面中的一个进行索引,而完全忽略另一个版本。 这并不意味着要受到惩罚,但确保 Google 正确编制索引和组织您的网站符合您的最佳利益。
当 Google 怀疑您的内容被恶意或操纵复制时,真正的麻烦就来了。 基本上,如果谷歌认为你的重复内容是为了欺骗他们的排名算法,你将面临惩罚。 提前清除任何错误以防止您的网站出现这种命运,符合您的最大利益。
联合:跨域重复内容
有时,相同的内容可以在不同的 URL 中逐字逐句地出现。 这方面的一些例子包括:
- 新闻文章(想想美联社)
- 来自不同网站管理员的文章目录中的相同文章
- 网站管理员将相同的内容提交到不同的文章目录
- 在网络上分发的新闻稿
- 来自制造商的产品信息出现在不同的电子商务网站上
所有这些例子都源于内容联合。 网络上充满了联合内容。 一份新闻稿可以在数千个独特的域中创建重复的内容。 但是搜索引擎努力为搜索者提供良好的用户体验,并且提供由相同内容组成的结果页面不会让很多人满意。 那么搜索引擎应该做什么呢? 不知何故,它必须决定内容的哪个位置与向搜索者展示最相关。 那么它是如何做到的呢? 直接来自大G:
当在不同站点上遇到此类重复内容时,我们会查看各种信号来确定哪个站点是原始站点,这通常效果很好。 这也意味着,如果您发现有人抓取您的内容,您不必非常担心您的网站在 Google 上的存在会受到负面影响。
好吧,谷歌,我不同意。 不幸的是,我认为您不太擅长决定哪个站点是内容的发起者。 迈克尔格雷也没有,他在他的博客文章“当谷歌获取重复内容错误时”感叹谷歌经常将他的原始内容归因于他将其内容联合到的其他网站。 根据迈克尔的说法:
然而问题在于谷歌,他们的排名算法恕我直言,对域信任和权威有太多偏见。
我同意迈克尔的看法。 在我的网络营销职业生涯的大部分时间里,我将完整的文章整合到各种文章目录中,以扩大我的内容的覆盖范围,同时还将其用作“SEO 燃料”,以获得指向我网站的白帽反向链接。 根据 Google 的说法,只要您的联合版本包含指向您原件的反向链接,这将有助于您在 Google 决定哪个是原件时的情况。 这里有证据:
首先是一段由著名博主、前谷歌搜索引擎算法工程师马特·卡茨 (Matt Cutts) 拍摄的视频:
关于联合的讨论从大约 2:25 开始。 在 2:54,他说你可以告诉人们你是“内容的主人”,方法是包含一个从联合作品返回到你的原始作品的链接。
更多证据:
如果您正在整合您的内容,但又想确保您的网站被标识为原始来源,那么要求您的整合合作伙伴提供一个返回原始内容的链接会很有用。
最后:
谨慎整合:如果您在其他网站上整合您的内容,Google 将始终在每个给定搜索中显示我们认为最适合用户的版本,这可能是您喜欢的版本,也可能不是。 但是,确保联合您的内容的每个站点都包含指向原始文章的链接是有帮助的。 您还可以要求使用您的联合材料的人使用 noindex 元标记,以防止搜索引擎将他们的内容版本编入索引。
现在,我认为谷歌最后一句话的有趣之处在于,他们实际上承认他们选择的内容可能不正确。 根据我的经验,如果提供内容的网站相对年轻或 PageRank 较低,则很可能不会选择正确的网站。 所以这就引出了下一个大问题:
我如何被列为我联合的内容的原始来源?

在过去的生活中,我将大量文章联合到 EzineArticles 只是为了看到谷歌将我的内容的搜索结果更高,即使我完全确定谷歌在将我的内容提交给 Ezine 之前已在其原始位置索引了我的内容。 Vanessa Fox 之前曾在 Google 工作并构建了网站管理员中心,她试图在她的博客文章“将您联合的内容列为原始来源”中解决这个问题。
不幸的是,她得出的结论是,基本上,您无法确保自己做到。 她建议:
创建与您为自己的网站编写的内容不同的内容版本以进行联合。 此方法最适用于产品附属提要等内容。 我认为它不适用于博客文章或其他类型的文章。 相反,您可以做一些事情,例如为联合撰写高级摘要文章,并为您自己的网站撰写包含有关该主题的详细信息的博客文章。
重写一段内容不是我对联合的定义。 那只是用不同的词重写一篇文章并分发它。 无论如何,几乎所有在网络上传播的信息都已经发布在其他地方; 甚至这篇博文也是由我在互联网上其他地方找到的大量信息组成的。 所以对我来说,写一篇新文章用不同的词说同样的事情并将其分发给联合合作伙伴并不是真正的原始文章联合。 这是另一篇文章的联合组织。 因此,我们仍然有一个问题,即联合已出现在您网站上的完全相同的内容的结果:这样做会产生什么影响? 它会以任何方式损害我的排名吗?
对我来说,这是围绕重复内容最重要的问题。 在我开始分析之前,让我们考虑一个重要的基本问题。
为什么我要从我的网站在别处整合完全相同的内容?
互联网实际上是在一种简单的互让经济上运作的。 交换的两种商品是独特的内容和反向链接。 独特内容被定义为 Google 未识别为重复的内容。 关于 Google 在决定内容是否应被视为重复的问题上究竟划清了哪些界限,有多种理论,但我听说过的一个数字是 30%。 基本上,根据 30% 理论,如果谷歌发现超过 30% 的特定内容出现在互联网的其他地方,它将被归类为重复。 现在,我无法证明这个数字的准确性,所以就看它的价值吧。 还有各种重复内容检测软件,例如 CopyScape,旨在帮助网站管理员检查他们的内容是否已被盗并跨其他域复制。 这也是一个很好的工具,可用于确定您的内容是否可能被 Google 视为重复。 这才是真正重要的。
但是我有点偏离了轨道,所以让我们回到为什么要联合内容的讨论上。 我提到了反向链接和独特内容的互联网经济。 独特的内容是可取的,因为它会被谷歌索引,可以说是该特定网站的另一个“帽子中的名字”实例。 基本上,网站编入索引的内容越多,它在相关查询的 Google 搜索结果中返回的机会就越大。
但是反向链接呢? 反向链接只是从任何其他网站到您自己网站的链接。 当一个网站链接到另一个网站时,搜索引擎认为这是一次“投票”。 此投票用于确定 Google 搜索结果中的权威性和相关性。 事实上,人们认为反向链接是决定您的网站应如何针对给定查询排名的最重要因素。 有很多因素会影响反向链接以及他们的“投票”的重要性,但我将在以后的博客文章中详细介绍。 现在,您需要知道的是,反向链接很有价值,因为它们可以提高您在搜索引擎中的排名,这意味着您网站的流量会增加。
好的,现在我们已经介绍了 Web 微观经济的基本商品。 这很重要,因为当您联合您的内容时,假设您在其中包含了一个链接回原始来源的反向链接,您将从您的内容联合到的每个网站获得一个反向链接。 很棒,对吧?
也许不吧。 第一个问题是 Google 对来自已知为重复内容的内容的反向链接的重视程度。 坦白说,我不知道。 一方面,如果您的唯一目标是获得反向链接,很容易将内容联合到一堆自动接受的博客中,这与您的内容质量或内容发起者应该获得多少奖励无关。 另一方面,联合也可以是特定内容质量的重要指标。 毕竟,如果它不是真的很棒,为什么要联合这么多?
最后,谷歌可能有关于它如何回答这两个问题的信号,但真正的答案可能只有编写算法的软件工程师知道。 许多人试图通过参与内容“旋转”来提高其联合内容的价值,只要它不是经常被自动化软件喷出的垃圾,这是完全合法的。 我将在稍后的帖子中更深入地讨论内容旋转。 目前,我们仍在尝试回答这个问题,即按照您自己网站上显示的内容整合内容是好主意还是坏主意。 经过仔细测试,我得出以下结论:
.
…
…….
*击鼓*
…
……
*更多鼓点*
……
…
也许。
我知道我知道。 那不是你想要的答案。 请允许我解释一下。
我拥有 50 多个域,我喜欢对它们进行大量测试。 昨晚我花了几个小时搜索我已经联合到其他各种博客和目录的内容。 我的发现既令人失望又令人鼓舞。
令人失望的部分是,在许多情况下,我的辛迪加内容的排名高于我自己的原创内容。 即使我自己的内容排名高于我的网站有一个到我网站的反向链接,内容的发起者,就像谷歌完全忽略了这个反向链接,仍然给其他网站更多的信任。 在某些情况下,我自己网站的内容版本无处可寻,显然落入了 Google 的重复 URL 集群并从搜索结果中过滤掉了。 这意味着,通过联合我的内容,实际上我自己的内容被取消了索引。
这几乎是最糟糕的情况,但它发生了。 有时,至少。 这就是奇怪的部分; 有时,我的内容被认定为原创内容并获得最高排名。 与其他网站和内容相比,它在高权威网站(通常是 EzineArticles)之后排名第二。 所以我必须得出以下结论:
当您联合您的内容时,它可能:
- 导致您自己的原始内容源(即您的网站)实际上针对该内容被取消索引
- 使您的网站在与您的内容相关的查询中排名很高,但不是最高的
- 使您的网站在您的内容中排名最高
嗯,这几乎涵盖了所有的基础,不是吗? 这些是我在查看我自己的网站时观察到的所有结果以及来自这些网站的联合文章的结果。 基本上,我可以得出结论,谷歌并不总是正确的。 而且,Google 不喜欢做任何具有任何一致性的事情。 他们最不希望我们 SEO 完全弄清楚他们的算法,因为一旦发生这种情况,他们的搜索结果的完整性将被破坏,因为人们将它们全部操纵到地狱。
令人鼓舞的是,当我发现来自联合内容的反向链接确实有助于我的网站在目标关键字上的排名时。 因此,来自谷歌标记为“重复”的内容的反向链接肯定至少有一些价值。
所以,问题仍然存在:我应该联合我的内容吗?
让我们看看这样做的好处:
联合您的内容的好处
- 从许多网站获取反向链接
- 将您的影响力和品牌知名度扩展到高访问量的网站
- 通过来自您联合内容中的反向链接的推荐获得直接流量
- 获得反向链接的方式比编写用于分发/联合的全新内容(或重写现有内容)便宜得多
联合您的内容的缺点
- 即使您遵循 Google 的建议并包含指向内容原始来源的反向链接,如果您联合的站点拥有比您自己的站点更高的权限,那么这些站点实际上可能会在您自己的内容方面胜过您
- Google 可能会将您的内容所在的 URL 与其余的重复项分组在一起,将其从搜索引擎结果页面中隐藏起来(有效地将其取消索引)
因此,联合您的内容是有风险的。 如果 Google 确定您的网站是内容的发起者,那么您绝对可以两全其美,从而奖励您的内容在搜索结果中的最高位置,并获得所有影响特定关键字整体排名的多汁反向链接。 但是,如果谷歌弄错了(而且它确实经常与他们的想法相反),您就有可能让您的内容永远不会在相关搜索引擎查询中排名。
这真的让我担心,因为我一直认为没有其他人可以做任何其他事情来损害特定网站的排名。 分析这些结果后,我担心我发现了自己的论点中的漏洞; 如果其他人访问了我的网站,复制了我的所有内容,并在网络上进行了联合,则我的内容联合到的站点实际上可能会比我自己的站点排名更高。 Google 尝试在此处以及 Matt Cutts 视频中解决此问题:
在大多数情况下,网站管理员对未经网站管理员同意抓取和重新分发内容的第三方没有影响。 我们意识到这不是受影响的网站管理员的错,这反过来意味着在多个网站上显示的相同内容本身并不被视为违反我们的网站管理员指南。 这只会导致进一步的过程,以确定内容的原始来源——这是 Google 非常擅长的,因为在大多数情况下,原始内容可以被正确识别,不会对内容的来源网站产生负面影响。
再次,不幸的是,我必须指出,根据我自己的经验,我反复看到自己的内容排名比联合网站的排名差。 因此,即使 Google 认为它擅长识别内容的原始来源,但我的数据表明并非如此。 随着时间的推移,我们只能希望谷歌改进其算法的这方面; 作为网站管理员,我们当然无能为力。 相反,您只需要了解联合的优缺点,并决定您是否愿意承担让 Google 错误地识别您的内容所有权的风险。
这里有一些技巧可以最大限度地降低谷歌出错的风险(理论上):
- 始终将新内容发布到您自己的网站,然后等待在其他地方联合发布,直到 Google 抓取您的内容并将其编入索引。 您可以通过对您的确切 URL(带引号)执行搜索查询来检查特定页面是否已被编入索引。 如果搜索返回正确的结果(即不是零结果),则它已被索引。 您可以尝试的另一个巧妙技巧是从您的内容中随机选择 11-12 个单词,然后再次用引号搜索该字符串。 您不会想到,但是特定序列中的任何 10-12 个单词出现在 Web 上的其他地方的可能性非常小。 立即尝试 — 将本段中的一个随机句子复制并粘贴到 Google 中,用引号将其括起来,然后看看您得到了多少结果。 结果您可能只会找到此 URL,除非这篇文章已被联合(这也是查看哪些站点在您联合时获取了您的内容的好方法)。
- 始终在您的联合版本中包含指向原始内容源 URL 的反向链接。 谷歌说这是正确的方法,但它仍然不是万能的。 尽管如此,它肯定不会受到伤害。
在联合之前采纳 Vanessa 的建议并重新编写您的内容怎么样?
这肯定会解决当 Google 错误地将内容所有权归类为可能使您自己的内容基本上被取消索引的问题,但它也存在一些主要问题:
- 如果你有很多内容,那真的很贵。 想想你需要多少时间来重写你拥有的每篇文章。 仅这篇文章就超过 6,000 字,我花了好几个小时才打字! 您可以将重写工作外包给像 Human Rewriter 这样的服务,但每 500 个字将花费您大约 4 美元(低于 SEO 和链接构建的成本),但这笔费用可能是多余的。 如果您有很多内容,那可能会变得非常昂贵。
- 您仍在分发以与原始内容相同的关键字为主题的内容,因此可以毫不夸张地说,重写后的内容在相关搜索查询中的排名仍会超过原始内容,尤其是在 EzineArticles 等高权威网站上。
同一域中的重复内容
最后一句话是,除非您真的在同一个域内的大量 URL 之间公然复制您的内容,否则没有什么可担心的。 重复内容所在的 URL 之一将被编入索引并被选为该 URL 集群的“代表”。 当用户在搜索引擎中执行搜索查询时,该特定内容将作为相关查询的结果显示,而欺骗集群中的其他 URL 则不会显示。 就那么简单。
然而,硬币的另一面是跨不同域的重复内容。 这是一个完全不同的怪物。 准备好应对了吗? 开始了。
传统的“重复内容”

传统的重复内容是当您听到这句话时直观地想到的内容类型。 它是与网络上其他地方(通常是您自己的网站)上存在的内容相同或高度相似的内容。 网站有意复制此内容的原因有很多:
- 复制旧内容,使您的网站看起来更更新。
- 一遍又一遍地复制材料以向您的网站添加更多页面。
- 抄袭材料冒充你自己。
所有这些情况都是欺骗性的,有时对用户来说,有时对谷歌来说,而且在大多数情况下,网站管理员知道远离这些做法。 如果你参与其中,你可能应该受到惩罚。
偷偷摸摸的重复内容
我称其为“偷偷摸摸”的重复内容,因为它很容易偷偷摸到你。 您无意创建重复的页面,但无论如何它们都可能发生。 通常,这是由于技术故障或不知情的复制造成的; 例如:
- 如果您的网站有 https:// 和 https:// 的两个版本,Google 可能会分别为每个页面的两个版本编制索引,然后将这些页面标记为重复内容的实例。
- 如果您有网页的“打印机友好”版本,它将显示为具有相同内容的单独 URL。
- 完整和移动修改形式的网页,如论坛部分。
不幸的是,大多数这些情况会在您构建和修改网站时自然出现,除非您特别采取了预防措施来阻止它。
“但我不会复制我的内容”
您对此评估的第一反应可能是被解雇。 您不会将您的内容从一个页面复制到另一个页面。 您非常小心,以确保您网站的每个页面都是原创的,没有重复的短语或部分。
不幸的是,您仍然存在风险。 Google 注册为“重复内容”的内容并不总是用户看到的重复内容。 浏览您网页的用户可能永远不会遇到重复的词组,但 Google 可能会抓取您的网站并在您的标题标签中发现数十个重复,或者您可能有多个非规范化的网址托管相同的网页内容。 即使您确信自己没有直接影响某种形式的重复内容,也值得检查您的网站以确保安全。
如何查找(和清理)重复内容

修复重复内容相对容易。 找到它是困难的部分。 就像我上面提到的那样,重复内容可能很难检测——仅仅因为从用户体验的角度来看你没有任何重复的内容并不意味着从搜索算法的角度来看你没有重复的内容。
您的第一步是手动操作; 浏览您的网站,看看是否有任何明显的内容重复。 例如,您的每个服务页面是否都有相同的段落结尾? 重写它。 您是否在新文章中重复使用了过去博客文章的一部分? 做个区分。 完成此初始手动扫描后,您可以使用两个主要工具来查找更多、更好的重复内容隐藏实例。
执行您自己的搜索
首先,您可以执行搜索以通过 Google 的眼睛查看。 使用 Site: 标签将您的搜索限制在您的网站,然后使用 intitle: 标签搜索特定短语。 它应该看起来像这样:
站点:thisisyoursite.comintitle:“thisisyourtargetphrase”
此搜索将在您给定的网站上生成与您选择的短语相关的所有结果。 如果您看到多个相同的结果,您就知道存在重复的内容问题。
检查网站管理员工具
检查重复内容的一种更简单的方法是使用 Google 网站管理员工具抓取您的网站并报告任何错误。 创建并验证您的网站站长工具帐户后,前往“搜索外观”标签并点击“HTML 改进”。 在这里,您将能够查看和下载重复元描述和标题标签的列表。 这些是常见且易于修复的问题,只需要一点时间来重写。
要确定重复内容样本是否会拉低您的排名,首先您必须确定为什么要发布此类内容。
这一切都归结为你的目的。
如果您的目标是尝试使用已在其他地方发布的内容来破坏系统,那么您一定会受到惩罚。 其目的显然具有欺骗性,旨在操纵搜索结果。
这就是谷歌对这种行为的看法:
网站上的重复内容不能作为对该网站采取行动的理由,除非重复内容的意图似乎是具有欺骗性和操纵搜索引擎结果。
文案

每次搜索只需 5 美分,您就可以让 Copyscape 为您审查整个作品。 但如果您的预算不允许这种支出,您仍然可以免费使用 Copyscape。 免费 Copyscape 的问题是您必须首先在线发布内容才能检索其 URL。
将您新发布的内容的 URL 复制并粘贴到 Copyscape 的搜索框中。 Copyscape 所做的是扫描整个互联网以查找您刚刚发布的内容的任何副本。
Copyscape 是一种可靠的工具,许多出版商非常依赖它来检查质量和原创性。 还有其他与 Copyscape 非常相似的工具可以用于相同的目的,例如 Plagiarism Detect 和 InterNIC。
检查重复内容相当容易和简单。 对于初学者来说,这是一项必不可少的 SEO 任务,但没有人应该认为这是理所当然的。 使用正确的工具集,您可以轻松地确保您的内容在在线发布之前是独一无二的。
通过为您的读者提供高质量和独特的内容,您将获得巨大的价值。
如何清理重复内容
一旦您确定了站点上重复的关键区域,您就可以开始采取行动来纠正它们。 您越早采取纠正措施,您就会越早开始从负面影响中恢复过来。 幸运的是,Google 还可以让您轻松查找和更正您网站上的重复内容。 当您登录 Google 网站管理员工具时,前往“搜索外观”,然后选择“HTML 改进”。 这将允许您生成 Google 检测为重复的所有页面的列表。 有了这个列表后,您就可以开始使用以下任一方法一一消除重复错误:
- 消除不必要的重复。 第一步是最简单和最明显的,但如果您有多个实例,它可能会很耗时。 在您可以重写一段内容以解决重复的任何情况下,请执行此操作。 把你的想法用不同的词表达出来,使用不同的框架工具,不要害怕从头开始重写。
- 样板。 Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
- Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
- Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
- 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
- Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
- Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.
结论
Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.
In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. 所以这就是我要做的。 I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.
Thanks for sticking with me through this crazy post!

