Conteúdo duplicado: o guia definitivo para encontrar e corrigir conteúdo duplicado para melhorar o SEO
Publicados: 2019-10-18O conteúdo duplicado é ruim. Usar o mesmo conteúdo, total ou parcial, em seu site leva a uma experiência do usuário insatisfatória e dispara uma bandeira vermelha no algoritmo de pesquisa do Google. Nos velhos tempos do SEO, o conteúdo duplicado era frequentemente usado como um truque barato para obter mais palavras-chave e mais conteúdo no seu site, então o Google desenvolveu um sistema para eliminar os spammers que violavam as práticas recomendadas ao fazer isso. Hoje, se você for pego usando conteúdo duplicado, sua autoridade de domínio pode ser prejudicada e sua classificação de palavras-chave pode cair.
Felizmente, o Google é bastante justo quanto ao assunto. A empresa entende que a maioria dos problemas de conteúdo duplicado não surge como uma tentativa maliciosa de aumentar a classificação de forma barata. Na verdade, a maioria dos casos de conteúdo duplicado são acidentes ou são ignorados pelos webmasters. Ainda assim, ter muito conteúdo repetido em seu site pode ser prejudicial, e é do seu interesse fazer um teste para ver se há alguma duplicação em seu site.
Introdução
Desde que comecei a trabalhar com SEO, essa questão tem girado em torno de fóruns e blogs. Em algum lugar, alguém perpetuou a ideia de que ter o mesmo conteúdo na página A do seu site e na página B do seu site faria com que seu site fosse penalizado nas classificações dos mecanismos de busca. Essa ideia começou a se infiltrar na comunidade de marketing da Internet porque um monte de spammers perceberam que quando eles tinham um conteúdo (ou seja, um artigo) que estava recebendo muito tráfego de pesquisa, eles podiam preencher todas as páginas de seu site com o mesmo conteúdo para atrair ainda mais tráfego dos motores de busca. Obviamente, o mesmo artigo descaradamente duplicado em centenas de páginas dentro de um único domínio é uma tentativa maliciosa de obter tráfego do mecanismo de pesquisa sem realmente agregar valor. O Google aderiu rapidamente a esse método e corrigiu seus algoritmos para detectar conteúdo duplicado e exibir apenas uma versão dele nos rankings de busca. Os sites que se engajaram nessa atividade flagrante foram desindexados e invadiram fóruns e blogs em toda a comunidade de marketing da Internet. Assim nasceu o medo da "penalidade de conteúdo duplicado".
No entanto, na grande maioria dos casos, o conteúdo duplicado não é malicioso e simplesmente um produto de qualquer CMS (sistema de gerenciamento de conteúdo) em que o site esteja sendo executado. Por exemplo, o WordPress (o CMS padrão da indústria) cria automaticamente páginas de “categoria” e “tag” que listam todas as postagens de blog em certas categorias ou tags. Isso cria vários URLs dentro do domínio que contêm o mesmo conteúdo.
1) O Google pode decidir me dispensar com um “aviso” e simplesmente optar por não indexar 99 das minhas 100 postagens duplicadas, mas manter uma delas indexada. NOTA: Isso não significa que as classificações de pesquisa do meu site seriam afetadas de alguma forma.
2) O Google pode decidir que é uma tentativa tão flagrante de burlar o sistema que desindexa completamente todo o meu site de todos os resultados de pesquisa. Isso significa que, mesmo se você pesquisasse diretamente por “Example.com”, o Google não encontraria resultados.
Portanto, é garantido que um desses dois cenários aconteça. Qual deles depende de quão flagrante o Google determina que seu erro será. Nas próprias palavras do Google:
O conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é enganar e manipular os resultados do mecanismo de pesquisa. Se o seu site sofre de problemas de conteúdo duplicado e você não segue os conselhos listados acima, fazemos um bom trabalho ao escolher uma versão do conteúdo para mostrar em nossos resultados de pesquisa.
Esse tipo de duplicação não mal-intencionada é bastante comum, especialmente porque muitos CMSs não lidam bem com isso por padrão. Portanto, quando as pessoas dizem que esse tipo de conteúdo duplicado pode afetar seu site, não é porque você provavelmente será penalizado; é simplesmente devido à maneira como os sites e os mecanismos de pesquisa funcionam.
A maioria dos mecanismos de pesquisa busca um certo nível de variedade; eles querem mostrar dez resultados diferentes em uma página de resultados de pesquisa, não dez URLs diferentes, todos com o mesmo conteúdo. Para isso, o Google tenta filtrar documentos duplicados para que os usuários tenham menos redundância.
Então, o que acontece quando um rastreador de mecanismo de pesquisa detecta conteúdo duplicado? (de https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)
Como o Google penaliza o conteúdo duplicado

O Google é bastante aberto sobre suas políticas de conteúdo duplicado. De acordo com seus relatórios, se o Google encontrar duas versões diferentes da mesma página da web, ou conteúdo que seja consideravelmente semelhante ao conteúdo local em outro lugar, ele selecionará aleatoriamente uma versão “canônica” para indexar. O exemplo que eles dão é o seguinte: imagine que você tem uma página da web padrão e uma versão para impressão dessa mesma página da web, completa com conteúdo idêntico. O Google escolheria uma dessas páginas aleatoriamente para indexar e ignoraria completamente a outra versão. Isso não implica em sofrer uma penalidade, mas é do seu interesse verificar se o Google está indexando e organizando corretamente o seu site.
O verdadeiro problema surge quando o Google suspeita que seu conteúdo está sendo duplicado de forma maliciosa ou manipulativa. Basicamente, se o Google achar que seu conteúdo duplicado foi um esforço para enganar seu algoritmo de classificação, você enfrentará uma ação punitiva. É do seu interesse esclarecer todos os erros com antecedência para evitar esse destino para o seu site.
Distribuição: conteúdo duplicado entre domínios
Às vezes, o mesmo conteúdo pode aparecer palavra por palavra em URLs diferentes. Alguns exemplos disso incluem:
- Artigos de notícias (pense na Associated Press)
- O mesmo artigo de um diretório de artigos obtido por diferentes webmasters
- Webmasters enviando o mesmo conteúdo para diretórios de artigos diferentes
- Comunicados à imprensa sendo distribuídos pela Web
- Informações sobre o produto de um fabricante que aparecem em diferentes sites de comércio eletrônico
Todos esses exemplos resultam da distribuição de conteúdo . A Web está repleta de conteúdo distribuído. Um comunicado à imprensa pode criar conteúdo duplicado em milhares de domínios exclusivos. Mas os mecanismos de pesquisa se esforçam para oferecer uma boa experiência do usuário aos pesquisadores, e entregar uma página de resultados com as mesmas partes do conteúdo não deixaria muitas pessoas felizes. Então, o que um mecanismo de pesquisa deve fazer? De alguma forma, ele tem que decidir qual local do conteúdo é o mais relevante para mostrar ao pesquisador. Então, como isso acontece? Direto do grande G:
Ao encontrar esse conteúdo duplicado em sites diferentes, olhamos para vários sinais para determinar qual site é o original, o que geralmente funciona muito bem. Isso também significa que você não deve se preocupar em ver efeitos negativos na presença do seu site no Google se notar que alguém está copiando o seu conteúdo.
Bem, Google, discordo. Infelizmente, não acho que você seja muito bom em decidir qual site é o originador do conteúdo. Nem Michael Gray, que lamenta em sua postagem no blog “Quando o Google torna o conteúdo duplicado errado”, que o Google geralmente atribui seu conteúdo original a outros sites para os quais ele distribui seu conteúdo. De acordo com Michael:
No entanto, o problema é com o Google, seu algoritmo de classificação IMHO coloca muito de um viés na confiança e autoridade de domínio.
E eu concordo com Michael. Durante grande parte da minha carreira de marketing na Internet, distribuí artigos completos em vários diretórios de artigos, a fim de expandir o alcance do meu conteúdo e, ao mesmo tempo, usá-lo como “combustível de SEO” para obter backlinks de chapéu branco para meus sites. De acordo com o Google, contanto que suas versões distribuídas contenham um backlink para o original, isso ajudará no seu caso quando o Google decidir qual peça é o original. Aqui está a prova:
Primeiro, um vídeo com Matt Cutts, um conhecido blogueiro e ex-engenheiro de algoritmos de mecanismo de pesquisa do Google:
A discussão sobre distribuição começa por volta das 2:25. Às 2:54, ele diz que você pode dizer às pessoas que você é o “mestre do conteúdo”, incluindo um link da peça sindicalizada de volta para a sua peça original.
Mais evidências:
Nos casos em que você está distribuindo seu conteúdo, mas também deseja ter certeza de que seu site é identificado como a fonte original, é útil pedir a seus parceiros de distribuição para incluir um link para seu conteúdo original.
E finalmente:
Distribua com cuidado : se você distribuir seu conteúdo em outros sites, o Google sempre mostrará a versão que consideramos mais apropriada para os usuários em cada pesquisa, que pode ou não ser a versão de sua preferência. No entanto, é útil garantir que cada site em que seu conteúdo é distribuído inclua um link para seu artigo original. Você também pode pedir àqueles que usam seu material distribuído que usem a metatag noindex para evitar que os mecanismos de pesquisa indexem suas versões do conteúdo.
Agora, o que acho interessante desta última citação do Google é que eles realmente admitem que o conteúdo que escolheram pode não ser o certo. Na minha experiência, é muito provável que não seja escolhido o certo se o site que originou o conteúdo for relativamente novo ou tiver um PageRank baixo. Portanto, isso levanta o próximo grande problema:
Como posso ser classificado como a fonte original do conteúdo que distribuo?

Em uma vida passada, eu distribuai toneladas de meus artigos para EzineArticles apenas para ver o Google creditar a eles resultados de pesquisa superiores para meu conteúdo, mesmo quando eu tinha plena certeza de que o Google tinha indexado meu conteúdo em seu local original antes de enviá-lo para o Ezine. Vanessa Fox, que já trabalhou no Google e construiu a Central do webmaster, tenta resolver essa questão em sua postagem no blog, “Classificação como fonte original para o conteúdo que você distribui”.
Infelizmente, ela conclui que, basicamente, não há nada que você possa fazer para garantir que o faça. Ela sugere:
Crie uma versão do conteúdo a distribuir diferente daquela que você escreve para seu próprio site. Este método funciona melhor para coisas como feeds de afiliados de produtos. Não acho que funcione tão bem para coisas como postagens em blogs ou outros tipos de artigos. Em vez disso, você poderia fazer algo como escrever um artigo de resumo de alto nível para distribuição e uma postagem de blog com detalhes sobre esse tópico para seu próprio site.
Reescrever uma parte do conteúdo não é minha definição de distribuição. Isso é apenas reescrever um artigo em palavras diferentes e distribuí-lo. Quase todas as informações que circulam na web já foram postadas em outro lugar; até mesmo esta postagem do blog é composta de uma tonelada de informações que encontrei em outro lugar na internet. Então, para mim, escrever um novo artigo que diga a mesma coisa em palavras diferentes e distribuí-lo aos parceiros de distribuição não é realmente distribuição do artigo original. É a distribuição de um artigo diferente. Portanto, ainda ficamos com a questão dos resultados de distribuir exatamente o mesmo conteúdo que já aparece em seu site: quais são os efeitos de fazer isso? Isso pode prejudicar minhas classificações de alguma forma ?
Para mim, esta é a questão mais importante em torno do conteúdo duplicado. Antes de entrar nessa análise, vamos considerar uma importante questão fundamental.
Por que eu iria querer distribuir exatamente o mesmo conteúdo do meu site em outro lugar?
A Internet realmente opera em uma economia simples de dar e receber. As duas mercadorias trocadas são conteúdo exclusivo e backlinks . Conteúdo exclusivo é definido como conteúdo que o Google não identifica como duplicado. Existem várias teorias sobre onde exatamente o Google traça a linha de decidir se o conteúdo deve ser considerado duplicado , mas um número que ouvi falar muito é de 30%. Basicamente, de acordo com a teoria dos 30%, se o Google identificar que mais de 30% de um determinado conteúdo aparece em outro lugar na Internet, ele será classificado como duplicado. Agora, eu não posso atestar a exatidão deste número, então considere o que vale a pena. Existem também vários softwares de detecção de conteúdo duplicado, como o CopyScape, que foi projetado para ajudar os webmasters a verificar se seu conteúdo foi roubado e duplicado em outros domínios. Essa também é uma boa ferramenta para determinar se o seu conteúdo pode ser considerado duplicado pelo Google. E isso é o que realmente importa.
Mas eu me desviei um pouco, então vamos voltar à discussão sobre por que você deseja distribuir conteúdo. Eu mencionei a economia de backlinks e conteúdo exclusivo da Internet. Conteúdo exclusivo é desejável porque será indexado pelo Google, dando a esse site específico outra instância de seu “nome no chapéu”, por assim dizer. Basicamente, quanto mais conteúdo um site tiver indexado, mais chances ele terá de ser retornado nos resultados de pesquisa do Google para consultas relevantes.
Mas e quanto aos backlinks? Backlinks são simplesmente links de qualquer outro site para o seu. Os motores de busca consideram um “voto” quando um site se vincula a outro. Este voto é usado para determinar a autoridade e relevância nos resultados de pesquisa do Google. Na verdade, acredita-se que os backlinks são o fator mais importante para determinar como seu site deve ser classificado para uma determinada consulta. Há uma série de fatores que influenciam os backlinks e quanto seu “voto” conta, mas falarei sobre isso em uma postagem futura no blog. Por enquanto, o que você precisa saber é que os backlinks são valiosos porque melhoram sua classificação nos motores de busca e isso significa mais tráfego para seu site.
OK, agora cobrimos os produtos básicos da microeconomia da web. Isso é importante porque quando você distribui seu conteúdo, supondo que incluiu um backlink nele vinculando de volta à sua fonte original, você recebe um backlink de cada site para o qual seu conteúdo foi distribuído. Incrível, certo?
Talvez não. A primeira pergunta é o quão altamente o Google valoriza um backlink de um conteúdo que é conhecido por ser conteúdo duplicado. Francamente, não sei. Por um lado, é fácil distribuir conteúdo para um monte de blogs aceitos automaticamente se seu único objetivo for obter backlinks, e isso não diz nada sobre a qualidade do seu conteúdo ou quanto o criador do conteúdo deve ser recompensado. Por outro lado, a distribuição também pode ser um grande indicador da qualidade de um determinado conteúdo. Afinal, por que seria tão distribuído se não fosse realmente ótimo?
No final, o Google provavelmente tem sinais de como responde a essas duas perguntas, mas as respostas reais provavelmente só são conhecidas pelos engenheiros de software que codificaram o algoritmo. Muitas pessoas tentam aumentar o valor de seu conteúdo distribuído ao se envolver em "spinning" de conteúdo, o que é perfeitamente legítimo, desde que não seja o lixo que muitas vezes é despejado por software automatizado. Eu irei me aprofundar mais sobre o conteúdo girando em um post posterior. Por enquanto, ainda estamos tentando responder se distribuir conteúdo exatamente como aparece em seu próprio site é uma boa ou uma má ideia. Após testes cuidadosos, cheguei à seguinte conclusão:
.
…
…….
* drumroll *
…
……
* mais tambores *
… ..
…
Pode ser.
Eu sei eu sei. Essa não é a resposta que você queria. Permita-me explicar.
Tenho mais de 50 domínios e gosto de fazer muitos testes neles. Passei algumas horas na noite passada realizando pesquisas para o meu conteúdo que eu havia distribuído para vários outros blogs e diretórios. E o que descobri foi decepcionante e encorajador.
A parte decepcionante foi que, em muitos casos, meu conteúdo distribuído superou meu próprio conteúdo original. Mesmo que um site com classificação superior à minha para o meu próprio conteúdo tivesse um backlink para o meu site, o originador do conteúdo, era como se o Google ignorasse completamente aquele backlink e ainda desse mais crédito aos outros sites. Em alguns casos, a versão do conteúdo do meu próprio site não foi encontrada em lugar nenhum, obviamente caindo no cluster de URL duplicado do Google e sendo filtrada dos resultados da pesquisa. Isso significa que, ao distribuir meu conteúdo, na verdade, consegui desindexar meu próprio conteúdo.
Este é o pior cenário possível, mas aconteceu. Às vezes, pelo menos. E essa é a parte estranha; às vezes, meu conteúdo era reconhecido como o conteúdo original e recebia a classificação mais alta. Com outros sites e partes de conteúdo, ficou em segundo lugar atrás de um site de alta autoridade, geralmente EzineArticles. Portanto, tenho que concluir o seguinte:
Quando você distribui seu conteúdo, ele pode:
- Faça com que sua própria fonte de conteúdo original (ou seja, seu site) seja, de fato, desindexada para aquele trecho de conteúdo
- Faça com que o seu site tenha uma classificação elevada para consultas relevantes para o seu conteúdo, mas não a mais alta
- Faça com que o seu site tenha uma classificação mais elevada para o seu conteúdo
Bem, isso cobre praticamente todas as bases, não é? Esses são todos os resultados que observei ao examinar meus próprios sites e os resultados da distribuição de artigos originados nesses sites. Basicamente, posso concluir que o Google nem sempre acerta. E o Google não gosta de fazer nada com qualquer tipo de consistência. A última coisa que eles querem é que nós, SEOs, descubramos completamente seu algoritmo, porque, uma vez que isso aconteça, a integridade de seus resultados de pesquisa será destruída enquanto as pessoas os manipulam para o inferno.

A parte encorajadora foi quando descobri que os backlinks do conteúdo distribuído definitivamente ajudaram na classificação dos meus sites para as palavras-chave-alvo. Portanto, definitivamente há pelo menos algum valor nos backlinks originados de conteúdo que o Google rotulou como “duplicado”.
Portanto, a questão permanece: Devo distribuir meu conteúdo?
Vejamos os benefícios de fazer isso:
Benefícios de distribuir seu conteúdo
- Obtenha backlinks de vários sites
- Expanda seu alcance e conhecimento da marca para sites de alto tráfego
- Obtenha tráfego direto por meio de referências de backlinks em seu conteúdo distribuído
- Uma maneira muito mais barata de obter backlinks do que escrever conteúdo totalmente novo (ou reescrever conteúdo existente) para distribuição / distribuição
Desvantagens de distribuir seu conteúdo
- Os sites para os quais você distribui podem na verdade superá-lo em seu próprio conteúdo se tiverem autoridade superior ao seu próprio site, mesmo se você seguir o conselho do Google e incluir um backlink para a fonte original do conteúdo
- O Google pode agrupar o URL no qual seu conteúdo reside com o restante das duplicatas, ocultando-o das páginas de resultados do mecanismo de pesquisa (efetivamente desindexando-o)
Portanto, distribuir seu conteúdo é arriscado. Definitivamente, você pode obter o melhor dos dois mundos se o Google decidir que seu site é o criador do conteúdo , recompensando seu conteúdo com a primeira posição nos resultados de pesquisa e também obtendo todos os backlinks interessantes que afetam sua classificação geral para palavras-chave específicas. Mas se o Google errar (e faz, muitas vezes, ao contrário do que eles possam pensar), você corre o risco de ter seu conteúdo nunca classificado para consultas relevantes em mecanismos de pesquisa.
E isso realmente me preocupa, porque sempre tive a opinião de que não há mais nada que outra pessoa possa fazer para prejudicar os rankings de um determinado site. Depois de analisar esses resultados, temo ter encontrado uma brecha em meu próprio argumento; se outra pessoa visitar meu site, copiar todo o meu conteúdo e distribuí-lo pela Web, é possível que os sites para os quais meu conteúdo foi distribuído tenham uma classificação mais elevada para ele do que o meu próprio site. O Google tenta resolver esse problema aqui, bem como no vídeo de Matt Cutts:
Na maioria dos casos, um webmaster não tem influência sobre terceiros que copiam e redistribuem o conteúdo sem o consentimento do webmaster. Sabemos que isso não é culpa do webmaster afetado, o que, por sua vez, significa que conteúdo idêntico exibido em vários sites não é inerentemente considerado uma violação de nossas diretrizes para webmasters. Isso simplesmente leva a outros processos com a intenção de determinar a fonte original do conteúdo - algo em que o Google é muito bom, pois na maioria dos casos o conteúdo original pode ser identificado corretamente, resultando em nenhum efeito negativo para o site que originou o conteúdo.
Mais uma vez, infelizmente, devo apontar que, em minha própria experiência, repetidamente, vi meu próprio conteúdo ser classificado pior do que os sites para os quais foi distribuído. Portanto, embora o Google pense que é bom em identificar a fonte original do conteúdo, meus dados sugerem o contrário. Com o tempo, só podemos esperar que o Google aprimore esse aspecto de seu algoritmo; certamente não há mais nada que possamos fazer como Webmasters. Em vez disso, você só precisa entender as vantagens e desvantagens da distribuição e decidir se está confortável em assumir os riscos de ter o Google identificando erroneamente a propriedade de seu conteúdo.
Aqui estão algumas dicas para minimizar o risco de o Google errar (em teoria):
- Sempre poste novo conteúdo em seu próprio site e espere para distribuí-lo em outro lugar até que o Google rastreie e indexe seu conteúdo. Você pode verificar se uma página específica foi indexada realizando uma consulta de pesquisa do seu URL exato, entre aspas. Se a pesquisa retornar o resultado correto (ou seja, resultados diferentes de zero), então ela foi indexada. Outro truque legal que você pode tentar é selecionar aleatoriamente 11-12 palavras de seu conteúdo e procurar por essa string, novamente entre aspas. Você não pensaria, mas a probabilidade de que quaisquer 10-12 palavras em uma sequência específica apareçam em outro lugar na Web é extremamente pequena. Experimente agora - copie e cole uma frase aleatória deste parágrafo no Google, coloque-a entre aspas e veja quantos resultados você obtém. Provavelmente, você só encontrará esse URL como resultado, a menos que este artigo tenha sido distribuído (essa também é uma ótima maneira de verificar quais sites selecionaram seu conteúdo quando você o distribuiu).
- Sempre inclua um backlink em sua versão distribuída para o URL da fonte de conteúdo original. O Google diz que essa é a maneira certa de fazer isso, mas ainda não é algo infalível. No entanto, certamente não pode doer.
Que tal aceitar a sugestão de Vanessa e reescrever seu conteúdo antes de distribuí-lo?
Isso definitivamente resolveria o problema de possivelmente ter seu próprio conteúdo essencialmente desindexado quando o Google atribui erroneamente a propriedade do conteúdo, mas também há alguns problemas importantes com isso:
- É muito caro se você tiver muito conteúdo. Pense em quanto tempo você levaria para reescrever cada artigo que possui. Este post sozinho tem mais de 6.000 palavras e levei horas e horas para digitar! Você poderia terceirizar a reescrita para um serviço como o Human Rewriter, mas isso custará cerca de US $ 4 por 500 palavras (menos do que o custo de SEO e link building), mas a despesa é provavelmente redundante. Isso pode ficar muito caro se você tiver muito conteúdo.
- Você ainda está distribuindo conteúdo temático em torno das mesmas palavras-chave de seu conteúdo original, então não é exagero pensar que o conteúdo reescrito ainda superaria seu conteúdo original para consultas de pesquisa relevantes, especialmente em sites de alta autoridade, como EzineArticles.
Conteúdo duplicado no mesmo domínio
A palavra final é que, a menos que você esteja realmente duplicando descaradamente seu conteúdo em toneladas de URLs dentro do mesmo domínio, não há nada com que se preocupar. Um de seus URLs em que reside o conteúdo duplicado será indexado e escolhido como o “representante” desse cluster de URL. Quando os usuários realizam consultas de pesquisa nos mecanismos de pesquisa, essa parte específica do conteúdo será exibida como resultado de consultas relevantes, e os outros URLs no cluster de dupe não. Simples assim.
No entanto, o outro lado da moeda é o conteúdo duplicado em diferentes domínios . E esse é um monstro totalmente diferente. Pronto para enfrentar isso? Aqui vamos nós.
“Conteúdo duplicado” tradicional

O conteúdo duplicado tradicional é o tipo de conteúdo que vem à mente intuitivamente quando você ouve a frase. É um conteúdo idêntico ou muito semelhante ao que existe em outro lugar na web (geralmente em seu próprio site). Existem vários motivos pelos quais um site duplicaria intencionalmente este conteúdo:
- Reproduzir conteúdo antigo para fazer seu site parecer mais atualizado.
- Copiar material repetidamente para adicionar mais páginas ao seu site.
- Plagiar material para passar por seu.
Todas essas situações são enganosas, às vezes para os usuários e às vezes para o Google e, na maioria das vezes, os webmasters sabem que devem ficar longe dessas práticas. Se você se engajar neles, provavelmente merece uma penalidade.
Conteúdo duplicado dissimulado
Eu chamo isso de conteúdo duplicado “sorrateiro” por causa da facilidade com que ele pode chegar até você. Você não tem intenção de criar páginas duplicadas, mas elas podem acontecer de qualquer maneira. Normalmente, isso se deve a um soluço técnico ou uma reprodução involuntária; por exemplo:
- Se você tiver duas versões de seu site para https: // e https: //, o Google pode indexar as duas versões de cada página separadamente e, em seguida, marcar essas páginas como instâncias de conteúdo duplicado.
- Se você tiver uma versão “amigável para impressão” de uma página da web, ela será exibida como um URL separado com o mesmo conteúdo.
- Formas de páginas da web completas e modificadas para celular, como seções de fórum.
Infelizmente, a maioria desses casos pode surgir naturalmente conforme você constrói e modifica seu site, a menos que você tenha tomado medidas preventivas específicas para impedi-lo.
“Mas eu não copio meu conteúdo”
Sua primeira reação a esta avaliação pode ser demissão. Você não copia seu conteúdo de uma página para outra. Você toma cuidado meticuloso para garantir que todas as páginas do seu site sejam escritas originalmente, sem frases ou seções duplicadas.
Infelizmente, ainda existe um risco para você. O que o Google registra como “conteúdo duplicado” nem sempre é o que um usuário vê como conteúdo duplicado. Um usuário que navega em suas páginas pode nunca encontrar uma frase repetida, mas o Google pode rastrear seu site e encontrar dezenas de repetições em suas tags de título, ou você pode ter vários URLs não canonizados hospedando o mesmo conteúdo na página. Mesmo que você tenha certeza de que não influenciou diretamente alguma forma de conteúdo duplicado, vale a pena verificar seu site apenas para ter certeza.
Como encontrar (e limpar) conteúdo duplicado

Corrigir conteúdo duplicado é relativamente fácil. Encontrar é a parte difícil. Como mencionei acima, o conteúdo duplicado pode ser difícil de detectar - só porque você não tem nenhum conteúdo repetido do ponto de vista da experiência do usuário, não significa que você não tem conteúdo repetido do ponto de vista de um algoritmo de pesquisa.
Seu primeiro passo é manual; vá até seu site e veja se há alguma repetição óbvia de conteúdo. Por exemplo, você tem um parágrafo idêntico concluindo cada uma de suas páginas de serviços? Reescreva. Você reutilizou uma seção de uma postagem anterior do blog em uma nova postagem? Faça uma distinção. Depois de concluir essa verificação manual inicial, há duas ferramentas principais que você pode usar para encontrar mais e melhores instâncias ocultas de conteúdo duplicado.
Faça sua própria pesquisa
Primeiro, você pode realizar uma pesquisa para ver através dos olhos do Google. Use uma tag Site: para restringir sua pesquisa apenas ao seu site e continue com uma tag intitle: para pesquisar uma frase específica. Deve ser um pouco mais ou menos assim:
Site: thisisyoursite.comintitle: ”thisisyourtargetphrase”
Essa pesquisa irá gerar todos os resultados em seu site que se correlacionam com a frase escolhida. Se vir vários resultados idênticos, você sabe que tem um problema de conteúdo duplicado.
Verifique as Ferramentas do Google para webmasters
Uma maneira mais simples de verificar se há conteúdo duplicado é usar as Ferramentas do Google para webmasters para rastrear seu site e relatar quaisquer erros. Depois de criar e verificar sua conta das Ferramentas do Google para webmasters, vá até a guia Aparência da pesquisa e clique em “Melhorias de HTML”. Aqui, você poderá ver e baixar uma lista de meta descrições e tags de título duplicadas. Esses são problemas comuns e facilmente solucionáveis que requerem apenas um pouco de tempo para serem reescritos.
Para determinar se uma amostra de conteúdo duplicado derrubará sua classificação, primeiro você deve determinar por que publicará tal conteúdo.
Tudo se resume ao seu propósito.
Se seu objetivo é tentar punir o sistema usando um conteúdo que foi publicado em outro lugar, você será penalizado. O objetivo é claramente enganoso e destina-se a manipular os resultados da pesquisa.
Isso é o que o Google tem a dizer sobre esse tipo de comportamento:
O conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é enganar e manipular os resultados do mecanismo de pesquisa.
Copyscape

Por 5 centavos por pesquisa, você pode fazer com que o Copyscape analise uma peça inteira para você. Mas se o seu orçamento não permitir esse tipo de gasto, você ainda pode usar o Copyscape gratuitamente. O problema com o Copyscape gratuito é que você terá que publicar o conteúdo online primeiro para recuperar seu URL.
Copie e cole o URL do seu conteúdo recém-publicado na caixa de pesquisa do Copyscape. O que o Copyscape faz é escanear todas as interwebs em busca de cópias do conteúdo que você acabou de publicar.
Copyscape é uma ferramenta confiável da qual muitos editores dependem fortemente para verificar sua qualidade e originalidade. Existem outras ferramentas muito semelhantes ao Copyscape que você pode usar para o mesmo propósito, como Detecção de Plágio e InterNIC.
Verificar se há conteúdo duplicado é bastante fácil e simples. É uma tarefa de SEO indispensável para iniciantes, mas ninguém deve considerá-la garantida. Com o conjunto certo de ferramentas, você pode garantir confortavelmente que seu conteúdo é exclusivo bem antes de publicá-lo online.
E, ao fornecer a seus leitores conteúdo exclusivo e de alta qualidade, você terá fornecido um grande valor.
Como limpar conteúdo duplicado
Depois de identificar as áreas críticas de duplicação em seu site, você pode começar a agir para corrigi-las. Quanto mais cedo você tomar uma ação corretiva, mais cedo começará a se recuperar dos efeitos negativos. Felizmente, o Google também facilita a localização e correção de conteúdo duplicado em seu site. Ao fazer login nas Ferramentas do Google para webmasters, vá para “Aparência da pesquisa” e, em seguida, “Melhorias de HTML”. Isso permitirá que você gere uma lista de todas as páginas que o Google detecta como duplicadas. Depois de obter essa lista, você pode começar a eliminar os erros duplicados um por um com qualquer um dos seguintes métodos:
- Elimine a duplicação desnecessária. A primeira etapa é a mais fácil e a mais óbvia, embora possa ser demorada se houver várias instâncias. Em qualquer situação em que você possa reescrever uma parte do conteúdo para resolver a duplicação, faça-o. Coloque suas ideias em palavras diferentes, use diferentes dispositivos de enquadramento e não tenha medo de reescrever do zero.
- Boilerplates . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
- Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
- Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
- 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
- Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
- Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.
Conclusão
Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.
In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.
Thanks for sticking with me through this crazy post!
