Como evitar o problema de conteúdo duplicado para o Google?

Publicados: 2021-11-01

O conteúdo duplicado em uma página tem muito em comum com o estouro do orçamento. Somente neste caso, estamos falando da diminuição do “Trust Budget” no site do robô de busca. Esse problema preocupa muitos proprietários de sites, pois pode aparecer até pelas costas. Depois de ler algo sobre o problema de conteúdo duplicado, seu site se transformou em uma bomba-relógio. Tick ​​Tock no relógio e as sanções do Google estão esperando por você.

Triste, mas é verdade, há cerca de 25-30% de conteúdo duplicado na Web. O ex-Googler Matt Cutts mantém essa visão. Embora o conteúdo duplicado possa causar um mundo de problemas com a otimização do mecanismo de pesquisa, não é tão dramático. Existe uma solução - leia este artigo e saiba como evitar problemas de conteúdo duplicado para o Google.

Índice mostrar
  • O que é conteúdo duplicado?
  • Fatos sobre conteúdo duplicado
  • Que tipo de conteúdo existe?
  • Qual é o código?
    • Páginas HTTPS
    • Sistemas de gerenciamento de conteúdo criando conteúdo duplicado
    • Páginas para impressão ou várias opções de classificação
    • Conteúdo duplicado em blogs e sistemas de arquivamento
    • Conteúdo duplicado gerado pelo usuário (postagens repetidas, etc.)
  • Conclusão

O que é conteúdo duplicado?

conteúdo-marketing-mesa-laptop-note-trabalho-escrevendo-artigo-blog
Existem 3 tipos principais de conteúdo duplicado.
  • Duplicata exata: Duas URLs têm conteúdo completamente idêntico;
  • Conteúdo com pequenas diferenças: como a ordem das frases, um pouco de imagens diferentes, etc;
  • Duplicatas entre domínios: uma cópia exata ou ligeiramente alterada existe em muitos domínios.

Além disso, existem dois conceitos relacionados que o Google não considera como conteúdo duplicado. Mas editores não tão experientes e especialistas em SEO podem facilmente misturá-los com conteúdo duplicado.

  • Conteúdo fino: São páginas com muito pouco conteúdo. Conjunto de páginas construídas em uma lista de endereços de organizações, que possuem 6.000 endereços, mas cada página contém apenas um endereço: apenas algumas linhas.
  • Conteúdo da fatia: páginas que diferem ligeiramente umas das outras. O site vende sapatos Timberland nos tamanhos 38, 38,5, 39, 40, 41, 42, etc. Se o site tiver uma página separada para cada tamanho de sapato, haverá uma pequena diferença entre todas essas páginas. Tal efeito o Google percebe como conteúdo de fatia.

O Google não gosta de conteúdo igualmente fino e segmentado. Qualquer um desses efeitos pode ser detectado pelo Google Panda. É por isso que os editores devem evitar criar esses tipos de páginas.

Conteúdo duplicado pode acontecer por vários motivos:
  • licenciamento do conteúdo do seu site;
  • defeitos na arquitetura do site devido a um sistema de gerenciamento de conteúdo não otimizado para mecanismos de busca;
  • existência de plágio.

Nos últimos cinco anos, os spammers, com uma necessidade extraordinária de conteúdo, começaram a “roubar” conteúdo de fontes legítimas, transpondo palavras usando uma variedade de processos complexos e colocando o texto resultante em suas páginas para atrair operações de busca de “cauda longa” e mostrar a publicidade contextual e outros objetivos desonestos. Então, hoje em dia as pessoas vivem em um mundo de “problemas de conteúdo duplicado” e “penalidades de conteúdo duplicado”.

Recomendado para você: 5 maneiras como um bom conteúdo pode acelerar seus esforços de marketing.

Fatos sobre conteúdo duplicado

perguntas-respostas-faq-consulta-ajuda
Local de conteúdo duplicado

Se todo o conteúdo determinado está em seu site, é conteúdo duplicado?

Sim, porque o conteúdo duplicado pode acontecer tanto no mesmo site quanto em sites diferentes.

Porcentagem de conteúdo duplicado

Qual porcentagem de uma página deve ser duplicada para se enquadrar em um filtro de conteúdo duplicado? Infelizmente, os mecanismos de pesquisa nunca tornam essas informações públicas porque isso afetaria sua capacidade de evitar o problema em si. Essa porcentagem está mudando constantemente para todos os motores. A linha inferior é que as páginas não precisam ser idênticas para serem consideradas duplicatas.

A proporção de código para texto

E se o seu código for muito grande, mas houver alguns elementos HTML exclusivos na página? O Google não vai pensar que todas as páginas são duplicatas umas das outras?

Não. Os motores de busca não se preocupam com o seu código, mas com o conteúdo das suas páginas. O tamanho do código só se torna um problema quando cresce fora de proporção.

Os elementos de navegação para a proporção de conteúdo exclusivo

Todas as páginas do seu site têm uma grande barra de navegação, muitos cabeçalhos e rodapés, mas muito pouco conteúdo. O Google não considerará todas essas páginas duplicadas?

Não. O Google considera os elementos de navegação antes mesmo de avaliar as páginas para duplicação.

Conteúdo licenciado

Você deseja evitar o problema de conteúdo duplicado. Mas o que fazer se você tiver conteúdo de outras fontes da Web que você licenciou para mostrar aos seus visitantes?

Use meta name = “robots” content=”noindex, follow”. Coloque-o no cabeçalho da sua página, e os motores de busca saberão que este conteúdo não é para eles. Outra opção é obter direitos exclusivos para possuir e publicar esse conteúdo.

Que tipo de conteúdo existe?

computador-laptop-desk-trabalho-escritório-conteúdo-escrita-nota-pesquisa
  • Conteúdo exclusivo é escrito por uma pessoa. É completamente diferente de qualquer outra combinação de letras, símbolos e palavras na web e não foi afetado por algoritmos de processamento de texto de computador.
  • Fragmentos são pequenos pedaços de conteúdo (por exemplo, citações) que são copiados e usados ​​repetidamente. Eles raramente representam um problema para os mecanismos de pesquisa, especialmente quando incluídos em um documento maior com muito conteúdo exclusivo.
  • Cobreiro. Os mecanismos de pesquisa procuram segmentos de frases relativamente pequenos (cinco a seis palavras) em outras páginas da web. Se dois documentos tiverem muitas telhas, os mecanismos de pesquisa podem interpretar esses documentos como conteúdo duplicado.

Qual é o código?

código de programação desenvolvimento web

Há muitas maneiras de criar conteúdo duplicado. Isso explica por que há mais do que suficiente na web. O conteúdo duplicado interno precisa de táticas específicas para obter os melhores resultados em termos de otimização. Falando francamente, páginas duplicadas são páginas sem valor para usuários e mecanismos de pesquisa. Então tente evitar esse problema completamente. Certifique-se de que apenas um URL se refira a cada página. Além disso, faça um redirecionamento 301 dos URLs antigos para os URLs restantes. Ele ajuda os robôs de busca a ver as mudanças que você fez o mais rápido possível e manter o “link juice” que as páginas deletadas tinham.

Se isso não for possível, existem muitas outras opções. Aqui está um resumo das soluções mais fáceis para vários cenários:

  • Você pode usar o arquivo robots.txt para impedir que os spiders do mecanismo de pesquisa rastreiem as versões duplicadas das páginas do seu site;
  • use o elemento rel=”canonical”, que é a segunda melhor solução para remover páginas duplicadas;
  • use CODE <meta name=”robots” content=”noindex”> para instruir os mecanismos de PESQUISA a não mostrar páginas duplicadas.

No entanto, observe: se você usar o robots.txt para impedir a visualização da página, aplicar noindex ou nofollow na página não faz sentido. Como uma aranha não pode ler a página, ela nunca verá meta-tags noindex ou nofollow. Com essas ferramentas em mente, considere algumas situações específicas de conteúdo duplicado.

Você pode gostar: Por que a redação de conteúdo é importante para marcas e empresas?

Páginas HTTPS

Se você estiver usando o protocolo SSL (troca de dados criptografada entre o navegador e o servidor da Web, que é frequentemente usado para comércio eletrônico), seu site terá páginas que começam com HTTPS: (em vez de HTTP:). O problema surge quando os links em suas páginas HTTPS apontam para outras páginas do site usando links relativos em vez de absolutos. Por exemplo, o link para sua página inicial se torna https://www.YourDomain.com em vez de http://www.YourDomain.com).

Se o seu site tiver esse problema, você pode usar rel=”canonical” ou redirecionamentos 301 para corrigi-lo. Uma solução alternativa é mudar os links para absolutos: http://www.YourDomain.com/content.html em vez de /contenthtml), o que também dificulta um pouco a vida de quem rouba seu conteúdo.

Sistemas de gerenciamento de conteúdo criando conteúdo duplicado

Às vezes, um site pode ter muitas versões de páginas idênticas. Isso acontece com limitações em alguns sistemas de gerenciamento de conteúdo que se referem ao mesmo conteúdo com mais de um URL. Geralmente é uma duplicação completamente extra que não tem valor para os usuários. A melhor decisão é remover as páginas duplicadas e fazer um redirecionamento 301 das páginas removidas para as restantes. Se não funcionar, tente outros métodos.

Páginas para impressão ou várias opções de classificação

Muitos sites oferecem páginas para impressão que fornecem ao usuário o mesmo conteúdo em um formato adaptado à impressora. Alguns sites de comércio eletrônico fornecem listas de seus produtos com várias classificações (por tamanho, cor, marca e preço). Essas páginas têm valor para o usuário, mas não têm valor para os mecanismos de pesquisa. Portanto, eles pensam que é conteúdo duplicado. Em tal situação, você pode criar uma planilha CSS para impressão.

Conteúdo duplicado em blogs e sistemas de arquivamento

Os blogs têm a forma de uma variante interessante da questão do conteúdo duplicado. Uma postagem de blog pode aparecer em várias páginas diferentes:

  • a página inicial do blog;
  • a página de permalink para esse post;
  • as páginas de arquivo;
  • as páginas da categoria.

Cada cópia de postagem é uma duplicata das outras cópias. Muito raramente os editores tentam lidar com o problema da presença de uma postagem na página inicial do blog e na página de links permanentes. E os motores de busca parecem lidar muito bem com esse problema. No entanto, pode fazer sentido mostrar apenas snippets de postagem nas páginas de categoria e arquivo.

Conteúdo duplicado gerado pelo usuário (postagens repetidas, etc.)

Uma variedade de sites usa estruturas para obter conteúdo gerado pelo usuário, como blogs, fóruns ou quadros de mensagens. Essas podem ser ótimas maneiras de desenvolver muito conteúdo a um custo muito baixo. O problema é que um usuário pode publicar o mesmo conteúdo em seu site e em vários outros sites ao mesmo tempo, o que leva a problemas de conteúdo duplicado. É difícil de controlar, mas para reduzir o problema você pode proceder da seguinte forma:

  • Você precisa ter uma política clara que notifique os usuários de que o conteúdo que eles fornecem ao seu site deve ser exclusivo e não pode ser postado em outros sites. Sem dúvida, é difícil conseguir isso, mas ajudará a realizar suas expectativas;
  • Aprimore seu fórum de uma maneira única que precisará de conteúdo diferente. Além dos campos de entrada de dados padrão, adicione também alguns campos exclusivos (diferentes de outros sites) que serão úteis para os visitantes do seu site.
Você também pode gostar: Como ampliar seu SEO com conteúdo de vídeo?

Conclusão

sinais-one-way-street-aviso-duplicado-motivação-emprego

Não se preocupe muito com conteúdo duplicado. Geralmente não é um grande negócio. Principalmente o próprio Google sabe como lidar com questões como páginas mestras ou citações de conteúdo. Além disso, muitas pessoas enfrentam o problema de conteúdo duplicado. Às vezes, duplicatas aparecem para ninguém onde eles esperam, então você deve sempre verificar o site para eles. Para evitá-los, você precisa criar conteúdo exclusivo para cada página.



Autor-Imagem-Isabelle-Jordan

Este artigo foi escrito por Isabelle Jordan. Isabelle é jornalista de negócios e marketing na companhia de seguros ektatraveling.com. Ela escreve para diferentes portais de notícias e blogs temáticos que a ajudam a ficar no centro das notícias de viagens e seguros. Esse trabalho lhe dá a oportunidade de escrever artigos sobre os temas mais relevantes da atualidade.