Compreendendo o Relatório de Cobertura do Índice

Publicados: 2018-12-20

Se você viu uma mensagem como esta nas últimas semanas, respire fundo e continue lendo! Neste artigo, explicarei por que você está vendo problemas de cobertura do Google Search Console e como proceder para corrigi-los.

O que é o Relatório de Cobertura do Índice

Com a inauguração do renovado Google Search Console, há uma série de recursos aprimorados que você deve conhecer. Um desses recursos é o Relatório de cobertura do índice, que descreve quantos URLs do seu site o Google catalogou (ou indexou) e aparecerá nos resultados de pesquisa do Google. Este relatório foi encontrado anteriormente em “Status do índice” na interface do Search Console antigo:

ANTIGO VS NOVO

Agora, o Relatório de cobertura do índice pode ser encontrado no menu "Índice" e, a seguir, clique em "Cobertura". Você verá quais URLs têm erros de indexação, avisos (ou válidos com avisos), são válidos ou excluídos do índice do Google. Para entender adequadamente este relatório, vamos explorar o que cada um desses grupos significa.

Erro : essas são páginas que atualmente não estão sendo veiculadas para os pesquisadores no Google, mas o Google também acredita que essa não é sua intenção.

Os erros podem ser acionados de muitas maneiras diferentes, incluindo algo tão simples como o seu robots.txt bloqueando rastreadores de uma página que você enviou para indexação até algo mais complicado como um erro de servidor (erro de nível 500). As boas notícias? A maioria desses erros pode ser corrigida de maneira relativamente fácil com a ajuda de seu webmaster, agência de marketing digital ou equipe de desenvolvimento da web.

Os erros mais comuns que temos visto no piso superior são “URL enviado bloqueado por robots.txt” e “URL enviado marcado como 'noindex'”. Esses são erros menos sinistros e ocorrem por meio do envio de um URL para indexação por meio do Google Search Console enquanto o arquivo robots.txt não permite o rastreamento para este URL ou contém uma tag noindex. Este é um sinal conflitante porque o seu site está dizendo aos mecanismos de pesquisa para não rastrear ou indexar esta página, mas ao mesmo tempo pede que ela seja indexada. O Google verá isso como não intencional e sinalizará como Erro em vez de Excluído (ou desindexação intencional).

Para outras maneiras de encontrar um erro, veja abaixo:

  • Erro do servidor (5xx) : O servidor não conseguiu encontrar o URL quando solicitado e retornou um erro de nível 500.
    • Solução : converse com sua equipe de desenvolvimento para corrigir esse lado do servidor. Não há muito mais que outra equipe possa fazer aqui sem a experiência adequada.
  • Erro de redirecionamento : há um problema na cadeia de redirecionamento associada a este URL. Ou existe um loop de redirecionamento ou um URL na cadeia tem um erro de nível 400 ou 500.
    • Solução : rastreie a URL, usando o Screaming Frog ou outra ferramenta, e identifique um erro de nível 400 ou 500 em uma das URLs na cadeia de redirecionamento. Se não tiver certeza, fale com sua agência de marketing digital e eles verificarão isso para você.
  • URL enviado bloqueado por robots.txt : você enviou esta página para indexação no Google Search Console, mas a página está sendo bloqueada pelo arquivo robots.txt.
    • Solução : verifique novamente seu arquivo robots.txt em www.yoursite.com/robots.txt. Certifique-se de que uma linha que começa com “disallow” não faça referência ao URL ou subpasta com o URL em questão. Sua agência de marketing digital pode ajudar a identificar quaisquer problemas no robots.txt.
  • URL enviado marcado como 'noindex ': você enviou esta página para indexação, mas a página tem uma metatag 'noindex' ou cabeçalho HTTP.
    • Solução : Avalie o URL, deseja que esta página seja encontrada quando for pesquisada no Google? Se você fizer isso, simplesmente remova a metatag ou o cabeçalho HTTP. Se você não conseguir encontrar a tag noindex olhando a fonte da página (Control + U), pergunte à sua agência de marketing digital ou equipe de desenvolvimento.
  • O URL enviado parece ser um soft 404 : você enviou esta página para indexação, mas o Google acredita que esta página é um soft 404.
    • Solução: um erro Soft 404 ocorre quando uma página com conteúdo de erro 404 é exibida, mas o código de status não é 404, mas 200. Examine a página, ela deveria ser realmente uma página de erro e o código de status está incorreto? Às vezes, o Google interpreta erroneamente uma página com baixo conteúdo como um soft 404. Em ambos os casos, considere um redirecionamento 301 para levar os usuários a uma página ativa relevante.
  • URL enviado não encontrado (404) : você enviou um URL de código de erro 404 para indexação por meio do Google Search Console.
    • Solução : você não quer páginas de erro no índice, pois isso fornece uma experiência ruim para o usuário. Se não se espera que esta página volte a ser uma página de status 200 ativa no futuro, 301 redirecione-a para conteúdo relevante em seu site.

Aviso : os URLs mostrados na seção Aviso ou Válido com avisos são categorizados do Google como “Páginas ... podem exigir sua atenção e podem ou não ter sido indexados, de acordo com o resultado específico” 1

Então o que isso quer dizer? Para mim, isso significa que o Google não tem certeza de como lidar com um URL, mas relutantemente o manteve indexado. Independentemente da situação de cada URL, remova essa incerteza e investigue por que cada URL está sendo sinalizado. Pelo que tenho visto até agora, tudo se resume a alguém usando o arquivo robots.txt como uma ferramenta de desindexação. Isso é incorreto por alguns motivos.

O arquivo robots.txt é usado para definir regras para evitar que os mecanismos de pesquisa rastreiem certas áreas do seu site. Se um URL está sendo mostrado para os pesquisadores no Google e você deseja que isso pare, não adicione uma cláusula de rejeição ao seu arquivo robots.txt, pois isso fará com que o Google pare de verificar esta página com seus rastreadores, spiders ou qualquer outro o nome que você deseja dar a eles. Para realmente tirar um URL do Google ou de qualquer mecanismo de pesquisa, atribua a ele uma tag noindex no <head> do HTML ou por meio de um cabeçalho HTTP.

Embora o foco deste artigo seja em Erros e Avisos, vamos cobrir rapidamente as seções Válidos e Excluídos.

Válido : muito simplesmente, esta é uma lista de URLs que foram indexados com sucesso. O único controle de qualidade a ser feito aqui é para o mapa do site XML e para garantir que você não está indexando algo que não deseja. Para fazer isso, simplesmente clique na caixa “Válido” (elimine a confusão por ter apenas uma caixa destacada por vez) e analise a seção Detalhes.

Você encontrará dois tipos de detalhes principais, “Enviado e indexado” e “Indexado, não enviado no mapa do site:”

  • Enviado e indexado: esta é uma lista de URLs do seu site que o Google confirma que foram indexados com sucesso.
  • Indexados, não enviados no sitemap: são URLs indexados que não aparecem no seu sitemap XML. Dependendo do seu site, normalmente não deve haver um grande número deles. Se quiser que um URL seja indexado, você deve ajudar os mecanismos de pesquisa e a si mesmo, e adicioná-los ao seu sitemap XML. Se não tiver certeza de como fazer isso, entre em contato com sua agência de marketing digital e eles podem fazer o controle de qualidade do seu sitemap de maneira adequada.

Excluído : esses são URLs intencionalmente deixados de fora do índice do Google. Isso pode acontecer de muitas maneiras diferentes, mas o Google acredita que seu site tomou medidas para evitar que esses URLs sejam pesquisados. Isso não é de forma alguma um problema e faz parte de um site saudável. Recursos internos, como páginas protegidas por senha ou URLs de imagens geradas por um site WordPress devem ser deixados de fora do índice, pois são uma experiência de página de destino ruim para os pesquisadores online.

Tem perguntas?

Se você leu este artigo e ainda não tem certeza de como lidar com seus problemas de cobertura, ligue para nós e nossa equipe de marketing de busca ficará feliz em ajudá-lo a resolver o problema.