Comprensión del informe de cobertura del índice

Publicado: 2018-12-20

Si ha visto un mensaje como este durante las últimas dos semanas, ¡respire hondo y siga leyendo! En este artículo, desglosaré por qué está viendo problemas de cobertura en Google Search Console y cómo solucionarlos.

¿Qué es el Informe de cobertura del índice?

Con la presentación de la renovada Google Search Console, hay una serie de funciones mejoradas que debe conocer. Una de esas características es el Informe de cobertura del índice, que describe cuántas de las URL de su sitio Google ha catalogado (o indexado) y aparecerán en los resultados de búsqueda de Google. Este informe se encontraba anteriormente en "Estado del índice" dentro de la antigua interfaz de Search Console:

VIEJO VS NUEVO

Ahora, el Informe de cobertura del índice se puede encontrar en el menú "Índice", luego haga clic en "Cobertura". Se le mostrará qué URL tienen errores de indexación, advertencias (o válidas con advertencias), son válidas o están excluidas del índice de Google. Para comprender correctamente este informe, exploremos lo que significa cada uno de estos grupos.

Error : estas son páginas que actualmente no se ofrecen a los buscadores en Google, pero Google también cree que esta no es su intención.

Los errores se pueden desencadenar de muchas formas diferentes, incluido algo tan simple como que su robots.txt bloquee los rastreadores de una página que envió para indexar a algo más complicado como un error del servidor (error de nivel 500). ¿Las buenas noticias? La mayoría de estos errores se pueden solucionar con relativa facilidad con la ayuda de su webmaster, agencia de marketing digital o equipo de desarrollo web.

Los errores más comunes que hemos visto en Top Floor son "URL enviada bloqueada por robots.txt" y "URL enviada marcada como 'noindex'". Estos son errores menos siniestros y se producen al enviar una URL para indexar a través de Google Search Console. mientras que el archivo robots.txt no permite el rastreo a esta URL o que contiene una etiqueta noindex. Esta es una señal contradictoria porque su sitio le está diciendo a los motores de búsqueda que no rastreen o indexen esta página, pero al mismo tiempo solicitan que se indexe. Google verá esto como involuntario y lo marcará como Error en lugar de Excluido (o desindexación intencional).

Para conocer otras formas de encontrar un error, consulte a continuación:

  • Error del servidor (5xx) : el servidor no pudo encontrar la URL cuando se solicitó y devolvió un error de nivel 500.
    • Solución : hable con su equipo de desarrollo para solucionar este problema del lado del servidor. No hay mucho más que otro equipo pueda hacer aquí sin la experiencia adecuada.
  • Error de redireccionamiento : hay un problema en la cadena de redireccionamiento asociada con esta URL. O hay un bucle de redireccionamiento o una URL en la cadena tiene un error de nivel 400 o 500.
    • Solución : rastree la URL, utilizando Screaming Frog u otra herramienta, e identifique un error de nivel 400 o 500 en una de las URL en la cadena de redireccionamiento. Si no está seguro, hable con su agencia de marketing digital y ellos verán esto por usted.
  • URL enviada bloqueada por robots.txt : enviaste esta página para indexarla en Google Search Console, pero el archivo robots.txt está bloqueando la página.
    • Solución : vuelva a comprobar su archivo robots.txt en www.yoursite.com/robots.txt. Asegúrese de que una línea que comience con "no permitir" no haga referencia a la URL o subcarpeta con su URL en cuestión. Su agencia de marketing digital puede ayudarlo a identificar cualquier problema en el archivo robots.txt.
  • URL enviada marcada como 'noindex ': enviaste esta página para indexarla, pero la página tiene una metaetiqueta 'noindex' o un encabezado HTTP.
    • Solución : evalúe la URL, ¿desea que se encuentre esta página cuando se busque en Google? Si lo hace, simplemente elimine la metaetiqueta o el encabezado HTTP. Si no puede encontrar la etiqueta noindex mirando la fuente de la página (Control + U), pregunte a su agencia de marketing digital o equipo de desarrollo.
  • La URL enviada parece ser un 404 suave : envió esta página para indexar, pero Google cree que esta página es un 404 suave.
    • Solución: Un error 404 suave ocurre cuando se muestra una página con contenido de error 404, pero el código de estado no es 404, sino 200. Examine la página, ¿se supone que realmente es una página de error y el código de estado es incorrecto? A veces, Google malinterpreta una página con poco contenido como un suave 404. En cualquier caso, considere una redirección 301 para llevar a los usuarios a una página relevante y en vivo.
  • URL enviada no encontrada (404) : Envió una URL de código de error 404 para indexar a través de Google Search Console.
    • Solución : no desea páginas de error en el índice, ya que proporciona una mala experiencia de usuario. Si no se espera que esta página vuelva a convertirse en una página de estado 200 en vivo en el futuro, 301 la redirigirá a contenido relevante en su sitio.

Advertencia : las URL que se muestran en la sección Advertencia, o Válidas con advertencias, están clasificadas por Google como "Páginas ... pueden requerir su atención y pueden o no haber sido indexadas, según el resultado específico" 1

Entonces, ¿qué significa esto? Para mí, esto significa que Google no está seguro de cómo manejar una URL, pero la mantuvo indexada a regañadientes. Independientemente de la situación de cada URL, elimine esta incertidumbre y analice por qué se marca cada URL. Por lo que he visto hasta ahora, se trata de alguien que usa el archivo robots.txt como herramienta de desindexación. Esto es incorrecto por un par de razones.

El archivo robots.txt se utiliza para configurar reglas para evitar que los motores de búsqueda rastreen ciertas áreas de su sitio. Si se muestra una URL a los buscadores en Google y desea que esto se detenga, no agregue una cláusula de rechazo a su archivo robots.txt, ya que esto le indicará a Google que deje de verificar esta página con sus rastreadores, arañas o lo que sea. nombre que quieras darles. Para quitarle realmente una URL a Google, o cualquier motor de búsqueda, asígnele una etiqueta noindex en el <head> del HTML o mediante un encabezado HTTP.

Aunque el enfoque de este artículo es sobre errores y advertencias, cubramos rápidamente las secciones Válidas y Excluidas.

Válido : simplemente, esta es una lista de URL que se han indexado correctamente. El único control de calidad que debe realizarse aquí es para su mapa de sitio XML y para asegurarse de que no está indexando algo que no desea. Para hacer esto, simplemente haga clic en el cuadro "Válido" (elimine la confusión al tener solo un cuadro resaltado a la vez) y revise la sección Detalles.

Se encontrará con dos tipos de detalles principales, "Enviado e indexado" e "Indexado, no enviado en el mapa del sitio:"

  • Enviado e indexado: esta es una lista de URL de su sitio que Google confirma que se indexaron correctamente.
  • Indexadas, no enviadas en el mapa del sitio: estas son URL indexadas que no aparecen en su mapa del sitio XML. Dependiendo de su sitio, normalmente no debería haber una gran cantidad de estos. Si desea que se indexe una URL, debe ayudar a los motores de búsqueda y a usted mismo, y agregarlos a su mapa del sitio XML. Si no está seguro de cómo hacer esto, comuníquese con su agencia de marketing digital y ellos pueden controlar su mapa del sitio de manera adecuada.

Excluidas : estas son URL que se dejaron intencionalmente fuera del índice de Google. Esto puede suceder a través de muchas vías diferentes, pero Google cree que su sitio tomó medidas para evitar que se busquen estas URL. Esto de ninguna manera es un problema y es parte de un sitio saludable. Los recursos internos, como las páginas protegidas con contraseña o las URL de imágenes generadas por un sitio de WordPress, deben dejarse fuera del índice, ya que son una mala experiencia de página de destino para los buscadores en línea.

¿Tiene preguntas?

Si ha leído este artículo y aún no está seguro de cómo manejar sus problemas de cobertura, llámenos y nuestro equipo de marketing de búsqueda estará encantado de ayudarlo a resolverlo.