¿Qué son los errores 404 'suaves' y afectarán mis clasificaciones?

Publicado: 2021-07-19

Los errores suaves 404 son diferentes de los errores 404 habituales y pueden ser perjudiciales para su sitio. Es importante corregirlos para que su sitio web pueda funcionar bien desde una perspectiva de SEO.

Página de error 404 de Hallam

Es probable que esté familiarizado con el código de error 404 que le indica que no se ha encontrado la página web que está buscando. Pero, ¿sabía que usar este mensaje de error en el contexto incorrecto puede generar lo que se conoce como un 404 suave, que puede afectar su rendimiento de SEO?

Los especialistas en marketing a veces pasan por alto estos aspectos técnicos de los sitios web y esperan que los desarrolladores web los manejen en su lugar. Esto puede ser perjudicial para el rendimiento de un sitio web en los resultados de búsqueda, por lo que los especialistas en SEO deben trabajar en estrecha colaboración con los desarrolladores web.

Este artículo se centrará en una categoría particular de error de rastreo, uno que, si no se resuelve, puede reducir enormemente la cantidad de páginas que los motores de búsqueda como Google rastrean e indexan en sus resultados de búsqueda. En este artículo, cubriremos:

  • Qué error suave 404 es
  • Los problemas con los errores suaves 404
  • Cómo corregir errores suaves 404
  • Por qué corregir errores suaves 404 ayudará al rendimiento de su sitio web

¿Qué es un error 404 suave?

Un verdadero mensaje de error 404 ocurre cuando el servidor de un sitio web devuelve un código de respuesta estándar HTTP 404 para indicar que no pudo encontrar la página web ( URL ) solicitada por el usuario. Esto informa tanto a los navegadores como a los motores de búsqueda que la página no existe.

Lo que la mayoría de la gente no entiende es que el contenido de la página (mensaje "página no encontrada") no tiene ninguna relación con la respuesta HTTP devuelta por el servidor. El hecho de que una página muestre un mensaje 404 Archivo no encontrado no significa que esta página se defina automáticamente como una página 404.

En las propias palabras de Google: “ Esto es como una jirafa con una etiqueta con su nombre que dice 'perro'. El hecho de que la etiqueta con el nombre diga que es un perro no significa que en realidad sea un perro. Del mismo modo, el hecho de que una página diga 404 no significa que esté devolviendo un código de estado 404. "

Se produce un error 404 suave cuando una página inexistente (una página que ha sido eliminada / eliminada) muestra un mensaje de 'página no encontrada' a cualquiera que intente acceder a ella, pero no devuelve un código de estado HTTP 404. También pueden ocurrir cuando la página inexistente redirige a los usuarios a una página irrelevante, como la página de inicio, en lugar de devolver un código de estado HTTP 404.

Lo importante a recordar aquí es que el contenido de una página web no tiene ninguna relación con la respuesta HTTP devuelta por el servidor.

Esta distinción es importante para el SEO porque determina cómo Google trata la página. El rastreo y la indexación es un proceso por el que pasan los bots de Google antes de incluir las páginas de su sitio web en las páginas de resultados de los motores de búsqueda. Cuando se devuelve un verdadero mensaje de error 404, los bots de Google no pierden tiempo rastreando o indexando la página. Cuando se devuelve un error 404 suave, la página aún se rastrea e indexa.

El problema con los errores suaves 404

Si su sitio web devuelve un código de estado HTTP que no sea 404 (o 410) para una página que no existe, puede afectar negativamente el rendimiento del sitio web en la búsqueda orgánica. Esto significa que si su sitio web tiene una alta proporción de errores suaves 404, puede ser dañino. Al no entregar un código de estado 404, su sitio web le dice a los motores de búsqueda que hay una página real en la URL a la que intentan acceder. Como resultado, la URL que ha eliminado (sin contenido) se rastreará e indexará, lo que desperdiciará un valioso presupuesto de rastreo en páginas redundantes.

Google define el presupuesto de rastreo como "la cantidad de URL que el robot de Google puede y quiere rastrear". El presupuesto de rastreo se divide en frecuencia de rastreo y demanda de rastreo:

  • Tasa de rastreo : diseñado para ayudar a Google a no rastrear sus páginas con demasiada frecuencia o demasiado rápido y dañar su servidor
  • Demanda de rastreo : cuánto desea Google rastrear sus páginas. Esto se basa en qué tan populares son sus páginas y qué tan obsoleto es el contenido en el índice de Google.

Google no quiere perder un tiempo interminable rastreando contenido en el mismo sitio web, por lo que tiene sentido que asignen un 'presupuesto' a sus rastreos web antes de pasar a otro sitio web.

Siguiendo la idea de los presupuestos de rastreo, si un sitio web tiene una alta proporción de errores suaves 404, esas páginas se rastrearán. El proceso de rastreo de estas páginas inexistentes invariablemente consumirá cantidades innecesarias del presupuesto de rastreo asignado al sitio. Debido al tiempo que el robot de Google pasa rastreando los errores 404 suaves, es posible que sus URL únicas no se detecten con tanta rapidez ni se rastreen con tanta frecuencia, lo que reduce la visibilidad del contenido importante de su sitio.

En última instancia, si tiene un alto porcentaje de 404 suaves, no solo está desperdiciando el presupuesto de rastreo en páginas sin sentido, sino que también está reduciendo la visibilidad de sus páginas importantes. Por lo tanto, no debería sorprendernos que cuando se resuelven los errores 404 leves, el rendimiento de un sitio web en los resultados de búsqueda orgánicos tiende a mejorar.

Para explicar cómo evaluaría el alcance de un problema 404 suave, echemos un vistazo a un ejemplo de un sitio web que muestra una serie de errores 404 suaves en Google Search Console. En el siguiente ejemplo, vemos que se informan 147 errores suaves 404 para el sitio web en cuestión. Esto bien puede hacer que suenen las campanas de alarma, pero primero debemos considerar la figura en contexto.

Errores suaves 404

Para hacer esto, debemos verificar cuántas páginas web del sitio web se han enviado a Google para rastrear e indexar. Para esta tarea, echaremos un vistazo al mapa del sitio XML del sitio web en cuestión, que es un indicador clave de cuántas páginas tiene un sitio web. Puede ver qué mapas del sitio XML se han enviado en Search Console> Mapas del sitio.

mapa del sitio

Y la cobertura, que muestra cuántas páginas web se están indexando o tienen algún problema, se puede encontrar en Search Console> Cobertura> Buscar mapa del sitio XML en el menú desplegable.

Cobertura: número de páginas web a las que se presta servicio

El ejemplo anterior muestra que Google está indexando 3.31K páginas de contenido del sitio web en cuestión.

Al observar los datos anteriores, podemos ver que este sitio web tiene alrededor de 3.409 páginas, por lo que los 107 errores suaves 404 ahora comienzan a parecer un poco menos siniestros. Aún así, en más del 3% del total de páginas del sitio, los 107 errores suaves 404 siguen desperdiciando parte del presupuesto de rastreo asignado a este sitio web. En este caso, Google pasa demasiado tiempo rastreando URL que simplemente no existen.

¿Cómo resuelvo estos problemas?

Google solo le permite exportar un máximo de 1000 URL en Google Search Console. En el ejemplo anterior, se informan menos de 1000 errores, por lo que se pueden descargar directamente a través de Search Console. Una vez que haya exportado la lista de URL, deberá evaluar por qué las páginas se informan como 404 suaves. Google proporciona información sobre las URL que resaltan como 404 suaves, como puede ver en el siguiente ejemplo:

Información de Google sobre errores suaves 404

En la mayoría de los casos, encontrará que un sitio web ofrecerá un código de estado 200 (OK) en las páginas que devuelven un mensaje de "página no encontrada". Por lo tanto, lo primero que debe hacer es ejecutar una selección de las páginas de error 404 suave a través de un verificador de código de estado HTTP como httpstatus.io , para evaluar qué códigos de estado están devolviendo esas páginas.

Digamos que el dominio de ejemplo a continuación mostraba una página 404 al usuario que intentaba acceder a ella, pero cuando verificamos el código de respuesta usando un verificador de código de estado HTTP, devolvió una respuesta HTTP 200. Este es un excelente ejemplo de un error 404 suave, ya que el código de respuesta HTTP indica a los robots de los motores de búsqueda que la página existe y debe ser rastreada. Sin embargo, no hay contenido en la página que sea devuelto por el servidor.

Verifique los códigos de respuesta del servidor

Página que devuelve un código de respuesta del servidor HTTP 200. Comprobado mediante: https://httpstatus.io/

El otro problema que puede encontrar al diagnosticar la causa raíz de los errores suaves 404 son las redirecciones 301/302 inapropiadas.

Los redireccionamientos 301 deben usarse cuando una página se elimina permanentemente y desea enviar a las personas a una nueva página más apropiada. Las redirecciones 302 son similares a las 301, pero se utilizan cuando la página se elimina temporalmente.

Algunos webmasters optan por redirigir todas las páginas eliminadas a la página de inicio del sitio web en lugar de mostrar un error 404, que no es del todo apropiado y confunde a los robots de los motores de búsqueda . Es importante destacar que tener 404 en su sitio web no es algo malo. Las páginas eliminadas o los productos agotados solo deben redirigirse a un reemplazo directo. Si no existe un reemplazo directo, debe mostrar una página de error 404 personalizada para mostrar opciones o productos alternativos al usuario.

He destacado un ejemplo de redireccionamientos inapropiados que desencadenan errores suaves 404 a continuación. En este caso, el webmaster está utilizando redireccionamientos 302 para redirigir a cualquiera que intente acceder a una página que ha sido eliminada y redirigir a esos usuarios a una página 404 personalizada, una que en realidad no proporciona un código de estado HTTP 404. Esto tendrá un gran impacto en la forma en que los motores de búsqueda rastrean el sitio web en cuestión, ya que se les indica a los motores de búsqueda que busquen en otros lugares las páginas que realmente se han eliminado. Si un robot de motor de búsqueda sigue esas instrucciones, eventualmente recibirá un código de estado HTTP 200 (OK) para una página que muestra un mensaje de error 404, que es otro nivel de mala práctica.

Un ejemplo de redireccionamiento 302 que se utiliza para enviar a los usuarios a una página de error 404 personalizada

Un ejemplo de redireccionamiento 302 que se utiliza para enviar a los usuarios a una página de error 404 personalizada

Nunca debe utilizar redireccionamientos para publicar una página de error 404. En su lugar, envíe un código de respuesta HTTP 404 cuando se solicite cualquier página que elimine o elimine de su sitio web y no haya un reemplazo directo. Esto evitará que su sitio web active una gran cantidad de errores suaves 404 y garantizará que los motores de búsqueda solo rastreen e indexen las páginas que desea clasificar.

Ejemplo del código de estado de una URL

Página que devuelve un código de respuesta del servidor HTTP 404. Comprobado mediante: http://httpstatus.io/

¿Resolver errores suaves 404 aumentará el tráfico a mi sitio web?

Los resultados de un proyecto técnico de SEO en el que trabajamos una vez para un cliente de comercio electrónico dejaron muy claro por qué siempre debe tomar nota de los errores suaves 404. Nos dimos cuenta de que el cliente en cuestión tenía una proporción extremadamente alta de errores suaves 404 en comparación con el número total de páginas de su sitio. Descubrimos que esto se debía a que su sitio web entregaba mensajes 404 sin devolver códigos de estado HTTP 404 para muchos de sus productos eliminados, de los cuales había miles.

Una vez que diagnosticamos el problema, nos pusimos en contacto con el desarrollador web del cliente para asegurarnos de que su servidor devolviera los códigos de estado HTTP 404 junto con los mensajes de 'página no encontrada' para cualquier producto que hubieran eliminado de su sitio web. El desarrollador implementó la solución como sugerimos, y dos días después, notamos que el tráfico orgánico había aumentado dramáticamente. Pasó de un promedio de 1.400 sesiones por día a un promedio de 2.600 por día.

404 análisis de códigos de estado

La historia no termina ahí amigos. Resulta que este cliente estaba usando una plataforma de sitio web personalizada utilizada por muchos otros minoristas en línea, lo que significa que otros sitios web creados por el desarrollador se ejecutaban en la misma plataforma. Entonces, cuando el desarrollador comenzó a proporcionar códigos de estado HTTP 404 para cualquier página eliminada en su plataforma, otras empresas que usaban esa plataforma comenzaron a informar un fuerte aumento en su tráfico orgánico. Solo puedo suponer que los desarrolladores web se llevaron todo el crédito por esto, a pesar de la batalla de un mes que tuvimos para convencerlos de que vale la pena resolver los 404 suaves en primer lugar.

Soft 404s: la importancia del SEO técnico

El SEO técnico es algo con lo que muchos especialistas en marketing solo están vagamente familiarizados. De hecho, incluso para los profesionales de SEO, a menudo es un área que tiende a caer en manos de los desarrolladores web. Esto puede generar enormes oportunidades perdidas en términos de mejorar la visibilidad de la búsqueda orgánica. Las funciones técnicas de un sitio web son lo que yo consideraría los componentes básicos del SEO y, como hemos visto en el ejemplo anterior, son especialmente importantes para los sitios web de comercio electrónico de nivel empresarial.

TL; DR - Demasiado largo; No leí

  • Siempre que se muestre el mensaje de error 404 (no encontrado) en una página, el servidor debe devolver un código de respuesta estándar HTTP 404.
  • El contenido de la página (el mensaje "página no encontrada") no tiene ninguna relación con la respuesta HTTP devuelta por el servidor.
  • Se produce un error 404 suave cuando una página que no existe (una página que ha sido eliminada / eliminada) muestra un mensaje de 'página no encontrada' a cualquiera que intente acceder a ella, pero no devuelve un código de estado HTTP 404. Esto puede suceder cuando la página eliminada redirige a los usuarios a una página irrelevante, como la página de inicio del sitio web.
  • La cantidad de 404 suaves informados debe compararse con la cantidad total de páginas indexables en un sitio; si esta proporción de 404 suaves / páginas indexables es alta, puede afectar negativamente el rendimiento de un sitio web en la búsqueda orgánica al desperdiciar un valioso presupuesto de rastreo.
  • La resolución de problemas suaves de 404 puede mejorar drásticamente la eficiencia del rastreo y garantizar que los motores de búsqueda solo dediquen tiempo a rastrear las páginas que usted desea.
  • Arreglar sus errores suaves 404 puede mejorar la visibilidad de un sitio web en la búsqueda orgánica.

¿Has aprendido algo nuevo?

Entonces únase a las 80.000 personas que leen nuestros artículos de expertos cada mes.
  • Este campo tiene fines de validación y no debe modificarse.

Si necesita ayuda con su SEO, no dude en contactarnos.