Cosa sono gli errori 404 "soft" e influiranno sulle mie classifiche?
Pubblicato: 2021-07-19Gli errori soft 404 sono diversi dai soliti errori 404 e possono essere dannosi per il tuo sito. È importante correggerli in modo che il tuo sito web possa funzionare bene dal punto di vista SEO.

Probabilmente conosci il codice di errore 404 che ti dice che la pagina web che stai cercando non è stata trovata. Ma sapevi che l'utilizzo di questo messaggio di errore nel contesto sbagliato può generare il cosiddetto soft 404, che può influire sulle tue prestazioni SEO?
I marketer a volte trascurano tali aspetti tecnici dei siti Web e si aspettano che gli sviluppatori Web li gestiscano invece. Questo può essere dannoso per le prestazioni di un sito web nei risultati di ricerca, motivo per cui gli specialisti SEO devono lavorare a stretto contatto con gli sviluppatori web.
Questo articolo si concentrerà su una particolare categoria di errore di scansione, che, se lasciata irrisolta, può ridurre enormemente la quantità di pagine che i motori di ricerca come Google scansionano e indicizzano nei loro risultati di ricerca. In questo articolo tratteremo:
- Che errore soft 404 è
- I problemi con gli errori soft 404
- Come correggere gli errori soft 404
- Perché correggere gli errori soft 404 aiuterà le prestazioni del tuo sito web
Che cos'è un errore 404 morbido?
Un vero messaggio di errore 404 si verifica quando il server di un sito Web restituisce un codice di risposta standard HTTP 404 per indicare che non è riuscito a trovare la pagina Web ( URL ) richiesta dall'utente. Questo informa sia i browser che i motori di ricerca che la pagina non esiste.
Quello che la maggior parte delle persone non capisce è che il contenuto della pagina – messaggio 'pagina non trovata' – non è completamente correlato alla risposta HTTP restituita dal server. Solo perché una pagina visualizza un messaggio File 404 non trovato, ciò non significa che questa pagina sia definita automaticamente come pagina 404.
Nelle stesse parole di Google: “ È come una giraffa che indossa un cartellino con il nome che dice 'cane'. Solo perché la targhetta del nome dice che è un cane, non significa che in realtà sia un cane. Allo stesso modo, solo perché una pagina dice 404, non significa che restituisca un codice di stato 404. "
Un errore soft 404 si verifica quando una pagina inesistente (una pagina che è stata eliminata/rimossa) visualizza un messaggio "pagina non trovata" a chiunque tenti di accedervi ma non riesce a restituire un codice di stato HTTP 404. Possono anche verificarsi quando la pagina inesistente reindirizza gli utenti a una pagina irrilevante, come la home page, invece di restituire un codice di stato HTTP 404.
La cosa importante da ricordare qui è che il contenuto di una pagina web è completamente estraneo alla risposta HTTP restituita dal server.
Questa distinzione è importante per la SEO perché determina come Google tratta la pagina. La scansione e l'indicizzazione sono un processo che i bot di Google seguono prima di elencare le pagine del tuo sito web nelle pagine dei risultati dei motori di ricerca. Quando viene restituito un vero messaggio di errore 404, i bot di Google non passano il tempo a eseguire la scansione o l'indicizzazione della pagina. Quando viene restituito un errore soft 404, la pagina viene ancora sottoposta a scansione e indicizzata.
Il problema con errori 404 soft Soft
Se il tuo sito web restituisce un codice di stato HTTP diverso da 404 (o 410) per una pagina inesistente, può avere un impatto negativo sulle prestazioni del sito web nella ricerca organica. Ciò significa che se il tuo sito web ha un'alta percentuale di errori soft 404, può essere dannoso. Non riuscendo a servire un codice di stato 404, il tuo sito web sta dicendo ai motori di ricerca che c'è una pagina reale nell'URL a cui stanno tentando di accedere. Di conseguenza, l'URL che hai eliminato (senza contenuto) verrà scansionato e indicizzato, sprecando così prezioso budget di scansione su pagine ridondanti.
Google definisce Crawl Budget come "il numero di URL che Googlebot può e vuole eseguire la scansione". Il budget di scansione è suddiviso in Frequenza di scansione e Domanda di scansione:
- Velocità di scansione : progettata per aiutare Google a non eseguire la scansione delle tue pagine troppo frequentemente o troppo velocemente e danneggiare il tuo server
- Crawl Demand : quanto Google desidera eseguire la scansione delle tue pagine. Questo si basa su quanto sono popolari le tue pagine e quanto sono obsoleti i contenuti nell'indice di Google
Google non vuole perdere tempo infinito a scansionare i contenuti sullo stesso sito web, quindi ha senso assegnare un "budget" alle loro scansioni web prima di passare a un altro sito web.
Rimanendo fedele all'idea dei budget di scansione, se un sito Web ha un'alta percentuale di errori soft 404, quelle pagine verranno sottoposte a scansione. Il processo di scansione di queste pagine inesistenti occuperà invariabilmente importi inutili del budget di scansione assegnato al sito. A causa del tempo che Googlebot impiega per la scansione dei soft 404, i tuoi URL univoci potrebbero non essere scoperti così rapidamente o scansionati con la stessa frequenza, riducendo così la visibilità dei contenuti importanti sul tuo sito.
In definitiva, se hai un'alta percentuale di soft 404, non stai solo sprecando il crawl budget su pagine insignificanti, ma stai anche riducendo la visibilità delle tue pagine importanti. Non dovrebbe quindi sorprendere che quando vengono risolti gli errori soft 404, le prestazioni di un sito Web nei risultati di ricerca organici tendono a migliorare.
Per spiegare come valuteresti l'entità di un problema soft 404, diamo un'occhiata a un esempio di un sito web che visualizza una serie di errori soft 404 in Google Search Console. Nell'esempio seguente, vediamo 147 errori soft 404 segnalati per il sito Web in questione. Questo potrebbe far suonare un campanello d'allarme, ma dobbiamo prima considerare la figura nel contesto.

Per fare ciò, dobbiamo controllare quante pagine web del sito web sono state inviate a Google per la scansione e l'indicizzazione. Per questo compito, diamo un'occhiata alla mappa del sito XML per il sito Web in questione, che è un indicatore chiave del numero di pagine di un sito Web. Puoi vedere quali sitemap XML sono state inviate in Search Console > Sitemap

E la copertura, che mostra quante pagine web vengono indicizzate o che presentano problemi, può essere trovata in Search Console > Copertura > Trova sitemap XML nel menu a discesa

L'esempio sopra mostra che Google sta indicizzando 3.31K pagine di contenuti dal sito web in questione.
Guardando i dati sopra, possiamo vedere che questo sito Web ha circa 3.409 pagine, quindi i 107 errori soft 404 ora iniziano a sembrare un po' meno inquietanti. Tuttavia, con oltre il 3% delle pagine totali del sito, i 107 errori soft 404 stanno ancora sprecando parte del budget di scansione assegnato a questo sito web. In questo caso, Google impiega troppo tempo a scansionare URL che semplicemente non esistono.
Come posso risolvere questi problemi?
Google ti consente di esportare solo un massimo di 1000 URL in Google Search Console. Nell'esempio sopra, sono stati segnalati meno di 1000 errori, quindi questi possono essere scaricati direttamente tramite Search Console. Dopo aver esportato l'elenco di URL, dovrai valutare il motivo per cui le pagine vengono segnalate come soft 404. Google fornisce alcune informazioni sugli URL che evidenziano come soft 404, come puoi vedere nell'esempio seguente:

Nella maggior parte dei casi, scoprirai che un sito Web servirà un codice di stato 200 (OK) sulle pagine che restituiscono un messaggio "pagina non trovata". Pertanto, la prima cosa che dovresti fare è eseguire una selezione delle pagine di errore soft 404 tramite un controllo del codice di stato HTTP come httpstatus.io , per valutare quali codici di stato restituiscono quelle pagine.
Supponiamo che il dominio di esempio sotto mostrasse una pagina 404 all'utente che cercava di accedervi, ma quando abbiamo controllato il codice di risposta utilizzando un controllo del codice di stato HTTP, ha restituito una risposta HTTP 200. Questo è un ottimo esempio di errore soft 404, poiché il codice di risposta HTTP indica ai robot dei motori di ricerca che la pagina esiste e deve essere sottoposta a scansione. Tuttavia, nella pagina non sono presenti contenuti restituiti dal server.

Pagina che restituisce un codice di risposta del server HTTP 200. Verificato utilizzando: https://httpstatus.io/
L'altro problema che potresti incontrare durante la diagnosi della causa principale degli errori soft 404 sono i reindirizzamenti 301/302 inappropriati.
I reindirizzamenti 301 dovrebbero essere utilizzati quando una pagina viene eliminata in modo permanente e si desidera indirizzare le persone a una nuova pagina più appropriata. I reindirizzamenti 302 sono simili ai 301 ma vengono utilizzati quando la pagina viene temporaneamente eliminata.

Alcuni webmaster scelgono di reindirizzare tutte le pagine eliminate alla home page del sito Web invece di fornire un errore 404, che non è affatto appropriato e confonde i robot dei motori di ricerca . È importante sottolineare che avere 404 sul tuo sito web non è una brutta cosa. Le pagine cancellate o i prodotti esauriti devono essere reindirizzati solo a una sostituzione diretta. Se non esiste una sostituzione diretta, dovresti mostrare una pagina di errore 404 personalizzata per visualizzare opzioni o prodotti alternativi all'utente.
Di seguito ho evidenziato un esempio di reindirizzamenti inappropriati che attivano errori soft 404. In questo caso, il webmaster utilizza i reindirizzamenti 302 per reindirizzare chiunque tenti di accedere a una pagina che è stata eliminata e reindirizza gli utenti a una pagina 404 personalizzata, una che in realtà non serve un codice di stato HTTP 404. Ciò avrà un enorme impatto sul modo in cui i motori di ricerca eseguono la scansione del sito Web in questione, poiché ai motori di ricerca viene chiesto di cercare altrove le pagine che sono state effettivamente eliminate. Se un robot del motore di ricerca segue queste istruzioni, alla fine riceverà un codice di stato HTTP 200 (OK) per una pagina che visualizza un messaggio di errore 404, che è un altro livello di cattiva pratica.

Un esempio di reindirizzamento 302 utilizzato per inviare gli utenti a una pagina di errore 404 personalizzata
Non dovresti mai utilizzare i reindirizzamenti per pubblicare una pagina di errore 404. Invece, fornisci un codice di risposta HTTP 404 quando vengono richieste pagine che rimuovi o elimini dal tuo sito web e non c'è una sostituzione diretta. Ciò impedirà al tuo sito Web di attivare un numero enorme di errori soft 404 e assicurerà che i motori di ricerca eseguano la scansione e l'indicizzazione solo delle pagine che desideri classificare.

Pagina che restituisce un codice di risposta del server HTTP 404. Verificato utilizzando: http://httpstatus.io/
La risoluzione degli errori Soft 404 aumenterà il traffico sul mio sito web?
I risultati di un progetto SEO tecnico su cui abbiamo lavorato una volta per un cliente di e-commerce hanno chiarito perché dovresti sempre prendere nota degli errori soft 404. Abbiamo notato che il cliente in questione aveva una percentuale estremamente elevata di errori soft 404 rispetto al numero totale di pagine del suo sito. Abbiamo scoperto che questo era dovuto al fatto che il loro sito Web stava fornendo messaggi 404 senza restituire i codici di stato HTTP 404 per molti dei loro prodotti eliminati, di cui ce n'erano migliaia.
Una volta diagnosticato il problema, ci siamo messi in contatto con lo sviluppatore web del cliente per assicurarci che il loro server restituisse i codici di stato HTTP 404 insieme ai messaggi "pagina non trovata" per tutti i prodotti rimossi dal loro sito web. Lo sviluppatore ha implementato la correzione come suggerito e due giorni dopo abbiamo notato che il traffico organico era aumentato notevolmente. È passato da una media di 1.400 sessioni al giorno a una media di 2.600 al giorno.

La storia non finisce qui gente. Si è scoperto che questo client utilizzava una piattaforma di siti Web personalizzata utilizzata da molti altri rivenditori online, il che significa che altri siti Web creati dallo sviluppatore erano in esecuzione sulla stessa piattaforma. Quindi, quando lo sviluppatore ha iniziato a fornire codici di stato HTTP 404 per qualsiasi pagina eliminata sulla sua piattaforma, altre aziende che utilizzano quella piattaforma hanno iniziato a segnalare un forte aumento del loro traffico organico. Posso solo presumere che gli sviluppatori web si siano presi tutto il merito per questo, nonostante la battaglia durata un mese per convincerli che valeva la pena risolvere i soft 404 in primo luogo!
Soft 404: l'importanza della SEO tecnica
La SEO tecnica è qualcosa che molti marketer conoscono solo vagamente. In effetti, anche per i professionisti della SEO, è spesso un'area che tende a cadere nelle mani degli sviluppatori web. Ciò può portare a enormi opportunità mancate in termini di miglioramento della visibilità della ricerca organica. Le funzioni tecniche di un sito Web sono ciò che considero gli elementi costitutivi della SEO e, come abbiamo visto nell'esempio sopra, sono particolarmente importanti per i siti Web di e-commerce di livello aziendale.
TL;DR – Troppo lungo; Non ho letto
- Ogni volta che il messaggio di errore 404 (non trovato) viene visualizzato su una pagina, il server dovrebbe restituire un codice di risposta standard HTTP 404.
- Il contenuto della pagina (il messaggio 'pagina non trovata') è completamente estraneo alla risposta HTTP restituita dal server.
- Un errore soft 404 si verifica quando una pagina inesistente (una pagina che è stata eliminata/rimossa) visualizza un messaggio "pagina non trovata" a chiunque tenti di accedervi ma non restituisce un codice di stato HTTP 404. Ciò può accadere quando la pagina eliminata reindirizza gli utenti a una pagina irrilevante come la home page del sito web.
- Il numero di soft 404 segnalati deve essere confrontato con il numero totale di pagine indicizzabili su un sito: se questo rapporto di soft 404/pagine indicizzabili è elevato, può avere un impatto negativo sulle prestazioni di un sito web nella ricerca organica sprecando prezioso crawl budget.
- La risoluzione dei problemi soft 404 può migliorare notevolmente l'efficienza della scansione e garantire che i motori di ricerca trascorrano solo il tempo a eseguire la scansione delle pagine che desideri.
- La correzione degli errori soft 404 può migliorare la visibilità di un sito Web nella ricerca organica.
Hai appena imparato qualcosa di nuovo?
Allora unisciti alle 80.000 persone che ogni mese leggono i nostri articoli di esperti.Se hai bisogno di aiuto con la tua SEO non esitare a contattarci.
