Ce sunt erorile 404 „ușoare” și care îmi vor afecta clasamentul?
Publicat: 2021-07-19Erorile soft 404 sunt diferite de erorile 404 obișnuite și pot fi dăunătoare site-ului dvs. Este important să le remediați, astfel încât site-ul dvs. web să poată performa bine din perspectiva SEO.

Este posibil să fiți familiarizați cu codul de eroare 404 care vă spune că pagina web pe care o căutați nu a fost găsită. Dar știați că utilizarea acestui mesaj de eroare într-un context greșit poate genera ceea ce este cunoscut sub numele de soft 404, care vă poate afecta performanța SEO?
Persoanele de marketing ignoră uneori astfel de aspecte tehnice ale site-urilor web și se așteaptă ca dezvoltatorii web să le gestioneze. Acest lucru poate fi în detrimentul performanței unui site web în rezultatele căutării, motiv pentru care specialiștii SEO trebuie să lucreze îndeaproape cu dezvoltatorii web.
Acest articol se va concentra pe o anumită categorie de erori de accesare cu crawlere, una care, dacă este lăsată nerezolvată, poate reduce enorm cantitatea de pagini motoare de căutare, cum ar fi accesarea cu crawlere Google și indexarea în rezultatele lor de căutare. În acest articol, vom acoperi:
- Ce este o eroare soft 404
- Problemele cu erori soft 404
- Cum se remediază erorile soft 404
- De ce remedierea erorilor soft 404 va ajuta performanța site-ului dvs. web
Ce este o eroare Soft 404?
Un mesaj de eroare adevărat 404 apare atunci când serverul unui site web returnează un cod de răspuns standard HTTP 404 pentru a indica faptul că nu a putut găsi pagina web ( URL ) solicitată de utilizator. Aceasta informează atât browserele, cât și motoarele de căutare că pagina nu există.
Ceea ce majoritatea oamenilor nu înțeleg este că conținutul paginii - mesajul „pagina nu a fost găsită” - nu este complet legat de răspunsul HTTP returnat de server. Doar pentru că o pagină afișează un mesaj 404 File Not Found, nu înseamnă că această pagină este definită automat ca o pagină 404.
În cuvintele proprii ale Google: „ Aceasta este ca o girafă care poartă o etichetă pe care scrie„ câine ”. Doar pentru că eticheta de nume spune că este un câine, nu înseamnă că este de fapt un câine. În mod similar, doar pentru că o pagină spune 404, nu înseamnă că returnează un cod de stare 404. ”
O eroare soft 404 apare atunci când o pagină inexistentă (o pagină care a fost ștearsă / eliminată) afișează un mesaj „pagina nu a fost găsită” către oricine încearcă să o acceseze, dar nu reușește să returneze un cod de stare HTTP 404. Ele pot apărea și atunci când pagina inexistentă redirecționează utilizatorii către o pagină irelevantă, cum ar fi pagina de pornire, în loc să returneze un cod de stare HTTP 404.
Cel mai important lucru de reținut aici este că conținutul unei pagini web nu are nicio legătură cu răspunsul HTTP returnat de server.
Această distincție este importantă pentru SEO, deoarece determină modul în care Google tratează pagina. Accesarea cu crawlere și indexarea este un proces pe care îl parcurg roboții Google înainte de a afișa paginile site-ului dvs. web în paginile cu rezultatele motorului de căutare. Când se returnează un mesaj de eroare 404 adevărat, roboții Google nu petrec timp accesând cu crawlere sau indexând pagina. Când se returnează o eroare soft 404, pagina este încă accesată cu crawlere și indexată.
Problema cu erorile Soft 404
Dacă site-ul dvs. returnează un cod de stare HTTP, altul decât un 404 (sau 410) pentru o pagină inexistentă, acesta poate avea un impact negativ asupra performanței site-ului în căutarea organică. Aceasta înseamnă că, dacă site-ul dvs. web are o proporție mare de erori soft 404, acesta poate fi dăunător. Dacă nu furnizează un cod de stare 404, site-ul dvs. le spune motoarelor de căutare că există o pagină reală la adresa URL pe care încearcă să o acceseze. Ca urmare, adresa URL pe care ați șters-o (fără conținut) va fi accesată cu crawlere și indexată, pierzând astfel bugetul valoros de accesare cu crawlere pe paginile redundante.
Google definește Bugetul de accesare cu crawlere ca „numărul de adrese URL pe care Google și le poate dori să acceseze cu crawlere”. Bugetul de accesare cu crawlere este împărțit în Rată de accesare și cerere de accesare cu crawlere:
- Rată de accesare cu crawlere - Concepută pentru a ajuta Google să nu acceseze cu crawlere paginile dvs. prea frecvent sau prea repede și să vă afecteze serverul
- Cerere de accesare cu crawlere - Cât de mult dorește Google să acceseze cu crawlere paginile dvs. Aceasta se bazează pe cât de populare sunt paginile dvs. și cât de vechi este conținutul din indexul Google
Google nu dorește să piardă timp nesfârșit accesând cu crawlere conținut pe același site web, așa că este logic ca aceștia să aloce un „buget” crawling-urilor lor web înainte de a trece la un alt site web.
Ținând cont de ideea bugetelor de accesare cu crawlere, dacă un site web are o proporție mare de erori soft 404, atunci acele pagini vor fi accesate cu crawlere. Procesul de accesare cu crawlere a acestor pagini inexistente va prelua invariabil sume inutile din bugetul de accesare cu crawlere atribuit site-ului. Datorită timpului în care Googlebot petrece accesând cu crawlere soft 404, este posibil ca adresele URL unice să nu fie descoperite la fel de repede sau să fie accesate cu crawlere la fel de frecvent - reducând astfel vizibilitatea conținutului important de pe site-ul dvs.
În cele din urmă, dacă aveți un procent ridicat de soft 404, nu numai că pierdeți bugetul de accesare cu crawlere pe pagini fără sens, dar reduceți și vizibilitatea paginilor dvs. importante. Prin urmare, nu ar trebui să fie o surpriză faptul că atunci când sunt rezolvate erorile soft 404, performanța unui site web în rezultatele căutării organice tinde să se îmbunătățească.
Pentru a explica modul în care ați evalua amploarea unei probleme soft 404, să aruncăm o privire la un exemplu de site web care afișează un număr de erori soft 404 în Google Search Console. În exemplul de mai jos, vedem 147 de erori soft 404 raportate pentru site-ul în cauză. Acest lucru poate provoca sunete de alarmă, dar mai întâi trebuie să luăm în considerare figura în context.

Pentru a face acest lucru, trebuie să verificăm câte pagini web de pe site au fost trimise către Google pentru a le accesa cu crawlere și a le indexa. Pentru această sarcină, ar trebui să aruncăm o privire la sitemap-ul XML pentru site-ul în cauză - care este un indicator cheie al numărului de pagini pe care le are un site web. Puteți vedea ce sitemap-uri XML au fost trimise în Search Console> Sitemap-uri

Și acoperirea, care arată câte pagini web sunt indexate sau au probleme, poate fi găsită în Search Console> Acoperire> Găsiți sitemap XML în meniul derulant

Exemplul de mai sus arată că Google indexează 3,31K pagini de conținut de pe site-ul în cauză.
Privind datele de mai sus, putem vedea că acest site web are în jur de 3.409 de pagini, astfel încât cele 107 erori soft 404 încep acum să pară puțin mai nefastă. Cu toate acestea, la peste 3% din totalul paginilor site-ului, cele 107 erori soft 404 risipesc încă o parte din bugetul de accesare cu crawlere alocat acestui site web. În acest caz, Google petrece prea mult timp accesând cu crawlere adresele URL care pur și simplu nu există.
Cum rezolv aceste probleme?
Google vă permite să exportați maximum 1000 de adrese URL în Google Search Console. În exemplul de mai sus, sunt raportate sub 1000 de erori, deci acestea pot fi descărcate direct prin Search Console. După ce ați exportat lista URL-urilor, va trebui să evaluați de ce paginile sunt raportate ca soft 404. Google furnizează câteva informații despre adresele URL pe care le evidențiază ca soft 404, așa cum puteți vedea în exemplul de mai jos:

În majoritatea cazurilor, veți găsi că un site web va difuza un cod de stare 200 (OK) pe paginile care returnează un mesaj „pagina nu a fost găsită”. Prin urmare, primul lucru pe care trebuie să-l faceți este să rulați o selecție a paginilor de eroare soft 404 printr-un verificator de cod de stare HTTP, cum ar fi httpstatus.io , pentru a evalua ce coduri de stare returnează acele pagini.
Să presupunem că exemplul de domeniu de mai jos afișa o pagină 404 utilizatorului care încerca să o acceseze, dar când am verificat codul de răspuns folosind un verificator de cod de stare HTTP, acesta a returnat un răspuns HTTP 200. Acesta este un prim exemplu de eroare soft 404, deoarece codul de răspuns HTTP indică roboților motorului de căutare că pagina există și că ar trebui să fie accesată cu crawlere. Cu toate acestea, nu există conținut pe pagină returnat de server.

Pagina care returnează un cod de răspuns al serverului HTTP 200. Verificat folosind: https://httpstatus.io/
Cealaltă problemă pe care s-ar putea să o întâlniți atunci când diagnosticați cauza principală a erorilor soft 404 este redirecționările 301/302 inadecvate.
Redirecționările 301 ar trebui folosite atunci când o pagină este ștearsă permanent și doriți să trimiteți oameni la o nouă pagină mai adecvată. Redirecționările 302 sunt similare cu 301, dar sunt utilizate atunci când pagina este ștearsă temporar.

Unii webmasteri aleg să redirecționeze toate paginile șterse către pagina de pornire a site-ului în loc să servească o eroare 404, care nu este deloc adecvată și încurcă roboții motorului de căutare . Este important să subliniezi că a avea 404 pe site-ul tău nu este un lucru rău. Paginile șterse sau produsele din stoc ar trebui redirecționate numai către un înlocuitor direct. Dacă nu există o înlocuire directă, ar trebui să difuzați o pagină de eroare 404 personalizată pentru a afișa utilizatorului opțiuni sau produse alternative.
Am evidențiat mai jos un exemplu de redirecționări necorespunzătoare care declanșează erori soft 404. În acest caz, webmasterul folosește 302 de redirecționări pentru a redirecționa pe oricine încearcă să acceseze o pagină ștearsă și redirecționează acei utilizatori către o pagină personalizată 404 - una care nu difuzează de fapt un cod de stare HTTP 404. Acest lucru va avea un impact enorm asupra modului în care motoarele de căutare accesează cu crawlere site-ul în cauză, deoarece motoarele de căutare sunt instruite să caute în altă parte paginile care au fost șterse. Dacă un robot de motor de căutare urmează aceste instrucțiuni, în cele din urmă li se va furniza un cod de stare HTTP 200 (OK) pentru o pagină care afișează un mesaj de eroare 404, care este un alt nivel de practică proastă.

Un exemplu de redirecționare 302 utilizată pentru a trimite utilizatorii către o pagină de eroare 404 personalizată
Nu ar trebui să utilizați niciodată redirecționări pentru a difuza o pagină de eroare 404. În schimb, difuzați un cod de răspuns HTTP 404 atunci când orice pagini pe care le eliminați sau le ștergeți de pe site-ul dvs. web sunt solicitate și nu există o înlocuire directă. Acest lucru va împiedica site-ul dvs. web să declanșeze un număr mare de erori soft 404 și va asigura că motoarele de căutare accesează cu crawlere și indexează doar paginile pe care doriți să le clasificați.

Pagina care returnează un cod de răspuns al serverului HTTP 404. Verificat folosind: http://httpstatus.io/
Rezolvarea erorilor Soft 404 va crește traficul către site-ul meu?
Rezultatele unui proiect SEO tehnic la care am lucrat odată pentru un client de comerț electronic a arătat foarte clar de ce ar trebui să luați întotdeauna notă de erorile soft 404. Am observat că clientul în cauză avea o proporție extrem de mare de erori soft 404 în comparație cu numărul total de pagini de pe site-ul lor. Am descoperit că acest lucru se datorează faptului că site-ul lor web difuza 404 mesaje fără a returna coduri de stare HTTP 404 pentru multe dintre produsele șterse, dintre care erau mii.
Odată ce am diagnosticat problema, ne-am legat de dezvoltatorul web al clientului pentru a ne asigura că serverul lor a returnat codurile de stare HTTP 404 alături de mesajele „pagina nu a fost găsită” pentru produsele pe care le-au eliminat de pe site-ul lor web. Dezvoltatorul a implementat remedierea așa cum am sugerat și, două zile mai târziu, am observat că traficul organic a crescut dramatic. A crescut de la o medie de 1.400 de sesiuni pe zi la o medie de 2.600 pe zi.

Povestea nu se termină aici, oameni buni. Se pare că acest client folosea o platformă personalizată de site web utilizată de mulți alți comercianți online - ceea ce înseamnă că alte site-uri web create de dezvoltator rulau pe aceeași platformă. Deci, când dezvoltatorul a început să difuzeze coduri de stare HTTP 404 pentru orice pagini șterse de pe platforma lor, alte companii care folosesc platforma respectivă au început să raporteze o creștere bruscă a traficului lor organic. Pot doar să presupun că dezvoltatorii web și-au luat tot meritul pentru acest lucru, în ciuda bătăliei de o lună pe care am avut-o convingându-i că 404 soft merită rezolvat în primul rând!
Soft 404s: Importanța SEO tehnic
SEO tehnic este un lucru pe care mulți specialiști în marketing îl cunosc doar vag. Într-adevăr, chiar și pentru practicienii SEO, este adesea un domeniu care tinde să cadă în mâinile dezvoltatorilor de web. Acest lucru poate duce la oportunități imense ratate în ceea ce privește îmbunătățirea vizibilității căutării organice. Funcțiile tehnice ale unui site web sunt ceea ce aș considera elementele de bază ale SEO și așa cum am văzut în exemplul de mai sus, acestea sunt deosebit de importante pentru site-urile de comerț electronic la nivel de întreprindere.
TL; DR - Prea lung; Nu am citit
- Ori de câte ori mesajul de eroare 404 (nu a fost găsit) este afișat pe o pagină, serverul ar trebui să returneze un cod de răspuns standard HTTP 404.
- Conținutul paginii (mesajul „pagina nu a fost găsită”) nu este complet legat de răspunsul HTTP returnat de server.
- O eroare soft 404 apare atunci când o pagină inexistentă (o pagină care a fost ștearsă / eliminată) afișează un mesaj „pagina nu a fost găsită” către oricine încearcă să o acceseze, dar nu returnează un cod de stare HTTP 404. Acest lucru se poate întâmpla atunci când pagina ștearsă redirecționează utilizatorii către o pagină irelevantă, cum ar fi pagina de pornire a site-ului web.
- Numărul de 404 soft raportat trebuie comparat cu numărul total de pagini indexabile de pe un site - dacă acest raport de 404 soft / pagini indexabile este ridicat, poate avea un impact negativ asupra performanței unui site web în căutarea organică prin risipirea bugetului valoros de accesare cu crawlere.
- Rezolvarea problemelor soft 404 poate îmbunătăți dramatic eficiența accesării cu crawlere și se poate asigura că motoarele de căutare petrec doar timp accesând cu crawlere paginile pe care le doriți.
- Remedierea erorilor soft 404 poate îmbunătăți vizibilitatea unui site web în căutarea organică.
Tocmai ai învățat ceva nou?
Apoi, alăturați-vă celor 80.000 de oameni care citesc în fiecare lună articolele noastre de experți.Dacă aveți nevoie de ajutor pentru SEO, nu ezitați să ne contactați.
