Czym są „miękkie” błędy 404 i czy wpłyną one na moje rankingi?

Opublikowany: 2021-07-19

Miękkie błędy 404 różnią się od zwykłych błędów 404 i mogą być szkodliwe dla Twojej witryny. Ważne jest, aby je naprawić, aby Twoja witryna mogła dobrze działać z punktu widzenia SEO.

Strona błędu Hallam 404

Prawdopodobnie znasz kod błędu 404, który informuje, że strona, której szukasz, nie została znaleziona. Ale czy wiesz, że użycie tego komunikatu o błędzie w niewłaściwym kontekście może generować tak zwany miękki błąd 404, który może wpłynąć na wydajność SEO?

Marketerzy czasami przeoczają takie techniczne aspekty stron internetowych i oczekują, że twórcy stron internetowych zajmą się nimi. Może to mieć negatywny wpływ na wyniki witryny w wynikach wyszukiwania, dlatego specjaliści SEO muszą ściśle współpracować z programistami internetowymi.

W tym artykule skupimy się na jednej konkretnej kategorii błędów indeksowania, która, jeśli nie zostanie rozwiązana, może znacznie zmniejszyć liczbę stron wyszukiwarek, takich jak indeksowanie i indeksowanie stron przez Google w ich wynikach wyszukiwania. W tym artykule omówimy:

  • Co to jest miękki błąd 404
  • Problemy z miękkimi błędami 404
  • Jak naprawić miękkie błędy 404
  • Dlaczego naprawienie miękkich błędów 404 poprawi wydajność Twojej witryny?

Co to jest miękki błąd 404?

Prawdziwy komunikat o błędzie 404 pojawia się, gdy serwer witryny zwraca standardowy kod odpowiedzi HTTP 404, aby wskazać, że nie mógł znaleźć strony internetowej ( URL ), której zażądał użytkownik. Informuje to zarówno przeglądarki, jak i wyszukiwarki, że strona nie istnieje.

Większość ludzi nie rozumie, że zawartość strony – komunikat „nie znaleziono strony” – jest całkowicie niezwiązana z odpowiedzią HTTP zwróconą przez serwer. Tylko dlatego, że strona wyświetla komunikat 404 Nie znaleziono pliku, nie oznacza to, że ta strona jest automatycznie definiowana jako strona 404.

Według własnych słów Google: „ To jest jak żyrafa z plakietką z imieniem z napisem „pies”. To, że plakietka z imieniem mówi, że to pies, nie oznacza, że ​​jest to pies. Podobnie to, że strona mówi 404, nie oznacza, że ​​zwraca kod stanu 404.

Miękki błąd 404 występuje, gdy nieistniejąca strona (strona, która została usunięta/usunięta) wyświetla komunikat „Nie znaleziono strony” każdemu, kto próbuje uzyskać do niej dostęp, ale nie zwraca kodu stanu HTTP 404. Mogą również wystąpić, gdy nieistniejąca strona przekierowuje użytkowników do nieistotnej strony, takiej jak strona główna, zamiast zwracać kod stanu HTTP 404.

Ważną rzeczą do zapamiętania jest tutaj to, że zawartość strony internetowej jest całkowicie niezwiązana z odpowiedzią HTTP zwróconą przez serwer.

To rozróżnienie jest ważne dla SEO, ponieważ decyduje o tym, jak Google traktuje stronę. Przeszukiwanie i indeksowanie to proces, przez który przechodzą boty Google przed umieszczeniem stron Twojej witryny na stronach wyników wyszukiwania. Po zwróceniu prawdziwego komunikatu o błędzie 404 boty Google nie spędzają czasu na przemierzaniu ani indeksowaniu strony. Po zwróceniu miękkiego błędu 404 strona jest nadal przeszukiwana i indeksowana.

Problem z miękkimi błędami 404

Jeśli Twoja witryna zwróci kod stanu HTTP inny niż 404 (lub 410) dla nieistniejącej strony, może to negatywnie wpłynąć na wyniki witryny w bezpłatnych wynikach wyszukiwania. Oznacza to, że jeśli Twoja witryna ma wysoki odsetek miękkich błędów 404, może to być szkodliwe. Nie dostarczając kodu stanu 404, Twoja witryna informuje wyszukiwarki, że pod adresem URL, do którego próbuje uzyskać dostęp, znajduje się prawdziwa strona. W rezultacie usunięty adres URL (bez treści) zostanie przeszukany i zindeksowany, co spowoduje marnowanie cennego budżetu na przeszukiwanie zbędnych stron.

Google definiuje Crawl Budget jako „liczbę adresów URL, które Googlebot może i chce zaindeksować”. Budżet indeksowania jest podzielony na szybkość indeksowania i zapotrzebowanie na indeksowanie:

  • Szybkość indeksowania – zaprojektowany, aby pomóc Google nie indeksować Twoich stron zbyt często lub zbyt szybko i nie szkodzić Twojemu serwerowi
  • Popyt na indeksowanie – jak bardzo Google chce indeksować Twoje strony. Jest to oparte na popularności Twoich stron i przestarzałej treści w indeksie Google

Google nie chce marnować niekończącego się czasu na indeksowanie treści w tej samej witrynie, więc warto przypisać „budżet” do indeksowania sieci przed przejściem do innej witryny.

Trzymając się idei budżetów indeksowania, jeśli witryna ma wysoki odsetek miękkich błędów 404, strony te zostaną zindeksowane. Proces indeksowania tych nieistniejących stron niezmiennie pochłania niepotrzebne kwoty budżetu indeksowania przypisanego do witryny. Ze względu na czas, jaki Googlebot spędza na indeksowaniu miękkich błędów 404, Twoje unikalne adresy URL mogą nie być wykrywane tak szybko lub indeksowane tak często, co zmniejsza widoczność ważnych treści w Twojej witrynie.

Ostatecznie, jeśli masz wysoki procent miękkich błędów 404, nie tylko marnujesz budżet indeksowania na bezsensownych stronach, ale także zmniejszasz widoczność ważnych stron. Nie powinno więc dziwić, że po usunięciu miękkich błędów 404 wydajność witryny w organicznych wynikach wyszukiwania zwykle się poprawia.

Aby wyjaśnić, w jaki sposób można ocenić zakres miękkiego błędu 404, spójrzmy na przykład witryny, która wyświetla szereg miękkich błędów 404 w Google Search Console. W poniższym przykładzie widzimy 147 miękkich błędów 404 zgłaszanych dla danej witryny. Może to wywołać dzwonki alarmowe, ale najpierw musimy wziąć pod uwagę liczbę w kontekście.

Miękkie błędy 404

W tym celu musimy sprawdzić, ile stron internetowych w witrynie zostało przesłanych do Google do przeszukania i zindeksowania. W tym zadaniu przyjrzymy się mapie witryny XML dla danej witryny – która jest kluczowym wskaźnikiem liczby stron w witrynie. Możesz zobaczyć, które mapy witryn XML zostały przesłane w Search Console > Mapy witryn

mapa strony

A zasięg, który pokazuje, ile stron internetowych jest indeksowanych lub ma jakieś problemy, można znaleźć w Search Console> Pokrycie> Znajdź mapę witryny XML w menu rozwijanym

Pokrycie - liczba obsługiwanych stron internetowych

Powyższy przykład pokazuje, że Google indeksuje 3,31 tys. stron treści z danej witryny.

Patrząc na powyższe dane, widzimy, że ta witryna ma około 3409 stron, więc 107 miękkich błędów 404 zaczyna teraz wydawać się nieco mniej złowieszczy. Mimo to, na ponad 3% wszystkich stron witryny, 107 miękkich błędów 404 nadal marnuje część budżetu indeksowania przypisanego do tej witryny. W takim przypadku Google spędza zbyt dużo czasu na indeksowaniu adresów URL, które po prostu nie istnieją.

Jak rozwiązać te problemy?

Google pozwala wyeksportować maksymalnie 1000 adresów URL w Google Search Console. W powyższym przykładzie zgłaszanych jest mniej niż 1000 błędów, więc można je pobrać bezpośrednio z Search Console. Po wyeksportowaniu listy adresów URL musisz ocenić, dlaczego strony są zgłaszane jako miękkie błędy 404. Google udostępnia pewne informacje na temat adresów URL, które wyróżnia jako miękkie błędy 404, jak widać w poniższym przykładzie:

Informacje Google o miękkich błędach 404

W większości przypadków okaże się, że witryna będzie wyświetlać kod stanu 200 (OK) na stronach, które zwracają komunikat „nie znaleziono strony”. Dlatego pierwszą rzeczą, którą musisz zrobić, to uruchomić wybór miękkich stron błędów 404 za pomocą narzędzia do sprawdzania kodu stanu HTTP, takiego jak httpstatus.io , aby ocenić, które kody stanu zwracają te strony.

Załóżmy, że poniższa przykładowa domena wyświetlała stronę 404 użytkownikowi próbującemu uzyskać do niej dostęp, ale kiedy sprawdziliśmy kod odpowiedzi za pomocą narzędzia do sprawdzania kodu stanu HTTP, zwróciła odpowiedź HTTP 200. Jest to doskonały przykład miękkiego błędu 404, ponieważ kod odpowiedzi HTTP wskazuje robotom wyszukiwarek, że strona istnieje i powinna zostać zindeksowana. Jednak na stronie nie ma treści, która została zwrócona przez serwer.

Sprawdź kody odpowiedzi serwera

Strona zwracająca kod odpowiedzi serwera HTTP 200. Sprawdzone za pomocą: https://https://https://status.io/

Innym problemem, który możesz napotkać podczas diagnozowania głównej przyczyny miękkich błędów 404, są nieodpowiednie przekierowania 301/302.

Przekierowań 301 należy używać, gdy strona jest trwale usunięta i chcesz skierować ludzi na nową, bardziej odpowiednią stronę. Przekierowania 302 są podobne do przekierowań 301, ale są używane, gdy strona jest tymczasowo usuwana.

Niektórzy webmasterzy decydują się na przekierowanie wszystkich usuniętych stron na stronę główną witryny zamiast wyświetlania błędu 404, co nie jest właściwe i dezorientuje roboty wyszukiwarek . Ważne jest, aby podkreślić, że błędy 404 w Twojej witrynie nie są złe. Usunięte strony lub produkty, których nie ma w magazynie, powinny być przekierowywane tylko do bezpośredniego zastąpienia. Jeśli bezpośredni zamiennik nie istnieje, należy wyświetlić niestandardową stronę błędu 404, aby wyświetlić użytkownikowi alternatywne opcje lub produkty.

Poniżej przedstawiłem przykład nieodpowiednich przekierowań wywołujących miękkie błędy 404. W tym przypadku webmaster używa przekierowań 302 do przekierowywania każdego, kto próbuje otworzyć stronę, która została usunięta, i przekierowuje tych użytkowników na niestandardową stronę 404 – taką, która w rzeczywistości nie obsługuje kodu stanu HTTP 404. Będzie to miało ogromny wpływ na sposób, w jaki wyszukiwarki indeksują daną witrynę, ponieważ wyszukiwarki są instruowane, aby szukać gdzie indziej stron, które zostały faktycznie usunięte. Jeśli robot wyszukiwarki zastosuje się do tych instrukcji, w końcu otrzyma kod stanu HTTP 200 (OK) dla strony, która wyświetla komunikat o błędzie 404, co jest zupełnie innym poziomem złej praktyki.

Przykład przekierowania 302 używanego do wysyłania użytkowników na niestandardową stronę błędu 404

Przykład przekierowania 302 używanego do wysyłania użytkowników na niestandardową stronę błędu 404

Nigdy nie należy używać przekierowań do wyświetlania strony błędu 404. Zamiast tego podaj kod odpowiedzi HTTP 404, gdy żądane są jakiekolwiek strony, które usuwasz lub usuwasz z witryny, a nie ma bezpośredniego zastąpienia. Zapobiegnie to wywoływaniu przez Twoją witrynę ogromnej liczby miękkich błędów 404 i zapewni, że wyszukiwarki będą indeksować i indeksować tylko te strony, które chcesz pozycjonować.

Przykład kodu stanu dla adresu URL

Strona zwracająca kod odpowiedzi serwera HTTP 404. Sprawdzone za pomocą: http://httpstatus.io/

Czy rozwiązywanie miękkich błędów 404 zwiększy ruch na mojej stronie?

Wyniki technicznego projektu SEO, nad którym kiedyś pracowaliśmy dla klienta e-commerce, bardzo jasno wyjaśniły, dlaczego zawsze należy zwracać uwagę na miękkie błędy 404. Zauważyliśmy, że dany klient miał wyjątkowo wysoki odsetek miękkich błędów 404 w porównaniu z całkowitą liczbą stron w swojej witrynie. Odkryliśmy, że dzieje się tak, ponieważ ich witryna wyświetlała wiadomości 404 bez zwracania kodów stanu HTTP 404 dla wielu usuniętych produktów, których było tysiące.

Po zdiagnozowaniu problemu nawiązaliśmy kontakt z programistą internetowym klienta, aby upewnić się, że serwer zwraca kody stanu HTTP 404 wraz z komunikatami „Nie znaleziono strony” dla produktów, które usunęli z witryny. Deweloper wdrożył poprawkę zgodnie z naszymi sugestiami, a dwa dni później zauważyliśmy, że ruch organiczny znacznie wzrósł. Wzrósł ze średnio 1400 sesji dziennie do średnio 2600 dziennie.

Analiza kodów stanu 404

Na tym historia się nie kończy. Okazuje się, że ten klient korzystał z niestandardowej platformy internetowej używanej przez wielu innych sprzedawców internetowych – co oznacza, że ​​inne witryny zbudowane przez programistę działały na tej samej platformie. Kiedy więc programista zaczął udostępniać kody stanu HTTP 404 dla dowolnych usuniętych stron na swojej platformie, inne firmy korzystające z tej platformy zaczęły zgłaszać gwałtowny wzrost ruchu organicznego. Mogę tylko założyć, że autorzy stron internetowych wzięli za to całą zasługę, pomimo miesięcznej bitwy, w której przekonywaliśmy ich, że przede wszystkim warto rozwiązać miękkie błędy 404!

Miękkie błędy 404: znaczenie technicznego SEO

Pozycjonowanie techniczne to coś, co wielu marketerów zna tylko mgliście. Rzeczywiście, nawet dla praktyków SEO, często jest to obszar, który wpada w ręce twórców stron internetowych. Może to prowadzić do ogromnych straconych możliwości w zakresie poprawy widoczności wyników organicznych. Techniczne funkcje strony internetowej są tym, co uważam za elementy składowe SEO i jak widzieliśmy w powyższym przykładzie, są one szczególnie ważne w przypadku witryn e-commerce na poziomie korporacyjnym.

TL;DR – za długi; Nie czytałem

  • Za każdym razem, gdy na stronie zostanie wyświetlony komunikat o błędzie 404 (nie znaleziono), serwer powinien zwrócić standardowy kod odpowiedzi HTTP 404.
  • Zawartość strony (komunikat „nie znaleziono strony”) jest całkowicie niezwiązana z odpowiedzią HTTP zwróconą przez serwer.
  • Miękki błąd 404 występuje, gdy nieistniejąca strona (strona, która została usunięta/usunięta) wyświetla komunikat „Nie znaleziono strony” każdemu, kto próbuje uzyskać do niej dostęp, ale nie zwraca kodu stanu HTTP 404. Może się tak zdarzyć, gdy usunięta strona przekierowuje użytkowników na nieistotną stronę, taką jak strona główna witryny.
  • Liczbę zgłoszonych miękkich błędów 404 należy porównać z całkowitą liczbą indeksowanych stron w witrynie – jeśli ten stosunek miękkich błędów 404 do indeksowanych stron jest wysoki, może to negatywnie wpłynąć na wyniki witryny w wynikach wyszukiwania organicznego, marnując cenny budżet indeksowania.
  • Rozwiązanie miękkich problemów 404 może znacznie poprawić wydajność indeksowania i zapewnić, że wyszukiwarki będą spędzać czas tylko na indeksowaniu stron, które chcesz.
  • Naprawienie miękkich błędów 404 może poprawić widoczność witryny w wynikach wyszukiwania organicznego.

Czy właśnie nauczyłeś się czegoś nowego?

Dołącz do 80 000 osób, które co miesiąc czytają nasze artykuły eksperckie.
  • To pole służy do celów walidacji i należy je pozostawić bez zmian.

Jeśli potrzebujesz pomocy w pozycjonowaniu, nie wahaj się z nami skontaktować.