Was sind „weiche“ 404-Fehler und werden sie sich auf mein Ranking auswirken?

Veröffentlicht: 2021-07-19

Weiche 404-Fehler unterscheiden sich von den üblichen 404-Fehlern und können für Ihre Website schädlich sein. Es ist wichtig, diese zu beheben, damit Ihre Website aus SEO-Sicht gut funktionieren kann.

Hallam 404-Fehlerseite

Sie kennen wahrscheinlich den Fehlercode 404, der Ihnen mitteilt, dass die gesuchte Webseite nicht gefunden wurde. Aber wussten Sie, dass die Verwendung dieser Fehlermeldung im falschen Kontext einen so genannten Soft 404 erzeugen kann, der sich auf Ihre SEO-Leistung auswirken kann?

Vermarkter übersehen manchmal solche technischen Aspekte von Websites und erwarten, dass Webentwickler sie stattdessen behandeln. Dies kann sich nachteilig auf die Leistung einer Website in den Suchergebnissen auswirken, weshalb SEO-Spezialisten eng mit Webentwicklern zusammenarbeiten müssen.

Dieser Artikel konzentriert sich auf eine bestimmte Kategorie von Crawling-Fehlern, die, wenn sie nicht behoben wird, die Anzahl der Seiten von Suchmaschinen wie Google Crawl und Index in ihren Suchergebnissen erheblich reduzieren kann. In diesem Artikel behandeln wir:

  • Was für ein Soft 404-Fehler ist
  • Die Probleme mit Soft 404-Fehlern
  • So beheben Sie Soft 404-Fehler
  • Warum das Beheben von Soft 404-Fehlern die Leistung Ihrer Website verbessert

Was ist ein Soft 404-Fehler?

Eine echte 404-Fehlermeldung tritt auf, wenn der Server einer Website einen HTTP 404-Standardantwortcode zurückgibt , um darauf hinzuweisen, dass die vom Benutzer angeforderte Webseite ( URL ) nicht gefunden werden konnte . Dies informiert sowohl Browser als auch Suchmaschinen, dass die Seite nicht existiert.

Was die meisten Leute nicht verstehen, ist, dass der Inhalt der Seite – die Meldung „Seite nicht gefunden“ – völlig unabhängig von der vom Server zurückgegebenen HTTP-Antwort ist. Nur weil eine Seite eine 404-Datei nicht gefunden-Meldung anzeigt, bedeutet dies nicht, dass diese Seite automatisch als 404-Seite definiert wird.

In Googles eigenen Worten: „ Das ist wie eine Giraffe, die ein Namensschild trägt, auf dem ‚Hund‘ steht. Nur weil auf dem Namensschild steht, dass es sich um einen Hund handelt, heißt das nicht, dass es sich tatsächlich um einen Hund handelt. Nur weil eine Seite 404 sagt, bedeutet das nicht, dass sie einen 404-Statuscode zurückgibt.

Ein Soft 404-Fehler tritt auf, wenn eine nicht vorhandene Seite (eine Seite, die gelöscht/entfernt wurde) jedem, der versucht, darauf zuzugreifen, die Meldung "Seite nicht gefunden" anzeigt, aber keinen HTTP 404-Statuscode zurückgibt. Sie können auch auftreten, wenn die nicht vorhandene Seite Benutzer auf eine irrelevante Seite wie die Startseite umleitet, anstatt einen HTTP 404-Statuscode zurückzugeben.

Dabei ist zu beachten, dass der Inhalt einer Webseite völlig unabhängig von der vom Server zurückgegebenen HTTP-Antwort ist.

Diese Unterscheidung ist wichtig für SEO, da sie bestimmt, wie Google die Seite behandelt. Crawling und Indexierung ist ein Prozess, den die Google-Bots durchlaufen, bevor sie die Seiten Ihrer Website auf den Ergebnisseiten von Suchmaschinen auflisten. Wenn eine echte 404-Fehlermeldung zurückgegeben wird, verbringen die Bots von Google keine Zeit damit, die Seite zu crawlen oder zu indizieren. Wenn ein Soft 404-Fehler zurückgegeben wird, wird die Seite trotzdem gecrawlt und indiziert.

Das Problem mit Soft 404-Fehlern

Wenn Ihre Website einen anderen HTTP-Statuscode als 404 (oder 410) für eine nicht vorhandene Seite zurückgibt, kann dies die Leistung der Website bei der organischen Suche beeinträchtigen. Das heißt, wenn Ihre Website einen hohen Anteil an Soft 404-Fehlern aufweist, kann dies schädlich sein. Wenn kein 404-Statuscode bereitgestellt wird, teilt Ihre Website den Suchmaschinen mit, dass sich unter der URL, auf die sie zuzugreifen versuchen, eine echte Seite befindet. Infolgedessen wird die von Ihnen gelöschte URL (ohne Inhalt) gecrawlt und indexiert, wodurch wertvolles Crawl-Budget für redundante Seiten verschwendet wird.

Google definiert das Crawling-Budget als „die Anzahl der URLs, die der Googlebot crawlen kann und möchte“. Das Crawl-Budget ist in Crawl-Rate und Crawl-Nachfrage unterteilt:

  • Crawling-Rate – Entwickelt, um Google zu helfen, Ihre Seiten nicht zu häufig oder zu schnell zu crawlen und Ihren Server zu beschädigen
  • Crawling-Nachfrage – Wie viel Google Ihre Seiten crawlen möchte. Dies hängt davon ab, wie beliebt Ihre Seiten sind und wie alt der Inhalt im Google-Index ist

Google möchte keine endlose Zeit mit dem Crawlen von Inhalten auf derselben Website verschwenden, daher ist es sinnvoll, ihren Web-Crawlings ein "Budget" zuzuweisen, bevor sie zu einer anderen Website wechseln.

Um bei der Idee der Crawling-Budgets zu bleiben: Wenn eine Website einen hohen Anteil an Soft 404-Fehlern aufweist, werden diese Seiten gecrawlt. Das Crawlen dieser nicht existierenden Seiten wird unweigerlich unnötig viel des der Site zugewiesenen Crawling-Budgets in Anspruch nehmen. Aufgrund der Zeit, die der Googlebot mit dem Crawlen von Soft 404s verbringt, werden Ihre eindeutigen URLs daher möglicherweise nicht so schnell oder so häufig gecrawlt – wodurch die Sichtbarkeit der wichtigen Inhalte auf Ihrer Website verringert wird.

Letztendlich verschwenden Sie bei einem hohen Prozentsatz an weichen 404-Fehlern nicht nur Crawl-Budget für bedeutungslose Seiten, sondern reduzieren auch die Sichtbarkeit Ihrer wichtigen Seiten. Es sollte daher nicht überraschen, dass sich die Performance einer Website in den organischen Suchergebnissen tendenziell verbessert, wenn Soft 404-Fehler behoben werden.

Um zu erklären, wie Sie das Ausmaß eines Soft 404-Problems einschätzen, sehen wir uns ein Beispiel für eine Website an, die in der Google Search Console eine Reihe von Soft 404-Fehlern anzeigt. Im folgenden Beispiel sehen wir, dass 147 Soft 404-Fehler für die fragliche Website gemeldet werden. Dies kann durchaus dazu führen, dass die Alarmglocken läuten, aber wir müssen die Abbildung zunächst im Kontext betrachten.

Soft 404-Fehler

Dazu müssen wir überprüfen, wie viele Webseiten der Website an Google zum Crawlen und Indexieren übermittelt wurden. Für diese Aufgabe würden wir uns die XML-Sitemap der jeweiligen Website ansehen – ein wichtiger Indikator dafür, wie viele Seiten eine Website hat. Welche XML-Sitemaps eingereicht wurden, sehen Sie unter Search Console > Sitemaps

Seitenverzeichnis

Und die Abdeckung, die anzeigt, wie viele Webseiten indiziert sind oder Probleme haben, finden Sie unter Search Console > Abdeckung > XML-Sitemap suchen im Dropdown-Menü

Abdeckung - Anzahl der Webseiten, die gewartet werden

Das obige Beispiel zeigt, dass Google 3,31 K Inhaltsseiten der fraglichen Website indiziert.

Wenn wir uns die obigen Daten ansehen, können wir sehen, dass diese Website etwa 3.409 Seiten umfasst, sodass die 107 Soft 404-Fehler jetzt etwas weniger ominös erscheinen. Dennoch verschwenden die 107 Soft 404-Fehler bei über 3% der Gesamtseiten der Website immer noch einen Teil des dieser Website zugewiesenen Crawling-Budgets. In diesem Fall verbringt Google zu viel Zeit damit, URLs zu crawlen, die einfach nicht existieren.

Wie behebe ich diese Probleme?

Google lässt Sie nur maximal 1000 URLs in der Google Search Console exportieren. Im obigen Beispiel werden weniger als 1000 Fehler gemeldet, sodass diese direkt über die Search Console heruntergeladen werden können. Nachdem Sie die URL-Liste exportiert haben, müssen Sie beurteilen, warum die Seiten als weiche 404-Fehler gemeldet werden. Google stellt einige Informationen zu den URLs bereit, die als Soft 404s gekennzeichnet sind, wie Sie im folgenden Beispiel sehen können:

Informationen von Google zu Soft 404-Fehlern

In den meisten Fällen werden Sie feststellen, dass eine Website auf Seiten, die die Meldung „Seite nicht gefunden“ zurückgeben, den Statuscode 200 (OK) liefert. Daher müssen Sie als Erstes eine Auswahl der Soft 404-Fehlerseiten durch einen HTTP-Statuscode-Checker wie httpstatus.io ausführen , um festzustellen , welche Statuscodes diese Seiten zurückgeben.

Nehmen wir an, die folgende Beispieldomäne zeigt dem Benutzer, der versucht, darauf zuzugreifen, eine 404-Seite an, aber als wir den Antwortcode mit einem HTTP-Statuscode-Checker überprüft haben, hat sie eine HTTP 200-Antwort zurückgegeben. Dies ist ein Paradebeispiel für einen Soft 404-Fehler, da der HTTP-Antwortcode Suchmaschinen-Robots anzeigt, dass die Seite existiert und gecrawlt werden sollte. Es gibt jedoch keinen Inhalt auf der Seite, der vom Server zurückgegeben wird.

Überprüfen Sie die Antwortcodes des Servers

Seite, die einen HTTP 200-Server-Antwortcode zurückgibt. Geprüft mit: https://httpstatus.io/

Das andere Problem, das bei der Diagnose der Ursache von Soft 404-Fehlern auftreten kann, sind unangemessene 301/302-Weiterleitungen.

301-Weiterleitungen sollten verwendet werden, wenn eine Seite dauerhaft gelöscht wird und Sie Personen auf eine neue, geeignetere Seite weiterleiten möchten. 302-Weiterleitungen ähneln 301-Weiterleitungen, werden jedoch verwendet, wenn die Seite vorübergehend gelöscht wird.

Einige Webmaster entscheiden sich dafür, alle gelöschten Seiten auf die Homepage der Website umzuleiten, anstatt einen 404-Fehler anzuzeigen, was überhaupt nicht angemessen ist und Suchmaschinen-Robots verwirrt . Es ist wichtig zu betonen, dass es keine schlechte Sache ist, 404s auf Ihrer Website zu haben. Gelöschte Seiten oder vergriffene Produkte sollten nur an einen direkten Ersatz weitergeleitet werden. Wenn kein direkter Ersatz vorhanden ist, sollten Sie eine benutzerdefinierte 404-Fehlerseite bereitstellen , um dem Benutzer alternative Optionen oder Produkte anzuzeigen.

Ich habe unten ein Beispiel für unangemessene Weiterleitungen hervorgehoben , die weiche 404-Fehler auslösen. In diesem Fall verwendet der Webmaster 302-Weiterleitungen , um jeden, der versucht, auf eine gelöschte Seite zuzugreifen, umzuleiten, und leitet diese Benutzer auf eine benutzerdefinierte 404-Seite um – eine, die keinen HTTP 404-Statuscode liefert. Dies wird sich stark darauf auswirken, wie Suchmaschinen die fragliche Website crawlen, da Suchmaschinen angewiesen werden, an anderer Stelle nach tatsächlich gelöschten Seiten zu suchen. Wenn ein Suchmaschinen-Roboter diese Anweisungen befolgt, wird ihm schließlich ein HTTP 200 (OK)-Statuscode für eine Seite zugestellt, die eine 404-Fehlermeldung anzeigt, was eine ganz andere Art von schlechter Vorgehensweise darstellt.

Ein Beispiel für eine 302-Weiterleitung, die verwendet wird, um Benutzer zu einer benutzerdefinierten 404-Fehlerseite zu leiten

Ein Beispiel für eine 302-Weiterleitung, die verwendet wird, um Benutzer zu einer benutzerdefinierten 404-Fehlerseite zu leiten

Sie sollten niemals Weiterleitungen verwenden, um eine 404-Fehlerseite bereitzustellen. Stellen Sie stattdessen einen HTTP 404-Antwortcode bereit, wenn Seiten, die Sie von Ihrer Website entfernen oder löschen, angefordert werden und es keinen direkten Ersatz gibt. Dies verhindert, dass Ihre Website eine große Anzahl von Soft 404-Fehlern auslöst und stellt sicher, dass Suchmaschinen nur die Seiten crawlen und indizieren, die Sie ranken möchten.

Beispiel für den Statuscode einer URL

Seite, die einen HTTP 404-Server-Antwortcode zurückgibt. Geprüft mit: http://httpstatus.io/

Erhöht das Beheben von Soft 404-Fehlern den Traffic auf meiner Website?

Die Ergebnisse eines technischen SEO-Projekts, an dem wir einmal für einen E-Commerce-Kunden gearbeitet haben, haben sehr deutlich gemacht, warum man Soft 404-Fehler immer beachten sollte. Wir haben festgestellt, dass der betreffende Kunde einen extrem hohen Anteil an Soft 404-Fehlern im Vergleich zur Gesamtzahl der Seiten auf seiner Website aufwies. Wir haben festgestellt, dass dies daran lag, dass ihre Website 404-Nachrichten bereitstellte, ohne für viele ihrer gelöschten Produkte, von denen es Tausende gab, HTTP 404-Statuscodes zurückzugeben.

Nachdem wir das Problem diagnostiziert hatten, haben wir uns mit dem Webentwickler des Kunden in Verbindung gesetzt, um sicherzustellen, dass sein Server HTTP 404-Statuscodes zusammen mit den Meldungen "Seite nicht gefunden" für alle Produkte zurückgegeben hat, die er von seiner Website entfernt hatte. Der Entwickler implementierte den Fix wie von uns vorgeschlagen und zwei Tage später stellten wir fest, dass der organische Traffic dramatisch zugenommen hatte. Sie stieg von durchschnittlich 1.400 Sitzungen pro Tag auf durchschnittlich 2.600 pro Tag.

404 Statuscode-Analyse

Die Geschichte endet nicht dort Leute. Es stellte sich heraus, dass dieser Kunde eine benutzerdefinierte Website-Plattform verwendet, die von vielen anderen Online-Händlern verwendet wird – was bedeutet, dass andere Websites des Entwicklers auf derselben Plattform liefen. Als der Entwickler anfing, HTTP 404-Statuscodes für alle gelöschten Seiten auf seiner Plattform bereitzustellen, meldeten andere Unternehmen, die diese Plattform nutzten, einen starken Anstieg ihres organischen Traffics. Ich kann nur vermuten, dass die Webentwickler dafür alle Ehre gemacht haben, trotz des monatelangen Kampfes, den wir davon überzeugt haben, dass es sich lohnt, Soft 404s überhaupt aufzulösen!

Soft 404s: Die Bedeutung von technischem SEO

Technisches SEO ist etwas, mit dem viele Marketer nur vage vertraut sind. Tatsächlich ist es sogar für SEO-Praktiker oft ein Bereich, der in die Hände von Webentwicklern fällt. Dies kann zu enormen verpassten Chancen in Bezug auf die Verbesserung der Sichtbarkeit der organischen Suche führen. Die technischen Funktionen einer Website sind meiner Meinung nach die Bausteine ​​von SEO und wie wir im obigen Beispiel gesehen haben, sind sie besonders wichtig für E-Commerce-Websites auf Unternehmensebene.

TL;DR – Zu lang; Nicht gelesen

  • Immer wenn die Fehlermeldung 404 (nicht gefunden) auf einer Seite angezeigt wird, sollte der Server einen HTTP 404-Standardantwortcode zurückgeben.
  • Der Inhalt der Seite (die Meldung 'Seite nicht gefunden') steht in keinem Zusammenhang mit der vom Server zurückgegebenen HTTP-Antwort.
  • Ein Soft 404-Fehler tritt auf, wenn eine nicht vorhandene Seite (eine Seite, die gelöscht/entfernt wurde) jedem, der versucht, darauf zuzugreifen, die Meldung "Seite nicht gefunden" anzeigt, aber keinen HTTP 404-Statuscode zurückgibt. Dies kann passieren, wenn die gelöschte Seite Benutzer auf eine irrelevante Seite wie die Homepage der Website umleitet.
  • Die Anzahl der gemeldeten Soft 404s muss mit der Gesamtzahl der indexierbaren Seiten einer Website verglichen werden – wenn dieses Verhältnis von Soft 404s/indexierbaren Seiten hoch ist, kann dies die Leistung einer Website bei der organischen Suche negativ beeinflussen, indem wertvolles Crawl-Budget verschwendet wird.
  • Das Beheben von Soft 404-Problemen kann die Crawling-Effizienz erheblich verbessern und sicherstellen, dass Suchmaschinen nur Zeit damit verbringen, die gewünschten Seiten zu crawlen.
  • Die Behebung Ihrer weichen 404-Fehler kann die Sichtbarkeit einer Website in der organischen Suche verbessern.

Haben Sie gerade etwas Neues gelernt?

Dann schließen Sie sich den 80.000 Menschen an, die jeden Monat unsere Fachartikel lesen.
  • Dieses Feld dient zu Validierungszwecken und sollte unverändert bleiben.

Wenn Sie Hilfe bei Ihrer SEO benötigen, zögern Sie nicht, uns zu kontaktieren.