什麼是“軟”404 錯誤,它們會影響我的排名嗎?

已發表: 2021-07-19

軟 404 錯誤與常見的 404 錯誤不同,它可能對您的網站有害。 修復它們很重要,這樣您的網站才能從 SEO 的角度表現良好。

哈勒姆 404 錯誤頁面

您可能熟悉 404 錯誤代碼,它告訴您尚未找到您要查找的網頁。 但是您是否知道在錯誤的上下文中使用此錯誤消息會產生所謂的軟 404,這會影響您的 SEO 性能?

營銷人員有時會忽略網站的此類技術方面,並期望 Web 開發人員來處理它們。 這可能不利於網站在搜索結果中的表現,這就是 SEO 專家需要與網絡開發人員密切合作的原因。

本文將重點介紹一類特定的抓取錯誤,如果不解決該錯誤,可以極大地減少搜索引擎(例如 Google 抓取和索引)搜索結果中的頁面數量。 在本文中,我們將介紹:

  • 什麼是軟 404 錯誤
  • 軟 404 錯誤的問題
  • 如何修復軟 404 錯誤
  • 為什麼修復軟 404 錯誤將有助於您的網站性能

什麼是軟 404 錯誤?

當網站的服務器返回HTTP 404 標準響應代碼以指示它無法找到用戶請求的網頁 ( URL ) 時,會出現真正的 404 錯誤消息 這會通知瀏覽器和搜索引擎該頁面不存在。

大多數人不明白的是,頁面的內容——“頁面未找到”消息——與服務器返回的 HTTP 響應完全無關。 僅僅因為頁面顯示 404 File Not Found 消息,並不意味著該頁面被自動定義為 404 頁面。

用谷歌自己的話來說:“這就像一隻長頸鹿戴著一個寫著‘狗’的名牌。 僅僅因為名稱標籤上寫著它是一隻狗,並不意味著它實際上是一隻狗。 同樣,僅僅因為頁面顯示 404,並不意味著它返回 404 狀態代碼。

當不存在的頁面(已被刪除/移除的頁面)向嘗試訪問它的任何人顯示“找不到頁面”消息但未能返回 HTTP 404 狀態代碼時,會發生軟 404 錯誤。 當不存在的頁面將用戶重定向到不相關的頁面(例如主頁)而不是返回 HTTP 404 狀態代碼時,也會發生這種情況。

這裡要記住的重要一點是,網頁的內容與服務器返回的 HTTP 響應完全無關。

這種區別對於 SEO 很重要,因為它決定了 Google 如何對待頁面。 爬行和索引是 Google 的機器人在搜索引擎結果頁面中列出您網站的頁面之前要經過的一個過程。 當返回真正的 404 錯誤消息時,Google 的機器人不會花時間抓取頁面或將其編入索引。 當返回軟 404 錯誤時,頁面仍會被抓取並編入索引。

軟 404 錯誤的問題

如果您的網站為不存在的頁面返回 404(或 410)以外的 HTTP 狀態代碼,則可能會對網站在自然搜索中的性能產生負面影響。 這意味著,如果您的網站有很高比例的軟 404 錯誤,則可能是有害的。 由於未能提供 404 狀態代碼,您的網站正在告訴搜索引擎他們試圖訪問的 URL 中有一個真實頁面。 因此,您刪除的網址(沒有內容)將被抓取並編入索引,從而在冗餘頁面上浪費寶貴的抓取預算。

Google 將抓取預算定義為“Googlebot 可以並且想要抓取的網址數量”。 抓取預算分為抓取率抓取需求:

  • 抓取速度- 旨在幫助 Google 不會太頻繁或太快地抓取您的網頁並損害您的服務器
  • 抓取需求– Google 想要抓取您的網頁的程度。 這取決於您的網頁有多受歡迎以及 Google 索引中的內容有多陳舊

谷歌不想在同一個網站上浪費無休止的時間來抓取內容,所以他們在轉移到另一個網站之前為他們的網絡抓取分配一個“預算”是有意義的。

堅持抓取預算的想法,如果一個網站的軟 404 錯誤比例很高,那麼這些頁面將被抓取。 抓取這些不存在的頁面的過程總是會佔用分配給站點的不必要的抓取預算。 由於 Googlebot 花費時間來抓取軟 404,因此您的唯一網址可能不會被快速地發現或抓取得那麼頻繁,從而降低了您網站上重要內容的可見度。

最終,如果您的軟 404 百分比很高,那麼您不僅會在無意義的頁面上浪費抓取預算,還會降低重要頁面的可見性。 因此,當軟 404 錯誤得到解決時,網站在自然搜索結果中的性能往往會提高也就不足為奇了。

為了說明您如何評估軟 404 問題的嚴重程度,讓我們看一個在 Google Search Console 中顯示大量軟 404 錯誤的網站示例。 在下面的示例中,我們看到相關網站報告了 147 個軟 404 錯誤。 這很可能會引起警鐘響起,但我們首先需要在上下文中考慮這個數字。

軟 404 錯誤

為此,我們需要檢查網站上有多少網頁已提交給 Google 進行抓取和索引。 對於此任務,我們將查看相關網站的 XML 站點地圖——這是一個網站有多少頁面的關鍵指標。 您可以在Search Console > Sitemaps查看已提交的 XML 站點地圖

站點地圖

可以在下拉菜單中的 Search Console > Coverage > Find XML sitemap下找到覆蓋範圍,顯示有多少網頁被編入索引或有任何問題

覆蓋範圍 - 正在服務的網頁數量

上面的例子表明,谷歌正在索引相關網站的 3.31K 頁內容。

查看上面的數據,我們可以看到這個網站有大約 3,409 個頁面,所以 107 個軟 404 錯誤現在開始看起來不那麼不祥了。 儘管如此,在超過網站總頁面的 3% 的情況下,107 個軟 404 錯誤仍在浪費分配給該網站的一些抓取預算。 在這種情況下,Google 花費了太多時間來抓取根本不存在的 URL。

如何解決這些問題?

Google 只允許您在 Google Search Console 中導出最多 1000 個網址。 在上面的示例中,報告的錯誤少於 1000 個,因此可以直接通過 Search Console 下載這些錯誤。 導出 URL 列表後,您需要評估頁面被報告為軟 404 的原因。 Google 提供了一些關於他們突出顯示為軟 404 的 URL 的信息,如下例所示:

Google 關於軟 404 錯誤的信息

在大多數情況下,您會發現網站將在返回“找不到頁面”消息的頁面上提供200(OK)狀態代碼 因此,您需要做的第一件事是通過 HTTP 狀態代碼檢查器(例如httpstatus.io )運行選擇的軟 404 錯誤頁面,以評估這些頁面返回的狀態代碼。

假設下面的示例域向嘗試訪問它的用戶顯示 404 頁面,但是當我們使用 HTTP 狀態代碼檢查器檢查響應代碼時,它返回了 HTTP 200 響應。 這是軟 404 錯誤的一個主要示例,因為 HTTP 響應代碼向搜索引擎機器人指示該頁面存在並且應該被抓取。 但是,服務器返回的頁面上沒有內容。

檢查服務器響應代碼

返回 HTTP 200 服務器響應代碼的頁面。 檢查使用:https://httpstatus.io/

在診斷軟 404 錯誤的根本原因時您可能會遇到的另一個問題是不適當的 301/302 重定向。

當頁面被永久刪除並且您希望將人們發送到更合適的新頁面時,應使用 301 重定向。 302 重定向類似於 301,但在頁面被臨時刪除時使用。

一些站長選擇將所有已刪除的頁面重定向到網站首頁,而不是提供 404 錯誤,這完全不合適,並且會混淆搜索引擎機器人 重要的是要強調在您的網站上使用 404 並不是一件壞事。 刪除的頁面或缺貨的產品只能重定向到直接替換。 如果不存在直接替代品,那麼您應該提供自定義 404 錯誤頁面以向用戶顯示替代選項或產品。

我在下面突出顯示了觸發軟 404 錯誤的不當重定向示例 在這種情況下,網站管理員使用302 重定向將試圖訪問已刪除頁面的任何人重定向,並將這些用戶重定向到自定義 404 頁面——該頁面實際上並不提供 HTTP 404 狀態代碼。 這將極大地影響搜索引擎如何抓取有問題的網站,因為搜索引擎被指示到別處尋找實際上已被刪除的頁面。 如果搜索引擎機器人遵循這些指令,他們最終將收到一個 HTTP 200 (OK) 狀態代碼,用於顯示 404 錯誤消息的頁面,這是另一個級別的不良做法。

用於將用戶發送到自定義 404 錯誤頁面的 302 重定向示例

用於將用戶發送到自定義 404 錯誤頁面的 302 重定向示例

您永遠不應該使用重定向來提供 404 錯誤頁面。 相反,當您從網站中刪除或刪除的任何頁面被請求並且沒有直接替換時,提供 HTTP 404 響應代碼 這將防止您的網站觸發大量軟 404 錯誤,並確保搜索引擎只抓取和索引您想要排名的頁面。

URL 的狀態代碼示例

返回 HTTP 404 服務器響應代碼的頁面。 檢查使用: http : //httpstatus.io/

解決軟 404 錯誤會增加我網站的流量嗎?

我們曾經為電子商務客戶開展的一個技術 SEO 項目的結果非常清楚地說明了為什麼您應該始終注意軟 404 錯誤。 我們注意到,與其網站上的頁面總數相比,有問題的客戶的軟 404 錯誤比例極高。 我們發現這是因為他們的網站提供 404 消息,但沒有返回許多已刪除產品的 HTTP 404 狀態代碼,其中有數千個。

一旦我們診斷出問題,我們就與客戶的 Web 開發人員聯繫,以確保他們的服務器返回 HTTP 404 狀態代碼以及他們從網站上刪除的任何產品的“頁面未找到”消息。 開發人員按照我們的建議實施了修復,兩天后,我們注意到自然流量急劇增加。 它從平均每天 1,400 次會話增加到每天平均 2,600 次。

404狀態碼分析

故事還沒有結束,伙計們。 事實證明,該客戶正在使用許多其他在線零售商使用的自定義網站平台——這意味著開發人員構建的其他網站也在同一平台上運行。 因此,當開發人員開始為其平台上的任何已刪除頁面提供 HTTP 404 狀態代碼時,使用該平台的其他企業開始報告其自然流量急劇上升。 我只能假設 Web 開發人員為此承擔了所有責任,儘管我們經過長達一個月的戰鬥讓他們相信軟 404 最初值得解決!

軟 404:技術 SEO 的重要性

技術搜索引擎優化是許多營銷人員只是模糊地熟悉的東西。 事實上,即使對於 SEO 從業者來說,這通常也是一個容易落入 Web 開發人員手中的領域。 這可能導致在提高自然搜索可見性方面錯失巨大的機會。 網站的技術功能是我認為的 SEO 的組成部分,正如我們在上面的示例中所見,它們對於企業級電子商務網站尤為重要。

TL;DR——太長; 沒讀

  • 每當頁面上顯示 404(未找到)錯誤消息時,服務器應返回 HTTP 404 標準響應代碼。
  • 頁面的內容(“頁面未找到”消息)與服務器返回的 HTTP 響應完全無關。
  • 當不存在的頁面(已刪除/移除的頁面)向嘗試訪問它的任何人顯示“找不到頁面”消息但未返回 HTTP 404 狀態代碼時,會發生軟 404 錯誤。 當刪除的頁面將用戶重定向到不相關的頁面(例如網站的主頁)時,就會發生這種情況。
  • 報告的軟 404 數量需要與網站上可索引頁面的總數進行比較——如果軟 404/可索引頁面的比例很高,則會浪費寶貴的爬網預算,從而對網站在自然搜索中的性能產生負面影響。
  • 解決軟 404 問題可以顯著提高抓取效率,並確保搜索引擎只花時間抓取您希望它們抓取的頁面。
  • 修復軟 404 錯誤可以提高網站在自然搜索中的可見度。

你剛學到新東西嗎?

然後加入每月閱讀我們專家文章的 80,000 人的行列。
  • 此字段用於驗證目的,應保持不變。

如果您需要 SEO 方面的幫助,請隨時與我們聯繫。