如何避免谷歌的重複內容問題?

已發表: 2021-11-01

頁面上的重複內容與預算超支有很多共同之處。 只有在這種情況下,我們才談論搜索機器人網站中“信任預算”的減少。 這個問題涉及很多網站所有者,因為它甚至可能出現在他們的背後。 閱讀有關重複內容問題的內容後,您的網站變成了定時炸彈。 時鐘滴答滴答,谷歌制裁正在等著你。

可悲但真實的是,網絡上大約有 25-30% 的重複內容。 前 Google 員工 Matt Cutts 持有這種觀點。 儘管重複的內容會讓您陷入搜索引擎優化的困境,但這並不是那麼戲劇化。 有一個解決方案 - 閱讀這篇文章並了解如何避免 Google 出現重複內容問題。

目錄顯示
  • 什麼是重複內容?
  • 關於重複內容的事實
  • 有什麼樣的內容?
  • 代碼是什麼?
    • HTTPS 頁面
    • 內容管理系統創建重複內容
    • 用於打印的頁面或多個排序選項
    • 博客和歸檔系統中的重複內容
    • 用戶生成的重複內容(重複的帖子等)
  • 結論

什麼是重複內容?

內容營銷辦公桌筆記本電腦筆記工作寫作文章博客
重複內容主要有 3 種類型。
  • 完全重複:兩個 URL 具有完全相同的內容;
  • 內容略有差異:如句序、圖片略有不同等;
  • 跨域重複:在許多域中都存在精確或略有更改的副本。

此外,存在兩個相關概念,谷歌不認為是重複內容。 但經驗不足的出版商和 SEO 專家很容易將它們與重複的內容混為一談。

  • 內容稀少:這些頁面內容很少。 建立在組織地址列表上的一組頁面,其中有 6 000 個地址,但每個頁面僅包含一個地址:僅幾行。
  • 切片內容:彼此略有不同的頁面。 該網站銷售尺寸為 38、38.5、39、40、41、42 等的 Timberland 鞋。如果該網站為每種鞋碼都有單獨的頁面,那麼所有這些頁面之間會有細微的差別。 谷歌將這種效果視為切片內容。

谷歌不喜歡同樣薄和切片的內容。 Google Panda 可以檢測到任何這些影響。 這就是為什麼出版商應該避免創建這些類型的頁面。

出現重複內容的原因有很多:
  • 您網站內容的許可;
  • 由於內容管理系統未針對搜索引擎進行優化而導致的網站架構缺陷;
  • 抄襲的存在。

在過去的五年中,垃圾郵件發送者對內容的需求非常大,他們開始從合法來源“竊取”內容,通過使用各種複雜的過程轉換單詞並將結果文本放在他們的頁面上以吸引“長尾”搜索操作並顯示上下文廣告和其他不誠實的目的。 因此,如今人們生活在一個“重複內容問題”和“重複內容處罰”的世界中。

為您推薦:好的內容可以加速您的營銷工作的 5 種方式。

關於重複內容的事實

問題-答案-常見問題解答-查詢-幫助
重複的內容位置

如果所有特定內容都在您的網站上,是否是重複內容?

是的,因為重複的內容既可能發生在同一個網站上,也可能發生在不同的網站上。

重複內容百分比

應該複製多少百分比的頁面以屬於重複內容過濾器? 不幸的是,搜索引擎從不公開這些信息,因為這會影響他們預防問題本身的能力。 所有引擎的這個百分比都在不斷變化。 底線是頁面不必相同才能被視為重複。

代碼與文本的比例

如果您的代碼非常大,但頁面上有一些獨特的 HTML 元素怎麼辦? 谷歌不會認為所有頁面都是相互重複的嗎?

不。搜索引擎不關心您的代碼,而是關心您頁面的內容。 代碼大小只有在變得不成比例時才會成為問題。

導航元素與獨特內容的比例

您網站上的所有頁面都有一個很大的導航欄、很多頁眉和頁腳,但內容卻很少。 Google 不會認為所有這些頁面都是重複的嗎?

不會。Google 會在評估頁面是否重複之前考慮導航元素。

許可內容

您想避免重複的內容問題。 但是,如果您有來自您許可向訪問者展示的其他網絡資源的內容,該怎麼辦?

使用元名稱=“機器人”內容=“noindex,follow”。 把它放在你頁面的標題中,搜索引擎就會知道這個內容不適合他們。 另一種選擇是獲得擁有和發布該內容的專有權。

有什麼樣的內容?

電腦筆記本電腦辦公桌工作辦公室內容寫作筆記研究
  • 獨特的內容是由一個人編寫的。 它與網絡上任何其他字母、符號和單詞的組合完全不同,不受計算機文本處理算法的影響。
  • 片段是被反复複製和使用的小塊內容(例如,引號)。 它們很少給搜索引擎帶來問題,尤其是當包含在具有許多獨特內容的較大文檔中時。
  • 帶狀皰疹。 搜索引擎在其他網頁上尋找相對較小的短語片段(五到六個單詞)。 如果兩個文檔有太多帶狀皰疹,搜索引擎可能會將這些文檔解釋為重複內容。

代碼是什麼?

編程代碼網頁開發

有很多方法可以創建重複的內容。 這就解釋了為什麼網絡上有足夠多的內容。 內部重複內容需要特定的策略才能在優化方面獲得最佳結果。 坦率地說,重複頁面是對用戶和搜索引擎都沒有價值的頁面。 然後儘量避免這個問題。 確保只有一個 URL 引用每個頁面。 此外,對舊 URL 執行 301 重定向到其餘 URL。 它可以幫助搜索機器人盡快看到您所做的更改,並保留已刪除頁面的“鏈接汁”。

如果這是不可能的,還有很多其他的選擇。 以下是針對各種場景的最簡單解決方案的概要:

  • 您可以使用 robots.txt 文件來阻止搜索引擎蜘蛛抓取您網站頁面的重複版本;
  • 使用 rel=”canonical” 元素,這是刪除重複頁面的次優解決方案;
  • 使用 CODE <meta name=”robots” content=”noindex”> 指示搜索引擎不要顯示重複頁面。

但是,請注意:如果您使用 robots.txt 來阻止頁面查看,則在頁面上應用 noindex 或 nofollow 是沒有意義的。 由於蜘蛛無法讀取頁面,它永遠不會看到 noindex 或 nofollow 元標記。 考慮到這些工具,考慮一些重複內容的特定情況。

您可能會喜歡:為什麼內容寫作對品牌和企業很重要?

HTTPS 頁面

如果您使用 SSL 協議(瀏覽器和 Web 服務器之間的加密數據交換,通常用於電子商務),那麼您的站點的頁面以 HTTPS:(而不是 HTTP:) 開頭。 當您的 HTTPS 頁面上的鏈接使用相對鏈接而不是絕對鏈接指向站點上的其他頁面時,就會出現問題。 例如,指向您主頁的鏈接變為 https://www.YourDomain.com 而不是 http://www.YourDomain.com)。

如果您的網站有這個問題,您可以使用 rel=”canonical” 或 301 重定向來解決它。 另一種解決方案是將鏈接更改為絕對鏈接:http://www.YourDomain.com/content.html 而不是 /contenthtml),這也使竊取您內容的人的生活更加困難。

內容管理系統創建重複內容

有時,一個站點可能有許多相同頁面的版本。 在某些使用多個 URL 引用相同內容的內容管理系統中,它發生了限制。 它通常是完全額外的重複,對用戶沒有價值。 最好的決定是刪除重複的頁面,並對已刪除的頁面執行 301 重定向到其餘頁面。 如果不起作用,請嘗試其他方法。

用於打印的頁面或多個排序選項

許多網站提供打印頁面,以適應打印機的格式為用戶提供相同的內容。 一些電子商務網站提供具有多種分類(按尺寸、顏色、品牌和價格)的產品列表。 這些頁面對用戶有價值,但對搜索引擎沒有價值。 因此,他們認為這是重複的內容。 在這種情況下,您可以創建一個用於打印的 CSS 電子表格。

博客和歸檔系統中的重複內容

博客在重複內容問題上具有有趣的變體形式。 一篇博文可以出現在幾個不同的頁面上:

  • 博客的起始頁;
  • 該帖子的永久鏈接頁面;
  • 存檔頁面;
  • 類別頁面。

每個帖子副本都是其他副本的副本。 出版商很少嘗試處理博客主頁和永久鏈接頁面上都存在帖子的問題。 搜索引擎似乎很好地解決了這個問題。 但是,在類別和存檔頁面上僅顯示帖子片段可能是有意義的。

用戶生成的重複內容(重複的帖子等)

許多網站使用結構來獲取用戶生成的內容,例如博客、論壇或留言板。 這些可以是以非常低的成本開發大量內容的好方法。 問題是用戶可以同時在您的網站和其他幾個網站上發布相同的內容,這會導致重複內容問題。 這很難控制,但為了減少問題,您可以按照以下步驟進行:

  • 您需要製定明確的政策,通知用戶他們提供給您網站的內容應該是獨一無二的,並且不能發佈在其他網站上。 毫無疑問,很難做到這一點,但它有助於實現您的期望;
  • 以需要不同內容的獨特方式刷新您的論壇。 除了標準數據輸入字段外,還添加一些對您的網站訪問者有用的獨特字段(不同於其他網站)。
您可能還喜歡:如何通過視頻內容放大您的 SEO?

結論

標誌單向街道通知重複就業動機

不要太擔心重複的內容。 這通常不是什麼大問題。 大多數情況下,谷歌本身知道如何處理母版頁或內容引用等問題。 此外,很多人面臨重複內容的問題。 有時重複出現在他們期望的地方沒有人,所以你應該經常檢查他們的網站。 為了防止它們,您需要為每個頁面創建獨特的內容。



作者-圖片-伊莎貝爾-喬丹

本文由伊莎貝爾·喬丹撰寫。 Isabelle 是 ektatraveling.com 保險公司的商業和營銷記者。 她為不同的新聞門戶網站和主題博客撰稿,幫助她始終處於旅遊和保險新聞的核心。 這樣的工作讓她有機會就當今最相關的主題撰寫文章。