เนื้อหาที่ซ้ำกัน: คู่มือขั้นสูงสุดสำหรับการค้นหาและแก้ไขเนื้อหาที่ซ้ำกันสำหรับ SEO ที่ปรับปรุงแล้ว

เผยแพร่แล้ว: 2019-10-18

เนื้อหาที่ซ้ำกันนั้นไม่ดี การใช้เนื้อหาเดียวกันทั้งในรูปแบบทั้งหมดหรือบางส่วนบนเว็บไซต์ของคุณทำให้ผู้ใช้ได้รับประสบการณ์ที่ไม่ดี และทำให้เกิดการติดธงแดงในอัลกอริธึมการค้นหาของ Google ในสมัยก่อนของ SEO เนื้อหาที่ซ้ำกันมักถูกใช้เป็นเคล็ดลับราคาถูกเพื่อให้ได้คีย์เวิร์ดและเนื้อหาบนเว็บไซต์มากขึ้น ดังนั้น Google จึงพัฒนาระบบเพื่อกำจัดนักส่งสแปมที่ละเมิดแนวทางปฏิบัติที่ดีที่สุดด้วยการทำเช่นนี้ วันนี้ หากคุณถูกจับได้ว่าใช้เนื้อหาที่ซ้ำกัน ผู้มีอำนาจโดเมนของคุณอาจประสบปัญหาและการจัดอันดับคำหลักของคุณอาจลดลง

โชคดีที่ Google ค่อนข้างยุติธรรมในเรื่องนี้ บริษัทเข้าใจดีว่าปัญหาเนื้อหาที่ซ้ำกันส่วนใหญ่ไม่ได้เกิดขึ้นจากการพยายามเพิ่มอันดับในราคาถูกโดยมุ่งร้าย ในความเป็นจริง เนื้อหาที่ซ้ำกันส่วนใหญ่เป็นอุบัติเหตุหรือถูกมองข้ามโดยผู้ดูแลเว็บ อย่างไรก็ตาม การมีเนื้อหาซ้ำมากเกินไปในไซต์ของคุณอาจสร้างความเสียหายได้ และคุณควรทำการทดสอบเพื่อดูว่ามีการทำซ้ำในไซต์ของคุณหรือไม่

สารบัญ

บทนำ

ตั้งแต่ฉันเริ่มเปียกใน SEO คำถามนี้ก็วนเวียนอยู่ในฟอรัมและบล็อกต่างๆ ที่ไหนสักแห่งที่มีใครบางคนขยายเวลาความคิดที่ว่าการมีเนื้อหาเดียวกันในหน้า A ของเว็บไซต์ของคุณเป็นหน้า B ของเว็บไซต์ของคุณจะทำให้เว็บไซต์ของคุณถูกลงโทษในการจัดอันดับของเครื่องมือค้นหา แนวคิดนี้เริ่มแพร่หลายในชุมชนการตลาดทางอินเทอร์เน็ตเนื่องจากกลุ่มผู้ส่งอีเมลขยะตระหนักว่าเมื่อพวกเขามีเนื้อหาบางส่วน (เช่น บทความ) ที่มีปริมาณการค้นหาจำนวนมาก พวกเขาสามารถเติมเต็มทุกหน้าของเว็บไซต์ด้วย เนื้อหาเดียวกันเพื่อดึงการเข้าชมจากเครื่องมือค้นหามากขึ้น เห็นได้ชัดว่า บทความเดียวกันนี้มีการทำซ้ำอย่างโจ่งแจ้งในหน้าเว็บหลายร้อยหน้าภายในโดเมนเดียว เป็นการพยายามมุ่งร้ายที่จะเพิ่มปริมาณการใช้เครื่องมือค้นหาโดยไม่เพิ่มมูลค่าใดๆ เลย Google จับวิธีนี้ได้ค่อนข้างเร็วและแก้ไขอัลกอริทึมเพื่อตรวจจับเนื้อหาที่ซ้ำกันและแสดงเวอร์ชันเดียวในการจัดอันดับการค้นหา เว็บไซต์ที่มีส่วนร่วมในกิจกรรมที่โจ่งแจ้งนี้ถูกยกเลิกการจัดทำดัชนีและร้องไห้ไปตามฟอรั่มและบล็อกทั่วทั้งชุมชนการตลาดทางอินเทอร์เน็ต ด้วยเหตุนี้จึงเกิดความกลัวต่อ "บทลงโทษเนื้อหาที่ซ้ำกัน"

อย่างไรก็ตาม ในกรณีส่วนใหญ่ เนื้อหาที่ซ้ำกันจะไม่เป็นอันตรายและเป็นเพียงผลิตภัณฑ์ของ CMS (ระบบจัดการเนื้อหา) ใดก็ตามที่เว็บไซต์ทำงานอยู่ ตัวอย่างเช่น WordPress (CMS มาตรฐานอุตสาหกรรม) จะสร้างหน้า "หมวดหมู่" และ "แท็ก" โดยอัตโนมัติ ซึ่งจะแสดงรายการโพสต์บล็อกทั้งหมดภายในหมวดหมู่หรือแท็กบางประเภท ซึ่งจะสร้าง URL หลายรายการภายในโดเมนที่มีเนื้อหาเดียวกัน

1) Google อาจตัดสินใจปล่อยฉันด้วย "คำเตือน" และเพียงแค่เลือกที่จะไม่สร้างดัชนี 99 โพสต์จาก 100 โพสต์ที่ซ้ำกันของฉัน แต่เก็บหนึ่งในนั้นไว้ในดัชนี หมายเหตุ: นี่ไม่ได้หมายความว่าอันดับการค้นหาเว็บไซต์ของฉันจะได้รับผลกระทบแต่อย่างใด

2) Google อาจตัดสินใจว่าเป็นความพยายามอย่างโจ่งแจ้งในการเล่นเกมระบบจนยกเลิกการสร้างดัชนีเว็บไซต์ทั้งหมดของฉันจากผลการค้นหาทั้งหมด ซึ่งหมายความว่าแม้ว่าคุณจะค้นหา "Example.com" โดยตรง Google ก็จะไม่พบผลลัพธ์

ดังนั้นหนึ่งในสองสถานการณ์นี้จึงรับประกันได้ว่าจะเกิดขึ้น อันไหนขึ้นอยู่กับว่า Google ตัดสินความผิดพลาดของคุณอย่างร้ายแรงเพียงใด ในคำพูดของ Google:

เนื้อหาที่ซ้ำกันบนไซต์ไม่ใช่เหตุผลสำหรับการดำเนินการบนไซต์นั้น เว้นแต่จะดูเหมือนว่าเจตนาของเนื้อหาที่ซ้ำกันนั้นจะเป็นการหลอกลวงและจัดการผลลัพธ์ของเครื่องมือค้นหา หากไซต์ของคุณประสบปัญหาเกี่ยวกับเนื้อหาที่ซ้ำกัน และคุณไม่ปฏิบัติตามคำแนะนำที่ระบุไว้ข้างต้น เราจะทำงานได้ดีในการเลือกเวอร์ชันของเนื้อหาที่จะแสดงในผลการค้นหาของเรา

การทำสำเนาที่ไม่เป็นอันตรายประเภทนี้เป็นเรื่องปกติธรรมดา โดยเฉพาะอย่างยิ่งเนื่องจาก CMS จำนวนมากไม่สามารถจัดการกับสิ่งนี้ได้ดีโดยค่าเริ่มต้น ดังนั้นเมื่อมีคนบอกว่าการมีเนื้อหาที่ซ้ำกันประเภทนี้อาจส่งผลต่อไซต์ของคุณ ไม่ใช่เพราะคุณมีแนวโน้มที่จะถูกลงโทษ เป็นเพราะวิธีการทำงานของเว็บไซต์และเครื่องมือค้นหา

เสิร์ชเอ็นจิ้นส่วนใหญ่มุ่งมั่นเพื่อความหลากหลายในระดับหนึ่ง พวกเขาต้องการแสดงผลลัพธ์ที่แตกต่างกันสิบรายการในหน้าผลการค้นหา ไม่ใช่สิบ URL ที่แตกต่างกันซึ่งมีเนื้อหาเหมือนกันทั้งหมด ด้วยเหตุนี้ Google จึงพยายามกรองเอกสารที่ซ้ำกันออกเพื่อให้ผู้ใช้พบกับความซ้ำซ้อนน้อยลง

แล้วจะเกิดอะไรขึ้นเมื่อโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาตรวจพบเนื้อหาที่ซ้ำกัน (จาก https://searchengineland.com/search-illustrated-how-a-search-engine-determines-duplicate-content-13980)

Google ลงโทษเนื้อหาที่ซ้ำกันอย่างไร

How Google Penalizes Duplicate Content

Google ค่อนข้างเปิดเผยเกี่ยวกับนโยบายเนื้อหาที่ซ้ำกัน ตามรายงานของพวกเขา หาก Google พบหน้าเว็บเดียวกันสองเวอร์ชันที่แตกต่างกัน หรือเนื้อหาที่คล้ายคลึงกันกับเนื้อหาในไซต์ที่อื่น Google จะสุ่มเลือกเวอร์ชัน "ตามรูปแบบบัญญัติ" เพื่อสร้างดัชนี ตัวอย่างที่พวกเขาให้คือ: ลองนึกภาพว่าคุณมีหน้าเว็บมาตรฐานและหน้าเว็บเดียวกันเวอร์ชันที่เป็นมิตรกับเครื่องพิมพ์ พร้อมด้วยเนื้อหาที่เหมือนกัน Google จะสุ่มเลือกหน้าใดหน้าหนึ่งเหล่านี้เพื่อสร้างดัชนี และละเว้นอีกเวอร์ชันหนึ่งโดยสมบูรณ์ สิ่งนี้ไม่ได้หมายความถึงการได้รับโทษ แต่เพื่อประโยชน์สูงสุดของคุณที่จะตรวจสอบให้แน่ใจว่า Google จัดทำดัชนีและจัดระเบียบไซต์ของคุณอย่างเหมาะสม

ปัญหาที่แท้จริงเกิดขึ้นเมื่อ Google สงสัยว่าเนื้อหาของคุณถูกคัดลอกโดยประสงค์ร้ายหรือบิดเบือน โดยพื้นฐานแล้ว หาก Google คิดว่าเนื้อหาที่ซ้ำกันของคุณเป็นความพยายามที่จะหลอกอัลกอริทึมการจัดอันดับ คุณจะต้องถูกลงโทษ เพื่อประโยชน์สูงสุดของคุณในการแก้ไขข้อผิดพลาดใดๆ ล่วงหน้า เพื่อป้องกันชะตากรรมดังกล่าวสำหรับไซต์ของคุณ

การเผยแพร่: ทำซ้ำเนื้อหาทั่วทั้งโดเมน

บางครั้ง เนื้อหาชิ้นเดียวกันอาจปรากฏแบบคำต่อคำใน URL ต่างๆ ตัวอย่างบางส่วนของสิ่งนี้รวมถึง:

  • บทความข่าว (คิดว่า Associated Press)
  • บทความเดียวกันจากไดเรกทอรีบทความที่เว็บมาสเตอร์ต่างหยิบขึ้นมา
  • เว็บมาสเตอร์ส่งเนื้อหาเดียวกันไปยังไดเรกทอรีบทความที่แตกต่างกัน
  • ข่าวประชาสัมพันธ์ที่เผยแพร่ผ่านเว็บ
  • ข้อมูลผลิตภัณฑ์จากผู้ผลิตที่ปรากฏบนเว็บไซต์อีคอมเมิร์ซต่างๆ

ตัวอย่างทั้งหมดเหล่านี้เป็นผลมาจากการ รวมเนื้อหา เว็บเต็มไปด้วยเนื้อหาที่รวบรวมไว้ ข่าวประชาสัมพันธ์ฉบับหนึ่งสามารถสร้างเนื้อหาที่ซ้ำกันในโดเมนที่ไม่ซ้ำกันนับพันโดเมน แต่เสิร์ชเอ็นจิ้นมุ่งมั่นที่จะมอบประสบการณ์การใช้งานที่ดีแก่ผู้ค้นหา และการแสดงหน้าผลลัพธ์ที่ประกอบด้วยเนื้อหาเดียวกันจะไม่ทำให้คนจำนวนมากมีความสุข แล้วเสิร์ชเอ็นจิ้นควรทำอย่างไร? อย่างไรก็ตาม จะต้องตัดสินใจว่าตำแหน่งของเนื้อหาใดมีความเกี่ยวข้องมากที่สุดเพื่อแสดงให้ผู้ค้นหาเห็น แล้วมันทำได้อย่างไร? ตรงจากบิ๊ก G:

เมื่อพบเนื้อหาที่ซ้ำกันดังกล่าวในไซต์ต่างๆ เราจะพิจารณาสัญญาณต่างๆ เพื่อพิจารณาว่าไซต์ใดเป็นไซต์ดั้งเดิม ซึ่งมักจะใช้ได้ผลดีมาก นอกจากนี้ยังหมายความว่าคุณไม่ควรกังวลมากว่าจะเห็นผลเชิงลบต่อการแสดงไซต์ของคุณบน Google หากคุณสังเกตเห็นว่ามีคนคัดลอกเนื้อหาของคุณ

Google ฉันขอแตกต่าง ขออภัย ฉันไม่คิดว่าคุณตัดสินใจได้ดีนักว่าไซต์ใดเป็นผู้ริเริ่มเนื้อหา Michael Grey ที่คร่ำครวญในบล็อกโพสต์ของเขาว่า “เมื่อ Google ได้รับเนื้อหาที่ซ้ำกันผิด” ที่ Google มักจะระบุแหล่งที่มาของเนื้อหาต้นฉบับของเขาไปยังไซต์อื่นๆ ที่เขาเผยแพร่เนื้อหาของเขา ตามที่ไมเคิล:

อย่างไรก็ตาม ปัญหาอยู่ที่ Google การจัดลำดับของ IMHO ทำให้เกิดอคติมากเกินไปในความน่าเชื่อถือและอำนาจของโดเมน

และฉันเห็นด้วยกับไมเคิล สำหรับอาชีพการตลาดทางอินเทอร์เน็ตส่วนใหญ่ของฉัน ฉันได้รวบรวมบทความฉบับเต็มไปยังไดเรกทอรีบทความต่าง ๆ เพื่อขยายการเข้าถึงเนื้อหาของฉันในขณะที่ใช้เป็น "เชื้อเพลิง SEO" เพื่อรับลิงก์ย้อนกลับแบบหมวกขาวไปยังเว็บไซต์ของฉัน ตามที่ Google ระบุไว้ ตราบใดที่เวอร์ชันที่เผยแพร่ของคุณมีลิงก์ย้อนกลับไปยังต้นฉบับของคุณ สิ่งนี้จะช่วยกรณีของคุณเมื่อ Google ตัดสินใจว่าชิ้นส่วนใดเป็นต้นฉบับ นี่คือหลักฐาน:

อันดับแรก วิดีโอที่มี Matt Cutts บล็อกเกอร์ชื่อดังและอดีตวิศวกรอัลกอริทึมของเครื่องมือค้นหาสำหรับ Google:

การอภิปรายเกี่ยวกับการเผยแพร่จะเริ่มต้นในเวลาประมาณ 2:25 น. เมื่อเวลา 2:54 น. เขาบอกว่าคุณสามารถบอกคนอื่นได้ว่าคุณเป็น “ผู้ควบคุมเนื้อหา” โดยการใส่ลิงก์จากผลงานที่รวบรวมมาไว้ในผลงานต้นฉบับของคุณ

หลักฐานเพิ่มเติม:

ในกรณีที่คุณกำลังเผยแพร่เนื้อหาของคุณ แต่ยังต้องการให้แน่ใจว่าไซต์ของคุณถูกระบุว่าเป็นแหล่งที่มาดั้งเดิม คุณควรขอให้พันธมิตรการเผยแพร่ของคุณใส่ลิงก์กลับไปยังเนื้อหาต้นฉบับของคุณ

และในที่สุดก็:

เผยแพร่อย่างระมัดระวัง : หากคุณเผยแพร่เนื้อหาของคุณบนไซต์อื่น Google จะแสดงเวอร์ชันที่เราคิดว่าเหมาะสมที่สุดสำหรับผู้ใช้ในการค้นหาแต่ละครั้ง ซึ่งอาจเป็นหรือไม่ใช่เวอร์ชันที่คุณต้องการก็ได้ อย่างไรก็ตาม การตรวจสอบให้แน่ใจว่าแต่ละไซต์ที่รวบรวมเนื้อหาของคุณนั้นมีลิงก์กลับไปยังบทความต้นฉบับของคุณ คุณยังสามารถขอให้ผู้ที่ใช้เนื้อหาที่รวบรวมของคุณใช้เมตาแท็ก noindex เพื่อป้องกันไม่ให้เครื่องมือค้นหาจัดทำดัชนีเวอร์ชันของเนื้อหา

สิ่งที่ฉันคิดว่าน่าสนใจจากคำพูดสุดท้ายนี้จาก Google ก็คือพวกเขายอมรับจริงๆ ว่าเนื้อหาที่พวกเขาเลือกอาจไม่ใช่สิ่งที่ถูกต้อง จากประสบการณ์ของผม มีความเป็นไปได้สูงที่จะไม่เลือกเว็บไซต์ที่เหมาะสมหากเว็บไซต์ที่กำเนิดเนื้อหานั้นค่อนข้างใหม่หรือมีเพจแรงก์ต่ำ นี่จึงทำให้เกิดปัญหาใหญ่ต่อไป:

ฉันจะได้รับการจัดอันดับเป็นแหล่งต้นฉบับสำหรับเนื้อหาที่ฉันเผยแพร่ได้อย่างไร

How do I get ranked as the original source for the content I syndicate?

ในอดีต ฉันเผยแพร่บทความจำนวนมากของฉันไปที่ EzineArticles เพื่อให้ Google ให้เครดิตกับผลการค้นหาที่สูงขึ้นสำหรับเนื้อหาของฉัน แม้ว่าฉันจะแน่ใจอย่างเต็มที่ว่า Google ได้จัดทำดัชนีเนื้อหาของฉันไว้ที่ตำแหน่งเดิมก่อนที่จะส่งไปยัง Ezine Vanessa Fox ซึ่งเคยทำงานที่ Google และสร้าง Webmaster Central พยายามแก้ไขปัญหานี้ในบล็อกโพสต์ของเธอ "การจัดอันดับเป็นแหล่งที่มาดั้งเดิมสำหรับเนื้อหาที่คุณเผยแพร่"

น่าเสียดายที่เธอสรุปว่า โดยพื้นฐานแล้ว ไม่มีอะไรที่คุณสามารถทำได้เพื่อให้แน่ใจว่าคุณทำ เธอแนะนำ:

สร้างเนื้อหาในเวอร์ชันที่แตกต่างจากที่คุณเขียนสำหรับไซต์ของคุณเอง วิธีนี้ใช้ได้ผลดีที่สุดกับสิ่งต่างๆ เช่น ฟีดผลิตภัณฑ์ในเครือ ฉันคิดว่ามันใช้ไม่ได้กับสิ่งต่างๆ เช่น โพสต์ในบล็อกหรือบทความประเภทอื่นๆ แต่คุณสามารถทำอะไรบางอย่าง เช่น เขียนบทความสรุประดับสูงสำหรับการเผยแพร่ และบล็อกโพสต์ที่มีรายละเอียดเกี่ยวกับหัวข้อนั้นสำหรับไซต์ของคุณเอง

การเขียนเนื้อหาใหม่ไม่ใช่คำจำกัดความของการเผยแพร่ นั่นเป็นเพียงการเขียนบทความใหม่โดยใช้คำที่ต่างกันและแจกจ่ายออกไป ข้อมูลเกือบทั้งหมดที่เผยแพร่บนเว็บได้ถูกโพสต์ไว้ที่อื่นแล้ว แม้แต่บล็อกโพสต์นี้ยังประกอบด้วยข้อมูลมากมายที่ฉันพบในที่อื่นบนอินเทอร์เน็ต ดังนั้น สำหรับฉัน การเขียนบทความใหม่ที่พูดสิ่งเดียวกันในคำที่ต่างกัน และการแจกจ่ายให้กับพันธมิตรการเผยแพร่นั้นไม่ใช่การเผยแพร่บทความต้นฉบับจริงๆ เป็นการเผยแพร่บทความอื่น ดังนั้นเราจึงยังคงมีคำถามเกี่ยวกับผลลัพธ์ของการรวม เนื้อหาเดียวกัน ที่ปรากฏบนเว็บไซต์ของคุณแล้ว: การกระทำ ดังกล่าวมีผลอย่างไร จะเป็นอันตรายต่ออันดับของฉันในทางใดทางหนึ่ง ?

สำหรับฉัน นี่เป็นคำถามที่สำคัญที่สุดเกี่ยวกับเนื้อหาที่ซ้ำกัน ก่อนที่ฉันจะเข้าสู่การวิเคราะห์นั้น เรามาพิจารณาคำถามพื้นฐานที่สำคัญกันก่อน

เหตุใดฉันจึงต้องการเผยแพร่เนื้อหาเดียวกันจากเว็บไซต์ของฉันที่อื่น

อินเทอร์เน็ตทำงานบนเศรษฐกิจที่เรียบง่ายของการให้และรับ สินค้าสองรายการที่แลกเปลี่ยน กัน มี เนื้อหาเฉพาะ และ ลิงก์ย้อนกลับ เนื้อหาที่ไม่ซ้ำหมายถึงเนื้อหาที่ Google ไม่ได้ระบุว่าซ้ำกัน มีทฤษฎีต่างๆ มากมายเกี่ยวกับจุดที่ Google กำหนดเส้นในการพิจารณาว่าเนื้อหาควรถูกพิจารณาว่า ซ้ำกัน หรือไม่ แต่ตัวเลขหนึ่งที่ฉันได้ยินมาบ่อยคือ 30% โดยพื้นฐานแล้ว ตามทฤษฎี 30% หาก Google ระบุว่าเนื้อหาชิ้นใดชิ้นหนึ่งปรากฏที่อื่นบนอินเทอร์เน็ตมากกว่า 30% เนื้อหานั้นจะถูกจัดประเภทว่า ซ้ำกัน ตอนนี้ฉันไม่สามารถยืนยันความถูกต้องของตัวเลขนี้ได้ ดังนั้นจงใช้มันให้คุ้มค่า นอกจากนี้ยังมีซอฟต์แวร์ตรวจจับเนื้อหาที่ซ้ำกันหลายตัว เช่น CopyScape ซึ่งออกแบบมาเพื่อช่วยให้เว็บมาสเตอร์ตรวจสอบว่าเนื้อหาของตนถูกขโมยและทำซ้ำในโดเมนอื่นหรือไม่ นอกจากนี้ยังเป็นเครื่องมือที่ดีในการพิจารณาว่าเนื้อหาของคุณมีแนวโน้มที่จะถูกพิจารณาว่า ซ้ำกัน โดย Google หรือไม่ และนั่นคือสิ่งที่สำคัญจริงๆ

แต่ฉันออกนอกลู่นอกทางไปเล็กน้อย กลับมาที่การสนทนา ว่าทำไม คุณถึงต้องการเผยแพร่เนื้อหา ฉันพูดถึงเศรษฐกิจอินเทอร์เน็ตของลิงก์ย้อนกลับและเนื้อหาที่ไม่ซ้ำใคร เนื้อหาที่ไม่ซ้ำเป็นที่ต้องการเพราะ Google จะทำดัชนี ซึ่งทำให้เว็บไซต์นั้นเป็นอีกตัวอย่างหนึ่งของ "ชื่อในหมวก" ของเว็บไซต์นั้นๆ โดยพื้นฐานแล้ว ยิ่งเว็บไซต์จัดทำดัชนีเนื้อหามากเท่าใด โอกาสที่เว็บไซต์จะแสดงผลในผลการค้นหาของ Google สำหรับข้อความค้นหาที่เกี่ยวข้องก็จะมากขึ้นเท่านั้น

แต่สิ่งที่เกี่ยวกับลิงก์ย้อนกลับ? ลิงก์ย้อนกลับเป็นเพียงลิงก์จากเว็บไซต์อื่นไปยังของคุณเอง เสิร์ชเอ็นจิ้นถือว่า "โหวต" เมื่อเว็บไซต์หนึ่งเชื่อมโยงไปยังอีกเว็บไซต์หนึ่ง การลงคะแนนนี้ใช้เพื่อกำหนดอำนาจและความเกี่ยวข้องในผลการค้นหาของ Google ในความเป็นจริง คิดว่าลิงก์ย้อนกลับเป็นปัจจัยที่สำคัญที่สุดเพียงอย่างเดียวในการพิจารณาว่าเว็บไซต์ของคุณควรจัดอันดับอย่างไรสำหรับข้อความค้นหาที่กำหนด มีปัจจัยมากมายที่ส่งผลต่อลิงก์ย้อนกลับและจำนวน "โหวต" ของพวกเขามีความสำคัญเพียงใด แต่ฉันจะพูดถึงสิ่งนั้นในโพสต์บล็อกในอนาคต สำหรับตอนนี้ สิ่งที่คุณต้องรู้ก็คือ ลิงก์ย้อนกลับนั้นมีค่าเพราะช่วยปรับปรุงอันดับของคุณในเครื่องมือค้นหา และนั่นหมายถึงการเข้าชมเว็บไซต์ของคุณมากขึ้น

ตกลง ตอนนี้เราได้ครอบคลุมสินค้าพื้นฐานของเศรษฐกิจจุลภาคของเว็บแล้ว นี่เป็นสิ่งสำคัญเพราะเมื่อคุณรวมเนื้อหาของคุณ สมมติว่าคุณได้รวมลิงก์ย้อนกลับในนั้นที่ลิงก์กลับไปยังแหล่งที่มาเดิมของคุณ คุณจะได้รับลิงก์ย้อนกลับจากทุกเว็บไซต์ที่เนื้อหาของคุณถูกเผยแพร่ ยอดเยี่ยมใช่มั้ย?

อาจจะไม่. คำถามแรกคือ Google ให้ความสำคัญกับลิงก์ย้อนกลับจากเนื้อหาที่ทราบว่าเป็นเนื้อหาที่ซ้ำกันมากเพียงใด ตรงไปตรงมาฉันไม่รู้ ในอีกด้านหนึ่ง การจัดเนื้อหาไปยังกลุ่มบล็อกที่ยอมรับอัตโนมัติเป็นเรื่องง่าย หากเป้าหมายเพียงอย่างเดียวของคุณคือการได้รับลิงก์ย้อนกลับ และสิ่งนี้ไม่ได้กล่าวถึงคุณภาพของเนื้อหาของคุณหรือจำนวนเงินที่ผู้สร้างเนื้อหาควรได้รับรางวัล ในทางกลับกัน การเผยแพร่อาจเป็นตัวบ่งชี้ที่ดีถึงคุณภาพของเนื้อหาบางชิ้น ท้ายที่สุดแล้วทำไมมันจึงถูกเผยแพร่อย่างมากถ้ามันไม่ได้ยอดเยี่ยมจริงๆ?

ในท้ายที่สุด Google อาจมีสัญญาณว่า Google ตอบคำถามสองข้อนี้อย่างไร แต่วิศวกรซอฟต์แวร์ที่เข้ารหัสอัลกอริทึมอาจรู้คำตอบที่แท้จริงเท่านั้น หลายคนพยายามเพิ่มมูลค่าของเนื้อหาที่รวบรวมโดยมีส่วนร่วมในเนื้อหา "การหมุน" ซึ่งถูกต้องตามกฎหมายอย่างสมบูรณ์ตราบใดที่ไม่ใช่ขยะที่มักจะพ่นออกโดยซอฟต์แวร์อัตโนมัติ ฉันจะลงลึกมากขึ้นเกี่ยวกับเนื้อหาที่หมุนในโพสต์ในภายหลัง สำหรับตอนนี้ เรายังคงพยายามตอบคำถามว่าการรวมเนื้อหาตามที่ปรากฏในเว็บไซต์ของคุณเป็นความคิดที่ดีหรือไม่ดี หลังจากทดสอบอย่างถี่ถ้วนแล้ว ฉันได้ข้อสรุปดังต่อไปนี้:

.

…….

*กลอง*

……

*กลองเพิ่มเติม*

…..

อาจจะ.

ฉันรู้ว่าฉันรู้ว่า. นั่นไม่ใช่คำตอบที่คุณต้องการ ให้ฉันอธิบาย

ฉันเป็นเจ้าของโดเมนมากกว่า 50 โดเมน และชอบที่จะทำการทดสอบหลายๆ อย่างกับโดเมนเหล่านั้น เมื่อคืนฉันใช้เวลาสองสามชั่วโมงในการค้นหาเนื้อหาของฉันที่รวมไปยังบล็อกและไดเร็กทอรีอื่นๆ และสิ่งที่ฉันพบคือทั้งน่าผิดหวังและให้กำลังใจ

ส่วนที่น่าผิดหวังก็คือ ในหลายกรณี เนื้อหาที่รวบรวมของฉันมีอันดับเหนือกว่าเนื้อหาดั้งเดิมของฉันเอง แม้ว่าไซต์ที่มีอันดับสูงกว่าของฉัน สำหรับเนื้อหาของฉันเอง จะมีลิงก์ย้อนกลับไปยังไซต์ของฉัน ซึ่งเป็นผู้สร้างเนื้อหา ก็เหมือนว่า Google เพิกเฉยต่อลิงก์ย้อนกลับนั้นโดยสิ้นเชิง และยังให้เครดิตแก่ไซต์อื่นๆ อีกด้วย ในบางกรณี ไม่พบเวอร์ชันเนื้อหาในไซต์ของฉันเอง เห็นได้ชัดว่าตกอยู่ในคลัสเตอร์ URL ที่ซ้ำกันของ Google และถูกกรองออกจากผลการค้นหา ซึ่งหมายความว่าในการเผยแพร่เนื้อหาของฉัน จริง ๆ แล้วฉันทำให้เนื้อหาของฉันถูกยกเลิกการจัดทำดัชนี

นี่เป็นสถานการณ์ที่เลวร้ายที่สุดที่เป็นไปได้ แต่ก็เกิดขึ้น บางครั้งอย่างน้อย และนั่นเป็นส่วนที่แปลก บางครั้ง เนื้อหาของฉันถูกมองว่าเป็นเนื้อหาต้นฉบับและได้รับการจัดอันดับสูงสุด สำหรับไซต์และเนื้อหาอื่น ๆ ไซต์นี้อยู่ในอันดับที่สองรองจากไซต์ที่มีอำนาจสูง โดยปกติแล้วคือ EzineArticles เลยต้องสรุปดังนี้

เมื่อคุณรวมเนื้อหาของคุณ อาจ:

  • ทำให้แหล่งที่มาของเนื้อหาที่เป็นต้นฉบับของคุณเอง (เช่น เว็บไซต์ของคุณ) ถูกยกเลิกการจัดทำดัชนีสำหรับเนื้อหานั้น
  • ทำให้ไซต์ของคุณมีอันดับสูงสำหรับคำค้นหาที่เกี่ยวข้องกับเนื้อหาของคุณ แต่ไม่สูงที่สุด
  • ทำให้ไซต์ของคุณมีอันดับสูงสุดสำหรับเนื้อหาของคุณ

ที่สวยมากครอบคลุมฐานทั้งหมดใช่ไหม นี่คือผลลัพธ์ทั้งหมดที่ฉันสังเกตเห็นเมื่อดูไซต์ของฉันเองและผลลัพธ์ของการรวบรวมบทความที่มาจากไซต์เหล่านั้น โดยพื้นฐานแล้ว ฉันสามารถสรุปได้ว่า Google ไม่ได้ทำให้ถูกต้องเสมอไป และ Google ไม่ชอบทำอะไรที่มีความสอดคล้องกัน สิ่งสุดท้ายที่พวกเขาต้องการคือ SEO ของเราในการค้นหาอัลกอริทึมของตนอย่างสมบูรณ์ เพราะเมื่อสิ่งนั้นเกิดขึ้น ความสมบูรณ์ของผลการค้นหาของพวกเขาจะถูกทำลายลงเมื่อผู้คนจัดการกับพวกเขาจนตกนรก

ส่วนที่ให้กำลังใจคือตอนที่ฉันค้นพบว่าลิงก์ย้อนกลับจากเนื้อหาที่รวบรวมช่วยจัดอันดับไซต์ของฉันสำหรับคำหลักเป้าหมายของฉัน ดังนั้น อย่างน้อยก็ มี ค่าของลิงก์ย้อนกลับที่เกิดจากเนื้อหาที่ Google ระบุว่า "ซ้ำกัน"

คำถามยังคงอยู่: ฉันควรเผยแพร่เนื้อหาของฉันหรือไม่

ลองดูประโยชน์ของการทำเช่นนั้น:

ประโยชน์ของการรวมเนื้อหาของคุณ

  • รับลิงก์ย้อนกลับจากเว็บไซต์มากมาย
  • ขยายการเข้าถึงและการรับรู้แบรนด์ของคุณไปยังไซต์ที่มีการเข้าชมสูง
  • รับการเข้าชมโดยตรงผ่านการอ้างอิงจากลิงก์ย้อนกลับในเนื้อหาที่รวบรวมของคุณ
  • วิธีที่ถูกกว่ามากในการรับลิงก์ย้อนกลับมากกว่าการเขียนเนื้อหาใหม่เอี่ยม (หรือเขียนเนื้อหาที่มีอยู่ใหม่) เพื่อแจกจ่าย/เผยแพร่

ข้อเสียของการรวมเนื้อหาของคุณ

  • ไซต์ที่คุณเผยแพร่อาจมีอันดับเหนือกว่าคุณสำหรับเนื้อหาของคุณเอง หากไซต์เหล่านั้นมีอำนาจที่สูงกว่าไซต์ของคุณเอง แม้ว่า คุณจะทำตามคำแนะนำของ Google และรวมลิงก์ย้อนกลับไปยังแหล่งที่มาดั้งเดิมของเนื้อหา
  • Google อาจจัดกลุ่ม URL ที่เนื้อหาของคุณอาศัยอยู่กับส่วนที่เหลือของรายการที่ซ้ำกัน โดยซ่อนจากหน้าผลลัพธ์ของเครื่องมือค้นหา (ยกเลิกการจัดทำดัชนีอย่างมีประสิทธิภาพ)

ดังนั้น การเผยแพร่เนื้อหาของคุณจึงมีความเสี่ยง แน่นอนคุณจะได้รับสิ่งที่ดีที่สุดของโลกทั้งหาก Google ตัดสินใจที่เว็บไซต์ของคุณเป็นผู้ริเริ่มของเนื้อหาจึงให้รางวัลเนื้อหาของคุณด้วยตำแหน่งบนสุดในผลการค้นหาและยังได้รับทั้งหมดที่ลิงก์ย้อนกลับฉ่ำที่เล่นเข้ามาในการจัดอันดับโดยรวมของคุณสำหรับคำหลักที่เฉพาะเจาะจง แต่ถ้า Google เข้าใจผิด (และค่อนข้างตรงกันข้ามกับที่พวกเขาคิด) คุณอาจเสี่ยงที่เนื้อหาของคุณจะไม่ถูกจัดอันดับสำหรับคำค้นหาที่เกี่ยวข้องในเครื่องมือค้นหา

และสิ่งนี้ทำให้ฉันกังวลมาก เพราะฉันมักจะมีความเห็นว่าไม่มีสิ่งใดที่ คนอื่น สามารถทำได้เพื่อทำลายการจัดอันดับของเว็บไซต์ใดเว็บไซต์หนึ่ง หลังจากวิเคราะห์ผลลัพธ์เหล่านี้แล้ว ฉันเกรงว่าจะพบช่องโหว่ในการโต้แย้งของตัวเอง หากมีผู้อื่นเข้าชมเว็บไซต์ของฉัน คัดลอกเนื้อหาทั้งหมดของฉัน และเผยแพร่ไปทั่วเว็บ เป็นไปได้ว่าไซต์ที่รวบรวมเนื้อหาของฉันจะมีอันดับสูงกว่าไซต์ของฉันเอง Google พยายามแก้ไขปัญหานี้ที่นี่เช่นเดียวกับในวิดีโอของ Matt Cutts:

ในกรณีส่วนใหญ่ ผู้ดูแลเว็บจะไม่มีอิทธิพลต่อบุคคลที่สามที่คัดลอกและแจกจ่ายเนื้อหาโดยไม่ได้รับความยินยอมจากผู้ดูแลเว็บ เราตระหนักดีว่านี่ไม่ใช่ความผิดของผู้ดูแลเว็บที่ได้รับผลกระทบ ซึ่งหมายความว่าเนื้อหาที่เหมือนกันซึ่งปรากฏบนไซต์หลายแห่งในตัวเองไม่ถือว่าเป็นการละเมิดหลักเกณฑ์สำหรับผู้ดูแลเว็บของเรา สิ่งนี้นำไปสู่กระบวนการเพิ่มเติมโดยมีจุดประสงค์เพื่อระบุแหล่งที่มาดั้งเดิมของเนื้อหา ซึ่งเป็นสิ่งที่ Google ค่อนข้างดี เนื่องจากในกรณีส่วนใหญ่สามารถระบุเนื้อหาต้นฉบับได้อย่างถูกต้อง ส่งผลให้ไม่มีผลกระทบด้านลบต่อเว็บไซต์ที่สร้างเนื้อหา

อีกครั้ง โชคไม่ดีที่ฉันต้องชี้ให้เห็นว่าจากประสบการณ์ของฉันเอง ซ้ำแล้วซ้ำเล่า ฉันเห็นเนื้อหาของตัวเองมีอันดับแย่กว่าไซต์ที่เผยแพร่ ดังนั้น แม้ว่า Google จะคิดว่าการระบุแหล่งที่มาดั้งเดิมของเนื้อหานั้นดี แต่ข้อมูลของฉันกลับเป็นอย่างอื่น ในเวลานี้ เราได้แต่หวังว่า Google จะปรับปรุงอัลกอริธึมในด้านนี้ ไม่มีอะไรที่เราสามารถทำได้ในฐานะผู้ดูแลเว็บอย่างแน่นอน คุณเพียงแค่ต้องเข้าใจข้อดีและข้อเสียของการเผยแพร่ และตัดสินใจว่าคุณยินดีรับความเสี่ยงในการให้ Google ระบุความเป็นเจ้าของเนื้อหาของคุณอย่างไม่ถูกต้องหรือไม่

ต่อไปนี้เป็นเคล็ดลับสองสามข้อเพื่อลดความเสี่ยงที่ Google จะเข้าใจผิด (ในทางทฤษฎี):

  • โพสต์เนื้อหาใหม่ในเว็บไซต์ของคุณเองเสมอ แล้วรอเผยแพร่เนื้อหาที่อื่นจนกว่า Google จะรวบรวมข้อมูลและจัดทำดัชนีเนื้อหาของคุณ คุณสามารถตรวจสอบเพื่อดูว่าหน้าใดได้รับการจัดทำดัชนีโดยการค้นหาคำค้นหาของ URL ที่แน่นอนของคุณในเครื่องหมายคำพูด หากการค้นหาส่งคืนผลลัพธ์ที่ถูกต้อง (กล่าวคือ ไม่ใช่ผลลัพธ์ที่เป็นศูนย์) แสดงว่าได้รับการจัดทำดัชนีแล้ว เคล็ดลับง่ายๆ อีกประการหนึ่งที่คุณสามารถลองได้คือสุ่มเลือก 11-12 คำจากเนื้อหาของคุณและค้นหาสตริงนั้นอีกครั้งในเครื่องหมายคำพูด คุณคงคิดไม่ถึง แต่โอกาสที่คำ 10-12 คำในลำดับที่เฉพาะเจาะจงจะปรากฏที่อื่นบนเว็บนั้นน้อยมาก ลองใช้เลย — คัดลอกและวางประโยคแบบสุ่มจากย่อหน้านี้ลงใน Google ล้อมรอบด้วยเครื่องหมายคำพูด และดูจำนวนผลลัพธ์ที่คุณได้รับ คุณอาจพบเฉพาะ URL นี้เท่านั้น เว้นแต่บทความนี้จะได้รับการเผยแพร่ (นี่เป็นวิธีที่ดีในการตรวจสอบว่าไซต์ใดที่หยิบเนื้อหาของคุณขึ้นมาเมื่อคุณเผยแพร่)
  • ใส่ลิงก์ย้อนกลับในเวอร์ชันที่เผยแพร่ของคุณไปยัง URL แหล่งที่มาของเนื้อหาต้นฉบับเสมอ Google กล่าวว่านี่เป็นวิธีการที่ถูกต้อง แต่ก็ยังไม่ใช่สิ่งที่แน่นอน อย่างไรก็ตาม มันไม่เจ็บแน่นอน

แล้วการนำข้อเสนอแนะของ Vanessa และเขียนเนื้อหาของคุณใหม่ก่อนที่จะเผยแพร่ล่ะ

วิธีนี้จะช่วยแก้ปัญหาที่อาจทำให้เนื้อหาของคุณถูกยกเลิกการจัดทำดัชนีโดยพื้นฐานแล้วเมื่อ Google ระบุแอตทริบิวต์การเป็นเจ้าของเนื้อหาอย่างไม่ถูกต้อง แต่ก็มีปัญหาสำคัญบางประการเช่นกัน:

  • มีราคาแพง มาก ถ้าคุณมีเนื้อหาจำนวนมาก ลองคิดดูว่าจะใช้เวลานานแค่ไหนในการเขียนบทความใหม่แต่ละบทความที่คุณมี โพสต์นี้เพียงอย่างเดียวมีมากกว่า 6,000 คำและใช้เวลาหลายชั่วโมงในการพิมพ์! คุณสามารถจ้างงานเขียนใหม่ไปยังบริการเช่น Human Rewriter ได้ แต่จะมีค่าใช้จ่ายประมาณ $4 ต่อ 500 คำ (น้อยกว่าต้นทุนของ SEO และการสร้างลิงก์) แต่ค่าใช้จ่ายนั้นน่าจะซ้ำซ้อน ซึ่งอาจมีราคาแพงมากหากคุณมีเนื้อหาจำนวนมาก
  • คุณยังคงเผยแพร่เนื้อหาที่มีหัวข้อเฉพาะเกี่ยวกับคำหลักเดียวกันกับเนื้อหาต้นฉบับของคุณ ดังนั้นจึงไม่ใช่เรื่องแปลกที่จะคิดว่าเนื้อหาที่เขียนใหม่จะ ยังคง มีอันดับเหนือกว่าเนื้อหาดั้งเดิมของคุณสำหรับคำค้นหาที่เกี่ยวข้อง โดยเฉพาะอย่างยิ่งในไซต์ที่มีอำนาจสูง เช่น EzineArticles

เนื้อหาที่ซ้ำกันในโดเมนเดียวกัน

คำสุดท้ายคือว่าถ้าคุณเป็นจริงโจ๋งครึ่มทำซ้ำเนื้อหาของคุณผ่านตันของ URL ที่ภายในโดเมนเดียวกันไม่มีอะไรต้องกังวลเกี่ยวกับ URL รายการใดรายการหนึ่งของคุณที่มีเนื้อหาที่ซ้ำกันจะถูกจัดทำดัชนีและเลือกให้เป็น "ตัวแทน" ของคลัสเตอร์ URL นั้น เมื่อผู้ใช้ทำการค้นหาในเครื่องมือค้นหา เนื้อหานั้นจะแสดงเป็นผลลัพธ์สำหรับข้อความค้นหาที่เกี่ยวข้อง และ URL อื่นๆ ในคลัสเตอร์ Dupe จะไม่แสดง ง่ายๆ อย่างนั้น

อย่างไรก็ตาม อีกด้านหนึ่งของเหรียญเป็นเนื้อหาที่ซ้ำกัน ในโดเมน ต่างๆ และนั่นเป็นสัตว์ประหลาดที่แตกต่างไปจากเดิมอย่างสิ้นเชิง พร้อมที่จะจัดการกับมัน? ไปเลย.

“เนื้อหาที่ซ้ำกัน” แบบดั้งเดิม

Traditional “Duplicate Content”

เนื้อหาที่ซ้ำกันแบบดั้งเดิมคือประเภทของเนื้อหาที่นึกถึงโดยสัญชาตญาณเมื่อคุณได้ยินวลีนั้น เป็นเนื้อหาที่เหมือนกันหรือคล้ายคลึงกันมากกับเนื้อหาที่มีอยู่ในที่อื่นบนเว็บ (โดยปกติอยู่ที่ไซต์ของคุณเอง) มีเหตุผลสองสามประการที่ไซต์จงใจทำซ้ำเนื้อหานี้:

  • ทำซ้ำเนื้อหาเก่าเพื่อให้ไซต์ของคุณมีการอัปเดตมากขึ้น
  • คัดลอกเนื้อหาซ้ำแล้วซ้ำอีกเพื่อเพิ่มหน้าในเว็บไซต์ของคุณ
  • ลอกเลียนแบบวัสดุเพื่อลอกเลียนแบบ

สถานการณ์เหล่านี้ทั้งหมดเป็นการหลอกลวง ในบางครั้งสำหรับผู้ใช้และในบางครั้งสำหรับ Google และโดยส่วนใหญ่ ผู้ดูแลเว็บรู้ว่าควรอยู่ห่างจากแนวทางปฏิบัติเหล่านี้ หากคุณมีส่วนร่วม คุณอาจสมควรได้รับโทษ

เนื้อหาที่ซ้ำซ้อนส่อเสียด

ฉันเรียกมันว่า "ล้วง" เนื้อหาที่ซ้ำกันเพราะมันสามารถแอบดูคุณได้ง่ายเพียงใด คุณไม่มีความตั้งใจที่จะสร้างหน้าที่ซ้ำกัน แต่ก็สามารถเกิดขึ้นได้อยู่ดี โดยปกติแล้ว สาเหตุนี้เกิดจากการสะดุดทางเทคนิคหรือการทำซ้ำโดยไม่ได้ตั้งใจ ตัวอย่างเช่น:

  • หากคุณมีเว็บไซต์สองเวอร์ชันสำหรับ https:// และ https:// Google อาจจัดทำดัชนีทั้งสองเวอร์ชันของแต่ละหน้าแยกจากกัน จากนั้นทำเครื่องหมายหน้าเหล่านั้นว่าเป็นเนื้อหาที่ซ้ำกัน
  • หากคุณมีหน้าเว็บเวอร์ชัน "เป็นมิตรกับเครื่องพิมพ์" หน้าเว็บนั้นจะแสดงเป็น URL แยกต่างหากที่มีเนื้อหาเดียวกัน
  • หน้าเว็บที่มีรูปแบบที่สมบูรณ์และปรับแต่งบนมือถือ เช่น ส่วนของฟอรัม

ขออภัย กรณีเหล่านี้ส่วนใหญ่สามารถเกิดขึ้นได้ตามธรรมชาติในขณะที่คุณสร้างและแก้ไขเว็บไซต์ของคุณ เว้นแต่คุณได้ดำเนินการป้องกันโดยเฉพาะเพื่อหยุดมัน

“แต่ฉันไม่คัดลอกเนื้อหาของฉัน”

ปฏิกิริยาแรกของคุณต่อการประเมินนี้อาจเป็นการเลิกจ้าง คุณไม่ได้คัดลอกเนื้อหาของคุณจากหน้าหนึ่งไปอีกหน้าหนึ่ง คุณใช้ความระมัดระวังอย่างพิถีพิถันเพื่อให้แน่ใจว่าทุกหน้าในไซต์ของคุณเขียนขึ้นตั้งแต่แรก โดยไม่มีวลีหรือส่วนที่ซ้ำกัน

ขออภัย ยังคงมีความเสี่ยงสำหรับคุณ สิ่งที่ Google ลงทะเบียนเป็น "เนื้อหาที่ซ้ำกัน" ไม่ใช่สิ่งที่ผู้ใช้มองว่าเป็นเนื้อหาที่ซ้ำกันเสมอไป ผู้ใช้ที่เรียกดูหน้าเว็บของคุณอาจไม่พบวลีที่ซ้ำกัน แต่ Google อาจรวบรวมข้อมูลไซต์ของคุณและพบการทำซ้ำหลายสิบรายการในแท็กชื่อของคุณ หรือคุณอาจมี URL ที่ไม่ใช่ Canonized หลายรายการซึ่งโฮสต์เนื้อหาในหน้าเดียวกัน แม้ว่าคุณจะรู้สึกมั่นใจว่าคุณไม่ได้มีอิทธิพลโดยตรงต่อเนื้อหาที่ซ้ำกันบางรูปแบบ แต่ก็ควรตรวจสอบเว็บไซต์ของคุณเพื่อให้แน่ใจ

วิธีค้นหา (และล้าง) เนื้อหาที่ซ้ำกัน

How to Find (and Clean) Duplicate Content

การแก้ไขเนื้อหาที่ซ้ำกันนั้นค่อนข้างง่าย การหามันเป็นส่วนที่ยาก เช่นเดียวกับที่ฉันกล่าวไว้ข้างต้น เนื้อหาที่ซ้ำกันอาจตรวจจับได้ยาก เพียงเพราะคุณไม่มีเนื้อหาซ้ำจากมุมมองของประสบการณ์ผู้ใช้ ไม่ได้หมายความว่าคุณไม่มีเนื้อหาที่ซ้ำกันจากมุมมองของอัลกอริธึมการค้นหา

ขั้นตอนแรกของคุณคือขั้นตอนที่ต้องทำด้วยตนเอง เข้าไปที่เว็บไซต์ของคุณและดูว่ามีเนื้อหาที่ซ้ำกันหรือไม่ ตัวอย่างเช่น คุณมีย่อหน้าที่เหมือนกันในการสรุปหน้าบริการแต่ละหน้าของคุณหรือไม่ เขียนใหม่ คุณใช้ส่วนของโพสต์บล็อกที่ผ่านมาซ้ำในโพสต์ใหม่หรือไม่ สร้างความแตกต่าง เมื่อคุณเสร็จสิ้นการสแกนด้วยตนเองครั้งแรกนี้แล้ว คุณจะมีเครื่องมือหลักสองอย่างที่คุณสามารถใช้ได้เพื่อค้นหาอินสแตนซ์ของเนื้อหาที่ซ้ำซ้อนและซ่อนได้ดีขึ้น

ทำการค้นหาของคุณเอง

ขั้นแรก คุณสามารถค้นหาเพื่อดูผ่านสายตาของ Google ใช้แท็ก Site: เพื่อจำกัดการค้นหาของคุณไว้ที่ไซต์ของคุณเท่านั้น และตามด้วยแท็ก intitle: เพื่อค้นหาวลีเฉพาะ ควรมีลักษณะเล็กน้อยดังนี้:

ไซต์:thisisyoursite.comintitle:”thisisyourtargetphrase”

การค้นหานี้จะสร้างผลลัพธ์ทั้งหมดบนเว็บไซต์ของคุณซึ่งสัมพันธ์กับวลีที่คุณเลือก หากคุณเห็นผลลัพธ์ที่เหมือนกันหลายรายการ แสดงว่าคุณมีปัญหาเนื้อหาที่ซ้ำกัน

ตรวจสอบเครื่องมือของผู้ดูแลเว็บ

วิธีที่ง่ายกว่าในการตรวจสอบเนื้อหาที่ซ้ำกันคือการใช้ Google Webmaster Tools เพื่อรวบรวมข้อมูลไซต์ของคุณและรายงานข้อผิดพลาดกลับมา เมื่อคุณสร้างและยืนยันบัญชีเครื่องมือของผู้ดูแลเว็บแล้ว ให้ไปที่แท็บลักษณะที่ปรากฏของการค้นหา แล้วคลิก "การปรับปรุง HTML" ที่นี่ คุณจะสามารถดูและดาวน์โหลดรายการคำอธิบายเมตาและแท็กชื่อที่ซ้ำกันได้ สิ่งเหล่านี้เป็นปัญหาทั่วไปและสามารถแก้ไขได้ง่ายซึ่งใช้เวลาเพียงเล็กน้อยในการเขียนใหม่

ในการพิจารณาว่าตัวอย่างเนื้อหาที่ซ้ำกันจะดึงอันดับของคุณลงมาหรือไม่ อันดับแรก คุณต้องพิจารณาว่าเหตุใดคุณจึงจะเผยแพร่เนื้อหาดังกล่าวตั้งแต่แรก

ทั้งหมดนี้ขึ้นอยู่กับจุดประสงค์ของคุณ

หากเป้าหมายของคุณคือพยายามทำลายระบบโดยใช้เนื้อหาที่เผยแพร่ที่อื่น คุณจะต้องถูกลงโทษ จุดประสงค์ชัดเจนหลอกลวงและตั้งใจที่จะบิดเบือนผลการค้นหา

นี่คือสิ่งที่ Google ได้กล่าวเกี่ยวกับพฤติกรรมประเภทนี้:

เนื้อหาที่ซ้ำกันบนไซต์ไม่ใช่เหตุผลสำหรับการดำเนินการบนไซต์นั้น เว้นแต่จะดูเหมือนว่าเจตนาของเนื้อหาที่ซ้ำกันนั้นจะเป็นการหลอกลวงและจัดการผลลัพธ์ของเครื่องมือค้นหา

Copyscape

Copyscape

สำหรับ 5 เซ็นต์ต่อการค้นหา คุณสามารถให้ Copyscape ตรวจทั้งชิ้นให้คุณได้ แต่ถ้างบประมาณของคุณไม่อนุญาตให้มีการใช้จ่ายแบบนั้น คุณยังสามารถใช้ Copyscape ได้ฟรี สิ่งที่จับได้ด้วย Copyscape ฟรีคือคุณจะต้องเผยแพร่เนื้อหาออนไลน์ก่อนเพื่อเรียกค้น URL

คัดลอกและวาง URL ของเนื้อหาที่เผยแพร่ใหม่ของคุณในช่องค้นหาของ Copyscape สิ่งที่ Copyscape ทำคือสแกนเว็บระหว่างเว็บทั้งหมดเพื่อหาสำเนาของเนื้อหาที่คุณเพิ่งเผยแพร่

Copyscape เป็นเครื่องมือที่เชื่อถือได้ซึ่งผู้จัดพิมพ์จำนวนมากต้องพึ่งพาอย่างมากในการตรวจสอบคุณภาพและความเป็นต้นฉบับ มีเครื่องมืออื่นๆ ที่คล้ายกับ Copyscape มากซึ่งคุณสามารถใช้เพื่อจุดประสงค์เดียวกันได้ เช่น Plagiarism Detect และ InterNIC

การตรวจสอบเนื้อหาที่ซ้ำกันนั้นค่อนข้างง่ายและสะดวก เป็นงาน SEO ที่ขาดไม่ได้สำหรับผู้เริ่มต้น แต่ไม่มีใครควรมองข้าม ด้วยชุดเครื่องมือที่เหมาะสม คุณจะมั่นใจได้ว่าเนื้อหาของคุณมีเอกลักษณ์เฉพาะตัวก่อนที่จะเผยแพร่ทางออนไลน์

และด้วยการมอบเนื้อหาคุณภาพสูงและไม่ซ้ำใครให้กับผู้อ่านของคุณ คุณก็จะได้รับความคุ้มค่าสูงสุด

วิธีทำความสะอาดเนื้อหาที่ซ้ำกัน

เมื่อคุณได้ระบุส่วนสำคัญของการทำซ้ำบนไซต์ของคุณแล้ว คุณสามารถเริ่มดำเนินการแก้ไขได้ ยิ่งคุณดำเนินการแก้ไขเร็วเท่าไหร่ คุณก็จะเริ่มฟื้นตัวจากผลกระทบด้านลบได้เร็วเท่านั้น โชคดีที่ Google ยังทำให้ง่ายต่อการค้นหาและแก้ไขเนื้อหาที่ซ้ำกันในเว็บไซต์ของคุณ เมื่อคุณลงชื่อเข้าใช้ Google Webmaster Tools ให้ไปที่ "ลักษณะที่ปรากฏของการค้นหา" จากนั้นไปที่ "การปรับปรุง HTML" วิธีนี้จะช่วยให้คุณสร้างรายการของหน้าที่ Google ตรวจพบว่าซ้ำกัน เมื่อคุณมีรายการนี้แล้ว คุณสามารถเริ่มกำจัดข้อผิดพลาดที่ซ้ำกันทีละรายการโดยใช้วิธีใดๆ ต่อไปนี้:

  • กำจัดการทำซ้ำที่ไม่จำเป็น ขั้นตอนแรกนั้นง่ายที่สุดและชัดเจนที่สุด แม้ว่าอาจใช้เวลานานหากคุณมีหลายกรณี ในสถานการณ์ใด ๆ ที่คุณสามารถเขียนเนื้อหาใหม่เพื่อแก้ไขการทำซ้ำ ให้ทำ ใส่ความคิดของคุณเป็นคำต่างๆ ใช้อุปกรณ์จัดเฟรมที่แตกต่างกัน และอย่ากลัวที่จะเขียนใหม่ตั้งแต่ต้นจนจบ
  • บอยเลอร์เพลท . Long boilerplates or copyright notices should be removed from various pages and placed on a single page instead. In cases where you would have to call your readers' attention to boilerplate or copyright at the bottom of each of your pages or posts, insert a link to the single special page instead.
  • Similar pages . There are cases when similar pages must be published, such as SEO for small and big businesses. Avoid publishing the same or similar information. Instead, expand on both services and make the information very specific to each business segment.
  • Noindex . People could be syndicating your content. If there's no way to avoid this, include a note at the bottom of each page of your content that asks users to include a “noindex” metatag on your syndicated content to prevent the duplicate content from being indexed by the search engines.
  • 301 redirects . Let the search engine spiders know that a page has permanently moved by using 301 redirects. This also alerts the search engines to remove the old URL from their index and replace it with the new address.
  • Choosing only one URL . There might be several URLs you could use to point to your homepage, but you should choose only one. When choosing the best URL for your page, be sure to keep the users in mind. Make the URL user-friendly. This makes it easier not only for your users to find your page, but also for the search engines to index your site. Some duplicate content errors aren't due to actual duplicated content. They have to do with the URL structure that Google sees. For example, if you have one page that is associated with thisisyoursite.com/, thisisyoursite.com/?, and thisisyoursite.com/?sessionid=111, Google will see that page as repeating content three times. First, choose between www or non-www formatting and stick to that.
  • Always create unique content . Affiliates almost always fall victim to the convenience of ready-made content provided by merchants. If you are an affiliate, be sure to create unique content for the merchant products you are promoting. Don't just copy and paste.

บทสรุป

Let's do a brief recap. “Duplicate content” can refer to plagiarized material, copied content for the purposes of site inflation, but more importantly for the average user, pages that Google indexes twice. These duplicate forms of content are easy to track down with Google Webmaster Tools and fix with canonicalization adjustments or redirects, but if they go unnoticed, they can cumulatively bring your rankings down. Be proactive and scout for duplicate content at least once every few months—unless your site management process is flawless, it's probably that duplicate content will surface when you least expect it.

In the end, it all comes down to testing on a massive scale, getting solid data and making decisions based on that data. So here's what I'm going to do. I'm going to run a huge test and then update this post with my results. At the beginning of the post I mentioned that I am soon launching a massive Website with tons of unique content. I'm going to syndicate it all, completely unedited, as far and wide as I possibly can. As I do so, I'll monitor traffic sources to see what keywords people are using to find my content. Then, I'll replicate those keyword queries in Google and see where my site ranks in the search results. This should be the definitive test for the merits of syndication.

Thanks for sticking with me through this crazy post!