จะหลีกเลี่ยงปัญหาเนื้อหาที่ซ้ำกันสำหรับ Google ได้อย่างไร

เผยแพร่แล้ว: 2021-11-01

เนื้อหาที่ซ้ำกันบนหน้ามีความเหมือนกันมากกับการใช้จ่ายเกินงบประมาณ เฉพาะในกรณีนี้ เรากำลังพูดถึงการลด "งบประมาณที่เชื่อถือได้" ในเว็บไซต์ของโรบ็อตการค้นหา ปัญหานี้เกี่ยวข้องกับเจ้าของไซต์จำนวนมาก เนื่องจากปัญหาอาจเกิดขึ้นได้แม้กระทั่งด้านหลัง เมื่ออ่านบางอย่างเกี่ยวกับปัญหาเนื้อหาที่ซ้ำกัน เว็บไซต์ของคุณกลายเป็นระเบิดเวลา ติ๊กต๊อกบนนาฬิกาและการลงโทษของ Google กำลังรอคุณอยู่

น่าเศร้า แต่ความจริงมีเนื้อหาที่ซ้ำกันประมาณ 25-30% บนเว็บ Matt Cutts อดีต Googler ถือมุมมองนี้ แม้ว่าเนื้อหาที่ซ้ำกันจะทำให้คุณอยู่ในโลกแห่งปัญหากับการเพิ่มประสิทธิภาพกลไกค้นหา แต่ก็ไม่ได้เลวร้ายขนาดนั้น มีวิธีแก้ปัญหา — อ่านบทความนี้และเรียนรู้วิธีหลีกเลี่ยงปัญหาเนื้อหาที่ซ้ำกันสำหรับ Google

สารบัญ แสดง
  • เนื้อหาที่ซ้ำกันคืออะไร?
  • ข้อเท็จจริงเกี่ยวกับเนื้อหาที่ซ้ำกัน
  • มีเนื้อหาประเภทใดบ้าง?
  • รหัสคืออะไร?
    • หน้า HTTPS
    • ระบบจัดการเนื้อหาสร้างเนื้อหาที่ซ้ำกัน
    • หน้าสำหรับพิมพ์หรือตัวเลือกการจัดเรียงหลายหน้า
    • เนื้อหาที่ซ้ำกันในบล็อกและระบบการเก็บถาวร
    • เนื้อหาที่ซ้ำกันที่ผู้ใช้สร้างขึ้น (โพสต์ซ้ำ ฯลฯ )
  • บทสรุป

เนื้อหาที่ซ้ำกันคืออะไร?

เนื้อหาการตลาดโต๊ะแล็ปท็อปหมายเหตุงานเขียนบทความบล็อก
เนื้อหาที่ซ้ำกันมี 3 ประเภทหลัก
  • ซ้ำกันทุกประการ: URL สองรายการมีเนื้อหาเหมือนกันทุกประการ
  • เนื้อหาที่มีความแตกต่างเล็กน้อย เช่น ลำดับประโยค รูปภาพต่างกันเล็กน้อย เป็นต้น
  • สำเนาข้ามโดเมน: มีสำเนา ที่แน่นอนหรือเปลี่ยนแปลงเล็กน้อยในหลายโดเมน

นอกจากนี้ มีสองแนวคิดที่เกี่ยวข้องกันซึ่ง Google ไม่ถือว่าเป็นเนื้อหาที่ซ้ำกัน แต่ผู้เผยแพร่โฆษณาและผู้เชี่ยวชาญ SEO ที่ไม่ค่อยมีประสบการณ์สามารถผสมผสานกับเนื้อหาที่ซ้ำกันได้อย่างง่ายดาย

  • เนื้อหาบางส่วน: เป็นหน้าที่มีเนื้อหาน้อยมาก ชุดของเพจที่สร้างจากรายชื่อที่อยู่องค์กร ซึ่งมีที่อยู่ 6,000 รายการ แต่แต่ละหน้ามีเพียงที่อยู่เดียว: เพียงไม่กี่บรรทัด
  • เนื้อหาสไลซ์: หน้าที่ต่างกันเล็กน้อย เว็บไซต์ขายรองเท้า Timberland ที่มีขนาด 38, 38.5, 39, 40, 41, 42 เป็นต้น หากเว็บไซต์มีหน้าแยกต่างหากสำหรับรองเท้าแต่ละขนาด จะมีความแตกต่างเล็กน้อยระหว่างหน้าเหล่านั้นทั้งหมด ผลกระทบดังกล่าวที่ Google มองว่าเป็นเนื้อหาสไลซ์

Google ไม่ชอบเนื้อหาที่บางและแบ่งส่วนเท่าๆ กัน Google Panda ตรวจพบเอฟเฟกต์ใดๆ เหล่านี้ได้ นั่นคือเหตุผลที่ผู้เผยแพร่โฆษณาควรหลีกเลี่ยงการสร้างหน้าประเภทนี้

เนื้อหาที่ซ้ำกันอาจเกิดขึ้นได้จากหลายสาเหตุ:
  • การอนุญาตให้ใช้เนื้อหาในเว็บไซต์ของคุณ
  • ข้อบกพร่องในสถาปัตยกรรมของเว็บไซต์เนื่องจากระบบการจัดการเนื้อหาไม่ได้รับการปรับให้เหมาะสมสำหรับเครื่องมือค้นหา
  • การมีอยู่ของการลอกเลียนแบบ

ในช่วงห้าปีที่ผ่านมา นักส่งสแปมที่มีความต้องการเนื้อหาพิเศษ ได้เริ่ม "ลอก" เนื้อหาจากแหล่งที่มาที่ถูกต้อง แปลงคำโดยใช้กระบวนการที่ซับซ้อนหลากหลาย และวางข้อความที่ได้บนหน้าเว็บเพื่อดึงดูดการดำเนินการค้นหา "หางยาว" และแสดงการโฆษณาตามบริบทและจุดมุ่งหมายที่ไม่ซื่อสัตย์อื่นๆ ดังนั้น ทุกวันนี้ผู้คนจึงอยู่ในโลกแห่ง "ปัญหาเนื้อหาที่ซ้ำกัน" และ "บทลงโทษเกี่ยวกับเนื้อหาที่ซ้ำกัน"

แนะนำสำหรับคุณ: 5 วิธีที่เนื้อหาที่ดีสามารถเร่งความพยายามทางการตลาดของคุณ

ข้อเท็จจริงเกี่ยวกับเนื้อหาที่ซ้ำกัน

คำถาม-คำตอบ-คำถามที่พบบ่อย-สอบถาม-ช่วยเหลือ
ตำแหน่งเนื้อหาที่ซ้ำกัน

หากเนื้อหาทั้งหมดอยู่ในไซต์ของคุณ เนื้อหานั้นซ้ำกันหรือไม่

ได้ เนื่องจากเนื้อหาที่ซ้ำกันสามารถเกิดขึ้นได้ทั้งในไซต์เดียวกันและคนละไซต์กัน

เปอร์เซ็นต์เนื้อหาที่ซ้ำกัน

เปอร์เซ็นต์ของหน้าที่ควรทำซ้ำเพื่อให้อยู่ภายใต้ตัวกรองเนื้อหาที่ซ้ำกัน ขออภัย เสิร์ชเอ็นจิ้นไม่เคยเปิดเผยข้อมูลนี้ต่อสาธารณะเพราะจะส่งผลต่อความสามารถในการป้องกันปัญหาด้วยตนเอง เปอร์เซ็นต์นี้เปลี่ยนแปลงตลอดเวลาสำหรับเครื่องยนต์ทั้งหมด สิ่งสำคัญที่สุดคือหน้าต่างๆ ไม่จำเป็นต้องเหมือนกันจึงจะถือว่าซ้ำกัน

อัตราส่วนรหัสต่อข้อความ

จะเกิดอะไรขึ้นถ้าโค้ดของคุณมีขนาดใหญ่มาก แต่มีองค์ประกอบ HTML ที่ไม่ซ้ำกันอยู่สองสามรายการบนหน้า Google จะไม่คิดว่าหน้าทั้งหมดซ้ำกันหรือไม่

ไม่ เครื่องมือค้นหาไม่สนใจรหัสของคุณ แต่เกี่ยวกับเนื้อหาของหน้าเว็บของคุณ ขนาดโค้ดจะกลายเป็นปัญหาเมื่อขยายเกินสัดส่วนเท่านั้น

องค์ประกอบการนำทางไปยังอัตราส่วนเนื้อหาที่ไม่ซ้ำกัน

หน้าทั้งหมดในไซต์ของคุณมีแถบนำทางขนาดใหญ่ ส่วนหัวและส่วนท้ายจำนวนมาก แต่มีเนื้อหาเพียงเล็กน้อย Google จะไม่ถือว่าหน้าเหล่านี้ซ้ำกันหรือไม่

ไม่ Google พิจารณาองค์ประกอบการนำทางก่อนที่จะประเมินหน้าสำหรับการทำซ้ำ

เนื้อหาที่ได้รับอนุญาต

คุณต้องการหลีกเลี่ยงปัญหาเนื้อหาที่ซ้ำกัน แต่จะทำอย่างไรถ้าคุณมีเนื้อหาจากแหล่งเว็บอื่นที่คุณได้รับอนุญาตให้แสดงต่อผู้เยี่ยมชมของคุณ

ใช้ meta name = “robots” content=”noindex, follow” ใส่ไว้ในส่วนหัวของหน้า แล้วเสิร์ชเอ็นจิ้นจะรู้ว่าเนื้อหานี้ไม่เหมาะสำหรับพวกเขา อีกทางเลือกหนึ่งคือการได้รับสิทธิพิเศษในการเป็นเจ้าของและเผยแพร่เนื้อหานั้น

มีเนื้อหาประเภทใดบ้าง?

คอมพิวเตอร์-แล็ปท็อป-โต๊ะทำงาน-งาน-สำนักงาน-เนื้อหา-เขียน-โน้ต-วิจัย
  • เนื้อหาที่ไม่ซ้ำ เขียนโดยบุคคล มันแตกต่างอย่างสิ้นเชิงจากการผสมผสานตัวอักษร สัญลักษณ์ และคำบนเว็บ และไม่ได้รับผลกระทบจากอัลกอริธึมการประมวลผลข้อความของคอมพิวเตอร์
  • Fragment คือเนื้อหาเล็กๆ (เช่น เครื่องหมายคำพูด) ที่คัดลอกและใช้ซ้ำแล้วซ้ำอีก พวกเขาไม่ค่อยสร้างปัญหาให้กับเครื่องมือค้นหา โดยเฉพาะอย่างยิ่งเมื่อรวมอยู่ในเอกสารขนาดใหญ่ที่มีเนื้อหาเฉพาะจำนวนมาก
  • โรคงูสวัด เสิร์ชเอ็นจิ้นมองหากลุ่มวลีที่ค่อนข้างเล็ก (ห้าถึงหกคำ) บนหน้าเว็บอื่นๆ หากเอกสารสองฉบับมีงูสวัดมากเกินไป เครื่องมือค้นหาอาจตีความเอกสารเหล่านั้นว่าเป็นเนื้อหาที่ซ้ำกัน

รหัสคืออะไร?

การพัฒนาเว็บโค้ดโปรแกรม

มีหลายวิธีในการสร้างเนื้อหาที่ซ้ำกัน สิ่งนี้อธิบายได้ว่าทำไมจึงมีมากกว่าเพียงพอบนเว็บ เนื้อหาที่ซ้ำกันภายในต้องใช้กลยุทธ์เฉพาะเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดในแง่ของการเพิ่มประสิทธิภาพ หน้าที่ซ้ำกันคือหน้าที่ไม่มีคุณค่าต่อทั้งผู้ใช้และเครื่องมือค้นหา จากนั้นพยายามหลีกเลี่ยงปัญหานี้อย่างสมบูรณ์ ตรวจสอบให้แน่ใจว่ามีเพียง URL เดียวที่อ้างอิงถึงแต่ละหน้า นอกจากนี้ ให้เปลี่ยนเส้นทาง 301 สำหรับ URL เก่าไปยัง URL ที่เหลือ ช่วยให้โรบ็อตค้นหาเห็นการเปลี่ยนแปลงที่คุณทำอย่างรวดเร็วที่สุดและเก็บ "ลิงก์น้ำผลไม้" ที่หน้าที่ถูกลบมี

หากเป็นไปไม่ได้ มีตัวเลือกอื่นอีกมากมาย นี่คือบทสรุปของวิธีแก้ปัญหาที่ง่ายที่สุดสำหรับสถานการณ์ต่างๆ:

  • คุณสามารถใช้ไฟล์ robots.txt เพื่อบล็อกสไปเดอร์ของเครื่องมือค้นหาไม่ให้รวบรวมข้อมูลผ่านหน้าเว็บไซต์ในเวอร์ชันที่ซ้ำกัน
  • ใช้องค์ประกอบ rel=”canonical” ซึ่งเป็นวิธีแก้ปัญหาที่ดีที่สุดอันดับสองในการลบหน้าที่ซ้ำกัน
  • ใช้ CODE <meta name=”robots” content=”noindex”> เพื่อสั่งให้เครื่องมือค้นหาไม่แสดงหน้าที่ซ้ำกัน

อย่างไรก็ตาม โปรดทราบ: หากคุณใช้ robots.txt เพื่อป้องกันการเปิดดูหน้าเว็บ การใช้ noindex หรือ nofollow ในหน้านั้นไม่สมเหตุสมผล เนื่องจากสไปเดอร์ไม่สามารถอ่านหน้านี้ได้ จึงจะไม่เห็นเมตาแท็ก noindex หรือ nofollow เมื่อคำนึงถึงเครื่องมือเหล่านี้แล้ว ให้พิจารณาสถานการณ์เฉพาะของเนื้อหาที่ซ้ำกัน

คุณอาจชอบ: เหตุใดการเขียนเนื้อหาจึงมีความสำคัญสำหรับแบรนด์และธุรกิจ

หน้า HTTPS

หากคุณกำลังใช้โปรโตคอล SSL (การแลกเปลี่ยนข้อมูลที่เข้ารหัสระหว่างเบราว์เซอร์และเว็บเซิร์ฟเวอร์ ซึ่งมักใช้สำหรับอีคอมเมิร์ซ) ไซต์ของคุณจะมีหน้าเว็บที่ขึ้นต้นด้วย HTTPS: (แทนที่จะเป็น HTTP:) ปัญหาจะเกิดขึ้นเมื่อลิงก์ในหน้า HTTPS ของคุณชี้ไปที่หน้าอื่นๆ ในไซต์โดยใช้ลิงก์แบบสัมพัทธ์แทนที่จะเป็นลิงก์แบบสัมบูรณ์ ตัวอย่างเช่น ลิงก์ไปยังหน้าแรกของคุณจะกลายเป็น https://www.YourDomain.com แทนที่จะเป็น http://www.YourDomain.com)

หากไซต์ของคุณประสบปัญหานี้ คุณสามารถใช้ rel=”canonical” หรือการเปลี่ยนเส้นทาง 301 เพื่อแก้ไขได้ อีกทางเลือกหนึ่งคือเปลี่ยนลิงก์เป็น Absolute: http://www.YourDomain.com/content.html แทน /contenthtml) ซึ่งทำให้ชีวิตยากขึ้นเล็กน้อยสำหรับผู้ที่ขโมยเนื้อหาของคุณ

ระบบจัดการเนื้อหาสร้างเนื้อหาที่ซ้ำกัน

บางครั้งไซต์อาจมีหน้าเว็บที่เหมือนกันหลายเวอร์ชัน เกิดขึ้นกับข้อจำกัดในระบบจัดการเนื้อหาบางระบบที่อ้างถึงเนื้อหาเดียวกันโดยมี URL มากกว่าหนึ่งรายการ โดยปกติแล้วจะเป็นการทำซ้ำเพิ่มเติมโดยสมบูรณ์ซึ่งไม่มีประโยชน์สำหรับผู้ใช้ การตัดสินใจที่ดีที่สุดคือการลบหน้าที่ซ้ำกันและทำการเปลี่ยนเส้นทาง 301 สำหรับหน้าที่นำออกไปยังหน้าที่เหลือ หากไม่ได้ผล ให้ลองใช้วิธีอื่น

หน้าสำหรับพิมพ์หรือตัวเลือกการจัดเรียงหลายหน้า

ไซต์จำนวนมากเสนอหน้าสำหรับการพิมพ์ที่ให้เนื้อหาเดียวกันแก่ผู้ใช้ในรูปแบบที่ปรับให้เข้ากับเครื่องพิมพ์ ไซต์อีคอมเมิร์ซบางแห่งมีรายการผลิตภัณฑ์ที่มีการจัดเรียงหลายแบบ (ตามขนาด สี ยี่ห้อ และราคา) หน้าเหล่านี้มีค่าสำหรับผู้ใช้ แต่ไม่มีค่าสำหรับเครื่องมือค้นหา ดังนั้นพวกเขาจึงคิดว่ามันเป็นเนื้อหาที่ซ้ำกัน ในสถานการณ์เช่นนี้ คุณสามารถสร้างสเปรดชีต CSS สำหรับการพิมพ์ได้

เนื้อหาที่ซ้ำกันในบล็อกและระบบการเก็บถาวร

บล็อกมีรูปแบบที่น่าสนใจเกี่ยวกับปัญหาเนื้อหาที่ซ้ำกัน โพสต์บล็อกสามารถปรากฏในหน้าต่างๆ ได้หลายหน้า:

  • หน้าเริ่มต้นของบล็อก
  • หน้าลิงก์ถาวรสำหรับโพสต์นั้น
  • หน้าเอกสารสำคัญ;
  • หน้าหมวดหมู่

สำเนาโพสต์แต่ละฉบับจะซ้ำกับสำเนาอื่นๆ ผู้จัดพิมพ์ไม่ค่อยพยายามจัดการกับปัญหาการมีอยู่ของโพสต์ทั้งในหน้าแรกของบล็อกและหน้าลิงก์ถาวร และดูเหมือนว่าเสิร์ชเอ็นจิ้นจะจัดการกับปัญหานี้ได้ค่อนข้างดี อย่างไรก็ตาม การแสดงเฉพาะตัวอย่างโพสต์ในหน้าหมวดหมู่และหน้าเก็บถาวรก็อาจสมเหตุสมผล

เนื้อหาที่ซ้ำกันที่ผู้ใช้สร้างขึ้น (โพสต์ซ้ำ ฯลฯ )

ไซต์ต่างๆ ใช้โครงสร้างเพื่อรับเนื้อหาที่ผู้ใช้สร้างขึ้น เช่น บล็อก ฟอรัม หรือกระดานข้อความ วิธีเหล่านี้เป็นวิธีที่ดีในการพัฒนาเนื้อหาจำนวนมากด้วยต้นทุนที่ต่ำมาก ปัญหาคือผู้ใช้สามารถเผยแพร่เนื้อหาเดียวกันทั้งบนไซต์ของคุณและไซต์อื่น ๆ หลายไซต์พร้อมกัน ซึ่งนำไปสู่ปัญหาเนื้อหาที่ซ้ำกัน เป็นการยากที่จะควบคุม แต่เพื่อลดปัญหา คุณสามารถดำเนินการดังนี้:

  • คุณต้องมีนโยบายที่ชัดเจนซึ่งแจ้งผู้ใช้ว่าเนื้อหาที่พวกเขาให้ไว้กับไซต์ของคุณควรไม่ซ้ำกันและไม่สามารถโพสต์บนไซต์อื่นได้ โดยปราศจากคำถาม เป็นเรื่องยากที่จะได้รับสิ่งนี้ แต่จะช่วยให้คุณตระหนักถึงความคาดหวังของคุณ
  • ปรับปรุงฟอรัมของคุณในแบบที่ไม่เหมือนใครซึ่งจะต้องมีเนื้อหาที่แตกต่างกัน นอกจากฟิลด์ป้อนข้อมูลมาตรฐานแล้ว ยังเพิ่มฟิลด์ที่ไม่ซ้ำกัน (แตกต่างจากไซต์อื่น ๆ ) ซึ่งจะเป็นประโยชน์สำหรับผู้เยี่ยมชมไซต์ของคุณ
คุณอาจชอบ: วิธีการขยาย SEO ของคุณด้วยเนื้อหาวิดีโอ?

บทสรุป

สัญญาณ-one-way-street-notice-ซ้ำ-การจ้างงาน-แรงจูงใจ

อย่ากังวลมากเกินไปเกี่ยวกับเนื้อหาที่ซ้ำกัน ปกติก็ไม่ใช่เรื่องใหญ่อะไร โดยส่วนใหญ่แล้ว Google เองก็รู้วิธีจัดการกับปัญหาต่างๆ เช่น มาสเตอร์เพจหรือการอ้างอิงเนื้อหา นอกจากนี้ ผู้คนจำนวนมากประสบปัญหาเนื้อหาที่ซ้ำกัน ในบางครั้ง สำเนาที่ซ้ำกันอาจไม่ปรากฏแก่ใครในที่ที่พวกเขาคาดหวัง ดังนั้นคุณควรตรวจสอบไซต์สำหรับพวกเขาเสมอ เพื่อป้องกันไม่ให้เกิดขึ้น คุณต้องสร้างเนื้อหาเฉพาะสำหรับแต่ละหน้า



Author-Image-อิซาเบล-จอร์แดน

บทความนี้เขียนโดย Isabelle Jordan อิซาเบลเป็นนักข่าวธุรกิจและการตลาดของบริษัทประกันภัย ektatraveling.com เธอเขียนถึงพอร์ทัลข่าวและบล็อกเฉพาะเรื่องต่างๆ ที่ช่วยให้เธออยู่ในหัวใจของข่าวการเดินทางและการประกันภัย งานดังกล่าวเปิดโอกาสให้เธอได้เขียนบทความเกี่ยวกับหัวข้อที่เกี่ยวข้องมากที่สุดในปัจจุบัน