ทำความเข้าใจรายงานการครอบคลุมดัชนี
เผยแพร่แล้ว: 2018-12-20หากคุณเคยเห็นข้อความแบบนี้ในช่วงสองสามสัปดาห์ที่ผ่านมา ให้หายใจเข้าลึกๆ แล้วอ่านต่อไป! ในบทความนี้ เราจะอธิบายสาเหตุที่ทำให้คุณพบปัญหาความครอบคลุมจาก Google Search Console และวิธีแก้ไข

รายงานการครอบคลุมดัชนีคืออะไร
ด้วยการเปิดตัว Google Search Console ที่ปรับปรุงใหม่ มีคุณลักษณะขั้นสูงมากมายที่คุณควรทราบ คุณลักษณะดังกล่าวประการหนึ่งคือรายงานความครอบคลุมของดัชนี ซึ่งระบุจำนวน URL ของไซต์ของคุณที่ Google จัดทำแค็ตตาล็อก (หรือจัดทำดัชนี) และจะปรากฏบนผลการค้นหาของ Google ก่อนหน้านี้รายงานนี้อยู่ภายใต้ "สถานะดัชนี" ภายในอินเทอร์เฟซ Search Console แบบเก่า:
เก่า VS ใหม่


ตอนนี้ รายงานความครอบคลุมของดัชนีจะอยู่ใต้เมนู "ดัชนี" จากนั้นคลิก "ความครอบคลุม" คุณจะเห็นว่า URL ใดมีข้อผิดพลาดในการจัดทำดัชนี คำเตือน (หรือถูกต้องโดยมีคำเตือน) ถูกต้อง หรือยกเว้นจากดัชนีของ Google เพื่อให้เข้าใจรายงานนี้อย่างถูกต้อง เรามาสำรวจความหมายของแต่ละกลุ่มกัน
ข้อผิดพลาด : หน้าเหล่านี้เป็นหน้าที่ไม่ได้ให้บริการแก่ผู้ค้นหาใน Google ในขณะนี้ แต่ Google ก็เชื่อว่าคุณไม่ได้ตั้งใจเช่นกัน
ข้อผิดพลาดสามารถทริกเกอร์ได้หลายวิธี ซึ่งรวมถึงบางอย่างที่ง่ายพอๆ กับโปรแกรมรวบรวมข้อมูลที่บล็อกโปรแกรมรวบรวมข้อมูลของ robots.txt จากหน้าเว็บที่คุณส่งเพื่อสร้างดัชนีไปยังสิ่งที่ซับซ้อนกว่า เช่น ข้อผิดพลาดของเซิร์ฟเวอร์ (ข้อผิดพลาดระดับ 500) ข่าวดี? ข้อผิดพลาดเหล่านี้ส่วนใหญ่สามารถแก้ไขได้ค่อนข้างง่ายด้วยความช่วยเหลือจากผู้ดูแลเว็บ เอเจนซี่การตลาดดิจิทัล หรือทีมพัฒนาเว็บ
ข้อผิดพลาดทั่วไปที่เราเห็นที่ชั้นบนสุดคือ “URL ที่ส่งถูกบล็อกโดย robots.txt” และ “URL ที่ส่งซึ่งทำเครื่องหมายว่า 'noindex'” สิ่งเหล่านี้เป็นข้อผิดพลาดที่ร้ายแรงน้อยกว่าและเกิดจากการส่ง URL สำหรับการจัดทำดัชนีผ่าน Google Search Console ขณะที่ไฟล์ robots.txt ไม่อนุญาตให้รวบรวมข้อมูลไปยัง URL นี้หรือมีแท็ก noindex นี่เป็นสัญญาณที่ขัดแย้งกันเนื่องจากไซต์ของคุณกำลังบอกเครื่องมือค้นหาไม่ให้รวบรวมข้อมูลหรือจัดทำดัชนีหน้านี้ แต่ในขณะเดียวกันก็ขอให้มีการจัดทำดัชนี Google จะเห็นว่าสิ่งนี้ไม่ได้ตั้งใจและติดธงทำเครื่องหมายภายใต้ข้อผิดพลาดมากกว่ายกเว้น (หรือการลบดัชนีโดยเจตนา)
สำหรับวิธีอื่นๆ ในการพบข้อผิดพลาด โปรดดูด้านล่าง:
- ข้อผิดพลาดของเซิร์ฟเวอร์ (5xx) : เซิร์ฟเวอร์ไม่พบ URL เมื่อร้องขอและส่งคืนข้อผิดพลาดระดับ 500
- วิธีแก้ไข : พูดคุยกับทีมพัฒนาของคุณเพื่อแก้ไขปัญหาฝั่งเซิร์ฟเวอร์ ไม่มีอะไรมากที่ทีมอื่นสามารถทำได้ที่นี่หากไม่มีประสบการณ์ที่เหมาะสม
- ข้อผิดพลาดในการเปลี่ยนเส้นทาง : มีปัญหาในสายการเปลี่ยนเส้นทางที่เกี่ยวข้องกับ URL นี้ อาจมีการวนรอบการเปลี่ยนเส้นทางหรือ URL ในห่วงโซ่มีข้อผิดพลาดระดับ 400 หรือ 500
- วิธีแก้ไข : รวบรวมข้อมูล URL โดยใช้ Screaming Frog หรือเครื่องมืออื่น และระบุข้อผิดพลาดระดับ 400 หรือ 500 ในหนึ่งใน URL ในกลุ่มการเปลี่ยนเส้นทาง หากไม่แน่ใจ ให้ปรึกษากับเอเจนซีการตลาดดิจิทัลของคุณ แล้วเจ้าหน้าที่จะตรวจสอบข้อมูลนี้ให้คุณ
- URL ที่ส่งถูกบล็อกโดย robots.txt : คุณส่งหน้านี้เพื่อจัดทำดัชนีภายใน Google Search Console แต่ไฟล์ robots.txt บล็อกหน้านี้อยู่
- วิธีแก้ไข : ตรวจสอบไฟล์ robots.txt ของคุณอีกครั้งที่ www.yoursite.com/robots.txt ตรวจสอบให้แน่ใจว่าบรรทัดที่ขึ้นต้นด้วย "disallow" ไม่ได้อ้างอิง URL หรือโฟลเดอร์ย่อยที่มี URL ที่เป็นปัญหา เอเจนซีการตลาดดิจิทัลสามารถช่วยระบุปัญหาใน robots.txt ได้
- URL ที่ส่งมีเครื่องหมาย 'noindex ': คุณส่งหน้านี้เพื่อจัดทำดัชนี แต่หน้านั้นมีเมตาแท็ก 'noindex' หรือส่วนหัว HTTP
- วิธีแก้ไข : ประเมิน URL คุณต้องการให้พบหน้านี้เมื่อค้นหาโดย Google หรือไม่ หากคุณทำเช่นนั้น เพียงลบเมตาแท็กหรือส่วนหัว HTTP หากคุณไม่พบแท็ก noindex โดยดูที่แหล่งที่มาของหน้า (Control + U) ให้สอบถามหน่วยงานการตลาดดิจิทัลหรือทีมพัฒนาของคุณ
- URL ที่ส่งดูเหมือนจะเป็น Soft 404 : คุณส่งหน้านี้เพื่อจัดทำดัชนี แต่ Google เชื่อว่าหน้านี้เป็น Soft 404
- วิธีแก้ไข: ข้อผิดพลาด Soft 404 คือเมื่อหน้าที่มีเนื้อหาข้อผิดพลาด 404 แสดงขึ้น แต่รหัสสถานะไม่ใช่ 404 แต่เป็น 200 ตรวจสอบหน้าว่าควรเป็นหน้าแสดงข้อผิดพลาดจริงหรือไม่ และรหัสสถานะไม่ถูกต้อง บางครั้ง Google จะตีความหน้าที่มีเนื้อหาต่ำเป็น soft 404 ผิด ไม่ว่าในกรณีใด ให้พิจารณาเปลี่ยนเส้นทาง 301 เพื่อนำผู้ใช้ไปยังหน้าที่เกี่ยวข้องและใช้งานจริง
- ไม่พบ URL ที่ส่ง (404) : คุณส่ง URL รหัสข้อผิดพลาด 404 สำหรับการจัดทำดัชนีผ่าน Google Search Console
- วิธีแก้ไข : คุณไม่ต้องการหน้าแสดงข้อผิดพลาดในดัชนีเนื่องจากทำให้ผู้ใช้ได้รับประสบการณ์ที่ไม่ดี หากหน้านี้ไม่คาดว่าจะเปลี่ยนกลับเป็นหน้าแสดงสถานะ 200 ครั้งในอนาคต 301 เปลี่ยนเส้นทางไปยังเนื้อหาที่เกี่ยวข้องบนไซต์ของคุณ
คำเตือน : URL ที่แสดงภายใต้ส่วนคำเตือนหรือ "ใช้ได้กับคำเตือน" ได้รับการจัดหมวดหมู่จาก Google ว่า "หน้า...อาจต้องการความสนใจจากคุณ และอาจได้รับการจัดทำดัชนีหรือไม่ก็ได้ ตามผลลัพธ์ที่เฉพาะเจาะจง"1

แล้วนี่หมายความว่าอย่างไร? สำหรับฉัน นี่หมายความว่า Google ไม่แน่ใจว่าจะจัดการ URL อย่างไร แต่จะเก็บดัชนีไว้อย่างไม่เต็มใจ โดยไม่คำนึงถึงสถานการณ์ของ URL แต่ละรายการ ให้ลบความไม่แน่นอนนี้ออกและค้นหาสาเหตุที่แต่ละ URL ถูกตั้งค่าสถานะ จากสิ่งที่ฉันเห็นจนถึงตอนนี้ มีคนที่ใช้ไฟล์ robots.txt เป็นเครื่องมือยกเลิกการสร้างดัชนี สิ่งนี้ไม่ถูกต้องด้วยเหตุผลสองสามประการ
ไฟล์ robots.txt ใช้เพื่อตั้งค่ากฎเพื่อป้องกันไม่ให้เครื่องมือค้นหารวบรวมข้อมูลบางพื้นที่ในเว็บไซต์ของคุณ หาก URL แสดงต่อผู้ค้นหาใน Google และคุณต้องการหยุดการทำงานนี้ อย่าเพิ่มประโยคที่ไม่อนุญาตในไฟล์ robots.txt ของคุณ เพราะจะเป็นการบอกใบ้ให้ Google หยุดตรวจสอบหน้านี้ด้วยโปรแกรมรวบรวมข้อมูล สไปเดอร์ หรืออะไรก็ตาม ชื่อที่คุณต้องการให้พวกเขา หากต้องการนำ URL ออกจาก Google หรือเครื่องมือค้นหาใดๆ อย่างแท้จริง ให้แท็ก noindex ใน <head> ของ HTML หรือผ่านส่วนหัว HTTP
แม้ว่าบทความนี้จะเน้นไปที่ข้อผิดพลาดและคำเตือน แต่ให้ครอบคลุมส่วนที่ถูกต้องและยกเว้นอย่างรวดเร็ว
ถูกต้อง : ค่อนข้างง่าย นี่คือรายการ URL ที่ได้รับการจัดทำดัชนีเรียบร้อยแล้ว QA เดียวที่ต้องทำที่นี่คือสำหรับแผนผังไซต์ XML ของคุณและเพื่อให้แน่ใจว่าคุณไม่ได้สร้างดัชนีสิ่งที่คุณไม่ต้องการ ในการดำเนินการนี้ เพียงคลิกช่อง "ถูกต้อง" (ขจัดความสับสนโดยเน้นเพียงกล่องเดียวเท่านั้นในแต่ละครั้ง) และตรวจทานส่วนรายละเอียด
คุณจะพบกับประเภทรายละเอียดหลักสองประเภท "ส่งและจัดทำดัชนี" และ "จัดทำดัชนีแล้ว ไม่ได้ส่งในแผนผังเว็บไซต์:"
- ส่งและจัดทำดัชนี: นี่คือรายการ URL จากเว็บไซต์ของคุณที่ Google ยืนยันว่าจัดทำดัชนีสำเร็จแล้ว
- จัดทำดัชนีแล้ว ไม่ได้ส่งในแผนผังเว็บไซต์: นี่คือ URL ที่จัดทำดัชนีซึ่งไม่ปรากฏในแผนผังเว็บไซต์ XML ของคุณ ขึ้นอยู่กับไซต์ของคุณ โดยทั่วไปไม่ควรมีจำนวนมาก หากคุณต้องการให้ URL ได้รับการจัดทำดัชนี คุณควรช่วยเครื่องมือค้นหาและตัวคุณเอง และเพิ่มลงในแผนผังเว็บไซต์ XML ของคุณ หากไม่แน่ใจว่าต้องทำอย่างไร โปรดติดต่อตัวแทนการตลาดดิจิทัลของคุณเพื่อให้พวกเขาสามารถ QA แผนผังไซต์ของคุณได้อย่างเหมาะสม
ยกเว้น : นี่คือ URL ที่จงใจละเว้นจากดัชนีของ Google สิ่งนี้สามารถเกิดขึ้นได้ผ่านหลายช่องทาง แต่ Google เชื่อว่าไซต์ของคุณมีมาตรการป้องกัน URL เหล่านี้ไม่ให้ถูกค้นหา นี่ไม่ใช่ปัญหาและเป็นส่วนหนึ่งของเว็บไซต์ที่ดี แหล่งข้อมูลภายใน เช่น หน้าที่มีการป้องกันด้วยรหัสผ่านหรือ URL รูปภาพที่สร้างโดยไซต์ WordPress ควรถูกละออกจากดัชนี เนื่องจากเป็นประสบการณ์หน้า Landing Page ที่ไม่ดีสำหรับผู้ค้นหาทางออนไลน์
มีคำถามหรือไม่?
หากคุณได้อ่านบทความนี้แล้วและยังไม่แน่ใจว่าจะจัดการกับปัญหาความครอบคลุมของคุณอย่างไร โปรดโทรหาเรา แล้วทีมการตลาดการค้นหาของเรายินดีที่จะช่วยเหลือคุณในการแก้ปัญหา
