สิทธิบัตรเว็บไซต์คุณภาพสูงของ Google

เผยแพร่แล้ว: 2016-12-08

แพนด้า

คุณอาจจำชื่อของผู้ประดิษฐ์สิทธิบัตรที่ฉันเขียนโพสต์ได้ เขามีหนึ่งใน Google Updates ที่คนพูดถึงมากที่สุดที่ตั้งชื่อตามเขา เป็นที่รู้จักกันในชื่อแพนด้า

โพสต์ Google Blog เกี่ยวกับ Panda อ้างถึงว่าเป็นการอัปเดต "ไซต์คุณภาพสูง" สิทธิบัตรนี้กล่าวถึงการแทนที่ผลการค้นหาอันดับสูงจากไซต์คุณภาพต่ำด้วยผลการค้นหาอันดับสูงจากไซต์คุณภาพสูง หนึ่งในบล็อกโพสต์ที่ดีที่สุดเกี่ยวกับ Panda Update คือโพสต์นี้จาก Amit Singhal:

คำแนะนำเพิ่มเติมเกี่ยวกับการสร้างไซต์คุณภาพสูง

เป็นเรื่องที่ดีที่บล็อกโพสต์ให้รายละเอียดมากมายเกี่ยวกับสิ่งที่เป็นเว็บไซต์คุณภาพสูง เพราะสิทธิบัตรไม่ได้บอกเราถึงวิธีแยกความแตกต่างระหว่างเว็บไซต์คุณภาพต่ำและเว็บไซต์คุณภาพสูง มีการอธิบายข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับวิธีที่ Google ระบุไซต์คุณภาพต่ำและไซต์คุณภาพสูงในการสัมภาษณ์แบบมีสายกับ Matt Cutts และ Amit Singhal:

TED 2011: 'หมีแพนด้า' ที่เกลียดฟาร์ม: ถาม & ตอบกับวิศวกรด้านการค้นหาอันดับต้น ๆ ของ Google

สิทธิบัตรนี้น่าสนใจเพราะให้ภาพเบื้องหลัง Panda Update เพื่อให้เราทราบว่าเกิดอะไรขึ้นกับผู้ค้นหาแทนที่จะเป็นเจ้าของไซต์เมื่อพวกเขาทำการค้นหาและไม่ได้ลงเอยที่ไซต์ฟาร์มเนื้อหาที่ Panda Update ควรจะเป็น เบี่ยงเบนความสนใจจากพวกเขา ตามสิทธิบัตรกล่าวว่า "มุ่งเน้นไปที่การปรับปรุงผลการค้นหาโดยแทนที่เว็บไซต์คุณภาพต่ำด้วยไซต์ที่ได้รับการระบุว่าเป็นไซต์คุณภาพสูง"

นี่เป็นปัญหาที่ได้รับการระบุในบางแห่งและมีการระบุไว้ในสถานที่สำคัญ เช่น New York Times ซึ่งสังเกตเห็นการอัปเดต Panda ของ Google:

Google Tweaks Algorithm เพื่อลดไซต์คุณภาพต่ำ

สิทธิบัตรนี้ระบุหน้าเว็บที่มีอันดับดีสำหรับคำค้นหาบางคำและดูคุณภาพของหน้าเหล่านั้น หากจำนวนเกณฑ์ของหน้าการจัดอันดับเหล่านี้เป็นหน้าคุณภาพต่ำ เครื่องมือค้นหาอาจใช้ข้อความค้นหาอื่นเพื่อค้นหาชุดที่สองของผลการค้นหาที่มีหน้าจากเว็บไซต์คุณภาพสูง ผลการค้นหาจากข้อความค้นหาแรกอาจถูกรวมเข้ากับผลลัพธ์จากข้อความค้นหาทางเลือก โดยนำหน้าจากเว็บไซต์คุณภาพต่ำออก เพื่อให้ผลการค้นหารวมหน้าจากเว็บไซต์คุณภาพสูงในเปอร์เซ็นต์ที่มากขึ้น
แง่บวกของผลลัพธ์นี้คือผลลัพธ์ที่มีเกณฑ์สูงของผลลัพธ์จากไซต์คุณภาพต่ำจะหายไป และถูกแทนที่ด้วยผลลัพธ์ที่มีไซต์คุณภาพสูงกว่า ผลการค้นหาของ Google จะดูดีขึ้น

รวมผลการค้นหา

รวมผลการค้นหา

สิทธิบัตรไม่ได้กำหนดว่าไซต์คุณภาพสูงหรือคุณภาพต่ำสำหรับเราคืออะไร บล็อกโพสต์จาก Amit Singhal ทำงานได้ดีกว่าในการให้ "คำแนะนำ" เกี่ยวกับความหมายของคำเหล่านั้น

สิทธิบัตรไม่ได้กล่าวถึงการสูญเสียการเข้าชมไซต์คุณภาพต่ำที่ถูกลบออกจากผลการค้นหา เราได้ยินจากผู้ที่ได้รับผลกระทบจาก Panda ว่าพวกเขาสูญเสียการเข้าชมไปยังไซต์ของพวกเขามากเพียงใด

สิทธิบัตรคือ:

การคัดเลือกสร้างข้อความค้นหาทางเลือก
นักประดิษฐ์ Navneet Panda, April R. Lehman, Trystan G. Upstill
ผู้รับมอบสิทธิ์เดิม Google Inc.
หมายเลขสิ่งพิมพ์ US9135307 B1
ประเภทสิ่งพิมพ์ Grant
ใบสมัครหมายเลข 13/728,851
วันที่ตีพิมพ์ 15 ก.ย. 2558
วันที่ยื่น 27 ธ.ค. 2555

เชิงนามธรรม:

วิธีการ ระบบ และอุปกรณ์ รวมถึงโปรแกรมคอมพิวเตอร์ที่เข้ารหัสบนสื่อบันทึกข้อมูลคอมพิวเตอร์ เพื่อให้ได้ผลการค้นหาจากเว็บไซต์คุณภาพสูง วิธีการหนึ่งรวมถึงการรับข้อมูลที่ระบุทรัพยากรแรกที่ตอบสนองต่อการสืบค้นข้อมูลครั้งแรก หากอย่างน้อยหมายเลขเกณฑ์แรก N ของทรัพยากรอันดับแรกที่อยู่ในอันดับต้น ๆ อยู่ในไซต์ซึ่งก่อนหน้านี้ถูกระบุว่าเป็นไซต์คุณภาพต่ำ จะได้รับแบบสอบถามที่สองและข้อมูลที่ระบุทรัพยากรที่สองที่ตอบสนองต่อการสืบค้นที่สอง ซึ่งอย่างน้อยก็จะมีเกณฑ์ที่สอง หมายเลข M ของทรัพยากรอันดับสองอันดับต้น ๆ อยู่ในไซต์ที่ระบุก่อนหน้านี้ว่าเป็นไซต์คุณภาพสูง ผลการค้นหามีให้เพื่อตอบสนองต่อคำค้นหาแรก โดยที่ผลการค้นหาระบุทรัพยากรแรกอย่างน้อยหนึ่งรายการ และยังระบุทรัพยากรที่สองโดยเฉพาะของทรัพยากรที่สองด้วย

คำจำกัดความของ "ไซต์" ในสิทธิบัตรนี้มีความน่าสนใจอย่างไร และนี่คือทางเลือกอื่นที่มีให้:

(1) การรวบรวมทรัพยากรที่โฮสต์บนเซิร์ฟเวอร์เฉพาะ
(2) ทรัพยากรในโดเมน เช่น “example.com” ซึ่งทรัพยากรในโดเมน เช่น “host.example.com/resource1” “www.example.com/folder/resource2” หรือ “ example.com/resource3” อยู่ในเว็บไซต์
(3) ทรัพยากรในโดเมนย่อย เช่น “en.example.com” ซึ่งทรัพยากรในโดเมนย่อย เช่น “en.example.com/resource1” หรือ “en.example.com/folder/resource2” อยู่ในไซต์
(4) ทรัพยากรในไดเรกทอรีย่อย เช่น “example.com/subdirectory” ซึ่งทรัพยากรในไดเรกทอรีย่อย เช่น “example.com/subdirectory/resource.html” อยู่ในไซต์

มีการกล่าวถึงคะแนนคุณภาพของไซต์ แต่ไม่ได้กำหนดไว้อย่างไร สิทธิบัตรบอกเราว่าเสิร์ชเอ็นจิ้นอาจใช้รายการไซต์สีขาวคุณภาพสูงและบัญชีดำของไซต์คุณภาพต่ำที่จัดทำขึ้นด้วยตนเองหรือด้วยวิธีอื่นแบบออฟไลน์

นอกจากนี้เรายังได้รับแจ้งว่าอาจมีการเก็บรวบรวมข้อมูลเกี่ยวกับคำค้นหาในบางช่วงเวลา หากหน้าเว็บที่มีอันดับสูงสุดจำนวนหนึ่งสำหรับข้อความค้นหาเริ่มต้นอยู่ในเว็บไซต์คุณภาพต่ำ ระบบอาจใช้การสืบค้นข้อมูลที่สองตามข้อความค้นหาแรกนั้น สิทธิบัตรบอกเราว่าวิธีหนึ่งที่อาจทำได้คือการใช้ฐานข้อมูลที่ "รวมถึงคำที่ใช้ค้นหาแทนและสามารถสร้างแบบสอบถามอื่นได้โดยการแทนที่คำที่ใช้ค้นหาทดแทนสำหรับหนึ่งในเงื่อนไขการสืบค้นในแบบสอบถามแรก" สิ่งนี้ทำให้ฉันนึกถึงบางโพสต์ที่ฉันเขียนเกี่ยวกับสิทธิบัตรของ Google ที่ครอบคลุมคำที่ใช้ค้นหาแทนเช่นที่ฉันเขียนเกี่ยวกับใน:

  • วิธีที่ Google อาจแทนที่เงื่อนไขการค้นหาด้วยการเกิดขึ้นร่วม
  • วิธีที่เครื่องมือค้นหาสามารถแทนที่คำค้นหาอื่นๆ สำหรับคุณ
  • การตรวจสอบ Google RankBrain และการแทนที่คำค้นหา

อีกทางหนึ่ง สิทธิบัตรบอกเราว่าเสิร์ชเอ็นจิ้นอาจสร้าง “กราฟแนวความคิดของข้อความค้นหาและสำรวจกราฟเพื่อรับข้อความค้นหาทางเลือกหนึ่งรายการขึ้นไป” นั้น “แต่ละโหนดในกราฟถูกกำหนดโดยคำค้นหาและชุดของผลการค้นหาอันดับต้นๆ ที่ได้รับสำหรับคำค้นหา ลิงก์ระหว่างโหนดในกราฟสามารถระบุได้ว่าข้อความค้นหามีความเกี่ยวข้องหรือข้อความค้นหาหนึ่งเป็นข้อความค้นหาอื่นสำหรับข้อความค้นหาอื่น”

นั่นจะแตกต่างอย่างมากจากกราฟลิงก์ที่เราคิดเกี่ยวกับ Google แต่เป็นวิธีคิดที่น่าสนใจเกี่ยวกับวิธีการค้นหาข้อความค้นหาอื่น สิทธิบัตรสร้างขึ้นจากแนวทางกราฟนี้ และดูเหมือนว่าอาจเป็นวิธีการที่พวกเขาใช้

ระบบการค้นหานี้อาจประเมินคำค้นหาทางเลือกที่เป็นไปได้มากกว่าหนึ่งคำก่อนที่จะเลือกคำที่มีการวัดความเชื่อมั่นสูงสุด

หากชุดผลลัพธ์ที่มีไซต์คุณภาพสูงจำนวนเกณฑ์ที่ผสานเข้าด้วยกัน อาจพยายามรวบรวมผลลัพธ์การค้นหาทางเลือกเพิ่มเติมจากไซต์คุณภาพสูง

บทสรุป

นี่อาจเป็นสิทธิบัตรดั้งเดิมจาก Panda Update Navneet Panda ของ Google เป็นหนึ่งในผู้ประดิษฐ์สิทธิบัตร ตามที่ได้เปิดเผยในการสัมภาษณ์ Wired กับ Cutts และ Singhal และสิทธิบัตรนี้กำหนดเป้าหมายไปยังไซต์ฟาร์มเนื้อหา ซึ่งเป็นสิ่งที่ Panda Update ดั้งเดิมเป็นที่รู้จักมากที่สุด ตัวสิทธิบัตรเองไม่ได้เปิดเผยความแตกต่างระหว่างไซต์คุณภาพต่ำและไซต์คุณภาพสูง และเราได้เรียนรู้ในการสัมภาษณ์แบบมีสายว่าเป็นวิศวกรค้นหาชื่อ Panda ที่ตั้งคำถามแรกเริ่มบางส่วนที่ระบุความแตกต่างระหว่างทั้งสอง