คลิกแพนด้า: ผลการค้นหาคุณภาพสูงตามการคลิกซ้ำและระยะเวลาการเยี่ยมชม

เผยแพร่แล้ว: 2017-06-29

คลิกแพนด้า

สิทธิบัตรแพนด้ากลับมาพร้อมข้อเรียกร้องใหม่

เมื่อสามปีที่แล้ว ฉันเขียนเกี่ยวกับสิทธิบัตรจาก Navneet Panda ของ Google ซึ่งเน้นที่การจัดอันดับหน้าเว็บในผลการค้นหา โพสต์ของฉันเป็นบทสรุป และถูกเรียกว่า Panda ของ Google ได้รับสิทธิบัตรเกี่ยวกับผลการค้นหาอันดับ เมื่อสัปดาห์ที่แล้ว Google มอบสิทธิบัตรเวอร์ชันต่อเนื่องที่ฉันเขียนเกี่ยวกับโพสต์นั้น ฉันชอบสิทธิบัตรที่ต่อเนื่องเนื่องจากส่วนการอ้างสิทธิ์ของสิทธิบัตรดังกล่าวเปลี่ยนไปเนื่องจากกระบวนการที่อธิบายไว้ในสิทธิบัตรนั้นเปลี่ยนไปในทางใดทางหนึ่ง การเปลี่ยนแปลงเหล่านี้มักเป็นภาพสะท้อนที่น่าสนใจของ Google ที่ทำการเปลี่ยนแปลงในกระบวนการที่อธิบายไว้ในสิทธิบัตรเดิม สิ่งนี้ชี้ให้เห็นการคลิกซ้ำว่ามีความสำคัญ

เราได้เห็นการเปลี่ยนแปลงที่ Google ในช่วงไม่กี่ปีที่ผ่านมาซึ่งเกี่ยวข้องกับสิ่งต่างๆ เช่น Rank Brain และ Machine Learning แต่การอัปเดตในสิทธิบัตรนี้ดูเหมือนจะเกี่ยวข้องกับการโต้ตอบของผู้ใช้กับเว็บไซต์ ดังที่ฉันได้กล่าวไปแล้ว หนึ่งในนักประดิษฐ์ที่เกี่ยวข้องกับสิทธิบัตรนี้คือ Navneet Panda ซึ่งเป็นที่รู้จักกันดีว่ามีส่วนร่วมในการอัพเดท Panda ที่ Google ไม่น่าแปลกใจเลยที่สิทธิบัตรบอกเราว่าเกี่ยวข้องกับการลดระดับผลการค้นหาสำหรับหน้าเว็บที่มีคุณภาพต่ำ

ฉันดูการอ้างสิทธิ์จากสิทธิบัตรเวอร์ชันใหม่นี้ และรู้สึกประหลาดใจกับการเปลี่ยนแปลงวิธีการทำงาน

สิทธิบัตรมุ่งเน้นไปที่ผลการค้นหาที่ส่งคืนเพื่อตอบสนองต่อข้อความค้นหา โดยกล่าวถึงปัจจัยการปรับเปลี่ยนตามกลุ่มที่อาจส่งผลต่อผลการค้นหาที่ปรากฏสำหรับข้อความค้นหา:

โดยทั่วไป แง่มุมที่เป็นนวัตกรรมใหม่ของหัวข้อที่อธิบายไว้ในข้อกำหนดนี้สามารถรวมไว้ในวิธีการที่รวมถึงการดำเนินการของการรับคำค้นหาจากอุปกรณ์ไคลเอ็นต์ รับข้อมูลที่ระบุแหล่งข้อมูลผลการค้นหาจำนวนมากและคะแนนเริ่มต้นตามลำดับสำหรับแหล่งข้อมูลผลการค้นหาแต่ละรายการ ระบุกลุ่มของทรัพยากรที่เกี่ยวข้องซึ่งแต่ละทรัพยากรของผลการค้นหาเป็นของ; กำหนดปัจจัยการแก้ไขตามกลุ่มตามลำดับสำหรับทรัพยากรแต่ละกลุ่ม และการปรับคะแนนเริ่มต้นสำหรับทรัพยากรผลการค้นหาแต่ละรายการโดยพิจารณาจากปัจจัยการแก้ไขเฉพาะกลุ่มอย่างน้อยบางส่วนสำหรับกลุ่มทรัพยากรที่ทรัพยากรผลการค้นหาอยู่ เพื่อสร้างคะแนนที่สองตามลำดับสำหรับแหล่งข้อมูลผลการค้นหาแต่ละรายการ

กระบวนการเบื้องหลังสิทธิบัตร

กระบวนการที่อธิบายไว้ในสิทธิบัตรเริ่มต้นด้วยการพิจารณาว่าผลลัพธ์ที่เลือกเพื่อตอบคำถามนั้นเป็นการนำทางหรือไม่ หากเป็นเช่นนั้น กระบวนการที่อธิบายไว้ในสิทธิบัตรดูเหมือนจะไม่ได้เพิ่มข้อมูลมากมายเกี่ยวกับไซต์ที่เลือกในผลการค้นหา

สิทธิบัตรบอกเราเกี่ยวกับการคลิกที่ไม่ซ้ำกันและการเยี่ยมชมโดยเจตนา (จากผู้ใช้ที่ไม่เคยคลิกผลการค้นหาจากแหล่งข้อมูลใด ๆ ในกลุ่มใดกลุ่มหนึ่งมาก่อน) และการนับการคลิกซ้ำในกลุ่มทรัพยากรที่เลือกเพื่อสร้าง เศษส่วนคลิกซ้ำสำหรับทรัพยากรที่เลือก

หากมีผู้ทำการค้นหาและเลือกแหล่งข้อมูลเดียวกันตลอดทั้งเซสชันการค้นหามากกว่าหนึ่งเซสชัน (อาจใช้คำต่างกัน) ข้อมูลนั้นจะถูกนับเป็นการคลิกซ้ำ และยิ่งมีการคลิกซ้ำมากเท่าใด สัญญาณของคุณภาพของทรัพยากรนั้นก็จะยิ่งสูงขึ้น – หากมีคนกลับมาที่หน้าเว็บโดยเจตนา (การเข้าชมโดยเจตนา) นั่นเป็นสัญญาณเชิงบวกและรวมกับสัญญาณอื่นๆ เช่น ระยะเวลาที่พวกเขาพำนักอยู่อาจมีอยู่นานเท่าใดก่อนที่พวกเขาจะกลับมาค้นหา

ความสำคัญของระยะเวลาของการเยี่ยมชม

ในขณะที่ระยะเวลาของการเยี่ยมชมผลการค้นหาเป็นสิ่งที่ฉันเห็นโดยนัยว่าเป็นสิ่งที่เครื่องมือค้นหาอาจใช้เป็นสัญญาณเชิงบวก นี่เป็นครั้งแรกที่ฉันได้เห็นมันสะกดอย่างชัดเจนในสิทธิบัตรซึ่ง บอกพวกเรา:

เมตริกระยะเวลาเฉลี่ยสำหรับกลุ่มทรัพยากรเฉพาะอาจเป็นหน่วยวัดทางสถิติที่คำนวณจากชุดข้อมูลการวัดระยะเวลาที่ผ่านไประหว่างเวลาที่ผู้ใช้รายหนึ่งคลิกบนผลการค้นหาซึ่งรวมอยู่ในหน้าเว็บผลการค้นหาที่ระบุ ทรัพยากรในกลุ่มทรัพยากรเฉพาะและเวลาที่ผู้ใช้ให้กลับไปที่หน้าเว็บผลการค้นหา

ตามที่ฉันเขียนเกี่ยวกับ Unraveling Panda Patterns ที่ Moz การบ่งชี้คุณภาพสูงในผลการค้นหาเป็นสัญญาณเชิงบวก และการบ่งชี้ของทรัพยากรคุณภาพต่ำอาจส่งผลให้ทรัพยากรเหล่านั้นถูกลดระดับลงในผลการค้นหา สิทธิบัตรบอกเราถึงประโยชน์ของสิ่งนี้คือ:

ดังนั้น ประสบการณ์ของผู้ใช้สามารถปรับปรุงได้ เนื่องจากผลการค้นหาที่สูงกว่าในลำดับการนำเสนอจะตรงกับความต้องการในการให้ข้อมูลของผู้ใช้มากกว่า

สิทธิบัตรความต่อเนื่องที่อัปเดตคือ:

ผลการค้นหาอันดับ
ผู้ประดิษฐ์: Navneet Panda, Vladimir Ofitserov และ Kaihua Zhu
ผู้รับมอบหมาย: Google
สิทธิบัตรสหรัฐอเมริกา: 9,684,697
ที่ได้รับ: 20 มิถุนายน 2017
ยื่น: 31 ธันวาคม 2012

เชิงนามธรรม

วิธีการ ระบบ และอุปกรณ์ รวมถึงโปรแกรมคอมพิวเตอร์ที่เข้ารหัสบนสื่อบันทึกข้อมูลคอมพิวเตอร์ เพื่อรับคำค้นหาจากอุปกรณ์ไคลเอนต์ รับข้อมูลผลการค้นหาที่ระบุแหล่งที่มาของผลการค้นหาจำนวนมากและคะแนนเริ่มต้นตามลำดับสำหรับแหล่งข้อมูลผลการค้นหาจำนวนมาก ระบุกลุ่มของทรัพยากรที่เกี่ยวข้องซึ่งแต่ละทรัพยากรของผลการค้นหาเป็นของ; กำหนดปัจจัยการแก้ไขตามกลุ่มตามลำดับสำหรับทรัพยากรแต่ละกลุ่ม และการปรับคะแนนเริ่มต้นสำหรับทรัพยากรผลการค้นหาแต่ละรายการโดยพิจารณาจากปัจจัยการแก้ไขเฉพาะกลุ่มอย่างน้อยบางส่วนสำหรับกลุ่มทรัพยากรที่ทรัพยากรผลการค้นหาอยู่ เพื่อสร้างคะแนนที่สองตามลำดับสำหรับแหล่งข้อมูลผลการค้นหาแต่ละรายการ

เวอร์ชันก่อนหน้าของผลการค้นหาการจัดอันดับสิทธิบัตรที่ได้รับในปี 2014 แตกต่างจากเวอร์ชันที่ใหม่กว่านี้ โดยเฉพาะอย่างยิ่งในส่วนการอ้างสิทธิ์ ซึ่งกล่าวถึงการคลิกในรายละเอียดมากขึ้น

Take Away

ตัวแทนของ Google หลายคนบอกเราว่าข้อมูลการเลือกคลิกมีแนวโน้มที่จะส่งเสียงดังและไม่ได้ใช้ในการจัดอันดับผลการค้นหา แต่อาจใช้ในการทดสอบอัลกอริทึมที่ Google ใช้แทน สิทธิบัตรนี้เป็นจริงด้วยหรือไม่? ดูเหมือนว่าจะเป็นส่วนสำคัญของกระบวนการที่อธิบายไว้ในสิทธิบัตร และคุ้มค่าที่จะใช้เวลาคิดทบทวน สิทธิบัตรชี้ไปที่การคลิกจากผู้ค้นหาที่เข้าสู่ระบบและมาพร้อมกับคุกกี้หรือรหัสอุปกรณ์ เชื่อถือได้แค่ไหน?

แต่ที่สำคัญกว่านั้น: (1) ให้เหตุผลแก่ผู้คนในการมาที่เว็บไซต์ของคุณสำหรับสิ่งที่คุณสนใจเพื่อจัดอันดับและ
(2) ให้เหตุผลแก่ผู้คนในการใช้เวลาบนเพจของคุณ เมื่อพวกเขามาเยี่ยมคุณ