อัปเดตเอนทิตีการจัดกลุ่มใน Google SERPs

เผยแพร่แล้ว: 2022-01-13

สิทธิบัตรของหน่วยงานจัดกลุ่มได้รับการปรับปรุง

การจัดกลุ่มเอนทิตี

หนึ่งในบล็อกโพสต์ล่าสุดของฉันเกี่ยวกับ Google การจัดกลุ่มผลการค้นหาข่าวตามหัวข้อในผลการค้นหาทั่วไป Google ได้จัดกลุ่มข้อมูลเกี่ยวกับเอนทิตีในผลการค้นหาเช่นกัน หากตอนนี้คุณค้นหาคนที่แสดงร่วมกับ Humprey Bogart ใน Casablanca คุณสามารถดูนักแสดงคนอื่นๆ ในภาพยนตร์นั้นได้ในผลการค้นหาเหล่านั้น คุณยังสามารถดูคำถามที่เกี่ยวข้องซึ่งรวมถึงนักแสดงและภาพยนตร์ (และอภิปรัชญาเกี่ยวกับหมวดหมู่ที่เกี่ยวข้องสำหรับภาพยนตร์) โพสต์ใหม่นี้เกี่ยวกับการจัดกลุ่มเอนทิตีและการเปลี่ยนแปลงวิธีที่ Google แสดงผลการค้นหาที่เกี่ยวข้องกับการจัดกลุ่มเอนทิตี

ต่อไปนี้คือตัวอย่างผลการค้นหาที่แสดงความเชื่อมโยงระหว่างนักแสดงกับภาพยนตร์คาซาบลังกา:

การทำคลัสเตอร์เอนทิตี - คาซาบลังกา

Google มีสิทธิบัตรต่อเนื่องตั้งแต่วันที่ 3 มกราคม 2022 ฉันได้เขียนเกี่ยวกับสิทธิบัตรรุ่นก่อนหน้าในปี 2019 ในโพสต์ Entity Clustering ในผลการค้นหาของ Google

การเรียกร้องจากสิทธิบัตรครั้งแรก

เนื่องจากสิทธิบัตรใหม่นี้เป็นสิทธิบัตรต่อเนื่อง สิทธิบัตรส่วนใหญ่จึงเหมือนกัน สิทธิบัตรมีการอ้างสิทธิ์ที่ได้รับการปรับปรุง การอ้างสิทธิ์ครั้งแรกจากสิทธิบัตร Clustering Search Results เวอร์ชัน 2019 อ่านดังนี้:

1. วิธีการประกอบด้วย: กำหนดรายการที่ตอบสนองต่อแบบสอบถาม; การสร้างคลัสเตอร์ระดับแรกของรายการ แต่ละคลัสเตอร์เป็นตัวแทนของเอนทิตีในฐานความรู้และรวมถึงรายการที่แมปกับเอนทิตี การคำนวณคะแนนคลัสเตอร์ตามลำดับสำหรับแต่ละคลัสเตอร์ระดับแรก โดยคะแนนคลัสเตอร์ตามลำดับสำหรับคลัสเตอร์ระดับแรกจะขึ้นอยู่กับ คะแนนเงาตามลำดับที่วัดการเชื่อมโยงกันและการแยกคลัสเตอร์ระดับแรก และอัตราส่วนเงาแทนเปอร์เซ็นต์ของ คลัสเตอร์ระดับแรกทั้งหมดมีคะแนนเงาตามลำดับเหนือเกณฑ์ การผสานคลัสเตอร์ระดับแรกตามความสัมพันธ์ออนโทโลจีเอนทิตีและคะแนนคลัสเตอร์ตามลำดับที่คำนวณสำหรับคลัสเตอร์ที่ผสาน โดยที่คะแนนคลัสเตอร์ตามลำดับของคลัสเตอร์ที่ผสานแสดงถึงคะแนนที่ดีกว่าคะแนนคลัสเตอร์ตามลำดับสำหรับคลัสเตอร์ระดับแรกที่รวมอยู่ในคลัสเตอร์ที่ผสาน ; การใช้คลัสเตอร์แบบลำดับชั้นกับคลัสเตอร์ที่ผสาน สร้างคลัสเตอร์สุดท้ายที่เพิ่มคะแนนคลัสเตอร์ตามลำดับสูงสุดสำหรับคลัสเตอร์แบบลำดับชั้น และการจัดเตรียมรายการที่ตอบสนองต่อการสืบค้นเพื่อแสดงตามคลัสเตอร์สุดท้าย

ข้อเรียกร้องจากสิทธิบัตรฉบับปรับปรุง

ในรายละเอียด โพสต์ที่ฉันเขียนในปี 2019 อธิบายถึงกระบวนการเบื้องหลังสิทธิบัตรของคลัสเตอร์ ตอนนี้ สิทธิบัตรเวอร์ชันใหม่ตั้งแต่วันแรกของปี 2022 มีภาษาใหม่ที่บอกเราว่าสิทธิบัตรมีไว้ทำอะไร การอ้างสิทธิ์ชุดแรกในปี 2542 บอกเราเกี่ยวกับ "คะแนนเงา" ซึ่งไม่ได้อยู่ในการอ้างสิทธิ์ใหม่ การอ้างสิทธิ์ปี 2022 มีข้อกำหนดบางคำที่ไม่ได้อยู่ในเวอร์ชัน 2019:

1. วิธีการที่ดำเนินการโดยเครื่องมือค้นหาที่ประกอบด้วย: การกำหนดชุดของรายการที่ตอบสนองต่อแบบสอบถาม; สำหรับแต่ละรายการของชุดของรายการที่กำหนดให้ตอบสนองต่อการสืบค้นข้อมูล: การระบุเอนทิตีที่เกี่ยวข้องกับรายการหนึ่งรายการขึ้นไป และการได้รับการฝังสำหรับรายการนั้น การสร้างคลัสเตอร์ระดับแรกจากชุดของรายการ โดยแต่ละคลัสเตอร์เป็นตัวแทนของเอนทิตีของเอนทิตีตั้งแต่หนึ่งรายการขึ้นไป การสร้างคลัสเตอร์ขั้นสุดท้ายโดยการรวมคลัสเตอร์ระดับแรกตามความสัมพันธ์ออนโทโลจีของเอนทิตีและความคล้ายคลึงในการฝังที่กำหนดโดยใช้การฝังรายการ ที่ซึ่งความสัมพันธ์ออนโทโลจีของเอนทิตีรวมถึงไฮเปอร์นิม คำพ้องความหมาย และไฮเปอร์นิมร่วม และการจัดเตรียมรายการจากชุดของรายการที่ตอบสนองต่อการสืบค้นเพื่อแสดงตามคลัสเตอร์สุดท้าย

2. วิธีการอ้างสิทธิ์ 1 ซึ่งคลัสเตอร์ระดับแรกที่มีขนาดเล็กกว่าจะถูกรวมก่อน

3. วิธีการอ้างสิทธิ์ 2 ซึ่งการรวมคลัสเตอร์ระดับแรกที่มีขนาดเล็กกว่านั้นรวมถึงสำหรับคลัสเตอร์ระดับแรกกลุ่มแรก: การกำหนดคลัสเตอร์ระดับแรกที่สองและคลัสเตอร์ระดับที่หนึ่งที่สามที่เกี่ยวข้องกับคลัสเตอร์ระดับแรกกลุ่มแรก ขึ้นอยู่กับความสัมพันธ์ ontology นิติบุคคล ; กำหนดว่าคลัสเตอร์ระดับแรกที่สามและคลัสเตอร์ระดับแรกแรกมีขนาดเล็กกว่าคลัสเตอร์ระดับแรกที่สอง และการรวมคลัสเตอร์ระดับแรกกลุ่มแรกกับคลัสเตอร์ระดับที่หนึ่งที่สาม

4. วิธีการอ้างสิทธิ์ 1 ซึ่งรวมคลัสเตอร์ระดับแรกที่คล้ายคลึงกันมากที่สุดก่อน

5. วิธีการของข้อถือสิทธิที่ 4 ซึ่งการรวมคลัสเตอร์แรกที่มีความคล้ายคลึงกันมากที่สุดก่อนนั้นรวมถึง สำหรับคลัสเตอร์ระดับแรกกลุ่มแรก: การกำหนดคลัสเตอร์ระดับที่หนึ่งที่สอง และคลัสเตอร์ระดับที่หนึ่งที่สามที่เกี่ยวข้องกับคลัสเตอร์ระดับแรกกลุ่มแรกใน เอนทิตีความสัมพันธ์ออนโทโลยี; การพิจารณาว่าคลัสเตอร์ระดับแรกกลุ่มแรกคล้ายกับคลัสเตอร์ระดับแรกที่สองมากกว่าคลัสเตอร์ระดับแรกที่สาม และการรวมคลัสเตอร์ระดับแรกกลุ่มแรกกับคลัสเตอร์ระดับแรกที่สอง

เวอร์ชันที่ใหม่กว่าบอกเราว่ามี "ความสัมพันธ์แบบออนโทโลยี" ซึ่งการอ้างสิทธิ์ชุดแรกไม่มี ดังนั้นเราจึงทราบจาก SERP ว่าโบการ์ตอยู่ในภาพยนตร์เรื่อง "Casablanca" เช่นเดียวกับนักแสดงคนอื่นๆ ที่ให้ความสนใจกับผลการค้นหานั้น

การจัดกลุ่มผลการค้นหา
นักประดิษฐ์: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning และ Ed Huai-Hsin Chi
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา: 11,216,503
ได้รับ: 4 มกราคม 2022
ยื่น: 26 พฤศจิกายน 2019

เชิงนามธรรม

การใช้งานให้ระบบที่ได้รับการปรับปรุงสำหรับการนำเสนอผลการค้นหาตามการเชื่อมโยงเอนทิตีของรายการค้นหา วิธีการตัวอย่างรวมถึงการสร้างคลัสเตอร์ระดับแรกของรายการที่ตอบสนองต่อการสืบค้น แต่ละคลัสเตอร์เป็นตัวแทนของเอนทิตีในฐานความรู้ และรวมถึงรายการที่แมปกับเอนทิตี การผสานคลัสเตอร์ระดับแรกตามความสัมพันธ์ออนโทโลจีของเอนทิตี การใช้คลัสเตอร์แบบลำดับชั้นกับ รวมคลัสเตอร์ สร้างคลัสเตอร์สุดท้าย และเริ่มต้นแสดงรายการตามคลัสเตอร์สุดท้าย ตัวอย่างอีกวิธีหนึ่งรวมถึงการสร้างคลัสเตอร์ระดับแรกจากรายการที่ตอบสนองต่อการสืบค้น แต่ละคลัสเตอร์เป็นตัวแทนของเอนทิตีในฐานความรู้ และรวมถึงรายการที่แมปกับเอนทิตี การสร้างคลัสเตอร์ขั้นสุดท้ายโดยการรวมคลัสเตอร์ระดับแรกตาม ontology เอนทิตีและ พื้นที่ฝังตัวที่สร้างขึ้นจากแบบจำลองการฝังที่ใช้การแมป และการเริ่มต้นแสดงรายการที่ตอบสนองต่อการสืบค้นตามคลัสเตอร์สุดท้าย

หากคุณย้อนกลับไปที่บทความต้นฉบับของฉันเกี่ยวกับสิทธิบัตรการจัดกลุ่มเอนทิตีในปี 2019 คุณจะเห็นว่าฉันพูดถึง "ontology" หลายครั้งเมื่อเขียนเกี่ยวกับเอนทิตี สิทธิบัตรเอนทิตีการจัดกลุ่มรุ่น 2022 เพิ่มภาษานั้นโดยตรงในการอ้างสิทธิ์ พวกเขาอยู่ใน SERP โดยไม่พูดถึงความสัมพันธ์ระหว่างภาพยนตร์กับนักแสดง

การจัดกลุ่มเอนทิตีและข่าวสาร

หลังจากการเปลี่ยนแปลงนี้ เมื่อเราค้นหาเอนทิตีและข่าวสารที่เฉพาะเจาะจง เราจะเห็นผลการค้นหาแบบกลุ่มในนั้นด้วย:

ข่าวกิจการคลัสเตอร์

ดังนั้น Google จึงไม่จัดเรียง SERP ตามความเหมาะสมของเอกสารการจับคู่สำหรับคำค้นหาอีกต่อไป – Google กำลังจัดกลุ่มหัวข้อและความสัมพันธ์ระหว่างหน่วยงานต่างๆ ซึ่งเป็นส่วนหนึ่งของการตัดสินใจว่าจะรวมสิ่งใดในผลการค้นหา

ค้นหาข่าวตรงไปยังกล่องจดหมายของคุณ

ช่องนี้มีไว้เพื่อวัตถุประสงค์ในการตรวจสอบและไม่ควรเปลี่ยนแปลง

*ที่จำเป็น