คะแนนเอนทิตีที่เกี่ยวข้องในการค้นหาตามความรู้

เผยแพร่แล้ว: 2018-02-12

“เสิร์ชเอ็นจิ้นที่สมบูรณ์แบบจะเข้าใจว่าคุณหมายถึงอะไรและให้อะไรกลับมาอย่างแน่นอน
คุณต้องการ." แลร์รี่ เพจ การค้นหาทำงานอย่างไร

การใช้ฐานความรู้เพื่อตอบคำถามเกี่ยวกับหน่วยงาน

เมื่อสามปีที่แล้ว ฉันเขียน How Knowledge Base Entities can be used in Searches เกี่ยวกับวิธีค้นหาโดยใช้คำค้นหา เช่น “หนังเรื่องไหนที่ Robert Duvall เล่นเป็นตัวละครที่บอกว่าเขาชอบกลิ่น Napalm ในตอนเช้ามากแค่ไหน ” การค้นหาภาพยนตร์ที่นักแสดงที่มีชื่อเสียงกล่าวว่าบทที่รู้จักกันดีเป็นตัวอย่างของ Google โดยใช้ข้อเท็จจริงที่อาจเรียนรู้จากฐานความรู้เพื่อให้สามารถตอบคำถามได้ ไม่ตอบด้วยตัวอย่างข้อมูลแนะนำ แต่จะแสดงวิดีโอสองสามวิดีโอตามด้วยเอกสารอื่นๆ ที่ตอบคำถามนั้นด้วย

สิทธิบัตรที่ Google มอบให้เมื่อเดือนที่แล้วยังพิจารณาข้อมูลจากกราฟความรู้ที่อาจได้เรียนรู้จากฐานความรู้เพื่อตอบคำถาม ไม่ใช่ตัวอย่างข้อมูลแนะนำ แต่เป็นผลการค้นหาที่เรียนรู้เกี่ยวกับเอนทิตีในคิวรีและคุณสมบัติที่เกี่ยวข้อง นี่คือการค้นหาเชิงความหมายที่นอกเหนือไปจากการทำความเข้าใจคำพ้องความหมายและคำที่เกี่ยวข้องเชิงความหมาย ไปจนถึงการรู้คุณสมบัติบางอย่างเกี่ยวกับสิ่งต่าง ๆ ที่เกี่ยวข้องกับการค้นหา (โปรดจำไว้ว่า Google Knowledge Graph นั้นเกี่ยวกับ "สิ่งของ ไม่ใช่สตริง" ดังนั้นจึงเป็นมากกว่าแค่การจับคู่คำหลัก จากคิวรีไปจนถึงคีย์เวิร์ดเดียวกัน (หรือที่เกี่ยวข้อง) ในเอกสาร ซึ่งจะแนะนำแนวคิดของคะแนนเอนทิตีที่เกี่ยวข้องด้วย

กราฟความรู้รวบรวมข้อมูลเอนทิตีเพื่อตอบคำถาม

ใช่ กราฟความรู้เป็นเหมือนสารานุกรม แต่นั่นไม่ใช่เหตุผลที่มีอยู่ พยายามเรียนรู้เกี่ยวกับเอนทิตีเพื่อช่วยในการตอบคำถามเกี่ยวกับพวกเขาในผลการค้นหา

สิทธิบัตรใหม่นี้บอกเราว่าอาจใช้ข้อมูลเกี่ยวกับหน่วยงานเฉพาะเพื่อตอบคำถาม:

ในการใช้งานบางอย่าง วิธีการที่ใช้คอมพิวเตอร์ประกอบด้วยการระบุในกราฟความรู้ โดยใช้ตัวประมวลผลอย่างน้อยหนึ่งตัว อย่างน้อยหนึ่งรายการ และหน่วยงานที่เกี่ยวข้องที่เกี่ยวข้องกับเอนทิตีอย่างน้อยหนึ่งรายการตามคุณสมบัติที่เกี่ยวข้อง วิธีการที่ใช้คอมพิวเตอร์ประกอบด้วย สำหรับแต่ละเอนทิตีที่เกี่ยวข้อง กำหนดโดยใช้ตัวประมวลผลอย่างน้อยหนึ่งคะแนน คะแนนเอนทิตีที่เกี่ยวข้องกับคุณสมบัติที่เกี่ยวข้องซึ่งเกี่ยวข้องกับเอนทิตีอย่างน้อยหนึ่งรายการและเอนทิตีที่เกี่ยวข้องอย่างใดอย่างหนึ่ง วิธีการที่ใช้คอมพิวเตอร์ประกอบด้วยการสร้างคะแนนคุณสมบัติโดยใช้ตัวประมวลผลอย่างน้อยหนึ่งตัวตามคะแนนเอนทิตีที่เกี่ยวข้องที่เกี่ยวข้องกับคุณสมบัตินั้น ๆ วิธีการที่ใช้คอมพิวเตอร์ประกอบด้วยการสร้าง โดยใช้ตัวประมวลผลอย่างน้อยหนึ่งตัว และทำให้เกิดการจัดเก็บโครงสร้างข้อมูลของคุณสมบัติที่จัดเรียงได้ตามคะแนนคุณสมบัติที่สร้างขึ้น ซึ่งโครงสร้างข้อมูลจะใช้เพื่อให้ผลการค้นหาที่เรียงลำดับตามการสืบค้น

หากคุณถามคำถาม Google เช่น "George Washington a Surveyor อยู่ที่ไหน" เสิร์ชเอ็นจิ้นให้ผลการค้นหาซึ่งมีรายละเอียดว่าเขาทำหน้าที่เป็นนักสำรวจวัยรุ่นก่อนเข้ารับราชการทหาร

เมืองหนึ่งชื่อวอชิงตัน เวอร์จิเนีย (ซึ่งเรียกตัวเองว่าวอชิงตันแห่งแรก) เป็นการระลึกถึงเด็กอายุ 17 ปีที่สำรวจพื้นที่โดยรอบในช่วงอายุยังน้อย

คะแนนเอนทิตีที่เกี่ยวข้อง

กระบวนการของสิทธิบัตรนี้ทำงานอย่างไร? นี่คือวิธีการทำงานของกราฟความรู้ในการช่วยส่งกลับผลการค้นหา โดยใช้คะแนนเอนทิตีที่เกี่ยวข้อง:

ในการใช้งานบางอย่าง ระบบประกอบด้วยโครงสร้างข้อมูลที่ประกอบด้วยกราฟความรู้และตัวประมวลผลอย่างน้อยหนึ่งตัว ตัวประมวลผลอย่างน้อยหนึ่งตัวได้รับการกำหนดค่าให้ดำเนินการที่ประกอบด้วยการระบุในกราฟความรู้อย่างน้อยหนึ่งเอนทิตีและเอนทิตีที่เกี่ยวข้องที่เกี่ยวข้องกับเอนทิตีอย่างน้อยหนึ่งรายการตามคุณสมบัติที่เกี่ยวข้อง ตัวประมวลผลตั้งแต่หนึ่งตัวขึ้นไปได้รับการกำหนดค่าให้ดำเนินการซึ่งประกอบด้วยสำหรับเอนทิตีที่เกี่ยวข้องแต่ละรายการ โดยกำหนดคะแนนเอนทิตีที่เกี่ยวข้องกับคุณสมบัติที่เกี่ยวข้องซึ่งเกี่ยวข้องกับเอนทิตีอย่างน้อยหนึ่งรายการและเอนทิตีที่เกี่ยวข้องอย่างใดอย่างหนึ่ง ตัวประมวลผลตั้งแต่หนึ่งตัวขึ้นไปได้รับการกำหนดค่าให้ดำเนินการที่ประกอบด้วยคุณสมบัติแต่ละรายการ โดยสร้างคะแนนคุณสมบัติตามคะแนนเอนทิตีที่เกี่ยวข้องซึ่งเชื่อมโยงกับคุณสมบัตินั้น ๆ ตัวประมวลผลตั้งแต่หนึ่งตัวขึ้นไปได้รับการกำหนดค่าให้ดำเนินการที่ประกอบด้วยการสร้างและทำให้มีการจัดเก็บโครงสร้างข้อมูลของคุณสมบัติที่เรียงลำดับได้ตามคะแนนคุณสมบัติที่สร้างขึ้น ซึ่งโครงสร้างข้อมูลจะใช้เพื่อให้ผลการค้นหาที่เรียงลำดับตามการสืบค้น

สิทธิบัตรที่ได้รับใหม่คือ

ให้ผลการค้นหาตามคุณสมบัติที่จัดเรียง
ผู้ประดิษฐ์: Yiming Li และ Zhenyu Gu
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา 9,875,320
ได้รับ: 23 มกราคม 2018
ยื่น: 8 กุมภาพันธ์ 2016

เชิงนามธรรม

เอนทิตีอาจเกี่ยวข้องกับเอนทิตีที่เกี่ยวข้องหลายรายการตามคุณสมบัติตั้งแต่หนึ่งรายการขึ้นไป และเอนทิตีอาจเกี่ยวข้องกับเอนทิตีหนึ่งประเภทขึ้นไป ระบบสำหรับให้ผลลัพธ์ที่เรียงลำดับอาจรวมถึงการระบุเอนทิตี เอนทิตีที่เกี่ยวข้อง และประเภท นอกจากนี้ ระบบอาจกำหนดคะแนนเอนทิตีที่เกี่ยวข้องสำหรับแต่ละเอนทิตีที่เกี่ยวข้อง สัมพันธ์กับเอนทิตี สำหรับแต่ละคุณสมบัติ คะแนนเอนทิตีที่เกี่ยวข้องของเอนทิตีที่เกี่ยวข้องกับเอนทิตีโดยคุณสมบัตินั้นจะถูกรวมเข้าด้วยกันเพื่อสร้างคะแนนคุณสมบัติ คุณสมบัติจะถูกจัดเรียงตามคะแนนคุณสมบัติของพวกเขา การเรียงลำดับอาจเกิดขึ้นสำหรับคุณสมบัติที่เกี่ยวข้องกับประเภทเอนทิตี และผลการค้นหาที่เรียงลำดับแล้วอาจถูกจัดเตรียมเป็นเอาต์พุตสำหรับประเภทเอนทิตีที่สนใจตั้งแต่หนึ่งประเภทขึ้นไป

ผลการค้นหาและตัวอย่างข้อมูลแนะนำ

เราได้เห็นคำตอบสำหรับข้อความค้นหาบางรายการที่มีทั้งผลการค้นหาและตัวอย่างข้อมูลเด่นตามที่ฉันได้เขียนไว้ในโพสต์ Google จะแต่งงานกับฐานความรู้ของพวกเขากับเครื่องมือค้นหาหรือไม่ Google ไม่ได้แสดงความต้องการมากเกินไปสำหรับการตอบคำถามด้วยผลการค้นหาหรือตัวอย่างข้อมูลแนะนำหรือข้อมูลเพิ่มเติม

บางครั้งคำตอบสำหรับคำถามเกี่ยวกับภาพยนตร์อาจดูเหมาะสมมาก ฉันชอบเวลาที่มีคำถามเกี่ยวกับภูมิศาสตร์ เช่น เมืองหลวงของ XXXX คืออะไร? แสดงแผนที่ในตัวอย่างข้อมูลเด่น เนื่องจากตำแหน่งของเมืองหลวงอาจเป็นข้อมูลที่เป็นประโยชน์

ไม่มีฐานความรู้เฉพาะเจาะจงเกี่ยวกับวิธีการที่ Google ใช้กราฟความรู้เพื่อตอบคำถามเกี่ยวกับเอนทิตี

ยังไม่มีฐานความรู้ที่บอกเราว่า Google ใช้กราฟความรู้อย่างไร ที่ใกล้เคียงที่สุดที่เรามีคือสิทธิบัตรแบบนี้ ซึ่งมีข้อมูลจำนวนมากอยู่ภายในนั้น ส่วนนี้เต็มไปด้วยแนวคิดและคำแนะนำว่า Google อาจปฏิบัติต่อข้อมูลเกี่ยวกับคุณสมบัติอย่างไร:

เอนทิตีหนึ่งๆ อาจเชื่อมโยงกับหลายประเภท และอาจเกี่ยวข้องกับเอนทิตีอื่นๆ หลายรายการด้วยคุณสมบัติตั้งแต่หนึ่งรายการขึ้นไป ตามที่ใช้ในที่นี้ เอนทิตีเป็นสิ่งหรือแนวคิดที่เป็นเอกพจน์ ไม่ซ้ำกัน มีคำจำกัดความชัดเจน และแยกแยะได้ ตัวอย่างเช่น ตัวตนอาจเป็นบุคคล สถานที่ รายการ ความคิด หัวข้อ แนวคิดเชิงนามธรรม องค์ประกอบที่เป็นรูปธรรม สิ่งที่เหมาะสมอื่นๆ หรือการรวมกันของสิ่งนั้น ในการใช้งานบางอย่าง ผลการค้นหาจะรวมผลลัพธ์ในการระบุการอ้างอิงเอนทิตี ตามที่ใช้ในที่นี้ การอ้างอิงเอนทิตีเป็นตัวระบุ เช่น ข้อความ หรือข้อมูลอื่นๆ ที่อ้างถึงเอนทิตี ตัวอย่างเช่น เอนทิตีอาจเป็นรูปลักษณ์ทางกายภาพของจอร์จ วอชิงตัน ในขณะที่การอ้างอิงเอนทิตีเป็นแนวคิดเชิงนามธรรมที่อ้างถึงจอร์จ วอชิงตัน ตามความเหมาะสม ตามบริบท จะเข้าใจว่าคำว่าเอนทิตีที่ใช้ในที่นี้อาจสอดคล้องกับการอ้างอิงเอนทิตี และคำว่าการอ้างอิงเอนทิตีที่ใช้ในที่นี้อาจสอดคล้องกับเอนทิตี ในการใช้งานบางอย่าง ระบบการค้นหาอาจระบุประเภทเอนทิตีที่เกี่ยวข้องกับการอ้างอิงเอนทิตี ประเภทเอนทิตีอาจเป็นการจัดหมวดหมู่หรือการจัดประเภทที่ใช้ในการระบุการอ้างอิงเอนทิตีในโครงสร้างข้อมูล ตัวอย่างเช่น การอ้างอิงเอนทิตี "จอร์จ วอชิงตัน" อาจเกี่ยวข้องกับเอนทิตีประเภท "ประธานาธิบดีสหรัฐฯ" "บุคคล" และ "เจ้าหน้าที่ทหาร" คุณสมบัติ อธิบายความสัมพันธ์ระหว่างเอนทิตี กล่าวคือ เอนทิตีหนึ่งเกี่ยวข้องกับเอนทิตีอื่นอย่างไร คุณสมบัติที่สำคัญที่สุดที่เกี่ยวข้องกับเอนทิตีอาจขึ้นอยู่กับประเภทที่น่าสนใจ ตัวอย่างเช่น สำหรับรายการ "Tom Hanks" ผู้ใช้อาจต้องการให้ผลการค้นหารวมภาพยนตร์ของเขาหรือข้อมูลอื่นๆ เกี่ยวกับการแสดงของเขา อย่างไรก็ตาม สำหรับเอนทิตี "Albert Einstein" ผู้ใช้อาจต้องการให้ผลการค้นหารวมทฤษฎี เอกสารทางเทคนิค และข้อมูลอื่นๆ ที่เกี่ยวข้องกับการมีส่วนร่วมของเขาในวิชาฟิสิกส์ เทคนิคที่เปิดเผยอาจใช้เพื่อกำหนดคุณลักษณะที่สำคัญ และตามด้วยให้ผลการค้นหาที่ผู้ใช้น่าจะต้องการ

ต้องการทราบข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับวิธีการใช้ฐานความรู้ในการค้นหาเชิงความหมายหรือไม่ มันอาจจะคุ้มค่าสำหรับคุณที่จะอ่านสิทธิบัตรนี้ โปรดทราบว่า Google ถือว่าไซต์จำนวนมากเป็นฐานความรู้ที่เป็นประโยชน์ซึ่งนอกเหนือไปจาก Wikipedia และ Wikidata อาจมองว่าแหล่งข้อมูลเช่น IMDB และ Yahoo Finance เป็นข้อมูลที่เป็นประโยชน์เกี่ยวกับข้อเท็จจริง

เพื่อแสดงสิทธิบัตรนี้ ฉันตัดสินใจแสดงให้จอร์จ วอชิงตันเป็นนักสำรวจ น้อยคนนักที่จะรู้ว่าเขาทำแบบนั้นตอนวัยรุ่น! อาจเป็นไปได้ว่าตำแหน่งนี้มีบทบาทสำคัญในตำแหน่งที่เขาดำรงตำแหน่งในภายหลัง เช่น ผู้บัญชาการทหารและนักการเมือง ข้อความต่อไปนี้จากสิทธิบัตรเกี่ยวกับประเภทเอนทิตีและความเข้าใจข้อมูลภายในกราฟส่งผลต่อภาพประกอบที่ฉันเลือก:

โหนดที่แสดงข้อมูลองค์กรอาจรวมอยู่ในกราฟความรู้ สิ่งเหล่านี้อาจถูกอ้างถึงในที่นี้เป็นโหนดประเภทเอนทิตี ตามที่ใช้ในที่นี้ โหนดประเภทเอนทิตีอาจอ้างถึงโหนดในกราฟความรู้ ในขณะที่ประเภทเอนทิตีอาจอ้างถึงแนวคิดที่แสดงโดยโหนดประเภทเอนทิตี ประเภทเอนทิตีอาจเป็นลักษณะการกำหนดของเอนทิตี ตัวอย่างเช่น โหนดประเภทเอนทิตี Y อาจเชื่อมต่อกับโหนดเอนทิตี X โดยขอบหรือลิงก์ "เป็น A" ซึ่งอธิบายเพิ่มเติมด้านล่าง เพื่อให้กราฟแสดงข้อมูล "เอนทิตี X คือประเภท Y" ตัวอย่างเช่น โหนดเอนทิตี "George Washington" อาจเชื่อมต่อกับโหนดประเภทเอนทิตี "President" โหนดเอนทิตีอาจเชื่อมต่อกับโหนดประเภทเอนทิตีหลายโหนด ตัวอย่างเช่น “จอร์จ วอชิงตัน” อาจเชื่อมต่อกับโหนดประเภทเอนทิตี “บุคคล” และโหนดประเภทเอนทิตี “ผู้บัญชาการทหาร”

ฉันแนะนำให้อ่านสิทธิบัตรนี้และพยายามทำความเข้าใจ อาจช่วยเชื่อมโยงว่าเสิร์ชเอ็นจิ้นสามารถรวบรวมและส่งคืนเคียวรีเกี่ยวกับคุณสมบัติและแง่มุมต่างๆ ได้อย่างไร นี่เป็นการค้นหาตามความหมายมากขึ้น โดยพิจารณาข้อมูลเกี่ยวกับสิ่งต่าง ๆ และวิธีที่สิ่งเหล่านี้อาจเกี่ยวข้องกัน ไม่เกี่ยวกับการจับคู่สตริงข้อความจากการสืบค้นไปยังเอกสาร แทนที่จะเน้นที่การรู้เกี่ยวกับเอนทิตี ประเภท คุณสมบัติของเอนทิตี และความเกี่ยวข้องกับเอนทิตีอื่นๆ

ฉันอยากดูหนังเกี่ยวกับเด็กหนุ่มชาววอชิงตันที่สำรวจหุบเขาเวอร์จิเนีย ฉันถามใน Google ว่า "มีภาพยนตร์เกี่ยวกับ George Washington ในฐานะนักสำรวจหรือไม่" ปรากฏว่าภาพยนตร์แอนิเมชั่นเริ่มต้นโดยครอบคลุมสมัยนั้น: นายพลจอร์จวอชิงตัน

เราจะใช้คะแนนเอนทิตีที่เกี่ยวข้องและคะแนนคุณสมบัติเมื่อเราสร้างเนื้อหาในอนาคตหรือไม่

คะแนนเอนทิตีที่เกี่ยวข้องและคะแนนทรัพย์สินจะเป็นสิ่งที่สำคัญที่จะต้องพิจารณาในอนาคตหรือไม่? สิทธิบัตรให้คำแนะนำว่าเสิร์ชเอ็นจิ้นอาจใช้สิ่งเหล่านี้อย่างไร:

ขั้นตอนที่ 606 รวมตัวประมวลผลอย่างน้อยหนึ่งตัวที่สร้างคะแนนคุณสมบัติสำหรับแต่ละคุณสมบัติตามคะแนนเอนทิตีที่เกี่ยวข้องกับคุณสมบัติ คะแนนเอนทิตีที่เกี่ยวข้องที่เกี่ยวข้องกับทรัพย์สินแต่ละแห่งอาจนำมารวมกันสำหรับคุณสมบัตินั้น ตัวอย่างเช่น อ้างอิงรูปที่ 4 คะแนนเอนทิตีที่เกี่ยวข้องสำหรับเอนทิตีที่เกี่ยวข้อง "Forrest Gump" "Big" และ "Saving Private Ryan" อาจนำมารวมกันเพื่อให้ผลรวมของทรัพย์สิน "Movies act in" เช่น 0.8+0.8+0.8=2.4 ในตัวอย่างเพิ่มเติม คะแนนเอนทิตีที่เกี่ยวข้องอาจรวมกันเป็นผลรวมถ่วงน้ำหนัก อาจใช้คะแนนเอนทิตีที่เกี่ยวข้องร่วมกันเพื่อสร้างคะแนนคุณสมบัติ ในการใช้งานบางประเภท อย่างน้อยหนึ่งประเภทอาจเป็นประเภทย่อยของประเภทเอนทิตีอื่น ตัวอย่างเช่น การอ้างอิงโครงสร้างข้อมูล 550 ของรูปที่ 5 ประเภท "นักแสดง" อาจเป็นประเภทย่อยของประเภทเอนทิตี "บุคคล" ซึ่งอาจเรียกว่าประเภทหลักที่สัมพันธ์กับประเภทย่อย ในการใช้งานบางประเภท สำหรับประเภทหลัก คะแนนคุณสมบัติสำหรับแต่ละคุณสมบัติของแต่ละประเภทย่อยอาจรวมด้วยคุณสมบัติเดียวกันของประเภทหลัก ตัวอย่างเช่น การอ้างอิงโครงสร้างข้อมูล 550 ของรูปที่ 5 คุณสมบัติ "ภาพยนตร์ที่ดำเนินการ" จะรวมอยู่ในประเภท "นักแสดง" และ "บุคคล" และด้วยเหตุนี้ คะแนนคุณสมบัติ 9.0 สำหรับประเภทนิติบุคคล "นักแสดง" อาจรวมเข้ากับคะแนนคุณสมบัติ 1.0 สำหรับประเภทนิติบุคคล "บุคคล" ” โปรเซสเซอร์หนึ่งตัวขึ้นไปอาจสร้างมาตรฐานใหม่ ปรับขนาด น้ำหนัก หรือเปลี่ยนแปลงคะแนนภายในประเภทหลักหลังจากรวมประเภทย่อยเข้าด้วยกัน

นั่นอาจทำให้รู้สึกดีขึ้นเล็กน้อยหลังจากอ่านข้อความนี้ Google ใช้กราฟความรู้เพื่อตอบคำค้นหาพร้อมผลการค้นหามาอย่างน้อย 3 ปี พวกเขากำลังซับซ้อนมากขึ้นเกี่ยวกับเรื่องนี้ด้วย มีแนวโน้มว่าจะพัฒนาต่อไปในขณะที่ Google ทดลองสิ่งใหม่ๆ และทดลองมากขึ้นว่าจะแสดงผลการค้นหาอย่างไร