โพสต์ที่ห้าของฉันเกี่ยวกับบริบทที่ Google: การเพิ่มข้อเท็จจริงบริบทในการตอบคำถาม (อัปเดต)

เผยแพร่แล้ว: 2018-04-03

ข้อมูลบริบทบอกเราว่าเอนทิตีเกี่ยวข้องกันอย่างไร

ประธานาธิบดีสหรัฐที่สูงที่สุด

Google ให้ตัวอย่างวิธีที่ไซต์สามารถใช้ข้อมูลบริบทในสิทธิบัตรใหม่ที่บอกเราเกี่ยวกับข้อเท็จจริงบริบท

โพสต์นี้เกี่ยวกับการใส่ข้อเท็จจริงลงในบริบท และฉันรู้สึกว่าต้องชี้ให้เห็นโพสต์อื่นๆ ที่ฉันได้เขียนเกี่ยวกับบริบทที่ Google เมื่อฉันเริ่มโพสต์นี้ การทำความเข้าใจบริบทเป็นสิ่งสำคัญ การรู้ว่ามีสิทธิบัตรอื่นๆ จาก Google ที่ถือว่าบริบทมีความสำคัญจริงๆ จะเพิ่มความหมายให้กับโพสต์นี้ โพสต์ก่อนหน้านี้ที่ฉันเขียนเกี่ยวกับบริบท ได้แก่ :

  • เวกเตอร์บริบทสิทธิบัตรของ Google เพื่อปรับปรุงการค้นหา
  • Context is King: การค้นหาแบบไม่มีพารามิเตอร์ของ Google
  • Google อาจใช้บริบทของลิงก์เพื่อระบุลิงก์สแปมได้อย่างไร
  • ผลการค้นหาเฉพาะที่ Google?

การยื่นขอสิทธิบัตร Google ล่าสุดบอกเราว่าผู้คนมักถามว่า "Barack Obama สูงแค่ไหน" พวกเขาชี้ให้เห็นว่าการเพิ่มข้อเท็จจริงบริบทให้กับคำตอบสำหรับคำถามนั้นสามารถทำให้คำตอบมีประโยชน์มากขึ้น:

ในบางแง่มุม ข้อมูลเชิงบริบทเกี่ยวกับข้อเท็จจริงเฉพาะอาจรวมถึงการจัดอันดับข้อเท็จจริงท่ามกลางข้อเท็จจริงอื่นๆ ที่คล้ายคลึงกัน ตัวอย่างเช่น อาจเป็นประโยชน์ที่จะรู้ว่าบารัค โอบามามีความสูงหกฟุตและสูงหนึ่งนิ้ว อย่างไรก็ตาม การรู้ว่าบารัค โอบามาเป็นประธานาธิบดีที่สูงเป็นอันดับที่เก้าของสหรัฐอเมริกาอาจเป็นประโยชน์มากกว่า ด้วยเหตุนี้ ความสูงของบารัค โอบามาจึงสามารถให้นอกเหนือจากบริบทของความสูงของบารัค โอบามาเมื่อเปรียบเทียบกับประธานาธิบดีคนอื่น ๆ ของสหรัฐอเมริกา

พวกเขาบอกเราว่าพวกเขาอาจเลือกข้อเท็จจริงตามบริบทโดยพิจารณาจากการให้คะแนนข้อเท็จจริงเหล่านั้น และวิธีที่พวกเขาจะสร้างรายชื่อของสิ่งต่าง ๆ เช่นประธานาธิบดีที่สูงที่สุด

คะแนนส่วนหนึ่งสำหรับข้อเท็จจริงบริบทเหล่านั้นอาจขึ้นอยู่กับบางส่วน เช่น ความถี่ที่คำค้นหาล่าสุดอาจอ้างอิงถึงเอนทิตีเฉพาะ อาจเกี่ยวข้องกับการสร้างข้อความภาษาธรรมชาติที่สอดคล้องกับข้อมูลเกี่ยวกับเอนทิตีนั้น

คุณสามารถเรียนรู้ความสนใจในข้อเท็จจริงบริบทและหน่วยงานที่เกี่ยวข้องได้จาก Query Logs

ตัวอย่างที่พวกเขาให้ไว้ในสิทธิบัตรสำรวจว่า "ข้อเท็จจริงที่มีโครงสร้างจัดอยู่ในกลุ่มที่กว้างขึ้นได้อย่างไร" นอกจากนี้ยังสามารถ "จัดเตรียมหน่วยงานที่เกี่ยวข้องอื่น ๆ ที่ได้รับการจัดอันดับให้อยู่ในกลุ่มที่กว้างขึ้น"

ค่านิยมอย่างหนึ่งของแนวทางนี้คือ ในการให้คะแนนข้อเท็จจริงเชิงบริบทจากการใช้ข้อมูลที่แสดงในคำค้นหา จะต้องใช้ "ความซับซ้อนในการคำนวณ" น้อยกว่าเพียงแค่ "ค้นหาฐานความรู้ของข้อมูลที่เกี่ยวข้องกับการค้นหาคำค้นหาอย่างละเอียดถี่ถ้วน" ซึ่งหมายความว่าวิธีการนี้ “สามารถกรองข้อมูลที่ 'ไม่เป็นที่นิยม' ซึ่งไม่ได้เกิดขึ้นบ่อยครั้งในคำค้นหาล่าสุดเพื่อกำหนดข้อเท็จจริงบริบทอย่างมีประสิทธิภาพและแม่นยำ”

ดังนั้น ข้อเท็จจริงบริบทที่ผลลัพธ์อาจแสดงอาจเกี่ยวข้องกับสิ่งที่ผู้คนค้นหาเกี่ยวกับเอนทิตี และเกี่ยวกับเอนทิตีที่เกี่ยวข้อง คำขอรับสิทธิบัตรคือ:

การให้ข้อเท็จจริงบริบท
ผับ. เลขที่: WO/2018/052685
หมายเลขการสมัครระหว่างประเทศ: PCT/US2017/048459
วันที่ตีพิมพ์: 22.03.2018
วันที่ยื่นระหว่างประเทศ: 24.08.2017
ผู้ประดิษฐ์: Akash Nanavati และ Andrew Huse Helmer

เชิงนามธรรม:

ในแง่มุมหนึ่ง วิธีการรวมถึงการรับรายการของเอนทิตี แต่ละรายการ (i) มีคะแนนที่เกี่ยวข้อง (ii) เกี่ยวข้องกับข้อเท็จจริงบริบทตามลำดับ และ (iii) การจัดอันดับชุดย่อยของเอนทิตี และสำหรับแต่ละรายการ ของเอนทิตี การสร้าง สำหรับแต่ละเอนทิตีในรายการ โครงสร้างข้อมูลที่อ้างอิง (i) เอนทิตี (ii) ข้อเท็จจริงบริบทที่เกี่ยวข้องกับรายการ (iii) ตำแหน่งของเอนทิตีสำหรับข้อเท็จจริงบริบท และ (iv ) คะแนนสำหรับรายการ วิธีการยังสามารถรวมถึงการรับข้อมูลที่ระบุเอนทิตีเฉพาะ การเลือกโครงสร้างข้อมูลเฉพาะที่อ้างอิงเอนทิตีเฉพาะ และการจัดหาสำหรับผลลัพธ์ ข้อมูลที่ระบุ (i) ข้อเท็จจริงบริบทที่เกี่ยวข้องกับโครงสร้างข้อมูลเฉพาะที่อ้างอิงเอนทิตีเฉพาะ และ (ii) อันดับของเอนทิตีสำหรับข้อเท็จจริงบริบทที่เกี่ยวข้องกับโครงสร้างข้อมูลเฉพาะที่อ้างอิงเอนทิตีเฉพาะ

บันทึกการค้นหาและข้อเท็จจริงบริบท Take-Aways

วิธีการให้คะแนนข้อเท็จจริงที่เกี่ยวข้องตามคำค้นหานี้ทำให้ฉันนึกถึงวิธีที่ Google อาจสร้าง ontology เกี่ยวกับหัวข้อโดยดูจากบันทึกการค้นหาที่เกี่ยวข้องกับสิ่งเหล่านั้น ซึ่งฉันเขียนเกี่ยวกับ SEO การย้ายจากคำหลักเป็น Ontology และรูปแบบการสืบค้น ฉันเขียนเกี่ยวกับคำถามในรูปแบบข้อความค้นหาที่พบในโพสต์นั้น เช่น "บารัคโอบามาสูงเท่าไหร่" ในสิทธิบัตรที่ฉันเขียนเกี่ยวกับวันนี้ เราได้เรียนรู้ว่าประธานาธิบดีโอบามาเป็นประธานาธิบดีที่สูงเป็นอันดับเก้า ดังนั้น กระบวนการของการใช้บันทึกการสืบค้นเพื่อสร้าง ontology เกี่ยวกับหัวข้อนั้นดูเหมือนว่าจะเกี่ยวข้องกับข้อเท็จจริงในการจัดอันดับที่อาจเกี่ยวข้องกับหัวข้อเหล่านั้นด้วย ซึ่งอาจรวมถึงข้อมูลนั้นในคำตอบ หรือรูปแบบอื่นๆ ที่เป็นไปได้ เช่น วงล้อแบบนี้:

ประธานาธิบดีสหรัฐที่สูงที่สุดในม้าหมุน

สิทธิบัตรชี้ให้เห็นว่าข้อเท็จจริงในบริบทเหล่านี้สามารถรวมเข้ากับหน่วยงานที่เกี่ยวข้องได้อย่างไร เช่น เราอาจเห็นในภาพหมุน:

แต่ละเอนทิตีที่เกี่ยวข้องสามารถรวมข้อเท็จจริงที่เกี่ยวข้องได้ รายการที่สอดคล้องกับข้อเท็จจริงบริบทสามารถจัดเตรียมพร้อมกับเอนทิตีที่เกี่ยวข้องและข้อเท็จจริงที่เกี่ยวข้องซึ่งสอดคล้องกับแต่ละเอนทิตีที่เกี่ยวข้องของรายการที่เกี่ยวข้อง ในบางลักษณะ อาจมีการระบุจำนวนที่กำหนดไว้ล่วงหน้าของเอนทิตีที่เกี่ยวข้องที่ภูมิภาคที่เกี่ยวข้อง 1 14 ของอินเทอร์เฟซเบราว์เซอร์สำหรับการแสดงข้อเท็จจริงบริบท จำนวนของเอนทิตีที่เกี่ยวข้องที่ให้ไว้สามารถขึ้นอยู่กับรายการที่เกี่ยวข้องกับข้อเท็จจริงบริบท ข้อเท็จจริงบริบท จำนวนรวมของเอนทิตีที่เกี่ยวข้อง หรือการรวมกันของสิ่งนั้น ตัวอย่างเช่น หากรายการภูมิภาค 1 12 ของข้อเท็จจริงบริบทรวมถึง “ประธานาธิบดีสูงสุดของสหรัฐอเมริกา” ภูมิภาคที่เกี่ยวข้อง 1 14 อาจรวมถึงประธานาธิบดีสหรัฐอเมริกาที่สูงที่สุดสี่คน: อับราฮัม ลินคอล์น, ลินดอน บี. จอห์นสัน, โธมัส เจฟเฟอร์สัน และแฟรงคลิน ดี รูสเวลต์และข้อเท็จจริงที่เกี่ยวข้องตามลำดับหรือความสูงในกรณีนี้สำหรับแต่ละคน

ฉันได้เขียนเกี่ยวกับเอนทิตีที่เกี่ยวข้องในผลการค้นหาในโพสต์ คะแนนเอนทิตีที่เกี่ยวข้องในการค้นหาตามความรู้ สิทธิบัตรที่ฉันเขียนในโพสต์นั้นพูดถึงคะแนนเอนทิตีที่เกี่ยวข้อง และอันนี้พูดถึงคะแนนข้อเท็จจริงและคะแนนเอนทิตีที่เกี่ยวข้อง สิ่งเหล่านี้ทำให้ฉันเชื่อว่าฉันอาจต้องเริ่มเรียนรู้เกี่ยวกับหน่วยงานที่เกี่ยวข้องและข้อเท็จจริงที่เกี่ยวข้องเมื่อฉันเขียนเกี่ยวกับนิติบุคคลในอนาคต และมีแนวโน้มว่า Google จะพยายามทำความเข้าใจความสัมพันธ์ระหว่างเอนทิตีกับข้อเท็จจริงและรูปแบบการสืบค้นที่อาจเกี่ยวข้องกับสิ่งเหล่านั้น

เพิ่ม: สิทธิบัตรเกี่ยวกับข้อเท็จจริงบริบทนี้ได้รับเมื่อวันที่ 14 พฤษภาคม 2019 ภายใต้ชื่อการให้ข้อเท็จจริงบริบท ฉันนึกถึงสิทธิบัตรของ Google ที่ฉันเขียนถึงในโพสต์ Google แสดงให้เราเห็นว่ามันใช้การแยกเอนทิตีสำหรับกราฟความรู้ซึ่งพูดถึงการทำความเข้าใจบริบทของหน่วยงาน (ข้อเท็จจริงที่เกี่ยวข้องกับสิ่งเหล่านี้) และการให้คะแนนด้วยคะแนนความมั่นใจเพื่อบอกเราว่าสิ่งเหล่านั้นถูกต้องอย่างไร ข้อเท็จจริงอาจเป็น

ปรับปรุงล่าสุด: 14 พฤษภาคม 2019