แก้ความกำกวมอินพุตการค้นหาตามบริบทของอินพุต
เผยแพร่แล้ว: 2018-05-15“เฮ้ Google; นิวยอร์ก นิวยอร์ก!”
Google ได้ยินคำถามสำหรับ "นิวยอร์ก นิวยอร์ก" มันบอกเส้นทาง เล่นเพลงของแฟรงก์ ซินาตรา หรือแสดงผลการค้นหาสไตล์นักท่องเที่ยวหรือไม่ มีแนวโน้มว่าจะขึ้นอยู่กับบริบทของแบบสอบถามนั้น
ตามที่เราได้รับแจ้งในสิทธิบัตรของ Google:
การป้อนข้อมูลของผู้ใช้สามารถระบุได้ว่าคลุมเครือด้วยเหตุผลหลายประการ โดยทั่วไป การป้อนข้อมูลของผู้ใช้จะถูกระบุว่าคลุมเครือ ถ้าระบบตีความว่ามีความหมายที่น่าจะตั้งใจไว้มากกว่าหนึ่งความหมาย โดยไม่ต้องพยายามแก้ความกำกวมข้อมูลโดยใช้เทคนิคที่อธิบายไว้ที่นี่ ตัวอย่างเช่น ในตัวอย่างปัจจุบัน ข้อมูลที่ป้อนของผู้ใช้ถูกระบุว่าคลุมเครือโดยพิจารณาจากแต่ละคำสั่งที่อาจสอดคล้องกับข้อมูลที่ป้อน – ข้อมูลที่ผู้ใช้ป้อน "ไปที่นิวยอร์ก นิวยอร์ก" สามารถระบุที่ตั้งทางภูมิศาสตร์ได้ (เมืองนิวยอร์ค York, NY), เพลง (เพลง "New York, New York") และหน้าเว็บ (หน้าเว็บท่องเที่ยวสำหรับเมือง New York, NY) คำสั่งต่างๆ สามารถระบุได้ว่าสอดคล้องกับอินพุตโดยใช้เทคนิคต่างๆ เช่น การสำรวจแอปพลิเคชันและ/หรือบริการที่สอดคล้องกับแต่ละคำสั่ง (เช่น การสอบถามเครื่องเล่นเพลงที่เกี่ยวข้องกับคำสั่ง "ไปที่ [เพลง]" เพื่อตรวจสอบว่า "นิวยอร์ก นิวยอร์ก" เป็นเพลงที่เข้าถึงได้บนอุปกรณ์คอมพิวเตอร์เคลื่อนที่หรือไม่) การเข้าถึงกลุ่มคำที่อนุญาตหนึ่งกลุ่มหรือมากกว่าสำหรับแต่ละคำสั่ง (เช่น การเข้าถึงกลุ่มคำตำแหน่งทางภูมิศาสตร์ที่อนุญาตสำหรับคำสั่ง "ไปที่ [ ที่ตั้งทางภูมิศาสตร์]”) เป็นต้น
แก้ความกำกวมอินพุตการค้นหาตามบริบทของข้อความค้นหาเหล่านั้น
Google ได้ป้อนข้อมูลสำหรับคำค้นหาเพื่อให้คำตอบที่ชัดเจนสำหรับคำค้นหา สิทธิบัตรของ Google ที่เพิ่งได้รับนี้จะพิจารณาบริบทของข้อความค้นหาเพื่อพยายามแก้ความกำกวมข้อมูลของผู้ใช้เพื่อให้ผลลัพธ์ไม่คลุมเครือ
ตามที่สิทธิบัตรบอกเรา นี่คือจุดประสงค์:
ในเทคนิคต่างๆ ที่อธิบายไว้ในเอกสารนี้ บริบทของอุปกรณ์คอมพิวเตอร์ เช่น โทรศัพท์มือถือ (เช่น สมาร์ทโฟน หรือโทรศัพท์แอป) จะถูกนำมาพิจารณาเพื่อแยกแยะข้อมูลที่ผู้ใช้ป้อนไม่ชัดเจน การป้อนข้อมูลของผู้ใช้ที่คลุมเครือคือข้อมูลป้อนเข้าที่หากไม่มีข้อมูลที่ทำให้สับสนที่เกี่ยวข้อง จะถูกตีความโดยอุปกรณ์คอมพิวเตอร์หรือสำหรับอุปกรณ์คอมพิวเตอร์ (เช่น โดยระบบเซิร์ฟเวอร์ที่อุปกรณ์คอมพิวเตอร์อยู่ในการสื่อสารทางอิเล็กทรอนิกส์) ที่สอดคล้องกับมากกว่า หนึ่งแบบสอบถามหรือคำสั่ง การป้อนข้อมูลที่คลุมเครืออาจเป็นเรื่องปกติโดยเฉพาะอย่างยิ่งสำหรับการป้อนข้อมูลด้วยเสียง ส่วนหนึ่งเป็นเพราะมีคำพ้องเสียง และส่วนหนึ่งเป็นเพราะตัวประมวลผลเสียงพูดเป็นข้อความอาจมีปัญหาในการแยกแยะคำที่ออกเสียงต่างกันแต่ฟังดูคล้ายกัน ตัวอย่างเช่น หากผู้ใช้พูดว่า "ค้นหาข้อมูลการเดินเรือ/การขาย" บนอุปกรณ์คอมพิวเตอร์เคลื่อนที่ การป้อนข้อมูลด้วยเสียงนี้อาจไม่ชัดเจน เนื่องจากอาจสอดคล้องกับคำสั่ง "ค้นหาข้อมูลการเดินเรือ" (เช่น ข้อมูลเกี่ยวกับการเดินเรือสำหรับเรือใบ ) หรือคำสั่ง "ค้นหาข้อมูลการขาย" (ข้อมูลเกี่ยวกับการขายสินค้า) อุปกรณ์อาจระบุด้วยซ้ำว่าข้อมูลที่ป้อนคือ "ค้นหาข้อมูลการขาย" เพราะ "ขาย" และ "ขาย" ฟังดูเหมือนกัน โดยเฉพาะอย่างยิ่งในบางภาษา
การแก้ความกำกวมอินพุตการค้นหานี้จะทำงานอย่างไร
สิทธิบัตรบอกเราว่าข้อมูลที่ป้อนโดยผู้ใช้ที่ไม่ชัดเจนอาจมีความชัดเจนตามบริบทที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์เคลื่อนที่ (และ/หรือผู้ใช้อุปกรณ์คอมพิวเตอร์เคลื่อนที่) แยกจากข้อมูลที่ผู้ใช้ป้อนเอง เช่น:
- ตำแหน่งทางกายภาพที่อุปกรณ์คอมพิวเตอร์เคลื่อนที่ตั้งอยู่ (เช่น บ้าน ที่ทำงาน รถยนต์ ฯลฯ)
- การเคลื่อนที่ของอุปกรณ์คอมพิวเตอร์พกพา (เช่น การเร่งความเร็ว หยุดนิ่ง ฯลฯ)
- กิจกรรมล่าสุดบนอุปกรณ์คอมพิวเตอร์พกพา (เช่น กิจกรรมเครือข่ายสังคม อีเมลที่ส่ง/รับ โทรออก/รับสาย ฯลฯ)
ตัวอย่างของอินพุตการค้นหาที่แก้ความกำกวมตามบริบทอาจรวมถึง
1. อุปกรณ์ที่ต่อเข้ากับแท่นอาจกำหนดประเภทของแท่นเสียบที่อยู่ในนั้น เช่น ผ่านหน้าสัมผัสทางไฟฟ้าบนแท่นและอุปกรณ์ที่ตรงกัน หรือผ่านการสื่อสารทางอิเล็กทรอนิกส์ (เช่น ผ่าน Bluetooth หรือ RFID) ระหว่างแท่นชาร์จกับ อุปกรณ์. ซึ่งอาจบอกได้ว่าอยู่ในบริบทเช่น "ในรถ" หรือ "ที่บ้าน" โดยอิงจากความมุ่งมั่นเช่นนั้น เพราะเหตุนั้น
…อุปกรณ์ที่ฉันใช้พูดเพื่อแก้ความกำกวมของฉัน เช่น "ทิศทาง" ซึ่งคำนี้สามารถตีความว่าเป็นทิศทางทางภูมิศาสตร์ (เช่น เส้นทางการขับขี่) ในบริบท "ในรถ" และคำแนะนำวิธีการ (เช่น สำหรับทำอาหาร) ใน โหมด "ที่บ้าน"
2. ในอีกตัวอย่างหนึ่ง การรับที่อุปกรณ์คอมพิวเตอร์พกพา การป้อนข้อมูลของผู้ใช้คลุมเครือที่อาจระบุคำสั่งหลายคำสั่งอาจทำให้คำสั่งนั้นกำหนดบริบทปัจจุบันที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์พกพาที่สามารถระบุตำแหน่งที่อุปกรณ์คอมพิวเตอร์พกพาอยู่ในปัจจุบัน ที่สามารถมีอิทธิพลต่อผลลัพธ์ที่ให้ตามบริบทนั้น
ข้อดีของการแก้ความกำกวมอินพุตการค้นหาตามบริบท
สิทธิบัตรบอกเราถึงข้อดีของการปฏิบัติตามกระบวนการที่อธิบายไว้ในสิทธิบัตรว่า:
การอนุญาตให้ผู้ใช้สั่งอุปกรณ์คอมพิวเตอร์พกพาให้ทำงานที่ต้องการโดยที่ผู้ใช้ไม่ต้องปฏิบัติตามขั้นตอนของการป้อนข้อมูลสำหรับงานที่ต้องการ เนื่องจากคุณลักษณะที่มีให้โดยอุปกรณ์คอมพิวเตอร์เคลื่อนที่เพิ่มขึ้น ผู้ใช้อาจจำเป็นต้องให้ข้อมูลเฉพาะเจาะจงมากขึ้น เพื่อให้ข้อมูลที่ป้อนเชื่อมโยงกับคุณลักษณะที่ต้องการอย่างเหมาะสม อย่างไรก็ตาม ความจำเพาะดังกล่าวอาจยุ่งยากและยากต่อการจดจำ วิธีการ ระบบ เทคนิค และกลไกที่อธิบายไว้ในเอกสารนี้สามารถให้ผู้ใช้ป้อนข้อมูลโดยใช้ความจำเพาะน้อยกว่าที่จำเป็นสำหรับคุณลักษณะอย่างเป็นทางการ แต่ยังคงเข้าถึงคุณลักษณะที่ต้องการได้
สิทธิบัตรคือ:
แก้ความกำกวมตามบริบท
นักประดิษฐ์: John Nicholas Jitkoff และ Michael J. LeBeau
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา: 9,966,071
ได้รับ: 8 พฤษภาคม 2018
ยื่น: 1 กรกฎาคม 2016
เชิงนามธรรม
ในการนำไปใช้งาน วิธีหนึ่งที่ใช้คอมพิวเตอร์รวมถึงการรับที่อุปกรณ์คอมพิวเตอร์พกพา การป้อนข้อมูลของผู้ใช้ที่คลุมเครือซึ่งบ่งชี้มากกว่าหนึ่งคำสั่งจากหลายคำสั่ง และกำหนดบริบทปัจจุบันที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์เคลื่อนที่ซึ่งระบุว่าอุปกรณ์คอมพิวเตอร์เคลื่อนที่อยู่ ณ ตำแหน่งใด วิธีการนี้ยังรวมถึงการแก้ความกำกวมอินพุตของผู้ใช้ที่คลุมเครือด้วยการเลือกคำสั่งจากหลายคำสั่งตามบริบทปัจจุบันที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์พกพา และทำให้เอาต์พุตที่เกี่ยวข้องกับประสิทธิภาพของคำสั่งที่เลือกถูกจัดเตรียมโดยอุปกรณ์คอมพิวเตอร์พกพา .
เมื่อเช้านี้ฉันได้พูดคุยกับผู้พูด (อุปกรณ์) ของ Google ซึ่งเริ่มต้นด้วยคำว่า “Ok Google” แต่ฉันไม่ได้ต้องการให้ฉันพูดวลีที่ใช้บ่อยนั้นหลังจากที่ Google ได้ทำการเปลี่ยนแปลงบางอย่างที่ประกาศในการประชุม Google I/O ครั้งล่าสุด ฉันขอคะแนนกีฬาแล้วถามคำถามเกี่ยวกับพวกเขา ฉันยังคงเรียนรู้วิธีที่ดีที่สุดในการโต้ตอบกับ Google Now เวอร์ชันลำโพงของฉัน แต่น่าสนใจ (จะพูดว่าได้โปรดไหมเมื่อเราขออะไรบางอย่างที่เป็นประโยชน์) การสนทนาตอนเช้าของฉันเกิดขึ้นในใจขณะที่ฉันเริ่มอ่านข้อความนี้จากสิทธิบัตรนี้:
เอกสารนี้อธิบายเทคนิค วิธีการ ระบบ และกลไกในการแก้ความกำกวมของข้อมูลที่ผู้ใช้ป้อนในอุปกรณ์คอมพิวเตอร์พกพา (เช่น โทรศัพท์เคลื่อนที่ สมาร์ทโฟน (เช่น iPhone BLACKBERRY) ผู้ช่วยดิจิทัลส่วนบุคคล (PDA) เครื่องเล่นสื่อแบบพกพา (เช่น , iPod) เป็นต้น) เนื่องจากคุณลักษณะที่มีให้โดยอุปกรณ์คอมพิวเตอร์พกพาเพิ่มขึ้น จำนวนคำสั่งที่อุปกรณ์คอมพิวเตอร์พกพารู้จักก็เพิ่มขึ้นเช่นกัน ตัวอย่างเช่น คุณลักษณะแต่ละอย่างในอุปกรณ์คอมพิวเตอร์พกพาอาจลงทะเบียนคำสั่งที่เกี่ยวข้องตั้งแต่หนึ่งคำสั่งขึ้นไป ซึ่งผู้ใช้สามารถพิมพ์ พูด ท่าทาง ฯลฯ เพื่อทำให้คุณสมบัตินี้เปิดใช้งานบนอุปกรณ์คอมพิวเตอร์พกพา อย่างไรก็ตาม เมื่อจำนวนคำสั่งที่รู้จักเพิ่มขึ้น คำสั่งต่างๆ สามารถมาบรรจบกันและทำให้ยากขึ้นในการแยกแยะว่าคำสั่งใดที่ผู้ใช้ป้อนให้สอดคล้องกัน ปัญหาถูกขยายสำหรับการป้อนข้อมูลด้วยเสียง ตัวอย่างเช่น การป้อนข้อมูลด้วยเสียงที่มีเสียงรบกวนเบื้องหลังอาจเป็นเรื่องยากที่จะตีความได้อย่างแม่นยำ และด้วยเหตุนี้ จึงสามารถจับคู่คำสั่งมากกว่าหนึ่งคำสั่งที่อุปกรณ์คอมพิวเตอร์เคลื่อนที่รู้จัก ตัวอย่างเช่น "ตัวอย่าง" การป้อนข้อมูลด้วยเสียงสามารถตีความได้ว่า "ตัวอย่างไข่" "ตัวอย่าง" หรือ "การทดสอบดึง" อีกตัวอย่างหนึ่ง คำสั่ง "go-to" อาจหมายถึง "ไปที่ [ตำแหน่งทางภูมิศาสตร์]" สำหรับแอปพลิเคชันการทำแผนที่ และ "ไปที่ [ศิลปิน/อัลบั้ม/เพลง]" สำหรับโปรแกรมเล่นสื่อ
ขณะที่เรากำลังพยายามเรียนรู้วิธีที่ดีที่สุดในการโต้ตอบกับอุปกรณ์และลำโพงและอุปกรณ์เคลื่อนที่เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดจาก Google Google ก็พยายามเรียนรู้วิธีที่ดีที่สุดในการโต้ตอบกับเรา และเพื่อให้แน่ใจว่าเราจะเข้าใจเมื่อเราขอ บางสิ่งบางอย่าง. สิทธิบัตรในการแก้ความกำกวมข้อมูลการค้นหานี้ใช้ไม่กี่ขั้นตอนในทิศทางนั้น ตามที่มันบอกเรา:
การใช้เทคนิคที่อธิบายไว้ในที่นี้ เพื่อตอบสนองต่อการรับอินพุตของผู้ใช้ที่มีความคลุมเครือ บริบทปัจจุบันสำหรับอุปกรณ์เคลื่อนที่ (และ/หรือผู้ใช้อุปกรณ์คอมพิวเตอร์เคลื่อนที่) สามารถกำหนดและใช้เพื่อแก้ความกำกวมอินพุตของผู้ใช้ที่คลุมเครือ บริบทปัจจุบันสำหรับอุปกรณ์คอมพิวเตอร์พกพาสามารถรวมข้อมูลที่หลากหลายที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์พกพาและ/หรือผู้ใช้อุปกรณ์คอมพิวเตอร์พกพา บริบทอาจอยู่ภายนอกอุปกรณ์และแสดงสถานะแบบเรียลไทม์รอบๆ อุปกรณ์ เช่น ตำแหน่งทางกายภาพปัจจุบัน (เช่น บ้าน ที่ทำงาน รถยนต์ ที่ตั้งอยู่ใกล้กับเครือข่ายไร้สาย “testnet2010” เป็นต้น) ทิศทางและอัตรา ของความเร็วที่อุปกรณ์กำลังเคลื่อนที่ (เช่น ไปทางเหนือที่ 20 ไมล์ต่อชั่วโมง) ตำแหน่งทางภูมิศาสตร์ปัจจุบัน (เช่น ที่มุมของ 10th Street และ Marquette Avenue) และเสียงรอบข้าง (เช่น เสียงฮัมต่ำ ดนตรี เป็นต้น) บริบทอาจอยู่ภายในอุปกรณ์ด้วย เช่น การนัดหมายในปฏิทินที่กำลังจะมาถึงและ/หรือการนัดหมายในปฏิทินล่าสุด (เช่น พบกับ John เวลา 14:30 น. วันที่ 29 กรกฎาคม 2010) เวลาและวันที่บนนาฬิกาในอุปกรณ์ (เช่น , 14:00 น. วันที่ 29 กรกฎาคม 2010), กิจกรรมล่าสุดของอุปกรณ์ (เช่น อีเมลที่ส่งถึง John เกี่ยวกับการประชุม 2:30 น.) และรูปภาพจากกล้องของอุปกรณ์คอมพิวเตอร์เคลื่อนที่
ฉันมักจะใช้โทรศัพท์เพื่อนำทางไปยังสถานที่ต่างๆ และต้องการสามารถพูดกับโทรศัพท์ของฉันได้ เพื่อเปลี่ยนแปลงตำแหน่งที่จะนำทางไป เช่น หากฉันตัดสินใจขับรถผ่านจุดหมายเดิมเพื่อไปร้านอื่นก่อน และต้องการปิดระบบนำทางให้หยุดบอกให้กลับรถเพื่อเดินทางกลับไปยังจุดหมายแรกนั้น
สิทธิบัตรนี้คุ้มค่าที่จะใช้เวลาทบทวนเพราะมันให้แนวคิดที่น่าสนใจเกี่ยวกับสิ่งที่อาจส่งผลต่อการทำงานของอุปกรณ์ตามบริบท ดังที่ได้กล่าวไว้ที่นี่:
ด้วยการระบุอินพุตของผู้ใช้ที่คลุมเครือ ในขั้นตอน B บริบทปัจจุบันสำหรับอุปกรณ์เคลื่อนที่สามารถกำหนดได้ บริบทปัจจุบันประกอบด้วยข้อมูลที่อธิบายสถานะปัจจุบันและ/หรือสภาพแวดล้อมของอุปกรณ์คอมพิวเตอร์เคลื่อนที่และ/หรือผู้ใช้อุปกรณ์คอมพิวเตอร์เคลื่อนที่ในขณะที่ได้รับข้อมูลเข้า ตัวอย่างเช่น บริบทปัจจุบันอาจรวมถึงข้อมูลต่างๆ ที่เกี่ยวข้องกับอุปกรณ์คอมพิวเตอร์พกพาและผู้ใช้ เช่น ข้อมูลเกี่ยวกับสภาพแวดล้อมทางกายภาพโดยรอบ (เช่น เครือข่ายที่พร้อมใช้งาน การเชื่อมต่อกับอุปกรณ์คอมพิวเตอร์ใกล้เคียงอื่นๆ ตำแหน่งทางภูมิศาสตร์ สภาพอากาศ ที่อยู่ใกล้เคียง ธุรกิจ, ระดับเสียงรอบข้าง, ระดับแสงโดยรอบ, ภาพที่ถ่ายด้วยกล้องของอุปกรณ์มือถือ ฯลฯ ), สถานะปัจจุบันของอุปกรณ์คอมพิวเตอร์พกพา (เช่น อัตราความเร็ว, อินพุตหน้าจอสัมผัสที่เปิดใช้งาน, อินพุตเสียงที่เปิดใช้งาน, เสียงกริ่ง เปิด/ปิด ฯลฯ) ข้อมูลเวลาและวันที่ (เช่น เวลาของวัน วันที่ การนัดหมายในปฏิทิน วันในสัปดาห์ เป็นต้น) กิจกรรมของผู้ใช้ (เช่น กิจกรรมของผู้ใช้ล่าสุด กิจกรรมของผู้ใช้ตามปกติ) เป็นต้น บริบทปัจจุบันสามารถกำหนดได้โดยอุปกรณ์คอมพิวเตอร์เคลื่อนที่โดยใช้ข้อมูลและเซ็นเซอร์ที่อยู่ในเครื่องและ/หรือระยะไกลไปยังอุปกรณ์คอมพิวเตอร์เคลื่อนที่
การเปลี่ยนแปลงที่เกี่ยวข้องกับการป้อนข้อมูลการค้นหาที่กำกวมขึ้นอยู่กับบริบท
กาลครั้งหนึ่ง เมื่อคุณปรับหน้าเว็บให้เหมาะสมสำหรับการสืบค้น เป็นไปได้ที่การสืบค้นที่ดำเนินการโดยใครบางคนนั่งอยู่ที่โต๊ะโดยใช้คอมพิวเตอร์เดสก์ท็อปหรือคอมพิวเตอร์แล็ปท็อป ตอนนี้อาจเป็นใครบางคนในรถหรือบนรถบัสหรือรถไฟ หรือในทางเดินของร้านค้าหรือในร้านกาแฟ เมื่อพวกเขาค้นหา "นิวยอร์ก นิวยอร์ก" อาจเป็นเพราะพวกเขาต้องการเส้นทางการจราจร ฟังเพลง หรืออ่านหน้าเว็บเพื่อค้นหาว่าเกิดอะไรขึ้นในตัวเมือง
ฉันจำได้ว่าไปเยี่ยมน้องสาวของฉันตอนที่เธอไปโรงเรียนในแมนฮัตตัน และเธอแนะนำให้เราค้นหาว่ามีเทศกาลริมถนนในเมืองในวันนั้นหรือไม่ เธอหยิบโทรศัพท์ขึ้นมากด 411 และถามโอเปอเรเตอร์ นี่เป็นเวลาประมาณ 5 ปีก่อนที่จะมีเวิลด์ไวด์เว็บเพื่อค้นหา และเธอก็ได้รับคำตอบจากโอเปอเรเตอร์ ซึ่งทำให้ฉันประหลาดใจอย่างมาก ฉันไม่ได้คาดหวังคำตอบเหล่านั้นจากแหล่งนั้น ฉันหวังว่าตอนนี้จะสามารถหาหน้าเว็บที่สามารถบอกฉันเกี่ยวกับสิ่งเหล่านั้นได้ แต่ไม่คิดว่าจะสามารถค้นหาข้อมูลเช่นนั้นโดยใช้คอมพิวเตอร์หรือโทรศัพท์มือถือได้ในอนาคตข้างหน้า โลกกำลังเปลี่ยนแปลง
คุณพร้อมแค่ไหนสำหรับการเปลี่ยนแปลงที่อุปกรณ์มือถือและเสิร์ชเอ็นจิ้นจะนำมาสู่เรา?

