วิธีที่ Google อาจใช้รีวิวเพื่อเรียนรู้เกี่ยวกับแอตทริบิวต์ของเอนทิตี

เผยแพร่แล้ว: 2018-09-06

โปสเตอร์แอตทริบิวต์เอนทิตี

เกี่ยวกับคุณสมบัติของเอนทิตี

เมื่อเราเห็น Google พูดถึงคุณสมบัติของเอนทิตีต่างๆ พวกเขามักจะอ้างถึงคุณสมบัติเหล่านั้นว่าเป็นแอตทริบิวต์เอนทิตีและมักจะกำหนดไว้เป็นคู่คีย์/ค่า ตัวอย่างเช่น อับราฮัม ลินคอล์น มีความสูง 6'4 นิ้ว อัลฟาเบทเป็นบริษัทโฮลดิ้งซึ่งมีสำนักงานใหญ่อยู่ที่เมาน์เทนวิว รัฐแคลิฟอร์เนีย Paul Newman มีตาสีฟ้า Fortnite เป็นเกมที่มีผู้เล่นหลายคน

บทวิจารณ์ออนไลน์บางรายการเกี่ยวกับหน่วยงานต่างๆ โดยเฉพาะ เช่น ผลิตภัณฑ์ ผู้สร้างผลิตภัณฑ์ และ/หรือผู้จำหน่ายผลิตภัณฑ์ บทวิจารณ์เหล่านี้อาจมีข้อมูลเกี่ยวกับคุณลักษณะของเอนทิตีที่ผู้ค้นหาอาจสนใจ สิทธิบัตรที่ Google มอบให้เมื่อสัปดาห์ที่แล้วบอกเราว่าอาจรวบรวมข้อมูลเกี่ยวกับคุณลักษณะของเอนทิตีจากรีวิวที่ผู้ค้นหาอาจสนใจ และวิธีที่พวกเขาอาจทำอย่างนั้น นี่เป็นสิ่งสำคัญเพราะตามที่สิทธิบัตรบอกเรา:

บทวิจารณ์จากผู้ใช้ประเภทนี้อาจรวมถึงข้อมูลเกี่ยวกับเอนทิตีที่อาจไม่ได้จัดเตรียมหรือสร้างขึ้น ตัวอย่างเช่น โดยตัวเอนทิตีเอง

ข้อมูลเกี่ยวกับแอตทริบิวต์ของหน่วยงานเปลี่ยนจากบทวิจารณ์ไปยังดัชนีของ Google

กระบวนการนี้เกี่ยวข้องกับแอตทริบิวต์ของเอนทิตีอาจเกี่ยวข้องกับ:

(1) การ ระบุ ตามคลังคำถามของผู้ใช้ ความสนใจของผู้ใช้ที่สังเกตได้หนึ่งหมวดหมู่ขึ้นไป
(2) การตรวจจับ ในบทวิจารณ์ของผู้ใช้อย่างน้อยหนึ่งรายการที่เกี่ยวข้องกับผลิตภัณฑ์ ส่วนหนึ่งของข้อความที่เกี่ยวข้องกับหมวดหมู่ความสนใจของผู้ใช้ที่สังเกตได้ตั้งแต่หนึ่งหมวดหมู่ขึ้นไป
(3) และตามการตรวจหา การ จัดทำดัชนี ในฐานข้อมูลที่ค้นหาได้ ผลิตภัณฑ์ที่อยู่ในความสนใจของผู้ใช้ที่สังเกตได้ตั้งแต่หนึ่งหมวดหมู่ขึ้นไป

ดังนั้น. เสิร์ชเอ็นจิ้นอาจพิจารณาข้อความค้นหาเกี่ยวกับหน่วยงานเพื่อระบุสิ่งที่ผู้ค้นหาอาจสนใจเกี่ยวกับหน่วยงานเหล่านั้น และใช้ข้อความค้นหาเหล่านั้นเพื่อระบุข้อความในบทวิจารณ์ที่ผู้ค้นหาอาจสนใจ และจัดทำดัชนีข้อความนั้นเพื่อให้ผู้ค้นหาสามารถค้นหาคำตอบของ แบบสอบถามที่พวกเขามีเกี่ยวกับเอนทิตี เช่น ผลิตภัณฑ์ ผู้ผลิตผลิตภัณฑ์ และผู้จำหน่ายผลิตภัณฑ์

Google อาจนับจำนวนคำถามที่ถามเกี่ยวกับแอตทริบิวต์ของเอนทิตีบางอย่างเพื่อทำความเข้าใจว่าคำตอบของคำถามเหล่านั้นมีความสนใจมากน้อยเพียงใด หรือผู้ใช้อาจมีความสนใจในคำถามเหล่านั้นอย่างไร

แมชชีนเลิร์นนิงอาจใช้เพื่อระบุว่าข้อความค้นหาสนใจในตัวผลิตภัณฑ์หรือผู้ผลิตผลิตภัณฑ์

นิติบุคคลแอตทริบิวต์สิทธิบัตรที่เป็นปัญหาซึ่งได้รับเมื่อสัปดาห์ที่แล้วสามารถดูได้ที่:

การวิเคราะห์บทวิจารณ์ของผู้ใช้เพื่อกำหนดแอตทริบิวต์ของเอนทิตี
ผู้ประดิษฐ์: Advay Mengle, Jindong Chen, Charmaine Cynthia Rose D'Silva และ Anna Patterson
ผู้รับมอบหมาย: GOOGLE LLC
สิทธิบัตรสหรัฐอเมริกา: 10,061,767
ได้รับ: สิงหาคม 28, 2018
ยื่น: 16 มิถุนายน 2017

เชิงนามธรรม

วิธีการและอุปกรณ์ได้อธิบายไว้ในที่นี้เพื่อจัดประเภทบทวิจารณ์ของผู้ใช้หรือบางส่วนของบทวิจารณ์นั้นที่เกี่ยวข้องกับเอนทิตีต่างๆ และสำหรับการเชื่อมโยงส่วนคำอธิบายที่แยกออกมาของข้อความที่มีอยู่ในบทวิจารณ์ของผู้ใช้หรือบางส่วนของมันกับเอนทิตีตามการจำแนกประเภท ในการใช้งานต่างๆ อาจมีการระบุหมวดหมู่ความสนใจของผู้ใช้ที่สังเกตได้ตั้งแต่หนึ่งหมวดหมู่ขึ้นไปตามคลังคำถามของผู้ใช้ ข้อความอย่างน้อยหนึ่งกลุ่มที่เกี่ยวข้องกับหมวดหมู่ความสนใจของผู้ใช้ที่สังเกตได้ตั้งแต่หนึ่งหมวดหมู่ขึ้นไปอาจถูกตรวจพบในรีวิวของผู้ใช้อย่างน้อยหนึ่งรายการที่เกี่ยวข้องกับผลิตภัณฑ์ จากการตรวจจับ ผลิตภัณฑ์อาจถูกสร้างดัชนีตามหมวดหมู่ความสนใจของผู้ใช้ที่สังเกตพบตั้งแต่หนึ่งหมวดหมู่ขึ้นไปในฐานข้อมูลที่ค้นหาได้ ในการใช้งานบางอย่าง ฐานข้อมูลที่ค้นหาได้อาจเข้าถึงได้จากอุปกรณ์ไคลเอ็นต์ระยะไกลตั้งแต่หนึ่งเครื่องขึ้นไป และอาจค้นหาได้โดยหมวดหมู่ความสนใจของผู้ใช้ที่สังเกตได้ตั้งแต่หนึ่งหมวดหมู่ขึ้นไป เพื่อให้ผลการค้นหาแสดงผลโดยอุปกรณ์ไคลเอ็นต์ระยะไกลตั้งแต่หนึ่งเครื่องขึ้นไป

บทวิจารณ์ของผู้ใช้ ตามที่อธิบายไว้ในสิทธิบัตรนี้อาจมาจากแหล่งต่างๆ เช่น:

  • บล็อก
  • โพสต์โซเชียลเน็ตเวิร์ก
  • อีเมล
  • บทความที่เขียนขึ้นสำหรับเว็บไซต์หรือสิ่งพิมพ์ เช่น นิตยสารหรือหนังสือพิมพ์
  • การโพสต์ในส่วนบทวิจารณ์ของผู้ใช้ของผู้ขายออนไลน์หรือตลาดกลาง
  • บทวิจารณ์ของผู้ใช้ส่งไปยังสำนักหักบัญชีบทวิจารณ์ของผู้ใช้ที่มีอยู่หลายแห่ง

บทวิจารณ์เหล่านั้นอาจถูกจัดประเภทตามหมวดหมู่ความสนใจที่อาจครอบคลุม และหน่วยงานที่พวกเขาอาจมีข้อมูลที่เกี่ยวข้อง เป็นเรื่องที่น่าสนใจเพราะสิทธิบัตรนี้บอกเราว่าแมชชีนเลิร์นนิงอาจเป็นส่วนหนึ่งของกระบวนการที่เกี่ยวข้องกับการทำตามขั้นตอนเหล่านี้ได้อย่างไร

ในการใช้งานบางอย่าง อาจใช้ “หมวดหมู่ความสนใจ” อย่างน้อยหนึ่งหมวดในเอนทิตีเพื่อจำแนกรีวิวของผู้ใช้และ/หรือส่วนหนึ่งของความคิดเห็นดังกล่าวว่าเกี่ยวข้องกับเอนทิตีเฉพาะ การตรวจหาคำหรือวลีในบทวิจารณ์ของผู้ใช้ที่สอดคล้องกับหมวดหมู่เหล่านี้ (เช่น คล้ายกันเพียงพอ) อาจถูกตีความว่าเป็นสัญญาณสำหรับการจัดประเภทบทวิจารณ์ของผู้ใช้หรือส่วนหนึ่งที่เกี่ยวข้องกับเอนทิตี หมวดหมู่ที่น่าสนใจอาจมีหลายรูปแบบ เช่น หมวดหมู่ของความสนใจที่คาดการณ์ไว้ และหมวดหมู่ความสนใจที่สังเกตได้ ในการใช้งานต่างๆ เอ็นจิ้นหมวดหมู่อาจรักษาดัชนีของหมวดหมู่ที่อาจใช้โดยเอ็นจิ้นตัวแยกประเภทเพื่อจัดประเภทบทวิจารณ์ของผู้ใช้และ/หรือบางส่วนของมัน

หากคุณเป็นแฟนตัวยงของเกมออนไลน์ สิทธิบัตรได้แสดงตัวอย่างหลายตัวอย่างที่เน้นไปที่สิ่งเหล่านั้นเพื่ออธิบายว่ากระบวนการเบื้องหลังสิทธิบัตรทำงานอย่างไร:

ในทางตรงกันข้าม ประเภทของความสนใจที่สังเกตพบอาจถูกกำหนด เช่น ตามกลไกของหมวดหมู่ ตามรูปแบบที่สังเกตพบในกิจกรรมของผู้ใช้ เช่น ท่ามกลางข้อความค้นหาของผู้ใช้จำนวนมาก (หรือคลังข้อมูล) ตัวอย่างเช่น และดำเนินการต่อด้วยตัวอย่างตลาดออนไลน์ของแอป ผู้ใช้หลายคนอาจค้นหาแอปโดยใช้คำหรือวลีเดียวกันหรือคล้ายกัน หากผู้ใช้ส่งคำค้นหาที่มีคำหรือวลีเฉพาะ (หรือรูปแบบที่คล้ายกันเพียงพอ) เพียงพอ เครื่องมือจัดหมวดหมู่อาจถือว่าคำหรือวลีเหล่านั้นประกอบเป็นหมวดหมู่ที่สนใจสังเกตและอาจอัปเดตดัชนีตามนั้น ดังนั้น หากมีผู้ใช้ค้นหาตลาดออนไลน์มากพอสำหรับ "เกมเล่นตามบทบาทออนไลน์ที่มีผู้เล่นหลายคนจำนวนมาก" หรือ "MMORPG" อาจมีการกำหนดหมวดหมู่ MMORPG

มีการอธิบายกระบวนการที่เกี่ยวข้องกับการแยกข้อความจากบทวิจารณ์และรวมถึงสิ่งต่างๆ เช่น การเปรียบเทียบระหว่างหน่วยงานต่างๆ (เช่น "ผลิตภัณฑ์ X ดีกว่าผลิตภัณฑ์ Y")

สิทธิบัตรใช้ความสนใจเป็นอย่างมากในการดึงข้อมูลและคำและวลีเฉพาะจากบทวิจารณ์และตอบสนองต่อคำถามเช่นหากมีคำถามมากมายเกี่ยวกับ "กล้องที่มีความสามารถในการซูมด้วยเลนส์ที่ยอดเยี่ยม" ข้อมูลอาจ ถูกดึงออกมาตอบคำถามนั้นสำหรับกล้องตัวใดตัวหนึ่ง และข้อมูลประเภทนี้อาจนำมาจากรีวิวกล้องของผู้ใช้

เราได้รับคำแนะนำเกี่ยวกับความหมายของการสกัดดังกล่าว:

เอ็นจิ้นกราฟอาจดำเนินการต่างๆ กับแอตทริบิวต์และ/หรือคะแนนเอนทิตีที่เกี่ยวข้องใหม่เหล่านี้ ตัวอย่างเช่น ในการใช้งานบางอย่าง เครื่องมือสร้างกราฟอาจเชื่อมต่อกับเครื่องมือค้นหา (ไม่ได้อธิบาย) และอาจสร้างดัชนีเอนทิตีตั้งแต่หนึ่งรายการขึ้นไปโดยยึดตามส่วนคำอธิบายของข้อความที่เกี่ยวข้องกับเอนทิตีตั้งแต่หนึ่งรายการขึ้นไป เช่น โดยข้อความอธิบาย เครื่องยนต์สมาคม

การใช้คำวิจารณ์เพื่อเรียนรู้เกี่ยวกับคุณสมบัติของเอนทิตี

สิ่งที่น่าสนใจคือ Google อาจใช้เนื้อหาที่ผู้ใช้สร้างขึ้น เช่น บทวิจารณ์ผลิตภัณฑ์ เพื่อเรียนรู้เกี่ยวกับผลิตภัณฑ์เหล่านั้น ผู้ผลิตผลิตภัณฑ์เหล่านั้น และผู้จัดจำหน่ายผลิตภัณฑ์

เราพบว่า Google มีความสนใจในการรีวิวผลิตภัณฑ์และธุรกิจ และสถานที่ต่างๆ เนื่องจากผู้ค้นหาค้นหาสิ่งเหล่านั้น เรายังได้เห็น Google พูดถึงวิธีที่พวกเขาอาจใช้ความเห็นเพื่อเรียนรู้เกี่ยวกับความรู้สึกที่มีต่อตัวตน สิทธิบัตรนี้นำความน่าสนใจไปอีกขั้น มากกว่าแค่ทำให้ผู้ค้นหาสามารถเขียนรีวิวได้หรือชี้ให้เห็นประโยคที่เต็มไปด้วยความรู้สึก พยายามเรียนรู้เกี่ยวกับสิ่งที่กำลังทบทวนเพื่อให้สามารถจับคู่ความสนใจเฉพาะกับข้อมูลที่ตอบได้

สิทธิบัตรบอกเราเกี่ยวกับตำแหน่งที่อาจพบบทวิจารณ์ออนไลน์ วิธีจัดประเภทและดึงข้อความจากบทวิจารณ์เหล่านั้น ความสนใจจากคำค้นหาของผู้ค้นหาอาจถูกรวบรวมเพื่อทำความเข้าใจว่าผู้ค้นหาเหล่านั้นอาจสนใจเรียนรู้อะไร และเครื่องมือค้นหาสามารถแสดงผู้ค้นหา ข้อมูลที่ตอบสนองต่อความสนใจเหล่านั้นเกี่ยวกับคุณลักษณะเฉพาะของนิติบุคคล

บางทีบทวิจารณ์อาจเป็นที่ที่ดีในการเรียนรู้ข้อมูลเกี่ยวกับแอตทริบิวต์ของเอนทิตีที่หน่วยงานเหล่านั้นไม่ได้เปิดเผยตนเอง คุณคิดอย่างไร?