แมชชีนเลิร์นนิงสำหรับโมเดลการจัดอันดับ

เผยแพร่แล้ว: 2021-05-05

แมชชีนเลิร์นนิงที่ Google

สิทธิบัตรของ Google นี้เกี่ยวกับการฝึกโมเดลการเรียนรู้ของเครื่องเพื่อจัดลำดับเอกสารตามคำค้นหา

ฝึกโมเดลการจัดอันดับ

เครื่องมือค้นหาออนไลน์เช่น Google จัดอันดับเอกสารตามคำค้นหาเพื่อแสดงผลการค้นหาที่เต็มไปด้วยเอกสารที่ตอบสนองต่อคำค้นหา

เครื่องมือค้นหามักจะแสดงผลการค้นหาตามลำดับที่กำหนดโดยการจัดอันดับ

เครื่องมือค้นหาจัดอันดับเอกสารโดยใช้ปัจจัยต่างๆ ด้วยเทคนิคการจัดอันดับต่างๆ

เสิร์ชเอ็นจิ้นอาจจัดอันดับเอกสารตามแบบจำลองการจัดลำดับของแมชชีนเลิร์นนิงที่ได้รับคุณสมบัติของเอกสารอินพุต และอาจรวมถึงคำค้นหาที่ได้รับ จากนั้นจะสร้างคะแนนการจัดอันดับสำหรับเอกสารอินพุต

สิทธิบัตรนี้อธิบายการฝึกอบรมโมเดลการเรียนรู้ของเครื่องจัดอันดับ

การใช้แมชชีนเลิร์นนิงในการฝึกโมเดลการจัดอันดับ

สิทธิบัตรตั้งแต่วันนี้ได้รับเมื่อวันที่ 29 เมษายน พ.ศ. 2564 โดยเน้นที่การรับข้อมูลการฝึกอบรมสำหรับโมเดลแมชชีนเลิร์นนิงจัดอันดับเพื่อจัดอันดับเอกสารตามคำค้นหา

ข้อมูลการฝึกอบรมรวมถึงตัวอย่างการฝึกอบรม ตัวอย่างการฝึกอบรมแต่ละรายการประกอบด้วยการระบุข้อมูล:

  • การค้นหา
  • เอกสารผลลัพธ์จากรายการผลลัพธ์สำหรับคำค้นหา
  • เอกสารผลลัพธ์ที่เลือกโดยผู้ค้นหาจากรายการผลลัพธ์ของเอกสารผลลัพธ์

สิทธิบัตรเกี่ยวกับการรับข้อมูลตำแหน่งสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ข้อมูลตำแหน่งนั้นระบุตำแหน่งของเอกสารผลลัพธ์ที่เลือกใน SERP สำหรับคำค้นหาในตัวอย่างการฝึกอบรม

การกำหนด สำหรับแต่ละข้อมูลตำแหน่งตัวอย่างการฝึกอบรมและค่าอคติการเลือกที่แสดงถึงผลลัพธ์นั้นจะส่งผลต่อการเลือกเอกสารผลลัพธ์

การกำหนดค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการจากค่าความลำเอียงการเลือกสำหรับตัวอย่างการฝึกอบรม ค่าความสำคัญที่กำหนดว่าตัวอย่างการฝึกอบรมมีความสำคัญเพียงใดในการฝึกอบรมโมเดลการเรียนรู้ของเครื่องที่จัดลำดับ

นอกจากนี้ กระบวนการที่ได้รับสิทธิบัตรอาจรวมถึงคุณลักษณะต่อไปนี้ร่วมกัน:

  • การรับข้อมูลการทดสอบที่ระบุข้อความค้นหาการทดสอบจำนวนมาก ซึ่งแต่ละคำจะเติมตำแหน่งตามลำดับในรายการผลการทดสอบของเอกสารผลการทดสอบสำหรับคำค้นหาการทดสอบของเอกสารผลการทดสอบที่เลือกโดยผู้ค้นหา โดยที่ตำแหน่งของเอกสารผลการทดสอบในรายการผลการทดสอบ ถูกสุ่มเรียงสับเปลี่ยนก่อนที่จะนำเสนอต่อผู้ค้นหา
  • การพิจารณาแต่ละตำแหน่ง การนับการเลือกเอกสารผลการทดสอบตามลำดับที่ตำแหน่งโดยผู้ค้นหาตามจำนวนคำค้นหาในการทดสอบในข้อมูลการทดสอบ และการกำหนด สำหรับแต่ละตำแหน่ง ค่าอคติของตำแหน่งตามลำดับสำหรับตำแหน่ง โดยพิจารณาจากจำนวนการเลือกสำหรับตำแหน่งนั้น ๆ
  • การกำหนดค่าอคติของตำแหน่งตามลำดับที่สอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกในรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับตัวอย่างการฝึกอบรม ให้เป็นค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม

โดยที่ข้อความค้นหาสำหรับการทดสอบในจำนวนคำค้นหาในการทดสอบแต่ละรายการอยู่ในคลาสข้อความค้นหาตามลำดับของคลาสข้อความค้นหาจำนวนมาก วิธีการนี้รวมถึงสำหรับคลาสข้อความค้นหาส่วนใหญ่แต่ละคลาส:

  • การกำหนด สำหรับแต่ละจำนวนตำแหน่ง การนับการเลือกเอกสารผลการทดสอบที่ตำแหน่งโดยผู้ค้นหาที่ตอบสนองต่อคำค้นหาในการทดสอบที่เป็นของคลาสข้อความค้นหาในข้อมูลการทดสอบ
  • การกำหนด สำหรับแต่ละตำแหน่ง ค่าอคติของตำแหน่งเฉพาะคลาสตามลำดับสำหรับตำแหน่ง โดยพิจารณาจากจำนวนการเลือกสำหรับตำแหน่งนั้น ๆ
  • การรับข้อมูลที่ระบุคลาสการสืบค้นที่เป็นคำค้นหาสำหรับตัวอย่างการฝึกอบรม
  • กำหนดค่าอคติตำแหน่งเฉพาะคลาสสำหรับคลาสแบบสอบถามที่เป็นของคำค้นหา
  • สอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกสำหรับตัวอย่างการฝึกอบรมในรายการผลลัพธ์ของเอกสารผลลัพธ์ที่จะเป็นค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม
  • การรับเวกเตอร์คุณลักษณะตามลำดับสำหรับคำค้นหาในการทดสอบแต่ละครั้ง การสร้างข้อมูลการฝึกอบรมสำหรับการฝึกตัวแยกประเภทที่ได้รับเวกเตอร์คุณลักษณะตามลำดับสำหรับคำค้นหาที่ป้อนเข้า และแสดงค่าความเอนเอียงของตำแหน่งเฉพาะคำค้นหาสำหรับแต่ละตำแหน่งสำหรับการค้นหาอินพุต แบบสอบถามและการฝึกอบรมลักษณนามเกี่ยวกับข้อมูลการฝึกอบรม
  • การรับคุณสมบัติเวกเตอร์สำหรับคำค้นหาในตัวอย่างการฝึกอบรม
  • การประมวลผลเวกเตอร์คุณลักษณะโดยใช้ตัวแยกประเภทที่ได้รับการฝึกอบรมเพื่อสร้างค่าอคติของตำแหน่งเฉพาะของข้อความค้นหาตามลำดับสำหรับแต่ละตำแหน่งของตำแหน่งสำหรับคำค้นหาในตัวอย่างการฝึกอบรม
  • การกำหนดค่าอคติตำแหน่งเฉพาะคำค้นหาที่สอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกสำหรับตัวอย่างการฝึกอบรมในรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับคำค้นหาให้เป็นค่าความลำเอียงการเลือกสำหรับตัวอย่างการฝึกอบรม
  • การติดป้ายกำกับข้อความค้นหาการทดสอบเป็นตัวอย่างเชิงบวกสำหรับตำแหน่งในรายการผลการทดสอบของเอกสารผลลัพธ์สำหรับคำค้นหาการทดสอบของผลการค้นหาการทดสอบที่ผู้ค้นหาเลือก และการติดป้ายกำกับข้อความค้นหาการทดสอบเป็นตัวอย่างเชิงลบสำหรับตำแหน่งอื่นๆ ของ หลายตำแหน่ง
  • การฝึกอบรมแบบจำลองการเรียนรู้ของเครื่องจัดอันดับในข้อมูลการฝึกอบรมโดยใช้ค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมจำนวนมากในข้อมูลการฝึกอบรม
  • การพิจารณา สำหรับแต่ละตัวอย่างการฝึกอบรมของตัวอย่างการฝึกอบรมจำนวนมากในข้อมูลการฝึกอบรม การสูญเสียตามลำดับสำหรับตัวอย่างการฝึกอบรม
  • การปรับ สำหรับแต่ละตัวอย่างการฝึกอบรมของตัวอย่างการฝึกอบรมจำนวนมากในข้อมูลการฝึกอบรม การสูญเสียสำหรับตัวอย่างการฝึกอบรมตามค่าความสำคัญของตัวอย่างการฝึกอบรมเพื่อสร้างการสูญเสียที่ปรับปรุง
  • การฝึกอบรมแบบจำลองการเรียนรู้ของเครื่องโดยใช้การสูญเสียที่ปรับแล้วสำหรับตัวอย่างการฝึกอบรมจำนวนมากในข้อมูลการฝึกอบรม

วิธีการนี้รวมถึงการฝึกโมเดลการเรียนรู้ของเครื่องโดยลดผลรวมของการสูญเสียที่ปรับปรุงแล้วสำหรับข้อมูลการฝึกอบรมจำนวนมาก

ข้อดีของการติดตามโมเดลการจัดอันดับการเรียนรู้ของเครื่อง

โมเดลข้อมูลการคลิกผ่านแบบธรรมดาสามารถประมาณความเกี่ยวข้องสำหรับคู่คิวรี-เอกสารแต่ละรายการในบริบทของการค้นเว็บ

แบบจำลองข้อมูลการคลิกผ่านแบบธรรมดานั้นมักต้องการการคลิกหลายครั้งสำหรับแบบสอบถามแต่ละรายการและเอกสารผลลัพธ์แต่ละคู่ ซึ่งทำให้ยากต่อการใช้แบบจำลองข้อมูลการคลิกผ่าน โดยที่ข้อมูลการคลิกมีน้อยมาก เนื่องจากร่างกายส่วนบุคคลและความต้องการข้อมูล เช่น การค้นหาส่วนบุคคล

เมื่อเทียบกับแบบจำลองข้อมูลการคลิกผ่านทั่วไป ระบบที่ใช้ความเอนเอียงในการเลือกสำหรับตำแหน่งรายการผลลัพธ์ที่หลากหลายเมื่อฝึกแบบจำลองการจัดอันดับสามารถใช้ประโยชน์จากข้อมูลการคลิกแบบเบาบางได้อย่างมีประสิทธิภาพมากขึ้น ในขณะที่ลดหรือขจัดผลกระทบของอคติในการเลือกที่มีต่อคะแนนการจัดอันดับที่สร้างโดยการฝึกอบรม แบบอย่าง.

ซึ่งหมายความว่ารูปแบบที่ได้รับการฝึกอบรมสามารถให้คะแนนการจัดอันดับที่แม่นยำแม้ว่าข้อมูลการคลิกจะเบาบางมาก ซึ่งหมายความว่าผลการค้นหาจะตอบสนองความต้องการด้านข้อมูลของผู้ค้นหาได้ดีขึ้น

สิทธิบัตรนี้สามารถพบได้ที่:

การฝึกอบรมรูปแบบการจัดอันดับ
หมายเลขสิทธิบัตร: US20210125108
นักประดิษฐ์ Donald Arthur Metzler, Jr., Xuanhui Wang, Marc Alexander Najork และ Michael Bendersky
ผู้สมัคร Google LLC
วันที่ได้รับ: 29 เมษายน 2021
วันที่ยื่น 24 ตุลาคม 2559

เชิงนามธรรม

วิธีการ ระบบ และอุปกรณ์ รวมถึงโปรแกรมคอมพิวเตอร์ที่เข้ารหัสบนสื่อจัดเก็บข้อมูลคอมพิวเตอร์ สำหรับการฝึกอบรมการจัดลำดับโมเดลแมชชีนเลิร์นนิง ในด้านหนึ่ง วิธีการประกอบด้วยการดำเนินการในการรับข้อมูลการฝึกอบรมสำหรับแบบจำลองการจัดลำดับของการเรียนรู้ด้วยเครื่อง ข้อมูลการฝึกอบรมรวมถึงตัวอย่างการฝึกอบรม และตัวอย่างการฝึกอบรมแต่ละรายการรวมถึงการระบุข้อมูล: คำค้นหา ผลลัพธ์ในเอกสารจากรายการผลลัพธ์สำหรับคำค้นหา และเอกสารผลลัพธ์ที่ผู้ค้นหาเลือกจากรายการผลลัพธ์ การรับข้อมูลตำแหน่งสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม ข้อมูลตำแหน่งที่ระบุตำแหน่งตามลำดับของเอกสารผลลัพธ์ที่เลือกในรายการผลลัพธ์สำหรับคำค้นหาใน ตัวอย่างการฝึกอบรม การกำหนดตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม ค่าอคติการเลือกตามลำดับ และกำหนดค่าความสำคัญตามลำดับสำหรับแต่ละตัวอย่างการฝึกอบรมจากค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม ค่าความสำคัญ

ตัวอย่างระบบค้นหาแมชชีนเลิร์นนิง

ผู้ค้นหาสามารถโต้ตอบกับระบบการค้นหาผ่านอุปกรณ์ค้นหา

อุปกรณ์ค้นหาอาจเป็นคอมพิวเตอร์ที่เชื่อมต่อกับระบบค้นหาผ่านเครือข่ายการสื่อสารข้อมูล เช่น เครือข่ายท้องถิ่น (LAN) หรือเครือข่ายบริเวณกว้าง (WAN) เช่น อินเทอร์เน็ต หรือเครือข่ายร่วมกัน

ในบางกรณี ระบบการค้นหาสามารถนำไปใช้กับอุปกรณ์ค้นหาได้ หากผู้ค้นหาติดตั้งแอปพลิเคชันที่ทำการค้นหาบนอุปกรณ์ค้นหา

อุปกรณ์ค้นหาโดยทั่วไปจะประกอบด้วยหน่วยความจำ เช่น หน่วยความจำเข้าถึงโดยสุ่ม (RAM) สำหรับจัดเก็บคำสั่งและข้อมูล และตัวประมวลผลสำหรับดำเนินการคำสั่งที่เก็บไว้ หน่วยความจำสามารถมีได้ทั้งหน่วยความจำแบบอ่านอย่างเดียวและแบบเขียนได้

โดยทั่วไป ระบบการค้นหาสามารถกำหนดค่าเพื่อค้นหาชุดเอกสารเฉพาะที่เกี่ยวข้องกับผู้ค้นหาของอุปกรณ์ค้นหา

คำว่า "เอกสาร" จะใช้อย่างกว้างๆ เพื่อรวมผลิตภัณฑ์งานใดๆ ที่เครื่องสามารถอ่านได้และที่เครื่องสามารถจัดเก็บได้

เอกสารอาจรวมถึง:

  • อีเมล
  • ไฟล์
  • การรวมกันของไฟล์
  • ไฟล์อย่างน้อยหนึ่งไฟล์ที่มีลิงก์ฝังตัวไปยังไฟล์อื่น
  • กลุ่มข่าวโพสต์
  • บล็อก
  • รายชื่อธุรกิจ
  • ข้อความที่พิมพ์ในรูปแบบอิเล็กทรอนิกส์
  • เว็บโฆษณา
  • เป็นต้น

การรวบรวมเอกสารที่ระบบค้นหากำหนดค่าให้ค้นหาอาจถูกส่งอีเมลในบัญชีอีเมลของผู้ค้นหา ข้อมูลแอปพลิเคชันมือถือที่เกี่ยวข้องกับบัญชีของผู้ค้นหา เช่น การตั้งค่าแอปพลิเคชันมือถือหรือประวัติการใช้งานแอปพลิเคชันมือถือ , ไฟล์ที่เกี่ยวข้องกับผู้ค้นหาในบัญชีการจัดเก็บเอกสารบนคลาวด์ เช่น ไฟล์ที่ผู้ค้นหาอัปโหลดหรือไฟล์ที่ผู้ค้นหารายอื่นแบ่งปันกับผู้ค้นหา หรือกลุ่มเอกสารเฉพาะของผู้ค้นหาอื่น

ผู้ค้นหาสามารถส่งข้อความค้นหาไปยังระบบค้นหาโดยใช้อุปกรณ์ค้นหา เมื่อผู้ค้นหาส่งข้อความค้นหา ข้อความค้นหาจะถูกส่งผ่านเครือข่ายไปยังระบบการค้นหา

เมื่อระบบค้นหาได้รับคำค้นหา โปรแกรมค้นหาภายในระบบค้นหาจะระบุเอกสารในชุดเอกสารที่ตรงกับคำค้นหาและตอบแบบสอบถามโดยสร้างผลการค้นหาที่แต่ละรายการระบุเอกสารที่เกี่ยวข้องซึ่งตรงกับการค้นหาและส่งผ่าน /เครือข่ายไปยังอุปกรณ์ค้นหาเพื่อนำเสนอต่อผู้ค้นหา กล่าวคือ ในรูปแบบที่สามารถนำเสนอต่อผู้ค้นหาได้

เสิร์ชเอ็นจิ้นอาจรวมถึงเอ็นจิ้นการจัดทำดัชนีและเอ็นจิ้นการจัดอันดับ เอ็นจิ้นการทำดัชนีจะจัดทำดัชนีเอกสารในคอลเลกชั่นของเอกสารและเพิ่มเอกสารที่จัดทำดัชนีไปยังฐานข้อมูลดัชนี เอ็นจิ้นการจัดอันดับจะสร้างคะแนนตามลำดับสำหรับเอกสารในฐานข้อมูลดัชนีที่ตรงกับคำค้นหาและจัดอันดับเอกสารตามคะแนนที่เกี่ยวข้อง

โดยทั่วไป ผลการค้นหาจะแสดงต่อผู้ค้นหา รายการผลลัพธ์จะถูกเรียงลำดับตามคะแนนการจัดอันดับที่สร้างโดยกลไกการจัดอันดับสำหรับเอกสารที่ระบุโดยผลการค้นหา 128 สำหรับกรณีก่อนหน้า ผลการค้นหาที่ระบุเอกสารที่มีคะแนนสูงกว่าสามารถนำเสนอในตำแหน่งที่สูงขึ้นในผลลัพธ์ รายการมากกว่าผลการค้นหาที่ระบุเอกสารที่มีคะแนนค่อนข้างต่ำกว่า

เอ็นจิ้นการจัดอันดับจะสร้างคะแนนการจัดอันดับสำหรับเอกสารโดยใช้แบบจำลองการจัดลำดับแมชชีนเลิร์นนิง

โมเดลแมชชีนเลิร์นนิงจัดอันดับคือโมเดลแมชชีนเลิร์นนิงที่ได้รับการฝึกฝนเพื่อรับคุณสมบัติหรือข้อมูลอื่นๆ ที่กำหนดลักษณะเอกสารที่ป้อนเข้า และอาจเป็นทางเลือก ข้อมูลที่กำหนดลักษณะคำค้นหา และสร้างคะแนนการจัดอันดับสำหรับเอกสารอินพุต

โมเดลแมชชีนเลิร์นนิงแบบจัดอันดับสามารถใช้โมเดลแมชชีนเลิร์นนิงได้หลากหลาย

โมเดลแมชชีนเลิร์นนิงแบบจัดอันดับอาจเป็นโมเดลแมชชีนเลิร์นนิงเชิงลึก เช่น โครงข่ายประสาทเทียม ซึ่งรวมถึงการดำเนินการที่ไม่เป็นเชิงเส้นหลายชั้น

หรือการจัดอันดับโมเดลแมชชีนเลิร์นนิงอาจเป็นโมเดลแมชชีนเลิร์นนิงแบบตื้น เช่น โมเดลเชิงเส้นทั่วไป

คะแนนการจัดอันดับอาจคาดการณ์ความเกี่ยวข้องของเอกสารอินพุตกับคำค้นหาหรืออาจพิจารณาทั้งความเกี่ยวข้องของเอกสารป้อนข้อมูลและคุณภาพที่ไม่ขึ้นกับข้อความค้นหาของเอกสารป้อนข้อมูล ทั้งนี้ขึ้นอยู่กับวิธีการจัดลำดับแบบจำลองการเรียนรู้ของเครื่อง

ในการใช้งานบางอย่าง เอ็นจิ้นการจัดอันดับจะแก้ไขคะแนนการจัดอันดับที่สร้างโดยโมเดลการเรียนรู้ของเครื่องจัดอันดับตามปัจจัยอื่นๆ และจัดลำดับเอกสารโดยใช้คะแนนการจัดอันดับที่แก้ไข

ในการฝึกการจัดอันดับโมเดลแมชชีนเลิร์นนิงเพื่อให้สามารถใช้โมเดลในการจัดอันดับเอกสารเพื่อตอบสนองต่อคำค้นหาที่ได้รับ ระบบการค้นหายังรวมเอ็นจิ้นการฝึกอบรมไว้ด้วย

เอ็นจิ้นการฝึกอบรมจะฝึกโมเดลแมชชีนเลิร์นนิงจัดอันดับตามข้อมูลการฝึกอบรมที่มีตัวอย่างการฝึกอบรมหลายแบบ

ตัวอย่างการฝึกอบรมแต่ละรายการระบุ

  • (i) คำค้นหา
  • (ii) เอกสารผลลัพธ์จากรายการผลลัพธ์สำหรับคำค้นหา
  • (iii) เอกสารผลลัพธ์ที่ผู้ค้นหาเลือกจากรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับคำค้นหา

ตามที่อธิบายไว้ในสิทธิบัตรนี้ การเลือกเอกสารผลลัพธ์เพื่อตอบสนองต่อคำค้นหาคือการเลือกผลการค้นหาที่ระบุเอกสารผลลัพธ์จากรายการผลลัพธ์ของผลการค้นหาที่แสดงเพื่อตอบสนองต่อการส่งคำค้นหาโดยผู้ค้นหา SERPs คือเอกสารที่ระบุโดยผลการค้นหาในรายการผลลัพธ์

เพื่อปรับปรุงคุณภาพของคะแนนการจัดอันดับจากแบบจำลองการจัดลำดับของแมชชีนเลิร์นนิง เมื่อฝึกแล้ว เอ็นจิ้นการฝึกจะฝึกในลักษณะที่คำนึงถึงรายการผลลัพธ์ของผลการค้นหาที่ผู้ค้นหาเลือก

กลไกการฝึกอบรมจะกำหนดค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการตามตำแหน่งในรายการผลลัพธ์ของผลการค้นหาที่ผู้ค้นหาเลือกตามคำค้นหาในตัวอย่างการฝึกอบรม

โดยการฝึกโมเดลแมชชีนเลิร์นนิงด้วยวิธีนี้ เอ็นจิ้นการฝึกจะลดหรือขจัดผลกระทบของอคติตำแหน่งต่อคะแนนการจัดอันดับที่สร้างโดยโมเดลแมชชีนเลิร์นนิงจัดอันดับเมื่อโมเดลได้รับการฝึกอบรมแล้ว

การกำหนดค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ระบบจะรับข้อมูลตำแหน่งซึ่งระบุตำแหน่งตามลำดับในรายการผลลัพธ์สำหรับคำค้นหาที่ผู้ค้นหาเลือกเพื่อตอบสนองต่อคำค้นหา กล่าวคือ ผลการค้นหาที่ผู้ค้นหาเลือกจากรายการผลลัพธ์ที่สร้างขึ้นเพื่อตอบสนองต่อคำค้นหา .

ตัวอย่างการฝึกเครื่องจักร

ระบบจะกำหนดค่าอคติในการเลือกตามลำดับ ซึ่งแสดงถึงระดับที่ตำแหน่งของเอกสารผลลัพธ์ที่เลือกในรายการผลลัพธ์สำหรับคำค้นหาในตัวอย่างการฝึกอบรมส่งผลต่อการเลือกเอกสารผลลัพธ์

ค่าความลำเอียงการเลือกสามารถกำหนดได้หลายวิธี

ระบบจะกำหนดค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ค่าความสำคัญสำหรับตัวอย่างการฝึกอบรมที่กำหนดจะกำหนดว่าตัวอย่างการฝึกอบรมมีความสำคัญเพียงใดในการฝึกอบรมแบบจำลองการจัดลำดับของการเรียนรู้ของเครื่อง

ค่าความสำคัญตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรมสามารถกำหนดตามค่าอคติการเลือกตามลำดับสำหรับตัวอย่างการฝึกอบรม

ตัวอย่างเช่น ค่าความสำคัญสำหรับตัวอย่างการฝึกหนึ่งๆ อาจเป็นค่าผกผันของค่าความลำเอียงการเลือกสำหรับตัวอย่างการฝึก หรือโดยทั่วไปแล้วจะเป็นสัดส่วนผกผันกับค่าความลำเอียงการเลือกสำหรับตัวอย่างการฝึก

เมื่อระบบกำหนดค่าความสำคัญตามลำดับสำหรับข้อมูลการฝึกอบรมของข้อมูลการฝึกอบรม ระบบจะฝึกอบรมแบบจำลองการจัดลำดับของแมชชีนเลิร์นนิงในข้อมูลการฝึกอบรมโดยใช้ค่าความสำคัญ

การกำหนดค่าอคติการเลือกตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ระบบจะรับข้อมูลการทดสอบที่ระบุคำค้นหาในการทดสอบ สำหรับคำค้นหาการทดสอบแต่ละรายการ ตำแหน่งตามลำดับในรายการผลการทดสอบของเอกสารผลการทดสอบสำหรับคำค้นหาการทดสอบของผลการทดสอบในเอกสารที่ผู้ค้นหาเลือกไว้

ทดลองแมชชีนเลิร์นนิง

รายการผลการทดสอบตำแหน่งของเอกสารผลการทดสอบจะถูกสุ่มเปลี่ยนก่อนรายการผลการทดสอบจะถูกนำเสนอต่อผู้ค้นหา

ดังนั้น เอกสารผลการทดสอบที่ผู้ค้นหาเลือกจากรายการผลลัพธ์ที่กำหนดจึงมีแนวโน้มที่จะถูกกำหนดให้กับตำแหน่งรายการผลการทดสอบใดๆ เท่ากัน

สำหรับแต่ละตำแหน่งในรายการผลการทดสอบ ระบบจะกำหนดจำนวนการเลือกเอกสารผลการทดสอบที่ตำแหน่งโดยผู้ค้นหาตามคำค้นหาของการทดสอบในข้อมูลการทดสอบ

ตัวอย่างเช่น ระบบสามารถกำหนดจำนวนการเลือกตามลำดับสำหรับตำแหน่ง N อันดับแรกในรายการผลการทดสอบ โดยที่ N เป็นจำนวนเต็มที่มากกว่า 1 เช่น สี่ ห้า หรือสิบ หรือสำหรับแต่ละตำแหน่งในรายการผลการทดสอบ

ตัวอย่างเช่น ที่ระบบได้รับข้อมูลการทดสอบ รวมถึง 10 รายการผลการทดสอบ ถ้าผู้ค้นหาเลือกอันดับแรกสำหรับ 7 ของรายการผลการทดสอบ ตำแหน่งที่สองสำหรับ 2 ของรายการผลการทดสอบ ดังนั้น อันดับที่สามสำหรับ 1 ของรายการผลการทดสอบ การนับการเลือกสำหรับตำแหน่งที่หนึ่งสามารถเป็น 7 การนับการเลือกสำหรับตำแหน่งที่สองสามารถเป็น 2 และการนับการเลือกสำหรับตำแหน่งที่สามสามารถเป็น 1

สำหรับแต่ละตำแหน่ง ระบบจะกำหนดค่าความเอนเอียงของตำแหน่งตามลำดับสำหรับตำแหน่งตามจำนวนการเลือกสำหรับตำแหน่งนั้น ๆ

ค่าความเอนเอียงของตำแหน่งแสดงถึงระดับที่เอกสารผลการทดสอบที่เลือกในรายการผลการทดสอบสำหรับคำค้นหาในการทดสอบในข้อมูลการทดสอบส่งผลต่อการเลือกเอกสารผลการทดสอบ

ในการใช้งานบางอย่าง ค่าอคติของตำแหน่งตามลำดับของแต่ละตำแหน่งสามารถเป็นสัดส่วนกับการนับการเลือกสำหรับตำแหน่งนั้น ๆ ในการใช้งานบางอย่าง สามารถคำนวณค่าความเอนเอียงของตำแหน่งตามลำดับสำหรับแต่ละตำแหน่งได้โดยการหารจำนวนการเลือกที่ตำแหน่งนั้นด้วยการเลือกตำแหน่งใดๆ ของตำแหน่งในรายการผลการทดสอบ

สำหรับตัวอย่างการฝึกแต่ละรายการในข้อมูลการฝึก ระบบจะกำหนดค่าความเอนเอียงของตำแหน่งที่สอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกในรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับตัวอย่างการฝึกให้เป็นค่าอคติการเลือกสำหรับตัวอย่างการฝึก

ตัวอย่างเช่น โดยที่ระบบกำหนดค่าความเอนเอียงของตำแหน่ง b 1 สำหรับตำแหน่งแรกโดยใช้จำนวนการเลือกเอกสารผลการทดสอบที่ตำแหน่งแรก หากตำแหน่งแรกคือตำแหน่งของเอกสารผลลัพธ์ที่ผู้ค้นหาเลือกในรายการผลลัพธ์ ตัวอย่างการฝึกอบรมในข้อมูลการฝึก ระบบจะกำหนดว่าค่าความเอนเอียงของตำแหน่ง 1 คือค่าอคติการเลือกสำหรับตัวอย่างการฝึก

การกำหนดค่าอคติการเลือกตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ในตัวอย่างนี้ แต่ละคำค้นหาในการทดสอบในคำค้นหาทดสอบได้รับการจัดประเภทว่าเป็นของคลาสคำค้นหาตามลำดับของชุดคลาสข้อความค้นหาที่กำหนดไว้ล่วงหน้า จากนั้น ระบบจะดำเนินการตามขั้นตอนสำหรับแต่ละคลาสในชุดคลาสเคียวรีที่กำหนดไว้ล่วงหน้า

แบบสอบถาม คลาส แมชชีนเลิร์นนิง

สำหรับคลาสข้อความค้นหาที่กำหนด ระบบจะรับข้อมูลการทดสอบที่ระบุข้อความค้นหาในการทดสอบซึ่งจัดอยู่ในประเภทข้อความค้นหาที่กำหนด และตำแหน่งตามลำดับในรายการผลการทดสอบของเอกสารผลลัพธ์สำหรับการค้นหาการทดสอบ ข้อความค้นหาของเอกสารผลการทดสอบที่ผู้ค้นหาเลือก

สำหรับคลาสข้อความค้นหาที่กำหนด ระบบจะกำหนดสำหรับตำแหน่งบางส่วนหรือทั้งหมดในรายการผลการทดสอบ จำนวนการเลือกเอกสารผลการทดสอบตามลำดับที่ตำแหน่งโดยผู้ค้นหาในการตอบสนองต่อคำค้นหาในการทดสอบที่เป็นของข้อความค้นหา คลาสในข้อมูลการทดลอง ตัวอย่างเช่น ระบบสามารถกำหนดจำนวนการเลือกตามลำดับสำหรับตำแหน่ง N อันดับแรกในรายการผลการทดสอบ

สำหรับคลาสเคียวรีที่กำหนด ระบบจะกำหนดค่าอคติของตำแหน่งเฉพาะคลาสตามลำดับสำหรับตำแหน่งโดยพิจารณาจากจำนวนการเลือกตามลำดับสำหรับตำแหน่งสำหรับแต่ละตำแหน่ง ในการใช้งานบางอย่าง ค่าอคติของตำแหน่งตามลำดับของแต่ละตำแหน่งสามารถเป็นสัดส่วนกับการนับการเลือกสำหรับตำแหน่งนั้น ๆ

สำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม ระบบจะรับข้อมูลที่ระบุคลาสการสืบค้นซึ่งมีข้อความค้นหาสำหรับตัวอย่างการฝึกอบรมอยู่

ระบบกำหนดตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม ค่าอคติตำแหน่งเฉพาะคลาสสำหรับคลาสแบบสอบถามที่ข้อความค้นหาอยู่และสอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกในรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับการฝึกอบรม ตัวอย่างเพื่อเป็นค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม

ตัวอย่างเช่น เมื่อคำค้นหา Q เป็นของคลาสการค้นหา t และระบบกำหนดบิตค่าอคติของตำแหน่งเฉพาะคลาสสำหรับตำแหน่งแรกโดยใช้จำนวนการเลือกเอกสารผลการทดสอบที่ตำแหน่งแรก หากตำแหน่งแรกเป็น ตำแหน่งของเอกสารผลลัพธ์ที่ผู้ค้นหาเลือกในรายการผลลัพธ์สำหรับตัวอย่างการฝึกอบรมในข้อมูลการฝึกอบรม ระบบจะกำหนดว่าค่าอคติของตำแหน่งเฉพาะคลาส b 1 t คือค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม

กระบวนการตัวอย่างสำหรับการกำหนดค่าอคติการเลือกตามลำดับสำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม

ระบบจะรับข้อมูลการทดสอบที่ระบุคำค้นหาในการทดสอบ สำหรับคำค้นหาการทดสอบแต่ละรายการ ตำแหน่งตามลำดับในรายการผลการทดสอบของเอกสารผลลัพธ์สำหรับคำค้นหาการทดสอบของเอกสารผลการทดสอบที่ผู้ค้นหาเลือก

ฟีเจอร์ Vector Machine Learning

ระบบจะรับเวกเตอร์คุณลักษณะตามลำดับสำหรับคำค้นหาในการทดสอบแต่ละคำของคำค้นหาในการทดสอบ เวกเตอร์คุณลักษณะสามารถเป็นแบบเฉพาะคำค้นหาหรือเฉพาะผู้ค้นหา ตัวอย่างเช่น ฟีเจอร์คิวรีอาจรวมถึงจำนวนคำในคิวรี คลาสของคิวรี หรือภาษาที่ต้องการของผู้ค้นหา

ระบบสร้างข้อมูลการฝึกอบรมสำหรับการฝึกอบรมตัวแยกประเภท ตัวแยกประเภทได้รับการฝึกอบรมให้รับเวกเตอร์คุณลักษณะที่เกี่ยวข้องสำหรับคำค้นหาที่ป้อนเข้า และส่งออกค่าความเอนเอียงของตำแหน่งเฉพาะคำค้นหาตามลำดับสำหรับตำแหน่งคำค้นหาค้นหาอินพุตแต่ละตำแหน่ง

ข้อมูลการฝึกอบรมสามารถรวมตัวอย่างเชิงบวกของคำค้นหาในการทดสอบและตัวอย่างเชิงลบของคำค้นหาในการทดสอบ ตัวอย่างเช่น ระบบสามารถติดป้ายกำกับคำค้นหาการทดสอบเป็นตัวอย่างเชิงบวกสำหรับรายการผลการทดสอบของเอกสารผลลัพธ์สำหรับคำค้นหาการทดสอบของผลการค้นหาการทดสอบที่ผู้ค้นหาเลือก ระบบสามารถติดป้ายกำกับคำค้นหาการทดสอบเป็นตัวอย่างเชิงลบสำหรับตำแหน่งที่ไม่ได้เลือกในรายการผลการทดสอบของเอกสารผลลัพธ์

ระบบจะฝึกลักษณนามในข้อมูลการฝึก การฝึกอบรมตัวแยกประเภทอาจเป็นกระบวนการเรียนรู้ของเครื่องที่เรียนรู้น้ำหนักตามลำดับเพื่อนำไปใช้กับเวกเตอร์คุณลักษณะอินพุตแต่ละรายการ โดยเฉพาะอย่างยิ่ง ตัวแยกประเภทได้รับการฝึกอบรมโดยใช้กระบวนการฝึกการเรียนรู้ด้วยเครื่องแบบวนซ้ำแบบเดิม ซึ่งจะกำหนดน้ำหนักที่ฝึกแล้วสำหรับตำแหน่งรายการผลลัพธ์แต่ละรายการ ตามน้ำหนักเริ่มต้นที่กำหนดให้กับตำแหน่งรายการผลลัพธ์แต่ละตำแหน่ง กระบวนการวนซ้ำจะพยายามค้นหาน้ำหนักที่เหมาะสมที่สุด ตัวอย่างเช่น ค่าอคติของตำแหน่งเฉพาะข้อความค้นหา bi Q สำหรับตำแหน่งที่ระบุ i สำหรับคำค้นหาที่ระบุ Q สามารถกำหนดได้โดยใช้สูตรต่อไปนี้:

β i หมายถึงน้ำหนักที่ฝึกสำหรับตำแหน่ง i และ v(Q) หมายถึงเวกเตอร์คุณลักษณะสำหรับคำค้นหา Q

ลักษณนามอาจเป็นตัวแบบการถดถอยโลจิสติก ตัวแยกประเภทที่เหมาะสมอื่น ๆ สามารถใช้ในการใช้งานอื่น ๆ ได้ รวมถึงเบย์ที่ไร้เดียงสา, แผนผังการตัดสินใจ, เอนโทรปีสูงสุด, โครงข่ายประสาทเทียม หรือสนับสนุนตัวแยกประเภทที่ใช้เครื่องเวกเตอร์

สำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึก ระบบจะรับเวกเตอร์คุณลักษณะสำหรับคำค้นหาในตัวอย่างการฝึก

สำหรับตัวอย่างการฝึกอบรมแต่ละรายการในข้อมูลการฝึกอบรม ระบบจะประมวลผลเวกเตอร์คุณลักษณะโดยใช้ตัวแยกประเภทที่ได้รับการฝึกอบรมเพื่อสร้างค่าอคติของตำแหน่งเฉพาะคำค้นหาตามลำดับสำหรับแต่ละตำแหน่งสำหรับคำค้นหาในตัวอย่างการฝึกอบรม ขั้นแรก ลักษณนามที่ได้รับการฝึกจะได้รับเวกเตอร์คุณลักษณะเป็นอินพุต จากนั้นจะแสดงค่าความเอนเอียงของตำแหน่งเฉพาะคำค้นหาตามลำดับสำหรับแต่ละตำแหน่งในรายการผลลัพธ์สำหรับคำค้นหาในตัวอย่างการฝึกอบรม

สำหรับตัวอย่างการฝึกแต่ละรายการในข้อมูลการฝึก ระบบจะกำหนดค่าความเอนเอียงของตำแหน่งเฉพาะคำค้นหาที่สอดคล้องกับตำแหน่งของเอกสารผลลัพธ์ที่เลือกสำหรับตัวอย่างการฝึกในรายการผลลัพธ์ของเอกสารผลลัพธ์สำหรับคำค้นหาเป็นค่าความเอนเอียงที่เลือก ตัวอย่างการฝึกอบรม

ตัวอย่างเช่น โดยที่ระบบกำหนดค่าความเอนเอียงของตำแหน่งเฉพาะข้อความค้นหา b 1 Q สำหรับตำแหน่งแรกโดยใช้ตัวแยกประเภทที่ได้รับการฝึก หากตำแหน่งแรกคือตำแหน่งของเอกสารผลลัพธ์ที่ผู้ค้นหาเลือกในรายการผลลัพธ์สำหรับตัวอย่างการฝึกอบรมใน ข้อมูลการฝึกอบรม ระบบจะกำหนดว่าค่าอคติเฉพาะตำแหน่งแบบสอบถาม b 1 Q คือค่าอคติการเลือกสำหรับตัวอย่างการฝึกอบรม

จัดอันดับโมเดลแมชชีนเลิร์นนิง