Nvidia Maxine: การแปลการสนทนาทางวิดีโอแบบเรียลไทม์ที่ขับเคลื่อนด้วย AI
เผยแพร่แล้ว: 2021-04-27Nvidia Corporation บริษัทยักษ์ใหญ่ด้านการประมวลผลกราฟิกในแคลิฟอร์เนีย ได้เปิดตัวฟีเจอร์ใหม่ที่เรียกว่า Nvidia Maxine Nvidia Maxine เป็นนวัตกรรมล้ำสมัยที่ผสมผสานปัญญาประดิษฐ์เข้ากับเทคโนโลยีการโทรผ่านวิดีโอเพื่อสร้างซอฟต์แวร์ที่ช่วยทำหน้าที่ต่างๆ ที่ช่วยเพิ่มคุณภาพและความเร็วของวิดีโอ สามารถใช้เป็นเครื่องมือสำหรับซอฟต์แวร์วิดีโอคอลอื่นๆ เพื่อลดความไม่ชัดเจน
ประกอบด้วยคุณสมบัติมากมาย เช่น การเพิ่มประสิทธิภาพกราฟิกอัตโนมัติ การจัดตำแหน่งใบหน้าอัตโนมัติ และการแปลภาษาอัตโนมัติ บริการทั้งหมดที่ทำให้แฮงเอาท์วิดีโอเป็นเหตุการณ์ที่แทบไม่มีข้อผิดพลาด สิ่งสำคัญที่สุดคือ คุณลักษณะการเพิ่มประสิทธิภาพกราฟิกอาจมีผลกระทบในวงกว้างสำหรับพื้นที่ที่ยังไม่พัฒนาซึ่งมีแบนด์วิดท์ต่ำ
- Nvidia Maxine คืออะไร?
- คุณลักษณะการแปลการโทรวิดีโอแบบเรียลไทม์ของ Nvidia คืออะไร
- Nvidia Maxine ทำงานอย่างไร?
- มันคุ้มค่าสมคำร่ำลือหรือไม่?
- คำพูดสุดท้าย
Nvidia Maxine คืออะไร?

Nvidia Maxine เป็นชุดเครื่องมือเพิ่มประสิทธิภาพวิดีโอที่พัฒนาโดย Nvidia Corporation และเปิดตัวในเดือนตุลาคม 2020 ที่การประชุมเทคโนโลยี GPU (การประชุมระดับโลกที่จัดโดย Nvidia เพื่อส่งเสริมการอภิปรายเกี่ยวกับการพัฒนาปัญญาประดิษฐ์กับวิศวกร นักพัฒนา และนักประดิษฐ์ที่ดีที่สุดในโลกใน การเข้าร่วม). เป็นการปฏิวัติเพิ่มเติมในโลกของการส่งวิดีโอที่แก้ไขความไม่ถูกต้องหรือบกพร่องที่อาจเกิดขึ้นในการโทรได้ในระดับที่สามารถปรับปรุงวิธีที่เราดำเนินการแฮงเอาท์วิดีโอได้อย่างสมบูรณ์
คุณลักษณะบางอย่างของ Nvidia Maxine ที่ดึงความสนใจมาที่ตัวเองอย่างรวดเร็วในชุมชน AI คือคุณลักษณะที่สามารถสร้างและแยกส่วนใบหน้า พื้นหลัง เสียง และแม้แต่คุณลักษณะใบหน้าได้โดยอัตโนมัติ
สำหรับตอนนี้ เครื่องมือเพิ่มประสิทธิภาพการโทรผ่านวิดีโอเหล่านี้พร้อมจำหน่ายให้กับบริษัทซอฟต์แวร์ที่อาจต้องการรวมเทคโนโลยีนี้เข้ากับโปรแกรมของตน แต่ความสำเร็จของเครื่องมือนี้อาจหมายความว่าคุณลักษณะต่างๆ อาจพร้อมใช้งานอย่างแพร่หลายในเร็วๆ นี้
แนะนำสำหรับคุณ: ศิลปะแห่งการประชุมทางโทรศัพท์: วิธีดำเนินการประชุมออนไลน์อย่างมีประสิทธิภาพ
คุณลักษณะการแปลการโทรวิดีโอแบบเรียลไทม์ของ Nvidia คืออะไร

Nvidia Maxine มาพร้อมกับหน่วยแปลภาษาที่สามารถแปลแฮงเอาท์วิดีโอจากและเป็นภาษาใดก็ได้ในเวลาไม่กี่วินาที สิ่งประดิษฐ์นี้สามารถพิสูจน์ได้ว่าเป็นประโยชน์อย่างเหลือเชื่อสำหรับประเทศที่ทำธุรกิจกับชาวต่างชาติ
สิ่งนี้สามารถพิสูจน์ได้ว่ามีประโยชน์อย่างยิ่งกับประเทศอย่างจีนและประเทศในยุโรปส่วนใหญ่ ซึ่งเป็นประเทศที่มีความสัมพันธ์ทางการค้าที่ดีกับประเทศส่วนใหญ่แต่ไม่ได้พูดภาษาอังกฤษเป็นภาษาราชการ สิ่งนี้จะช่วยกระชับความสัมพันธ์ทางธุรกิจและทำให้เกิดการเปลี่ยนแปลงทางเศรษฐกิจและการเงินครั้งใหญ่แก่ประเทศที่ใช้งาน
สิ่งที่ทำให้คุณลักษณะนี้แตกต่างจากคุณลักษณะอื่นๆ เช่น Google แปลภาษาก็คือความสามารถในการแปลการสนทนาและบทสนทนาในแบบเรียลไทม์ ซึ่งหมายความว่าจะไม่มีการหยุดชั่วคราวที่น่าอึดอัดใจใดๆ ในแฮงเอาท์วิดีโอต่างประเทศ เนื่องจากนักแปลที่เป็นมนุษย์เริ่มการแปลแบบวงเวียนหรือเมื่อมีคนคลำหา Google แปลภาษาเพื่อทำความเข้าใจสิ่งที่กำลังพูด
การทำงานกับบริษัทต่างชาติที่ไม่มีภาษากลางมักจะเป็นงานที่ยากเสมอ แต่ด้วยการระบาดของ COVID-19 ที่จุดสูงสุดของคลื่นลูกที่สอง งานนั้นจึงยากขึ้นมากด้วยการประชุมในรูปแบบระยะไกลด้วยความช่วยเหลือของแอพเช่น ซูมและสไกป์ เฟรมที่หยุดนิ่งและการส่งสัญญาณเสียงที่ผิดพลาดเนื่องจากการเชื่อมต่ออินเทอร์เน็ตที่ช้าเป็นเรื่องปกติที่เกิดขึ้น แต่การประชุมในภาษาต่างประเทศนั้นยากลำบาก Nvidia Maxine ได้รับการขนานนามว่าเป็นสิ่งที่จะช่วยให้ผู้ใช้กำจัดความไม่สะดวกที่น่ารำคาญเหล่านี้ทั้งหมดด้วยคุณสมบัติการแปลการสนทนาทางวิดีโอแบบเรียลไทม์ทำให้เป็นสิ่งประดิษฐ์ที่ไม่สามารถมาในเวลาที่ดีกว่า

Nvidia Maxine ทำงานอย่างไร?

องค์ประกอบหลักในความเร็วที่ Nvidia Maxine แปลภาษาอย่างเป็นธรรมชาติคือการใช้ปัญญาประดิษฐ์ (AI) เพื่อแยกแยะรูปแบบคำพูดและเสียงเพื่อแปลประโยคเป็นภาษาที่เลือกในระยะเวลาน้อยที่สุด
Maxine ของ Nvidia ใช้สิ่งที่เรียกว่า 'การเรียนรู้อย่างลึกซึ้ง' เพื่อให้ได้เอฟเฟกต์ส่วนใหญ่ที่มีให้จากเครื่องมือของตน การเรียนรู้เชิงลึกเป็นการเรียนรู้ AI ประเภทหนึ่งที่เรียกว่าการเรียนรู้ของเครื่อง ซึ่งพัฒนาขึ้นครั้งแรกในปี 2555 และเป็นเทคโนโลยีที่อยู่เบื้องหลังแอปการจดจำใบหน้า คุณลักษณะการแปล และระบบแนะนำเนื้อหาส่วนใหญ่
เครื่องมือที่รวมอยู่ในกลุ่มผลิตภัณฑ์ของ Nvidia Maxine จนถึงขณะนี้ ได้แก่ การแปลงวิดีโอความละเอียดต่ำเป็นวิดีโอความละเอียดสูงโดยใช้ AI การจัดตำแหน่งใบหน้าอัตโนมัติ การลดสัญญาณรบกวน และแน่นอน คุณสมบัติการแปลที่ทำงานแบบเรียลไทม์ เครื่องมือเหล่านี้จะเป็นประโยชน์สำหรับผู้ที่มีการเชื่อมต่ออินเทอร์เน็ตที่ไม่เสถียร สถานที่ทำงานที่มีเสียงดัง และอุปสรรคด้านภาษาขณะดำเนินการประชุมทางไกล
นอกเหนือจากคุณสมบัติการแปลตามเวลาจริงแล้ว เครื่องมือที่น่าดึงดูดใจที่สุดของ Nvidia Maxine คือคำมั่นสัญญาว่าจะลดแบนด์วิดท์ที่จำเป็นสำหรับการส่งสัญญาณวิดีโอที่ราบรื่นของภาพความละเอียดสูง กล่าวอย่างง่าย ๆ สิ่งประดิษฐ์ใหม่ล่าสุดของ GPU ยักษ์ทำงานบนเหตุผลที่ไม่จำเป็นต้องส่งข้อมูลภาพทั้งหมดในวิดีโอใด ๆ เพื่อให้ได้ภาพความละเอียดสูงในอีกด้านหนึ่ง Maxine ทำงานโดยส่งเฉพาะบางจุดของภาพ จากนั้นเติมช่องว่างด้วยตัวเองด้วยเทคโนโลยีปัญญาประดิษฐ์ (AI)
มันคุ้มค่าสมคำร่ำลือหรือไม่?

การประดิษฐ์ของ Nvidia ทำให้เกิดคำถามบางประการเกี่ยวกับจริยธรรมของการใช้แฮงเอาท์วิดีโอ โดยอ้างถึงการเพิ่มขึ้นของอุบัติการณ์ของผู้แอบอ้างที่หลอกให้ผู้คนคิดว่าพวกเขาเป็นครอบครัวหรือเพื่อน และชอบตกปลาดุกที่อยู่เบื้องหลังความสงสัย นอกจากนี้ การอภิปรายจะยังคงเปิดกว้างเกี่ยวกับการแปลโดยมนุษย์กับเครื่อง อย่างน้อยก็อีกหลายวัน
อย่างไรก็ตาม การระบาดใหญ่ของโควิด-19 ทำให้ประชากรโลกส่วนใหญ่ไม่สามารถทำงานจากที่บ้านได้ เหตุการณ์นี้ทำให้อัตราการดาวน์โหลดเพิ่มขึ้นอย่างรวดเร็วซึ่งซอฟต์แวร์และแอปพลิเคชันการโทรผ่านวิดีโอได้เห็นในช่วงไม่กี่เดือนที่ผ่านมา มันแสดงให้เห็นว่าฟีเจอร์ของการโทรวิดีโอมีความสำคัญเพียงใดและโดยการขยาย Nvidia Maxine นั้นมีความสำคัญต่ออนาคตของการประชุมทางไกลและงานสำนักงานเสมือนในอนาคต
นอกจากนั้น สถานะของ Nvidia ในฐานะบริษัทที่ให้บริการเทคโนโลยีล้ำสมัยแก่ผู้ใช้คอมพิวเตอร์ทุกประเภทตั้งแต่เกมเมอร์ไปจนถึงนักพัฒนาซอฟต์แวร์ ให้ความน่าเชื่อถือในการลงทุนนี้ เนื่องจากความสามารถทางการเงินของบริษัท Nvidia ในการค้นคว้าและผลิตเครื่องมือเหล่านี้ในปริมาณมากสำหรับ ประโยชน์ของผู้ใช้
อย่างไรก็ตาม บางสิ่งที่อาจพิสูจน์ให้เห็นถึงความตกตะลึงสำหรับผู้ใช้บางรายอาจเป็นเพราะ Maxine จำเป็นต้องมี GPU Nvidia เพื่อให้มันใช้งานได้ ตัวแทนของ Nvidia ยังไม่ได้ยืนยันเรื่องนี้
คุณยังอาจต้องการ: 10 ซอฟต์แวร์ตัดต่อวิดีโอสำหรับใช้ตั้งแต่มือใหม่จนถึงมืออาชีพ
คำพูดสุดท้าย

ตอนนี้คงต้องรอดูกันต่อไปว่าบริษัทยักษ์ใหญ่ด้านวิดีโอคอลอื่นๆ เช่น Zoom และ Microsoft ซื้อเทคโนโลยีของ Nvidia Maxine หรือพัฒนาเทคโนโลยีของตนเองเพื่อเสริมแอปพลิเคชันวิดีโอคอล ด้วยการปรับปรุงเทคโนโลยีในทุกช่วงตึก การรักษาให้ทันเวลาจึงอาจเป็นเรื่องยาก บริษัทแปลสามารถช่วยซอฟต์แวร์ของคุณปรับให้เข้ากับความต้องการของผู้บริโภคได้ พวกเขายังช่วยคุณแปลซอฟต์แวร์ของคุณเป็นภาษาต่างๆ มากกว่า 100 ภาษา
