Nvidia Maxine: tłumaczenie rozmów wideo w czasie rzeczywistym oparte na sztucznej inteligencji

Opublikowany: 2021-04-27

Nvidia Corporation, gigant przetwarzania grafiki z siedzibą w Kalifornii, niedawno zaprezentował nową funkcję o nazwie Nvidia Maxine. Nvidia Maxine to najnowocześniejsza innowacja, która łączy sztuczną inteligencję z technologią połączeń wideo w celu stworzenia oprogramowania, które pomaga wykonywać różne funkcje poprawiające jakość i szybkość wideo. Może być używany jako narzędzie dla innych programów do połączeń wideo, aby zmniejszyć ich nieprecyzyjność.

Zawiera wiele funkcji, takich jak automatyczne ulepszanie grafiki, automatyczne wyrównanie twarzy i automatyczne tłumaczenie języka — wszystkie usługi, które mogą sprawić, że rozmowa wideo będzie praktycznie bezbłędna. Co najważniejsze, funkcja ulepszania grafiki może mieć dalekosiężne skutki dla słabo rozwiniętych obszarów, które działają ze słabą przepustowością.

Spis treści pokaż
  • Co to jest Nvidia Maxine?
  • Co to jest funkcja tłumaczenia rozmów wideo w czasie rzeczywistym Nvidii?
  • Jak działa Nvidia Maxine?
  • Czy to warte szumu?
  • Ostatnie słowa

Co to jest Nvidia Maxine?

pytanie-zapytanie-myśl-myśl-plan

Nvidia Maxine to zestaw narzędzi do ulepszania wideo opracowany przez firmę Nvidia Corporation i zaprezentowany w październiku 2020 r. na konferencji GPU Technology Conference (światowej konferencji zorganizowanej przez firmę Nvidia w celu promowania dyskusji na temat rozwoju sztucznej inteligencji z najlepszymi inżynierami, programistami i innowatorami na świecie frekwencja). Jest to rewolucyjny dodatek do świata transmisji wideo, który koryguje nieścisłości lub usterki, które mogą pojawić się w rozmowach telefonicznych w stopniu, który może całkowicie zmienić sposób, w jaki prowadzimy rozmowy wideo.

Niektóre cechy Nvidii Maxine, które szybko zwracają na siebie uwagę w społeczności AI, to te, za pomocą których jest ona w stanie automatycznie konstruować i dekonstruować twarze, tła, dźwięki, a nawet rysy twarzy.

Na razie te narzędzia do ulepszania połączeń wideo są dostępne w sprzedaży producentom oprogramowania, które mogą chcieć włączyć tę technologię do swoich programów, ale ich sukces może oznaczać, że funkcje mogą wkrótce stać się powszechnie dostępne.

Polecane dla Ciebie: Sztuka telekonferencji: Jak prowadzić efektywne spotkania online.

Co to jest funkcja tłumaczenia rozmów wideo w czasie rzeczywistym Nvidii?

online-nauka-edukacyjna-czat-wideo-konferencja-spotkanie

Nvidia Maxine jest dostarczana z jednostką tłumaczącą język, która jest w stanie przetłumaczyć rozmowę wideo zi na dowolny język w ciągu kilku sekund. Wynalazek ten może okazać się niezwykle korzystny dla krajów, które prowadzą interesy z obcokrajowcami.

Może to okazać się szczególnie przydatne w przypadku krajów takich jak Chiny i większość krajów europejskich — tych, które cieszą się zdrowymi stosunkami handlowymi z większością krajów, ale nie posługują się językiem angielskim jako językiem urzędowym. Pomoże to wzmocnić więzi biznesowe i wywoła ogromne zmiany gospodarcze i finansowe w krajach, które go zatrudniają.

Inną rzeczą, która odróżnia tę funkcję od innych funkcji, takich jak Tłumacz Google, jest możliwość tłumaczenia rozmów i dialogów w czasie rzeczywistym. Oznacza to, że nie będzie żadnych niezręcznych przerw w zagranicznych rozmowach wideo, gdy tłumacz włącza się do tłumaczenia okrężnego lub gdy ktoś grzebie w Tłumaczu Google, aby zrozumieć, co zostało powiedziane.

Praca z zagranicznymi firmami bez wspólnego języka zawsze była trudnym zadaniem, ale wraz z pandemią COVID-19 u szczytu drugiej fali, zadanie to stało się znacznie trudniejsze, ponieważ spotkania prowadzone były zdalnie za pomocą aplikacji takich jak Zoom i Skype. Częstym zjawiskiem są zamrożone ramki i urywane transmisje głosowe spowodowane wolnymi łączami internetowymi, ale takie, które utrudniają prowadzenie spotkań w obcych językach. Nvidia Maxine jest reklamowana jako coś, co pomoże jej użytkownikom pozbyć się wszystkich tych nieznośnych niedogodności dzięki funkcji tłumaczenia rozmów wideo w czasie rzeczywistym — dzięki czemu jest to wynalazek, który nie mógł nadejść w lepszym czasie.

Jak działa Nvidia Maxine?

AI-sztuczna-inteligencja-kod-skrypt-projekt-opracowanie

Kluczowym elementem szybkości, z jaką Nvidia Maxine tłumaczy języki spontanicznie, jest wykorzystanie sztucznej inteligencji (AI) do rozpoznawania wzorców mowy i głosów w celu przetłumaczenia zdania na wybrany język w jak najkrótszym czasie.

Nvidia Maxine wykorzystuje coś, co nazywa się „głębokim uczeniem”, aby osiągnąć większość efektów zapewnianych przez jej narzędzia. Głębokie uczenie to popularny rodzaj uczenia się sztucznej inteligencji, zwany uczeniem maszynowym, który został po raz pierwszy opracowany w 2012 roku i jest technologią stojącą za większością aplikacji do rozpoznawania twarzy, funkcji tłumaczeniowych i systemów rekomendacji treści.

Narzędzia znajdujące się dotychczas w ofercie Nvidia Maxine obejmują konwertowanie filmów o niskiej rozdzielczości na filmy o wysokiej rozdzielczości za pomocą sztucznej inteligencji, automatyczne wyrównanie twarzy, redukcję szumów i oczywiście funkcję tłumaczenia, która działa w czasie rzeczywistym. Narzędzia te przydadzą się osobom z niestabilnymi połączeniami internetowymi, hałaśliwym miejscem pracy i barierami językowymi podczas prowadzenia zdalnych spotkań.

Poza funkcją tłumaczenia w czasie rzeczywistym, najbardziej atrakcyjnym narzędziem Nvidia Maxine jest obietnica zmniejszenia przepustowości wymaganej do płynnej transmisji wideo obrazów w wysokiej rozdzielczości. Mówiąc prościej, najnowszy wynalazek giganta GPU opiera się na przesłance, że nie jest konieczne przesyłanie całości informacji wizualnej w dowolnym filmie, aby uzyskać obrazy w wysokiej rozdzielczości po drugiej stronie. Maxine działa, wysyłając tylko określone punkty dowolnego obrazu, a następnie samodzielnie wypełnia luki za pomocą technologii sztucznej inteligencji (AI).

Czy to warte szumu?

sztuczna-inteligencja-uczenie maszynowe-iot-ai-web-design-development

Wynalazek Nvidii budzi pewne pytania dotyczące etyki sztucznego manipulowania połączeniami wideo, powołując się na wzrost częstości oszustów, którzy oszukują ludzi, by myśleli, że są rodziną lub przyjaciółmi, i zasłaniają się wątpliwościami. Ponadto debata pozostanie otwarta na temat tłumaczenia człowieka i tłumaczenia maszynowego, przynajmniej przez kilka dni.

Jednak pandemia COVID-19 ograniczyła zdecydowaną większość światowej populacji do pracy w domu. Zjawisko to doprowadziło do gwałtownego wzrostu liczby pobrań oprogramowania i aplikacji do połączeń wideo w ostatnich miesiącach. To pokazuje, jak ważna jest funkcja wideorozmów, a co za tym idzie, Nvidia Maxine jest dla przyszłości zdalnych spotkań i pracy w wirtualnym biurze.

Poza tym status Nvidii jako firmy, która dostarcza najnowocześniejszą technologię wszystkim użytkownikom komputerów, od graczy po programistów, nadaje temu przedsięwzięciu wiarygodność ze względu na możliwości finansowe korporacji Nvidia do badania i masowej produkcji tych narzędzi dla korzyści jego użytkowników.

Jednak czymś, co może być powodem do konsternacji dla niektórych użytkowników, może być konieczność posiadania przez Maxine procesora graficznego Nvidia, aby działał. Przedstawiciele Nvidii jeszcze tego nie potwierdzili.

Możesz także polubić: 10 oprogramowania do edycji wideo do użytku od początkujących do profesjonalistów.

Ostatnie słowa

nvidia-maxine-ai-rozmowa-wideo-w czasie-rzeczywistym-translacja-wniosek

Teraz okaże się, czy inni giganci połączeń wideo, tacy jak Zoom i Microsoft, kupią technologię Nvidia Maxine lub opracują własne, aby uzupełnić swoje aplikacje do połączeń wideo. Dzięki ulepszeniom technologicznym w każdym bloku, nadążanie za duchem czasu może być trudne. Biura tłumaczeń mogą pomóc w dostosowaniu oprogramowania do potrzeb klienta. Pomagają nawet zlokalizować oprogramowanie w ponad 100 językach.