Nvidia Maxine: traduzione di videochiamate in tempo reale basata sull'intelligenza artificiale

Pubblicato: 2021-04-27

Nvidia Corporation, il gigante dell'elaborazione grafica con sede in California, ha recentemente presentato una nuova funzionalità chiamata Nvidia Maxine. Nvidia Maxine è un'innovazione all'avanguardia che combina l'intelligenza artificiale con la tecnologia di videochiamata per creare un software che aiuta a svolgere varie funzioni che migliorano la qualità e la velocità del video. Può essere utilizzato come strumento per altri software di videochiamata per ridurre la loro imprecisione.

Include molte funzionalità come il miglioramento grafico automatico, l'allineamento automatico del viso e la traduzione automatica della lingua, tutti servizi che potrebbero rendere la videochiamata un evento praticamente privo di errori. Ancora più importante, la funzione di miglioramento della grafica potrebbe avere effetti di vasta portata per le aree sottosviluppate che operano con una larghezza di banda ridotta.

Mostra il sommario
  • Cos'è Nvidia Maxine?
  • Qual è la funzione di traduzione delle videochiamate in tempo reale di Nvidia?
  • Come funziona Nvidia Maxine?
  • Vale la pena fare pubblicità?
  • Parole finali

Cos'è Nvidia Maxine?

domanda-interrogazione-pensa-piano-di-pensiero

Nvidia Maxine è un set di strumenti di miglioramento video sviluppato da Nvidia Corporation e presentato nell'ottobre 2020 alla GPU Technology Conference (una conferenza globale organizzata da Nvidia per promuovere discussioni sugli sviluppi dell'Intelligenza Artificiale con i migliori ingegneri, sviluppatori e innovatori del mondo in presenza). È un'aggiunta rivoluzionaria al mondo della trasmissione video che corregge le imprecisioni o gli errori che possono sorgere nelle telefonate a un livello tale da rinnovare completamente il modo in cui gestiamo le videochiamate.

Alcune delle caratteristiche di Nvidia Maxine che stanno rapidamente attirando l'attenzione nella comunità dell'IA sono quelle con cui è automaticamente in grado di costruire e decostruire volti, sfondi, rumori e persino tratti del viso.

Per ora, questi strumenti di miglioramento delle videochiamate sono in vendita alle società di software che potrebbero voler incorporare la tecnologia nei loro programmi, ma il loro successo potrebbe significare che le funzionalità potrebbero presto diventare ampiamente disponibili.

Consigliato per te: L'arte della teleconferenza: come eseguire riunioni online efficaci.

Qual è la funzione di traduzione delle videochiamate in tempo reale di Nvidia?

online-learning-education-chat-videoconferenza-riunione

Nvidia Maxine viene fornito con un'unità di traduzione linguistica in grado di tradurre una videochiamata da e verso qualsiasi lingua in pochi secondi. Questa invenzione potrebbe rivelarsi incredibilmente vantaggiosa per i paesi che conducono affari con stranieri.

Ciò potrebbe rivelarsi particolarmente utile in relazione a paesi come la Cina e la maggior parte di quelli europei, quelli che intrattengono sane relazioni commerciali con la maggior parte dei paesi ma non parlano inglese come lingua ufficiale. Ciò contribuirà a rafforzare i legami commerciali e ad apportare enormi cambiamenti economici e finanziari ai paesi che lo impiegano.

Un'altra cosa che distingue questa funzionalità da altre funzionalità come Google Translate è la sua capacità di tradurre conversazioni e dialoghi in tempo reale. Ciò significa che non ci saranno pause imbarazzanti nelle videochiamate straniere quando un traduttore umano si lancia in una traduzione rotonda o quando qualcuno armeggia con Google Translate per capire cosa viene detto.

Lavorare con aziende straniere senza una lingua comune è sempre stato un compito difficile, ma con la pandemia di COVID-19 al culmine della sua seconda ondata, tale compito è diventato molto più difficile con riunioni condotte in remoto con l'aiuto di app come Zoom e Skype. I frame bloccati e le trasmissioni vocali glitch dovute a connessioni Internet lente sono un evento comune, ma che rendono la conduzione di riunioni in lingue straniere una lotta in salita. Nvidia Maxine viene pubblicizzato come qualcosa che aiuterà i suoi utenti a sbarazzarsi di tutti questi fastidiosi inconvenienti con la sua funzione di traduzione delle videochiamate in tempo reale, rendendola un'invenzione che non sarebbe potuta arrivare in un momento migliore.

Come funziona Nvidia Maxine?

AI-intelligenza-artificiale-codice-script-design-sviluppo

La componente chiave nella velocità con cui Nvidia Maxine traduce le lingue spontaneamente è il suo uso dell'Intelligenza Artificiale (AI) per discernere i modelli vocali e le voci per tradurre la frase nella lingua selezionata in un lasso di tempo minimo.

Maxine di Nvidia utilizza qualcosa chiamato "apprendimento profondo" per ottenere la maggior parte degli effetti forniti dai suoi strumenti. Il deep learning è un tipo popolare di apprendimento basato sull'intelligenza artificiale chiamato apprendimento automatico, sviluppato per la prima volta nel 2012 ed è la tecnologia alla base della maggior parte delle app di riconoscimento facciale, delle funzionalità di traduzione e dei sistemi di raccomandazione dei contenuti.

Gli strumenti inclusi nella gamma di Nvidia Maxine finora includono la conversione di video a bassa risoluzione in video ad alta risoluzione tramite AI, allineamento automatico del viso, riduzione del rumore e, naturalmente, la funzione di traduzione che opera in tempo reale. Questi strumenti saranno utili per le persone con connessioni Internet instabili, luoghi di lavoro rumorosi e barriere linguistiche durante lo svolgimento di riunioni a distanza.

Oltre alla funzione di traduzione in tempo reale, lo strumento più interessante di Nvidia Maxine è la sua promessa di ridurre la larghezza di banda richiesta per una trasmissione video fluida di immagini ad alta definizione. In parole povere, l'ultima invenzione del gigante delle GPU funziona sulla base della logica che non è necessario trasmettere la totalità delle informazioni visive in nessun video per ottenere immagini ad alta definizione dall'altra parte. Maxine funziona inviando solo alcuni punti specifici di qualsiasi immagine, quindi colmando le lacune da solo con l'aiuto della sua tecnologia di intelligenza artificiale (AI).

Vale la pena fare pubblicità?

intelligenza artificiale-machine-learning-iot-ai-web-design-development

L'invenzione di Nvidia solleva alcune domande sull'etica della manipolazione artificiale delle videochiamate, citando l'aumento dell'incidenza di impostori che ingannano le persone facendole credere di essere familiari o amici e pescando al gatto dietro i dubbi. Inoltre, il dibattito rimarrà aperto sulla traduzione umana e automatica, almeno per qualche altro giorno.

Tuttavia, la pandemia di COVID-19 ha limitato la stragrande maggioranza della popolazione mondiale a lavorare da casa. Questo evento ha portato a un rapido aumento del tasso di download che il software e le applicazioni per videochiamate hanno visto negli ultimi mesi. Ciò dimostra quanto sia importante una caratteristica delle videochiamate e, per estensione, Nvidia Maxine per il futuro delle riunioni a distanza e del lavoro in ufficio virtuale.

Oltre a questo, lo status di Nvidia come azienda che fornisce tecnologia all'avanguardia a tutti i tipi di utenti di computer, dai giocatori agli sviluppatori di software, conferisce credibilità a questa impresa grazie alla capacità finanziaria della società Nvidia di ricercare e produrre in serie questi strumenti per il beneficio dei suoi utenti.

Tuttavia, qualcosa che potrebbe rivelarsi un punto di costernazione per alcuni utenti potrebbe essere la necessità di Maxine di avere una GPU Nvidia affinché funzioni. I rappresentanti di Nvidia non lo hanno ancora confermato.

Potrebbe piacerti anche: 10 software di editing video da utilizzare dai principianti ai professionisti.

Parole finali

nvidia-maxine-ai-real-time-video-call-translation-conclusion

Ora resta da vedere se altri giganti delle videochiamate come Zoom e Microsoft acquisteranno la tecnologia di Nvidia Maxine o ne svilupperanno qualcuna per integrare le loro applicazioni di videochiamata. Con i miglioramenti tecnologici in ogni blocco, può essere difficile stare al passo con i tempi. Le società di traduzione possono aiutare il tuo software ad adattarsi alle esigenze dei tuoi consumatori. Ti aiutano anche a localizzare il tuo software in più di 100 lingue.