Nvidia Maxine: tradução de chamadas de vídeo em tempo real com inteligência artificial
Publicados: 2021-04-27A Nvidia Corporation, gigante de processamento gráfico com sede na Califórnia, revelou recentemente um novo recurso chamado Nvidia Maxine. Nvidia Maxine é uma inovação de última geração que combina inteligência artificial com tecnologia de videochamada para criar software que ajuda a executar várias funções que melhoram a qualidade e a velocidade do vídeo. Ele pode ser usado como uma ferramenta para outros softwares de videochamada para diminuir sua imprecisão.
Ele inclui muitos recursos, como aprimoramento gráfico automático, alinhamento automático de face e tradução automática de idioma - todos os serviços que podem tornar a chamada de vídeo um evento praticamente livre de erros. Mais importante ainda, o recurso de aprimoramento gráfico pode ter efeitos de longo alcance para áreas subdesenvolvidas que operam com largura de banda ruim.
- O que é Nvidia Maxine?
- O que é o recurso de tradução de chamadas de vídeo em tempo real da Nvidia?
- Como o Nvidia Maxine funciona?
- Vale a pena o Hype?
- Palavras finais
O que é Nvidia Maxine?

Nvidia Maxine é um conjunto de ferramentas de aprimoramento de vídeo desenvolvido pela Nvidia Corporation e apresentado em outubro de 2020 na GPU Technology Conference (uma conferência global organizada pela Nvidia para promover discussões sobre desenvolvimentos em Inteligência Artificial com os melhores engenheiros, desenvolvedores e inovadores do mundo em comparecimento). É uma adição revolucionária ao mundo da transmissão de vídeo que corrige as imprecisões ou falhas que podem surgir nas chamadas telefônicas a um grau que pode reformular completamente a maneira como operamos as chamadas de vídeo.
Alguns dos recursos do Nvidia Maxine que estão rapidamente chamando a atenção para si na comunidade de IA são aqueles com os quais ele é capaz de construir e desconstruir automaticamente rostos, planos de fundo, ruídos e até recursos faciais.
Por enquanto, essas ferramentas de aprimoramento de videochamadas estão à venda para empresas de software que queiram incorporar a tecnologia em seus programas, mas seu sucesso pode significar que os recursos podem se tornar amplamente disponíveis em breve.
Recomendado para você: A Arte da Teleconferência: Como Realizar Reuniões Online Eficazes.
O que é o recurso de tradução de chamadas de vídeo em tempo real da Nvidia?

Nvidia Maxine vem com uma unidade de tradução de idiomas que é capaz de traduzir uma chamada de vídeo de e para qualquer idioma em questão de segundos. Esta invenção pode ser incrivelmente benéfica para países que realizam negócios com estrangeiros.
Isso pode ser especialmente útil em relação a países como a China e a maioria dos europeus – aqueles que desfrutam de relações comerciais saudáveis com a maioria dos países, mas não falam inglês como idioma oficial. Isso ajudará a fortalecer os laços de negócios e provocar grandes mudanças econômicas e financeiras para os países que o empregam.
Outra coisa que diferencia esse recurso de outros recursos como o Google Tradutor é sua capacidade de traduzir conversas e seus diálogos em tempo real. Isso significa que não haverá pausas estranhas em videochamadas estrangeiras quando um tradutor humano iniciar uma tradução indireta ou quando alguém se atrapalhar com o Google Tradutor para entender o que está sendo dito.
Trabalhar com empresas estrangeiras sem linguagem comum sempre foi uma tarefa difícil, mas com a pandemia do COVID-19 no auge de sua segunda onda, essa tarefa se tornou muito mais difícil com reuniões sendo realizadas de forma remota com a ajuda de aplicativos como Zoom e Skype. Quadros congelados e transmissões de voz com falhas devido a conexões lentas de internet são uma ocorrência comum, mas aquelas que tornam a realização de reuniões em idiomas estrangeiros uma luta árdua. O Nvidia Maxine está sendo apresentado como algo que ajudará seus usuários a se livrar de todos esses inconvenientes incômodos com seu recurso de tradução de chamadas de vídeo em tempo real - tornando-o uma invenção que não poderia ter vindo em melhor hora.

Como o Nvidia Maxine funciona?

O componente chave na velocidade com que a Nvidia Maxine traduz idiomas espontaneamente é o uso de Inteligência Artificial (IA) para discernir padrões de fala e vozes para traduzir a frase para o idioma selecionado em um período mínimo de tempo.
O Maxine da Nvidia usa algo chamado 'aprendizado profundo' para obter a maioria dos efeitos fornecidos por suas ferramentas. O aprendizado profundo é um tipo popular de aprendizado de IA chamado aprendizado de máquina, desenvolvido pela primeira vez em 2012 e é a tecnologia por trás da maioria dos aplicativos de reconhecimento facial, recursos de tradução e sistemas de recomendação de conteúdo.
As ferramentas incluídas na gama da Nvidia Maxine até agora incluem a conversão de vídeos de baixa resolução em vídeos de alta resolução por meio de IA, alinhamento automático de face, redução de ruído e, claro, o recurso de tradução que opera em tempo real. Essas ferramentas serão benéficas para pessoas com conexões de internet instáveis, locais de trabalho barulhentos e barreiras linguísticas durante a realização de reuniões remotas.
Além do recurso de tradução em tempo real, a ferramenta mais atraente da Nvidia Maxine é sua promessa de diminuir a largura de banda necessária para uma transmissão de vídeo suave de imagens de alta definição. Em termos simples, a mais nova invenção da gigante das GPUs funciona com o raciocínio de que não é necessário transmitir a totalidade das informações visuais em qualquer vídeo para obter imagens de alta definição do outro lado. Maxine funciona enviando apenas alguns pontos específicos de qualquer imagem – preenchendo as lacunas por conta própria com a ajuda de sua tecnologia de inteligência artificial (IA).
Vale a pena o Hype?

A invenção da Nvidia levanta algumas questões sobre a ética da manipulação artificial de videochamadas, citando o aumento na incidência de impostores enganando as pessoas a pensar que são familiares ou amigos e enganando as dúvidas. Além disso, o debate permanecerá aberto sobre tradução humana versus tradução automática, pelo menos por mais alguns dias.
No entanto, a pandemia do COVID-19 limitou a grande maioria da população mundial a trabalhar em casa. Essa ocorrência levou a um rápido aumento na taxa de downloads que o software e os aplicativos de videochamada têm visto nos últimos meses. Isso mostra o quão importante é um recurso de videochamada e, por extensão, a Nvidia Maxine é para o futuro das reuniões remotas e do trabalho de escritório virtual.
Além disso, o status da Nvidia como uma empresa que fornece tecnologia de ponta para todos os tipos de usuários de computador, de jogadores a desenvolvedores de software, confere credibilidade a esse empreendimento devido à capacidade financeira da corporação Nvidia de pesquisar e produzir em massa essas ferramentas para o benefício de seus usuários.
No entanto, algo que pode ser um ponto de consternação para alguns usuários pode ser a necessidade de Maxine de ter uma GPU Nvidia para funcionar. Os representantes da Nvidia ainda não confirmaram isso.
Você também pode gostar: 10 softwares de edição de vídeo para usar de iniciantes a profissionais.
Palavras finais

Resta saber se outros gigantes de videochamadas, como Zoom e Microsoft, compram a tecnologia da Nvidia Maxine ou desenvolvem algumas próprias para complementar seus aplicativos de videochamada. Com melhorias na tecnologia em cada quarteirão, pode ser um desafio acompanhar os tempos. As empresas de tradução podem ajudar seu software a se ajustar às necessidades do consumidor. Eles até ajudam você a localizar seu software em mais de 100 idiomas.
