Inteligência Artificial é capaz de clonar sua voz em 5 segundos

Um software analisa a voz original e a converte em um modelo matemático, que pode ser aplicado a um sistema capaz de ler qualquer texto

Vivemos em um mundo em que é cada vez mais difícil confiar em nossos  próprios olhos, e agora também nos ouvidos.

Inteligência Artificial pode clonar sua voz em 5 segundos

Tecnologias como os deepfakes são capazes de gerar fotos e vídeos colocando pessoas em cenas e situações onde nunca estiveram, e agora um novo modelo de rede neural é capaz de clonar a voz de um humano usando uma amostra com meros 5 segundos de duração.

O software é parte do artigo “Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis”, publicado no site arXiv da Universidade de Cornell, nos EUA, e escrito por Ye Jia, Yu Zhang, Ron J. Weiss, Quan Wang, Jonathan Shen, Fei Ren, Zhifeng Chen, Patrick Nguyen, Ruoming Pang, Ignacio Lopez Moreno e Yonghui Wu.

O sistema analisa a voz a ser clonada, gerando um modelo matemático. Este modelo é aplicado a um sistema de geração de texto-para-voz, que pode então reproduzir qualquer texto usando uma cópia da voz original. Embora a matemática por trás do sistema seja complexa, os resultados são impressionantes e fáceis de compreender:

Além de reproduzir uma voz já existente o sistema é capaz de gerar novas vozes, usando trechos aleatórios das amostras, e também pode ser usado em técnicas de tradução, analisando uma voz em um idioma e gerando uma voz similar à original em inglês.

Você pode gostar!