A Microsoft revelou o modelo de inteligência artificial VASA-1, capaz de criar vídeos hiper-realistas a partir de uma única foto e um arquivo de áudio. Este desenvolvimento, impressionante e preocupante ao mesmo tempo, oferece sincronia de movimentos labiais e expressões faciais detalhadas.
↳ Potencial de aplicação: Destinada inicialmente para uso em acessibilidade e educação, a tecnologia possibilita a geração de personagens virtuais que podem auxiliar indivíduos com dificuldades de comunicação, além de proporcionar companhia ou suporte terapêutico.
↳ Preocupações éticas: Apesar do potencial positivo, há preocupações significativas com o uso antiético da tecnologia, especialmente na criação de deepfakes. A Microsoft destacou que não lançará o modelo VASA-1 comercialmente até que medidas de segurança adequadas estejam garantidas para prevenir abusos.
↳ Detalhes técnicos: O VASA-1 pode renderizar vídeos de alta qualidade com baixa latência, suportando resoluções de até 512×512 pixels e 40 FPS, e permite ajustes granulares no vídeo, como direção do olhar e expressões emocionais.
Via B9