Meta Platforms ha recentemente lanciato Audiobox, un rivoluzionario programma di clonazione vocale basato sull’intelligenza artificiale (IA). Questo strumento gratuito, sviluppato dai ricercatori del laboratorio Facebook AI Research (FAIR), consente agli utenti di generare voci personalizzate e effetti sonori attraverso una combinazione di input vocali e prompt testuali in linguaggio naturale. Il programma, presentato come un nuovo modello di ricerca di base per la generazione di audio, offre applicazioni diverse, dalla creazione di voci clonate alla produzione di suoni ambientali.
Audiobox permette agli utenti di scrivere frasi o descrizioni di suoni che desiderano generare, semplificando così il processo di creazione di contenuti audio personalizzati. Meta ha introdotto una famiglia di modelli dedicati alla mimica vocale e alla generazione di suoni ambientali, costruiti sul modello condiviso auto-supervisionato Audiobox SSL.
Tuttavia, l’utilizzo di Audiobox non è privo di controversie, poiché i dati utilizzati per l’addestramento del modello, comprendenti 160.000 ore di parlato, 20.000 ore di musica e 6.000 ore di campioni sonori, sollevano preoccupazioni riguardo alla provenienza e all’utilizzo di materiale potenzialmente protetto da diritti d’autore.
________
Audiobox: la nuova tecnologia AI di Meta che clona e genera voci