L’approccio di Eleven in ricerca sfrutta più dati, più potenza di calcolo e nuove tecniche per fornire il nostro modello di sintesi vocale più avanzato.
Eleven Multilingual v1: il nostro avanzato modello di sintesi vocale che supporta sette nuove lingue: francese, tedesco, hindi, italiano, polacco, portoghese e spagnolo. Basandosi sulla ricerca che ha alimentato Eleven Monolingual v1, il nostro attuale approccio di deep learning sfrutta più dati, più potenza di calcolo e nuove tecniche all’interno di un modello sempre più sofisticato, in grado di comprendere le sfumature testuali e di fornire una performance emotivamente ricca. Questo sviluppo espande gli orizzonti creativi per creatori, sviluppatori di giochi e editori, e apre la strada all’uso dei media generativi per creare contenuti più localizzati, accessibili e immaginativi.
Il nuovo modello di sintesi vocale di Eleven rappresenta un’importante pietra miliare nella democratizzazione della voce. Grazie a questo strumento, creatori, sviluppatori di giochi, istituti di istruzione e organizzazioni di accessibilità possono ora raggiungere un pubblico più ampio e diversificato. La capacità del modello di identificare e articolare testo multilingue lo rende particolarmente utile per applicazioni multiculturali ed educative, e il fatto che sia disponibile in sette lingue diverse apre un mondo di possibilità per le organizzazioni internazionali.
Nonostante le limitazioni note del modello, come l’articolazione errata di numeri, acronimi e parole straniere quando vengono utilizzati in una lingua diversa dall’originale, Eleven continua a migliorare il prodotto e a lavorare per garantire la massima qualità e precisione. Grazie a Eleven Multilingual v1, la voce umana si avvicina sempre di più alla sua trasposizione in un contesto digitale, aprendo nuovi scenari di creatività, innovazione e inclusione.
In questo momento di crescente multilinguismo e multiculturalismo, Eleven si impegna a fare la differenza. La nuova sintesi vocale multilingue rappresenta solo l’inizio di una rivoluzione che renderà la voce umana più accessibile, comprensibile e coinvolgente per tutti.