OpenAI, Sora sta diventando disponibile per i red teamers per valutare le aree critiche per danni o rischi. Stiamo anche concedendo l’accesso a un certo numero di artisti visivi, designer e filmmaker per ottenere feedback su come far avanzare il modello per essere più utile per i professionisti creativi.
OpenAI vuole dare al pubblico un’idea di quali capacità dell’IA sono all’orizzonte.
Sora è in grado di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati del soggetto e dello sfondo. Il modello comprende non solo ciò che l’utente ha richiesto nel prompt, ma anche come queste cose esistono nel mondo fisico.
Il modello ha una profonda comprensione del linguaggio, consentendogli di interpretare accuratamente i prompt e generare personaggi coinvolgenti che esprimono emozioni vibranti. Sora può anche creare più scatti all’interno di un singolo video generato che persistono accuratamente i personaggi e lo stile visivo.
Tuttavia, il modello ha anche delle debolezze. Potrebbe avere difficoltà a simulare accuratamente la fisica di una scena complessa e potrebbe non comprendere specifiche istanze di causa ed effetto. Ad esempio, una persona potrebbe prendere un morso da un biscotto, ma successivamente il biscotto potrebbe non avere un segno di morso.
Il modello potrebbe anche confondere dettagli spaziali di un prompt, ad esempio, mescolando sinistra e destra, e potrebbe avere difficoltà con descrizioni precise di eventi che si verificano nel tempo, come seguire una traiettoria specifica della telecamera.
__________
Creating video from text