Sora di OpenAI: Il Futuro della Generazione Video e la Simulazione del Mondo Reale

La ricerca nel campo della generazione di video sta raggiungendo nuovi traguardi con l’introduzione del modello Sora, presentato in un recente rapporto tecnico. Questo modello, sviluppato per operare su una vasta scala di dati video, rappresenta un passo significativo verso la creazione di simulatori generali del mondo fisico.

Il rapporto tecnico del 15 febbraio 2024 delinea la metodologia adottata per l’addestramento dei modelli generativi su dati video di varie durate, risoluzioni e proporzioni. Utilizzando un’architettura basata su trasformatori, Sora è in grado di generare video ad alta fedeltĂ  di durata fino a un minuto.

Una delle innovazioni chiave di Sora è l’adozione di un approccio basato su “patch” spazio-temporali per rappresentare i dati visivi. Questo consente al modello di apprendere e generare video e immagini di diverse dimensioni e proporzioni.

Inoltre, Sora si distingue per la sua capacitĂ  di mantenere la flessibilitĂ  nei confronti delle dimensioni dei video generati. Questo significa che il modello può produrre video con risoluzioni e proporzioni variabili, adattandosi alle esigenze degli utenti e consentendo un’ampia gamma di applicazioni.

Il rapporto sottolinea anche l’importanza della comprensione del linguaggio nell’addestramento dei modelli generativi. Sora è in grado di utilizzare descrizioni dettagliate fornite dagli utenti per generare video ad alta qualitĂ  che rispecchiano fedelmente le richieste.

Il modello Sora rappresenta un passo avanti significativo nella ricerca sulla generazione di video. Con la sua capacitĂ  di simulare il mondo reale attraverso dati visivi, potrebbe avere applicazioni rivoluzionarie in campi come l’animazione, la realtĂ  virtuale e la creazione di contenuti multimediali.

______
Video generation models as world simulators

NEWS AIopenmind su:

3D (12)6G (8)Accademia di Comunicazione (4)Acer (1)Adobe (45)Aeronautica (11)Africa (3)Agenti AI (53)Agenti autonomi (1)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (16)AGID (1)Agricoltura (2)Amazon (54)Ambiente (4)AMD (2)Android (7)Animali (7)Animazione (6)Anthropic (42)Anziani (1)App (13)Apple (85)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (31)Assistente vocale (7)Astronomia (2)Asus (2)AT&T (1)Audi (1)Audio (67)Autoapprendimento (1)Avatar (8)Aviazione (1)Avvocati (3)Aziende (27)Banca (5)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (7)Cattolicesimo (3)Certificazioni (1)Chataudio (1)Chatbot IA (55)Chip (4)Cina (99)Cinema (11)Claude (20)Clima (5)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (2)Compagnie aeree (1)Computer (8)Computer quantistici (49)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)ContabilitĂ  (2)Convegno (16)Copilot (7)Copyright (25)Criptovalute (2)Cybersecurity (9)Dalle-2 (3)Dark web (3)Data center (19)Dating (1)Deepfake (3)DeepSeek (29)Design automobilistico (3)Design Industriale (6)Diritti Autore (1)Disney (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (15)ENEA (2)Esercito (2)Etica (216)Europol (3)Eventi (7)Evento (9)Facebook (4)FakeNews (22)Falegnameria (1)Fauna selvatica (1)Film (6)Finanza (27)Finanziamenti Italia (4)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (48)Fotografia (119)Francia (6)Free lance (1)G7 (1)Gaming (3)Garante privacy (21)Giappone (16)Giochi (10)Giornalismo (24)Giustizia (2)Google (421)Governo (7)Governo Italiano (3)Grafica (6)Grok (6)Guerra (16)Guida autonoma (8)Hong Kong (7)Hugging Face (5)IBM (9)Illustrazioni (1)iMessage (1)Immobiliare (1)India (7)Indossabili (4)Influencer (1)Informazione (10)Inghilterra (14)INPS (2)Intel (9)ISO (1)Istruzione (17)Jailbreaking (1)Kamala Harris (1)Lavoro (79)Libri (3)Linguistica computazionale (12)Linkedin (9)Linux (1)Luma AI (1)Luna (1)Maltrattamento infantile (1)Marina (1)Marketing (129)Medicina (36)Mercedes-Benz (1)Meta (131)Metaverso (17)Meteo (1)Microsoft (232)Midjourney (18)Mistral (13)MobilitĂ  sostenibile (2)Moda (6)Modelli AI (141)Motori di Ricerca (13)Mozilla (3)Museo (1)Musica (43)NASA (1)Nato (2)Natura (6)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Norvegia (1)Nvidia (66)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)Odore (1)Offerte lavoro (2)OMS (1)ONU (1)Open Source (11)OpenAI (353)Opera (15)Opera Browser (1)Oppo (3)Oracle (3)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (18)Pianeta (2)PlayStation (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (34)Programmazione (15)Prompt (5)Pubblicazione (1)PubblicitĂ  (19)QR Code (1)Qualcomm (5)Ray-Ban (7)RealtĂ  mista (4)Reddit (7)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (137)Ricerca scientifica (16)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (4)Robotica (76)Runway (13)Salute (23)Samsung (15)SanitĂ  (19)Satelliti (3)Sceneggiatura (1)Semiconduttori (3)SEO (3)Shopping online (4)Sicurezza (30)Sicurezza informatica (90)SMS (1)Snapchat (11)Soccorso (1)SocietĂ  (15)Software (4)Sony (2)Sora (1)Sport (3)Spotify (7)Stability (5)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (4)Startup (501)streaming live (1)Supercomputer (5)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Synthesia (1)Taiwan (12)Taxi (2)Telecomunicazioni (7)Telegram (3)Televisione (1)Tesla (10)TikTok (12)Torah (1)Traduttore AI (7)Trasporti (9)Truffa (2)Twitter (13)Ucraina (3)Udito (1)UE (13)UNESCO (3)UNICEF (1)Unione Europea (31)UniversitĂ  (5)Uomo (1)USA (80)Vaticano (5)Video (144)Videocomunicazione (4)Videogiochi (11)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (1)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (14)WhatsApp (11)Wikipedia (1)Wordpress (3)X (13)xAI (8)Xiaomi (1)Yahoo (3)Youtube (20)Zoom (7)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Bluesky annuncia l’uso dei dati degli utenti per l’AI​Techprincess

Bluesky, la piattaforma di social media emergente, ha recentemente aggiornato la sua policy dichiarando l'intenzione di utilizzare i dati pubblici degli utenti per l'addestramento...

IBM e Governo Basco portano il Quantum System Two in Europa

Il primo IBM Quantum System Two d'Europa sarà in Spagna IBM e il Governo Basco hanno annunciato l’installazione del primo IBM Quantum System Two d’Europa...

Test ChatGPT Connectors per integrare Google Drive e Slack​

OpenAI ha annunciato l'avvio dei test per una nuova funzionalitĂ  denominata ChatGPT Connectors, progettata per integrare il chatbot ChatGPT con piattaforme come Google Drive...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines