Report: L’architettura che rivoluziona la sintesi di immagini ad alta risoluzione

Gli ultimi sviluppi in campo di deep learning stanno portando ad avanguardie incredibili nella sintesi di immagini ad alta risoluzione. Tra questi, i modelli di diffusione (DM) rappresentano una vera e propria rivoluzione. Questi modelli sono in grado di generare immagini sintetiche con una fedeltà visiva senza precedenti e possono essere utilizzati per compiti come l’inpainting o la super-risoluzione (vedi ricerca “High-Resolution Image Synthesis with Latent Diffusion Models“).

Tuttavia, questi modelli sono anche molto complessi e richiedono risorse computazionali significative per l’addestramento e l’inferenza. Per ovviare a questo problema, i ricercatori hanno sviluppato una nuova architettura chiamata Stable Diffusion, che utilizza i modelli di diffusione latente (LDM) per ridurre significativamente i requisiti computazionali mantenendo la stessa qualità e flessibilità dei DM basati su pixel.

La nuova architettura consente di applicare i modelli di diffusione direttamente nello spazio latente di codificatori automatici preaddestrati. Questo riduce il tempo di addestramento e rende l’inferenza meno costosa. Inoltre, l’introduzione di livelli di attenzione incrociata nell’architettura del modello consente ai modelli di diffusione di diventare generatori potenti e flessibili per input di condizionamento generale come testo o riquadri di delimitazione.

I risultati ottenuti con Stable Diffusion sono sorprendenti. I modelli di diffusione latente raggiungono prestazioni altamente competitive su varie attività, tra cui la generazione incondizionata di immagini, l’inpainting e la super-risoluzione. Inoltre, la sintesi ad alta risoluzione diventa possibile in modo convoluzionale.

Gli sviluppi della nuova architettura Stable Diffusion sono una vera e propria rivoluzione nel campo della sintesi di immagini ad alta risoluzione. La tecnologia è ancora in fase di sviluppo, ma i risultati finora ottenuti promettono di aprire nuove strade nel mondo dell’elaborazione delle immagini.

Nel video seguente si possono vedere gli ultimi progressi di una delle piattaforme di generazione immagini.

NEWS AIopenmind su:

3D (13)6G (14)Accademia di Comunicazione (4)Acer (1)Adobe (45)Aeronautica (11)Africa (3)Agenti AI (74)Agenti autonomi (1)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (23)AGID (1)Agricoltura (3)Amazon (60)Ambiente (5)AMD (3)Android (7)Animali (7)Animazione (6)Anthropic (50)Anziani (1)App (13)Apple (88)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (33)Assistente vocale (8)Astronomia (2)Asus (2)AT&T (1)Audi (1)Audio (69)Autoapprendimento (1)Avatar (8)Aviazione (1)Avvocati (3)Aziende (27)Banca (5)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)California (1)Canva (7)Cattolicesimo (3)Certificazioni (1)Chataudio (1)Chatbot IA (55)Chip (4)Cina (115)Cinema (11)Claude (22)Clima (5)CNR (1)Coca-Cola (2)Commercio (2)Commissione Europea (3)Compagnie aeree (1)Computer (8)Computer quantistici (50)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (2)Contabilità (2)Convegno (16)Copilot (7)Copyright (31)Corea del Nord (1)Criptovalute (2)Cybersecurity (21)Dalle-2 (3)Dark web (3)Data center (21)Dating (1)Deepfake (3)DeepSeek (29)Design automobilistico (3)Design Industriale (6)Diritti Autore (1)Disney (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (16)ENEA (2)Esercito (2)Etica (258)Europol (3)Eventi (9)Evento (9)Facebook (4)FakeNews (22)Falegnameria (1)Fauna selvatica (1)Film (6)Finanza (29)Finanziamenti Italia (4)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (52)Fotografia (122)Francia (6)Free lance (1)G7 (1)Gaming (3)Garante privacy (21)Giappone (18)Giochi (10)Giornalismo (24)Giustizia (3)Google (439)Governo (8)Governo Italiano (3)Grafica (6)Grok (8)Guerra (17)Guida autonoma (8)Hong Kong (10)Hugging Face (6)IBM (9)Illustrazioni (1)iMessage (1)Immobiliare (1)India (7)Indossabili (4)Influencer (1)Informazione (10)Inghilterra (14)INPS (2)Intel (9)ISO (1)Israele (1)Istruzione (17)Jailbreaking (1)Kamala Harris (1)Lavoro (89)Libri (3)Linguistica computazionale (12)Linkedin (9)Linux (1)Luma AI (1)Luna (1)Maltrattamento infantile (1)Marina (1)Marketing (137)Medicina (36)Mercedes-Benz (1)Meta (135)Metaverso (17)Meteo (1)Microsoft (240)Midjourney (18)Mistral (13)Mobilità sostenibile (2)Moda (6)Modelli AI (147)Motori di Ricerca (14)Mozilla (3)Museo (1)Musica (45)NASA (1)Nato (2)Natura (7)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Norvegia (1)Nvidia (80)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)Odore (1)Offerte lavoro (2)OMS (1)ONU (1)Open Source (17)OpenAI (370)Opera (16)Opera Browser (1)Oppo (3)Oracle (3)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (19)Pianeta (2)PlayStation (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (34)Programmazione (16)Prompt (5)Pubblicazione (1)Pubblicità (19)QR Code (1)Qualcomm (5)Ray-Ban (7)Realtà mista (4)Reddit (7)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (143)Ricerca scientifica (16)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (5)Robotica (85)Runway (15)Salute (29)Samsung (15)Sanità (19)Satelliti (5)Sceneggiatura (1)Semiconduttori (5)SEO (3)Shopping online (4)Sicurezza (31)Sicurezza informatica (90)SMS (1)Snapchat (11)Soccorso (1)Società (15)SoftBank (1)Software (5)Sony (2)Sora (1)Sport (4)Spotify (7)Stability (5)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (4)Startup (537)streaming live (1)Supercomputer (6)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Synthesia (1)Taiwan (17)Taxi (2)Telecomunicazioni (7)Telegram (4)Televisione (1)Tesla (10)TikTok (12)Tinder (1)Torah (1)Traduttore AI (7)Trasporti (13)Truffa (2)Twitter (13)Ucraina (3)Udito (1)UE (13)UNESCO (3)UNICEF (1)Unione Europea (34)Università (5)Uomo (1)USA (85)Vaticano (5)Video (144)Videocomunicazione (4)Videogiochi (12)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (1)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (14)WhatsApp (12)Wikipedia (2)Wordpress (3)X (13)xAI (10)Xiaomi (1)Yahoo (3)Youtube (20)Zoom (7)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

00
days
:
00
hrs
:
00
mins
:
00
secs

Runway Gen-4 alza l’asticella della video generazione AI

https://twitter.com/runwayml/status/1906718938542530925?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1906718940610408745%7Ctwgr%5Ee97d4471cd63b1e472947c089f7eb4d76e201607%7Ctwcon%5Es2_&ref_url=https%3A%2F%2Fwww.punto-informatico.it%2Frunway-gen-4-nuovo-generatore-video-ai-impressionante%2F La nuova versione Gen-4 di Runway ridefinisce gli standard nella creazione di video generati da intelligenza artificiale, offrendo realismo, coerenza e comprensione del mondo...

#COMPUTERQUANTISTICO #weeklynews 23/3/2025 Cineca ospita IQM Radiance 54

Quantum computing in Italia: Cineca ospita IQM Radiance 54, il computer quantistico più potente. Le 10 notizie principali Cineca e IQM: il più potente computer quantistico...

Word ora riassume documenti lunghi fino a 3.000 pagine

Microsoft migliora il riepilogo in Word: nuove opzioni di lunghezza e supporto per documenti molto estesi. Microsoft annuncia due importanti aggiornamenti per gli utenti di...

All Digital Weeks: L’importanza di un approccio armonizzato

REGISTRATI SU Stati Generali dell’Innovazione – SGI _____________ L’avvento dell’Intelligenza Artificiale – L’importanza di un approccio armonizzato L’avvento dell’Intelligenza Artificiale (AI) rappresenta una delle più significative rivoluzioni...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines