Report: L’architettura che rivoluziona la sintesi di immagini ad alta risoluzione

Gli ultimi sviluppi in campo di deep learning stanno portando ad avanguardie incredibili nella sintesi di immagini ad alta risoluzione. Tra questi, i modelli di diffusione (DM) rappresentano una vera e propria rivoluzione. Questi modelli sono in grado di generare immagini sintetiche con una fedeltà visiva senza precedenti e possono essere utilizzati per compiti come l’inpainting o la super-risoluzione (vedi ricerca “High-Resolution Image Synthesis with Latent Diffusion Models“).

Tuttavia, questi modelli sono anche molto complessi e richiedono risorse computazionali significative per l’addestramento e l’inferenza. Per ovviare a questo problema, i ricercatori hanno sviluppato una nuova architettura chiamata Stable Diffusion, che utilizza i modelli di diffusione latente (LDM) per ridurre significativamente i requisiti computazionali mantenendo la stessa qualità e flessibilità dei DM basati su pixel.

La nuova architettura consente di applicare i modelli di diffusione direttamente nello spazio latente di codificatori automatici preaddestrati. Questo riduce il tempo di addestramento e rende l’inferenza meno costosa. Inoltre, l’introduzione di livelli di attenzione incrociata nell’architettura del modello consente ai modelli di diffusione di diventare generatori potenti e flessibili per input di condizionamento generale come testo o riquadri di delimitazione.

I risultati ottenuti con Stable Diffusion sono sorprendenti. I modelli di diffusione latente raggiungono prestazioni altamente competitive su varie attività, tra cui la generazione incondizionata di immagini, l’inpainting e la super-risoluzione. Inoltre, la sintesi ad alta risoluzione diventa possibile in modo convoluzionale.

Gli sviluppi della nuova architettura Stable Diffusion sono una vera e propria rivoluzione nel campo della sintesi di immagini ad alta risoluzione. La tecnologia è ancora in fase di sviluppo, ma i risultati finora ottenuti promettono di aprire nuove strade nel mondo dell’elaborazione delle immagini.

Nel video seguente si possono vedere gli ultimi progressi di una delle piattaforme di generazione immagini.

Consulta gli articoli AIopenmind su:

3D (1)6G (1)Adobe (2)Aeronautica (5)Africa (2)AGI (Intelligenza artificiale generalizzata) (1)Ambiente (1)Animali (4)Anziani (1)App (1)Apple (4)Archeologia (2)Architettura (1)Armi (2)Arte (20)Astronomia (2)Audio (13)Avatar (2)Aviazione (1)Avvocati (1)Aziende (7)Banca (2)Biblioteca (1)Bill Gates (1)Bing (6)Birra (1)Blockchain (1)Boston Dynamics (1)Canva (1)Cattolicesimo (3)Certificazioni (1)chataudio (1)Chatbot IA (6)Chip (1)Cina (33)Cinema (2)CNR (1)Coca-Cola (1)Commercio (1)Compagnie aeree (1)Computer quantistici (20)Comuni italiani (1)Comunicazione (6)Comunicazioni vocali (1)Contabilità (1)Convegno (1)Copyright (4)Cybersecurity (1)Dating (1)Deepfake (1)Design automobilistico (2)Design Industriale (1)Doppiaggio (1)Drone (1)Droni (1)Editing fotografico (1)Editoria (4)Esercito (2)Etica (45)Europol (1)Eventi (1)Evento (3)Facebook (2)FakeNews (8)Falegnameria (1)Fauna selvatica (1)Finanza (2)Firefly (1)Fotografia (12)Free lance (1)Gaming (1)Giappone (6)Giochi (2)Giornalismo (8)Giustizia (1)Google (18)Governo (5)Grafica (1)Guerra (8)Guida autonoma (2)Hong Kong (1)IBM (2)Illustrazioni (1)Immobiliare (1)India (3)INPS (1)Intel (1)Istruzione (5)Lavoro (10)Maltrattamento infantile (1)Marina (1)Marketing (5)Medicina (9)Meta (2)Metaverso (10)Microsoft (22)Midjourney (4)Mobilità sostenibile (1)Moda (3)Mozilla (1)Musica (3)Nato (1)NFT (3)Nvidia (4)Oculistica (1)OMS (1)OpenAI (39)Opera (1)Parlamento Europeo (1)Patente di guida (1)Pensieri (1)Polizia (2)Ponti (1)Privacy (8)Programmazione (1)Pubblicazione (1)Pubblicità (4)Relazioni internazionali (2)Relazioni Pubbliche (3)Report (22)Riconoscimento emotivo (1)Risorse online (15)Ristorazione (2)Robotica (8)Sanità (11)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)Sicurezza (6)Sicurezza informatica (8)Soccorso (1)Società (1)Software (3)Sport (1)Standard (1)Startup (3)streaming live (1)Sviluppatori (1)Sviluppo sostenibile (1)Taiwan (1)Taxi (1)Telecomunicazioni (1)Televisione (1)Tesla (1)TikTok (2)Torah (1)Truffa (1)Ucraina (1)Udito (1)UE (5)Unione Europea (2)Università (2)Uomo (1)USA (11)Vaticano (2)Video (11)Videocomunicazione (1)Videogiochi (1)Vigili del fuoco (1)Violenza domestica (1)Vodafone (1)WhatsApp (2)Youtube (1)Zoom (1)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Il Cerimoniale pontificio è Comunicazione. Regole formali e cerimoniali come valore nelle RP

https://www.youtube.com/watch?v=sJpPNpvnvSE Registrati per avere informazioni post evento con la nostra newsletter. Regole formali e cerimoniali come valore nelle RP" che si terrà il 23 Febbraio 2023 alle...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines