Scoprire l’infinito: nuove prospettive con NNGP e NTK per reti neurali dotate di meccanismi di attenzione

Un recente studio ha evidenziato una crescente quantità di letteratura sulla relazione tra le reti neurali ampie (NN) e i processi gaussiani (GP), identificando un’equivalenza tra i due per una varietà di architetture NN. Tale equivalenza consente, ad esempio, un’approssimazione accurata del comportamento delle NN bayesiane ampie senza campionamenti di tipo MCMC o approssimazioni variazionali, o la caratterizzazione della distribuzione delle NN ampie inizializzate casualmente ottimizzate mediante discesa del gradiente senza eseguire mai un ottimizzatore. Lo studio fornisce un’estensione rigorosa di questi risultati alle NN che coinvolgono strati di attenzione, mostrando che, a differenza dell’attenzione a singola testa, che induce comportamenti non gaussiani, le architetture di attenzione a più teste si comportano come GP man mano che il numero di teste tende all’infinito. Si discutono inoltre gli effetti delle codifiche posizionali e della normalizzazione dei livelli e si propongono modifiche al meccanismo di attenzione che portano a risultati migliorati sia per NN finite che infinitamente ampie. Si valutano empiricamente i kernel di attenzione, ottenendo un miglioramento moderato rispetto al precedente stato dell’arte su CIFAR-10 per GP senza kernel addestrabili e preelaborazione avanzata dei dati. Infine, si introducono nuove funzionalità nella libreria Neural Tangents (Novak et al., 2020) che consentono l’applicazione di modelli NNGP/NTK, con e senza attenzione, a sequenze di lunghezza variabile, con un esempio sul dataset delle recensioni IMDb.

__________
Infinite attention: NNGP and NTK for deep attention networks

NEWS AIopenmind su:

3D (4)6G (1)Accademia di Comunicazione (1)Acer (1)Adobe (22)Aeronautica (9)Africa (2)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (3)AGID (1)Amazon (17)Ambiente (1)Android (4)Animali (6)Animazione (3)Anziani (1)App (5)Apple (30)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (24)Assistente vocale (2)Astronomia (2)Asus (1)AT&T (1)Audio (29)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (11)Banca (3)Bard (3)Biblioteca (1)Bill Gates (1)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (2)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (39)Chip (2)Cina (49)Cinema (3)Claude (5)Clima (2)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (1)Compagnie aeree (1)Computer quantistici (27)Computer Vision (3)Comuni italiani (1)Comunicazione (7)Comunicazioni vocali (2)Concorso bellezza AI (1)Contabilità (1)Convegno (12)Copilot (5)Copyright (5)Criptovalute (1)Cybersecurity (1)Dalle-2 (2)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (1)Diritti Autore (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)Editing fotografico (2)Editoria (7)ENEA (2)Esercito (2)Etica (111)Europol (1)Eventi (4)Evento (7)Facebook (3)FakeNews (16)Falegnameria (1)Fauna selvatica (1)Film (2)Finanza (6)Finanziamenti Italia (3)Firefly (3)Formazione (7)Fotografia (75)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (16)Giappone (8)Giochi (5)Giornalismo (10)Giustizia (1)Google (161)Governo (7)Governo Italiano (1)Grafica (2)Guerra (10)Guida autonoma (3)Hong Kong (1)Hugging Face (2)IBM (6)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (2)Influencer (1)Informazione (6)Inghilterra (4)INPS (2)Intel (3)Istruzione (16)Jailbreaking (1)Lavoro (42)Libri (3)Linguistica computazionale (6)Linkedin (4)Maltrattamento infantile (1)Marina (1)Marketing (14)Medicina (23)Mercedes-Benz (1)Meta (39)Metaverso (15)Microsoft (109)Midjourney (11)Mobilità sostenibile (1)Moda (5)Modelli AI (1)Motori di Ricerca (2)Mozilla (2)Musica (24)Nato (1)Natura (1)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (23)Occhiali (2)Occhiali Intelligenti (1)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (134)Opera (3)Opera Browser (1)Oppo (2)Oracle (1)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Pianeta (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (17)Programmazione (7)Prompt (5)Pubblicazione (1)Pubblicità (15)QR Code (1)Qualcomm (2)Ray-Ban (2)Realtà mista (2)Reddit (1)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (57)Ricerca scientifica (7)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (2)Robotica (30)Salute (3)Samsung (4)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

L’AI e il problema dei dati errati

OpenAI, l'azienda dietro il famoso chatbot ChatGPT, è al centro di un'accesa polemica riguardante la gestione delle informazioni personali nell'Unione Europea. Secondo il GDPR,...

REGENERATION NOW

COMUNICATO STAMPA|INVITOAl via la terza Edizione dell’evento Common Home “REGENERATION NOW”Roma, Luiss University – 9 maggio 2024 Il 9 maggio 2023, dalle 9.30 alle 17.00, a...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines