Google Research: modelli di lingua più grandi imparano diversamente in-contexto

Il 15 maggio 2023, Google Research ha pubblicato un post sul proprio blog intitolato “I modelli di lingua più grandi imparano in contesti differenti”, scritto da Jerry Wei, studente ricercatore, e Denny Zhou, Principal Scientist. I ricercatori spiegano che i modelli di lingua sono diventati molto avanzati grazie alla loro capacità di apprendere in-contexto (ICL), un processo in cui i modelli sono stimolati con alcuni esempi di input-label prima di eseguire il compito su un esempio di valutazione non visto. Questa abilità è resa possibile dal loro utilizzo di conoscenze semantiche precedentemente apprese per prevedere le etichette e dalle loro abilità di apprendere i mapping input-label dai contesti forniti.

Nel post, i ricercatori esaminano come questi due fattori interagiscono nei modelli di lingua di diversa scala in ambienti di apprendimento in-contexto, tramite l’analisi di due diverse impostazioni. La prima è l’apprendimento in-contexto con etichette invertite, dove i modelli sono stimolati con esempi che presentano etichette invertite rispetto alle conoscenze semantiche precedentemente apprese, costringendoli a ignorare queste ultime per eseguire correttamente il compito. La seconda impostazione è l’apprendimento in-contexto con etichette semanticamente non correlate, dove le etichette in contesto sono sostituite con parole che non sono semanticamente correlate al compito che si intende eseguire, costringendo il modello a eseguire il mapping input-label.

I ricercatori hanno testato cinque diverse famiglie di modelli di lingua su sette diversi compiti di elaborazione del linguaggio naturale, tra cui l’analisi del sentimento e la rilevazione dell’odio. Hanno scoperto che i modelli di lingua più grandi possono ignorare le conoscenze semantiche apprese precedentemente quando sono presentate etichette invertite in contesto, mentre i modelli di lingua più piccoli non possono farlo. Hanno anche scoperto che i modelli di lingua più piccoli dipendono maggiormente dalle conoscenze semantiche apprese precedentemente rispetto ai modelli di lingua più grandi quando sono presenti etichette semanticamente non correlate.

I ricercatori ritengono che questi risultati possano essere utilizzati per migliorare le prestazioni dei modelli di lingua, attraverso la messa a punto degli algoritmi di apprendimento in-contexto e la scelta dei modelli più adatti per ogni compito di elaborazione del linguaggio naturale.

NEWS AIopenmind su:

3D (4)6G (1)Adobe (9)Aeronautica (7)Africa (2)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (1)Amazon (6)Ambiente (1)Android (1)Animali (6)Animazione (2)Anziani (1)App (1)Apple (14)Archeologia (2)Architettura (3)Armi (2)Arredamento interni (1)Arte (21)Astronomia (2)Audio (21)Autoapprendimento (1)Avatar (2)Aviazione (1)Avvocati (1)Aziende (8)Banca (2)Bard (3)Biblioteca (1)Bill Gates (1)Bing (9)Birra (1)Blockchain (1)Boston Dynamics (1)Calcio (2)Canva (1)Cattolicesimo (3)Certificazioni (1)chataudio (1)Chatbot IA (25)Chip (2)Cina (47)Cinema (2)Clima (2)CNR (1)Coca-Cola (1)Commercio (1)Commissione Europea (1)Compagnie aeree (1)Computer quantistici (24)Computer Vision (3)Comuni italiani (1)Comunicazione (6)Comunicazioni vocali (1)Contabilità (1)Convegno (1)Copyright (4)Cybersecurity (1)Dark web (2)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (1)Doppiaggio (1)Drone (1)Droni (1)E-commerce (1)Editing fotografico (2)Editoria (6)ENEA (1)Esercito (2)Etica (93)Europol (1)Eventi (3)Evento (3)Facebook (3)FakeNews (14)Falegnameria (1)Fauna selvatica (1)Finanza (5)Finanziamenti Italia (1)Firefly (2)Formazione (2)Fotografia (46)Francia (1)Free lance (1)Gaming (1)Garante privacy (11)Giappone (8)Giochi (3)Giornalismo (10)Giustizia (1)Google (92)Governo (5)Grafica (1)Guerra (8)Guida autonoma (2)Hong Kong (1)IBM (5)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Influencer (1)Informazione (2)Inghilterra (1)INPS (1)Intel (2)Istruzione (12)Lavoro (34)Libri (2)Linguistica computazionale (6)Linkedin (2)Maltrattamento infantile (1)Marina (1)Marketing (13)Medicina (19)Meta (16)Metaverso (14)Microsoft (57)Midjourney (10)Mobilità sostenibile (1)Moda (5)Mozilla (2)Musica (13)Nato (1)Natural Language Processing (1)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (11)Occhiali (1)Oculistica (1)OMS (1)OpenAI (96)Opera (2)Orologio (1)Parlamento Europeo (2)Patente di guida (1)Pensieri (1)Pianeta (1)Polizia (2)Ponti (1)Presentazioni aziendali (2)Privacy (15)Programmazione (3)Prompt (5)Pubblicazione (1)Pubblicità (10)Realtà mista (2)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (33)Ricerca scientifica (5)Riconoscimento emotivo (1)Risorse online (85)Ristorazione (2)Robotica (21)Salute (1)Samsung (1)Sanità (12)Satelliti (2)Sceneggiatura (1)Semiconduttori (2)SEO (1)Shopping online (1)Sicurezza (14)Sicurezza informatica (20)SMS (1)Snapchat (2)Soccorso (1)Società (1)Software (3)Sport (1)Stable Animation SDK (1)Stable Diffusion (5)Standard (1)Startup (6)streaming live (1)Superintelligenza (1)Sviluppatori (1)Sviluppo sostenibile (1)Taiwan (2)Taxi (1)Telecomunicazioni (2)Telegram (1)Televisione (1)Tesla (3)TikTok (2)Torah (1)Traduttore AI (1)Truffa (1)Twitter (6)Ucraina (1)Udito (1)UE (6)UNESCO (1)Unione Europea (8)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Antiriciclaggio per l’arte: a Roma il Workshop

organizzato da Genio Business https://www.youtube.com/watch?v=BCd6l-uDkYc Questo imprescindibile aspetto per il mercato dell’Arte, alla luce delle trasformazioni e delle possibilità tecnologiche e di Intelligenza Artificiale dell’attuale momento...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines