AI più affidabile: il MIT insegna ai modelli a dire “non lo so”

Un nuovo metodo sviluppato dal MIT CSAIL riduce fino al 90% gli errori di confidenza nei modelli di intelligenza artificiale, migliorando affidabilità e sicurezza senza sacrificare le prestazioni. La tecnica RLCR introduce un cambio di paradigma nei sistemi di ragionamento automatico, con implicazioni dirette per sanità, finanza e diritto.

L’eccessiva sicurezza dell’intelligenza artificiale è da tempo uno dei principali fattori di rischio nei sistemi avanzati. I modelli linguistici tendono infatti a fornire risposte con elevata certezza, indipendentemente dalla loro accuratezza. Un problema noto come “overconfidence”, spesso alla base delle cosiddette allucinazioni.

Una nuova ricerca del Massachusetts Institute of Technology, pubblicata il 22 aprile 2026 e presentata alla International Conference on Learning Representations, introduce una soluzione concreta: il metodo RLCR (Reinforcement Learning with Calibration Rewards).

Secondo i dati ufficiali, RLCR riduce l’errore di calibrazione fino al 90%, mantenendo o migliorando l’accuratezza anche su compiti non visti durante l’addestramento. Il sistema introduce una modifica alla funzione di ricompensa del reinforcement learning, integrando il cosiddetto “Brier score”, una metrica statistica che penalizza le discrepanze tra fiducia dichiarata e accuratezza reale.

Il problema alla base è strutturale: i modelli vengono premiati solo per risposte corrette o penalizzati per errori, senza considerare il livello di certezza. Questo porta i sistemi a “indovinare con sicurezza”, generando output potenzialmente fuorvianti.

Come sottolineato dai ricercatori, tra cui Mehul Damani e Isha Puri, RLCR consente ai modelli di esprimere incertezza in modo esplicito, introducendo una nuova dimensione nel processo decisionale: la consapevolezza dei limiti.

Applicazioni pratiche emergono già nei test: selezionare risposte in base alla fiducia dichiarata migliora le prestazioni complessive, mentre l’integrazione del ragionamento sull’incertezza rafforza anche i modelli più piccoli.

Fonte e paper:
https://news.mit.edu/2026/teaching-ai-models-to-say-im-not-sure-0422


Approfondimento e contesto

  • 2023–2025: Crescita dei modelli di ragionamento (es. RLHF e chain-of-thought) – fonte: OpenAI, DeepMind
  • 2025: Studi accademici evidenziano rischi di allucinazioni nei LLM – fonte: arXiv, Stanford HAI
  • 2026: Introduzione RLCR – MIT CSAIL

Approfondimenti:


Abstract: impatti, rischi e scenari futuri

Pro:

  • Maggiore affidabilità dei sistemi AI
  • Riduzione delle decisioni errate in contesti critici
  • Migliore trasparenza e interpretabilità

Rischi:

  • Possibile aumento della complessità computazionale
  • Dipendenza da metriche di calibrazione non universali
  • Uso improprio in contesti ad alta automazione senza supervisione umana

Implicazioni etiche e sociali:
RLCR introduce un cambio culturale: l’intelligenza artificiale non come sistema infallibile, ma come strumento consapevole dei propri limiti. Questo potrebbe ridurre il rischio di fiducia cieca negli algoritmi, ma richiede utenti formati per interpretare correttamente l’incertezza.


AI più affidabile: il MIT insegna ai modelli a dire “non lo so”

NEWS AIopenmind su:

3D (13)6G (39)Accademia di Comunicazione (4)Acer (1)Adobe (55)Adobe Firefly Custom Models: AI generativa personalizzata per immagini e stile creativo (0)Aeronautica (11)Africa (6)Agenti AI (263)Agenti autonomi (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (74)AGID (1)Agricoltura (6)Amazon (87)Ambiente (5)AMD (7)America Latina (1)Android (10)Animali (7)Animazione (6)Anthropic (96)Anthropocosmic AI (1)Anziani (1)App (14)Apple (99)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (36)Asia (1)Assistente vocale (8)Astronomia (3)Asus (2)AT&T (1)Audi (1)Audio (72)Autoapprendimento (1)Avatar (8)Aviazione (2)Avvocati (4)Aziende (27)Banca (7)Bard (3)BCE (1)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)California (5)Canva (10)Cattolicesimo (3)Certificazioni (1)Character (2)Chataudio (1)Chatbot IA (56)Chip (4)Cina (207)Cinema (20)Claude (31)Clima (6)CNR (1)Coca-Cola (2)Commercio (3)Commissione Europea (6)Compagnie aeree (1)Computer (8)Computer quantistici (78)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (2)Contabilità (2)Convegno (17)Copilot (7)Copyright (33)Corea del Nord (1)Corea del Sud (5)Criptovalute (2)Cybersecurity (119)Dalle-2 (3)Danimarca (1)Dark web (3)Data center (50)Dating (1)Deepfake (6)DeepSeek (31)Design automobilistico (3)Design Industriale (7)Diritti Autore (1)Disney (3)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)Dubai (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (18)ENEA (2)Esercito (2)etc (0)Etica (1154)Europol (3)Eventi (10)Evento (9)Facebook (6)FakeNews (24)Falegnameria (1)Fauna selvatica (1)Film (7)Finanza (88)Finanziamenti Italia (4)Firefly (3)Firefox (3)Fondo Monetario Internazionale (2)Formazione (126)Fotografia (124)Francia (6)Free lance (1)Fujitsu (1)Fusione nucleare (2)G7 (1)Gaming (3)Garante privacy (21)Gelati (1)Giappone (51)Giochi (12)Giornalismo (32)Giustizia (4)Google (636)Governo (9)Governo Italiano (6)Grafica (6)Grok (35)Guerra (35)Guida autonoma (10)Hong Kong (40)Hugging Face (6)IBM (12)Illustrazioni (1)iMessage (1)Immobiliare (1)India (19)Indossabili (4)Influencer (1)Informazione (13)Inghilterra (19)INPS (2)Intel (10)Interfacce neurali (1)ISO (1)Israele (3)Istruzione (18)Jailbreaking (1)Kamala Harris (1)Lavoro (283)Libri (5)Linguistica computazionale (12)Linkedin (12)Linux (1)Luma AI (1)Luna (1)Maltrattamento infantile (1)Marina (1)Marketing (331)Medicina (39)Medio Oriente (1)Mercedes-Benz (1)Meta (180)Metaverso (17)Meteo (2)Microsoft (308)Midjourney (18)Mistral (13)Mobilità sostenibile (2)Moda (7)Modelli AI (156)Motori di Ricerca (14)Motorola (1)Mozilla (3)Museo (1)Musica (63)NASA (5)Nato (2)Natura (8)Natural Language Processing (2)Nazioni Unite (1)NBA (1)Netflix (3)Neuralink (1)NFT (3)Norvegia (1)Nvidia (138)Occhiali (8)Occhiali Intelligenti (21)Occhiali Smart (1)Oculistica (1)Odore (1)Offerte lavoro (2)OMS (1)ONU (3)Open Source (27)OpenAI (539)Opera (17)Opera Browser (1)Oppo (3)Oracle (5)Orologio (1)papa Leone XIV (2)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (33)Pianeta (2)PlayStation (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (34)Programmazione (22)Prompt (5)Pubblicazione (1)Pubblicità (19)QR Code (1)Qualcomm (5)Ray-Ban (7)Realtà mista (5)Reddit (8)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (341)Ricerca scientifica (18)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (5)Robotica (189)Runway (18)Russia (3)Salute (134)Samsung (26)Sanità (24)Satelliti (5)Sceneggiatura (1)Semiconduttori (11)SEO (3)Shopping online (4)Sicurezza (39)Sicurezza informatica (94)SMS (1)Snapchat (12)Soccorso (1)Società (32)SoftBank (1)Software (5)Sony (3)Sora (1)Sport (8)Spotify (12)Stability (5)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (7)Startup (593)streaming live (1)Supercomputer (6)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Svizzera (1)Synthesia (1)Taiwan (49)Taxi (2)Telecomunicazioni (7)Telegram (4)Televisione (2)Tesla (10)TikTok (13)Tinder (5)Torah (1)Traduttore AI (7)Trasporti (53)Truffa (2)Twitter (13)Ucraina (4)Udito (1)UE (16)UNESCO (4)UNICEF (1)Unione Europea (83)Unitree Robotics (1)Università (5)Uomo (1)USA (129)Vaticano (8)Video (155)Videocomunicazione (4)Videogiochi (21)Vietnam (1)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (2)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (14)WhatsApp (12)Wikimedia (1)Wikipedia (4)Wordpress (6)X (13)xAI (11)Xiaomi (1)Yahoo (4)Youtube (33)Zoom (11)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

IA e pubblicazioni scientifiche: la corsa al “pubblica o perisci” rischia di impoverire la ricerca

Link alla fonte iniziale (articolo + studio):Phys.org – A leading journal finds that AI is flooding academic publishing with lower quality workTipo documento scaricabile:...

IA, IoT e Blockchain rivoluzionano la sicurezza alimentare

Fonte originale dello studio (review scientifica peer-reviewed):ScienceDirect – Progressi nell’applicazione e nell’utilizzo di IA, IoT e blockchain nell’analisi microbiologica e nella sicurezza alimentareTipo di...

All Digital Weeks: L’importanza di un approccio armonizzato

REGISTRATI SU Stati Generali dell’Innovazione – SGI _____________ L’avvento dell’Intelligenza Artificiale – L’importanza di un approccio armonizzato L’avvento dell’Intelligenza Artificiale (AI) rappresenta una delle più significative rivoluzioni...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines