Un nuovo metodo sviluppato dal MIT CSAIL riduce fino al 90% gli errori di confidenza nei modelli di intelligenza artificiale, migliorando affidabilità e sicurezza senza sacrificare le prestazioni. La tecnica RLCR introduce un cambio di paradigma nei sistemi di ragionamento automatico, con implicazioni dirette per sanità, finanza e diritto.
L’eccessiva sicurezza dell’intelligenza artificiale è da tempo uno dei principali fattori di rischio nei sistemi avanzati. I modelli linguistici tendono infatti a fornire risposte con elevata certezza, indipendentemente dalla loro accuratezza. Un problema noto come “overconfidence”, spesso alla base delle cosiddette allucinazioni.
Una nuova ricerca del Massachusetts Institute of Technology, pubblicata il 22 aprile 2026 e presentata alla International Conference on Learning Representations, introduce una soluzione concreta: il metodo RLCR (Reinforcement Learning with Calibration Rewards).
Secondo i dati ufficiali, RLCR riduce l’errore di calibrazione fino al 90%, mantenendo o migliorando l’accuratezza anche su compiti non visti durante l’addestramento. Il sistema introduce una modifica alla funzione di ricompensa del reinforcement learning, integrando il cosiddetto “Brier score”, una metrica statistica che penalizza le discrepanze tra fiducia dichiarata e accuratezza reale.
Il problema alla base è strutturale: i modelli vengono premiati solo per risposte corrette o penalizzati per errori, senza considerare il livello di certezza. Questo porta i sistemi a “indovinare con sicurezza”, generando output potenzialmente fuorvianti.
Come sottolineato dai ricercatori, tra cui Mehul Damani e Isha Puri, RLCR consente ai modelli di esprimere incertezza in modo esplicito, introducendo una nuova dimensione nel processo decisionale: la consapevolezza dei limiti.
Applicazioni pratiche emergono già nei test: selezionare risposte in base alla fiducia dichiarata migliora le prestazioni complessive, mentre l’integrazione del ragionamento sull’incertezza rafforza anche i modelli più piccoli.
Fonte e paper:
https://news.mit.edu/2026/teaching-ai-models-to-say-im-not-sure-0422
Approfondimento e contesto
- 2023–2025: Crescita dei modelli di ragionamento (es. RLHF e chain-of-thought) – fonte: OpenAI, DeepMind
- 2025: Studi accademici evidenziano rischi di allucinazioni nei LLM – fonte: arXiv, Stanford HAI
- 2026: Introduzione RLCR – MIT CSAIL
Approfondimenti:
- MIT News: https://news.mit.edu
- Stanford HAI: https://hai.stanford.edu
- arXiv AI papers: https://arxiv.org
Abstract: impatti, rischi e scenari futuri
Pro:
- Maggiore affidabilità dei sistemi AI
- Riduzione delle decisioni errate in contesti critici
- Migliore trasparenza e interpretabilità
Rischi:
- Possibile aumento della complessità computazionale
- Dipendenza da metriche di calibrazione non universali
- Uso improprio in contesti ad alta automazione senza supervisione umana
Implicazioni etiche e sociali:
RLCR introduce un cambio culturale: l’intelligenza artificiale non come sistema infallibile, ma come strumento consapevole dei propri limiti. Questo potrebbe ridurre il rischio di fiducia cieca negli algoritmi, ma richiede utenti formati per interpretare correttamente l’incertezza.







