La startup californiana Guide Labs presenta Steerling-8B, un modello linguistico open source da 8 miliardi di parametri progettato per garantire piena tracciabilità delle risposte. L’obiettivo è superare l’opacità dei sistemi di deep learning e offrire maggiore controllo in settori regolamentati e applicazioni sensibili.
La società di San Francisco Guide Labs, fondata dal CEO Julius Adebayo e dalla direttrice scientifica Aya Abdelsalam Ismail, ha annunciato il rilascio open source di Steerling-8B, un large language model costruito su un’architettura che integra un “livello concettuale” capace di rendere ogni token generato riconducibile ai dati di addestramento.
Il progetto nasce dalla ricerca accademica di Adebayo al MIT, dove nel 2018 ha co-firmato uno studio sull’inaffidabilità dei metodi tradizionali di interpretabilità dei modelli di deep learning. L’approccio proposto da Guide Labs ribalta la logica attuale: invece di analizzare il modello a posteriori, l’interpretabilità viene incorporata fin dalla progettazione.
Secondo l’azienda, Steerling-8B raggiunge circa il 90% delle capacità dei modelli esistenti con un uso più efficiente dei dati di training. La struttura consente di isolare concetti specifici — ad esempio genere o violenza — e di attivarli o disattivarli in modo controllato. Questo potrebbe risultare decisivo in ambiti regolati come finanza e sanità, dove trasparenza e conformità normativa sono requisiti essenziali.
Il tema è centrale anche nel dibattito globale sull’etica dell’IA. L’architettura proposta potrebbe facilitare il rispetto delle normative europee e statunitensi, riducendo rischi legati a bias, utilizzo di contenuti protetti da copyright e decisioni automatizzate opache.
Guide Labs, uscita da Y Combinator e finanziata con un seed round da 9 milioni di dollari guidato da Initialized Capital nel novembre 2024, punta ora a sviluppare un modello di dimensioni maggiori e a offrire accesso via API.
Approfondimento e cronologia
- 2018 – Studio sull’interpretabilità dei modelli deep learning (MIT)
- Novembre 2024 – Seed round da 9 milioni di dollari (Initialized Capital)
- Febbraio 2026 – Lancio open source di Steerling-8B
Fonti:
- TechCrunch (23 febbraio 2026)
- MIT Computer Science & Artificial Intelligence Laboratory (CSAIL) – pubblicazioni su interpretabilità
- OECD AI Policy Observatory – principi su trasparenza e accountability
Consigli di approfondimento:
- OECD, Principles on Artificial Intelligence: https://oecd.ai/en/ai-principles
- MIT CSAIL, pubblicazioni su AI interpretability: https://www.csail.mit.edu
- European Commission, AI Act: https://digital-strategy.ec.europa.eu
Abstract: Pro e rischi etico-sociali
L’approccio interpretabile di Guide Labs rafforza trasparenza, controllo normativo e sicurezza applicativa, favorendo fiducia pubblica e auditabilità. Tuttavia, l’ingegnerizzazione dei concetti potrebbe limitare comportamenti emergenti e ridurre la capacità di generalizzazione creativa dei modelli. Nel lungo periodo, l’adozione diffusa di LLM tracciabili potrebbe ridefinire standard industriali, imponendo nuovi obblighi di responsabilità e trasformando il rapporto tra esseri umani e sistemi decisionali automatizzati.







