OpenAI ha presentato Codex Security, un agente di intelligenza artificiale progettato per individuare vulnerabilità software complesse e ridurre drasticamente i falsi positivi nei processi di sicurezza. La nuova tecnologia, disponibile in anteprima per i clienti ChatGPT Enterprise, Business ed Edu, utilizza modelli di IA avanzati e analisi contestuale del codice per identificare problemi critici e suggerire patch affidabili. Nei test beta ha analizzato oltre 1,2 milioni di commit, individuando centinaia di vulnerabilità gravi e migliorando significativamente il rapporto tra segnale e rumore nelle scansioni di sicurezza.
Un agente AI per individuare vulnerabilità complesse
Con la diffusione del cosiddetto “vibe coding” – lo sviluppo software accelerato da strumenti di intelligenza artificiale – la sicurezza del codice sta diventando uno dei principali colli di bottiglia per le aziende tecnologiche.
OpenAI ha introdotto Codex Security, un sistema agentico progettato per analizzare repository software, comprendere il contesto architetturale dei progetti e individuare vulnerabilità che gli strumenti tradizionali spesso non rilevano.
Secondo OpenAI, molti strumenti di sicurezza basati sull’IA generano grandi quantità di segnalazioni di bassa qualità. Questo costringe i team di sicurezza a lunghi processi di triage. Codex Security affronta il problema combinando ragionamento agentico, modellazione delle minacce e validazione automatizzata per identificare vulnerabilità realmente rilevanti.
Come funziona Codex Security
Il sistema opera attraverso tre fasi principali.
- Costruzione del contesto del sistema
L’agente analizza il repository e crea un modello di minaccia specifico del progetto, identificando componenti sensibili, relazioni di fiducia e punti di esposizione. - Individuazione e validazione delle vulnerabilità
Utilizzando questo contesto, Codex Security cerca problemi di sicurezza e li verifica in ambienti sandbox isolati, riducendo il rischio di falsi positivi. - Correzione automatizzata del codice
Il sistema suggerisce patch coerenti con l’architettura del software, riducendo il rischio di regressioni durante l’integrazione.
Durante la fase beta, le scansioni su repository identici nel tempo hanno mostrato miglioramenti significativi:
- −84% di rumore nelle segnalazioni
- −90% di errori nella classificazione della gravità
- −50% di falsi positivi
Impatto sull’ecosistema open source
OpenAI ha utilizzato Codex Security per analizzare diversi progetti open source critici. Le vulnerabilità individuate sono state segnalate ai maintainer di software ampiamente utilizzati, tra cui OpenSSH, GnuTLS, PHP, Chromium e libssh.
Secondo OpenAI, la piattaforma ha già identificato 792 vulnerabilità critiche e oltre 10.500 ad alta gravità su repository analizzati durante la fase beta.
L’azienda prevede inoltre di ampliare il programma Codex for OSS, che offre strumenti di sicurezza basati su IA e account ChatGPT gratuiti per supportare i maintainer open source.
Cronologia e contesto tecnologico
- 2024 – Nasce il progetto Aardvark, primo prototipo interno di agente AI per la sicurezza del codice.
- 2025 – Avvio del programma beta privata con aziende e team di sicurezza.
- 2026 – Lancio della preview sperimentale di Codex Security integrata nella piattaforma Codex.
Fonti istituzionali e tecniche:
- OpenAI – Annuncio ufficiale Codex Security
https://openai.com - MITRE – Common Vulnerabilities and Exposures (CVE) database
https://cve.mitre.org - OWASP – Software security best practices
https://owasp.org
Consigli di approfondimento
- OWASP Top 10: le vulnerabilità più critiche nel software
https://owasp.org/www-project-top-ten/ - NIST Secure Software Development Framework
https://www.nist.gov/ssdf - CISA – Secure by Design principles
https://www.cisa.gov/securebydesign
Abstract: opportunità e rischi etici
L’introduzione di agenti di sicurezza basati su IA potrebbe ridurre drasticamente il rischio di vulnerabilità nei sistemi digitali, migliorando la qualità del software e accelerando la revisione del codice.
Tuttavia emergono anche questioni etiche e operative:
- dipendenza crescente dagli strumenti automatizzati, con rischio di riduzione delle competenze umane;
- centralizzazione delle tecnologie di sicurezza nelle mani di poche grandi aziende tecnologiche;
- potenziale uso offensivo degli stessi strumenti per individuare vulnerabilità sfruttabili.
Nel lungo periodo, la diffusione di agenti di sicurezza autonomi potrebbe trasformare il modo in cui il software viene progettato, spostando la sicurezza da attività di revisione manuale a processo continuo integrato nello sviluppo.







