OpenAI ha annunciato il modello GPT-5.4, una nuova generazione di intelligenza artificiale progettata per operare direttamente sui computer degli utenti. Il sistema introduce funzionalità native per controllare applicazioni, browser e strumenti digitali, segnando un passo significativo verso l’evoluzione degli agenti autonomi basati su AI, capaci di svolgere attività complesse senza intervento umano continuo.
Il nuovo modello GPT-5.4, presentato da OpenAI a marzo 2026, rappresenta un’evoluzione importante nella corsa globale agli agenti di intelligenza artificiale autonomi. Secondo l’azienda, il sistema integra miglioramenti nelle capacità di ragionamento, programmazione e gestione di flussi di lavoro professionali, inclusi documenti, fogli di calcolo e presentazioni.
Una delle innovazioni principali riguarda le funzionalità native di utilizzo del computer. Il modello può interagire direttamente con dispositivi e software, eseguendo azioni come digitare comandi da tastiera, muovere il mouse o interpretare screenshot per completare attività. In pratica, GPT-5.4 può operare come un assistente digitale operativo, capace di lavorare su più applicazioni contemporaneamente.
OpenAI ha integrato il modello nella propria API e nella piattaforma di sviluppo Codex, mentre una versione denominata GPT-5.4 Thinking è stata implementata in ChatGPT per migliorare il ragionamento multi-passo e l’analisi di informazioni provenienti da diverse fonti.
Secondo l’azienda, il modello è anche più efficace nelle ricerche complesse: può condurre indagini iterative su più cicli, individuando fonti rilevanti anche in contesti informativi molto vasti, una capacità definita internamente come ricerca “ago nel pagliaio”.
Queste funzionalità si inseriscono nella strategia più ampia del settore tecnologico verso sistemi agentici, cioè reti di agenti software capaci di collaborare per svolgere compiti articolati online. Strumenti simili sono già stati sperimentati con piattaforme come ChatGPT Agent e altri sistemi autonomi che possono, ad esempio, pianificare acquisti o gestire attività digitali.
Secondo diversi analisti, gli agenti AI potrebbero trasformare il modo in cui le persone interagiscono con il software, passando da interfacce manuali a ecosistemi di automazione intelligente.
Approfondimento e cronologia
- 2023 – Diffusione globale dei modelli generativi come GPT-4 e Claude.
- 2024 – Prime sperimentazioni di agenti AI capaci di utilizzare strumenti e API.
- 2025 – Introduzione di sistemi agentici multi-modello e automazioni avanzate.
- 2026 – Lancio di GPT-5.4 con controllo diretto del computer.
Fonti istituzionali e autorevoli
- OpenAI – https://openai.com
- The Verge – https://www.theverge.com
- Stanford HAI – https://hai.stanford.edu
- OECD AI Policy Observatory – https://oecd.ai
Consigli di approfondimento
- OECD – AI and the Future of Work
https://oecd.ai - Stanford HAI – AI Index Report
https://hai.stanford.edu/ai-index - European Commission – AI governance
https://digital-strategy.ec.europa.eu
Abstract: pro e rischi
Vantaggi
- maggiore automazione dei processi digitali
- incremento della produttività nelle attività professionali
- integrazione più efficiente tra software e strumenti AI
Rischi etici e sociali
- perdita di controllo umano nei processi decisionali
- vulnerabilità di sicurezza se gli agenti operano su sistemi critici
- aumento della dipendenza tecnologica
Nel lungo periodo, la diffusione degli agenti autonomi potrebbe ridefinire il rapporto tra esseri umani e software, trasformando l’interazione con il computer da strumento passivo a sistema decisionale attivo.







