Google ha presentato Gemini 2.5 Computer Use, un nuovo modello di intelligenza artificiale capace di utilizzare un browser web come farebbe una persona. L’innovazione consente agli agenti AI di cliccare, scorrere, compilare moduli e interagire con interfacce digitali, superando il limite delle API e aprendo nuove prospettive per l’automazione.
Il modello, disponibile su Google AI Studio e Vertex AI, è in grado di eseguire 13 azioni principali, tra cui aprire finestre, digitare testo e trascinare elementi. Una demo pubblica su Browserbase mostra Gemini 2.5 alle prese con compiti pratici, come giocare a 2048 o navigare su Hacker News per individuare dibattiti di tendenza.
Google afferma che la velocità del sistema è stata triplicata rispetto alle versioni precedenti e che il modello “supera le alternative” di OpenAI e Anthropic su benchmark web e mobile. Tuttavia, a differenza del ChatGPT Agent e dello strumento analogo di Claude, Gemini non ha accesso all’intero sistema operativo, ma soltanto al browser.
La tecnologia potrà essere utile per testare interfacce utente, accedere a dati non disponibili via API e assistere utenti in scenari complessi, dall’e-commerce alle applicazioni aziendali. Allo stesso tempo, emergono interrogativi etici sulla trasparenza, la sicurezza dei dati e il rischio di automazione di massa in attività originariamente pensate per persone.
Breve cronologia e fonti
- 2023 – OpenAI introduce ChatGPT con funzioni di browsing sperimentali.
- 2024 – Anthropic lancia Claude con capacità di “computer use”.
- 2025 – Google presenta Gemini 2.5 Computer Use (fonte: Google AI).
Approfondimenti:
- OpenAI Dev Day 2025
- Anthropic Claude
- Vertex AI – Google Cloud
Abstract
L’introduzione di Gemini 2.5 segna un passo decisivo verso un’IA capace di interagire direttamente con l’ambiente digitale umano. Tra i vantaggi: maggiore accessibilità ai dati, automazione di processi complessi e supporto agli sviluppatori. Tra i rischi: perdita di controllo umano, vulnerabilità informatiche e impatti sociali legati alla sostituzione di compiti lavorativi. Le conseguenze future dipenderanno dall’equilibrio tra innovazione e regolamentazione.







