Claude Opus 4.5: il nuovo modello di Anthropic avanza nella corsa agli agenti AI ma restano criticità di sicurezza

Il lancio di Claude Opus 4.5 segna un nuovo passo nella competizione tra modelli agentici, con miglioramenti nella codifica e nell’uso del computer. Tuttavia, le vulnerabilità legate agli attacchi di prompt injection e ai casi d’uso dannosi evidenziano che la sicurezza rimane un fronte aperto.

Anthropic ha presentato Claude Opus 4.5 definendolo il suo modello più avanzato per codifica, agenti e automazione del computer. Il modello, disponibile da oggi tramite app, API e cloud provider, sarebbe in grado — secondo l’azienda — di superare Gemini 3 di Google in diverse metriche di programmazione. Tra i progressi dichiarati figurano una migliore capacità nella ricerca approfondita, nell’uso di slide e nella gestione di fogli di calcolo, oltre all’introduzione di strumenti potenziati per Claude Code e nuove funzioni nelle app destinate ai consumatori.

Il punto critico resta però la sicurezza. Come mostrato nella system card ufficiale, Opus 4.5 non è immune agli attacchi di prompt injection, una forma di manipolazione che inserisce istruzioni nascoste in contenuti testuali provenienti da siti e fonti esterne. Nonostante Anthropic affermi che il modello sia “più difficile da ingannare rispetto agli altri modelli di frontiera”, numerosi attacchi riescono ancora a superare le difese.

L’azienda ha introdotto nuove valutazioni interne ed esterne sui rischi legati alla codifica, all’uso del browser e agli scenari di automazione agentica. Nelle prove su 150 richieste di programmazione dannosa, il modello ha rifiutato il 100% dei comandi. Tuttavia, i risultati peggiorano quando Opus 4.5 interagisce tramite Claude Code o nelle funzioni di computer use: solo il 78% delle richieste malevole di creazione malware o software intrusivi è stato bloccato, e circa l’88% delle istruzioni volte alla sorveglianza o alla raccolta illecita di dati.

Il quadro complessivo suggerisce che, nonostante il rapido avanzamento verso agenti più autonomi, le vulnerabilità strutturali della sicurezza AI richiedono ancora un impegno profondo e continuo.


Approfondimento • Cronologia dei fatti collegati

  • 2023–2024 — Prime system card di sicurezza LLM: OpenAI, Anthropic e Google iniziano a pubblicare documentazione dedicata ai rischi dei modelli. NIST AI RMF
  • 2024 — Diffusione dei primi attacchi di prompt injection pratici documentati da ricercatori indipendenti e centri come MIT CSAIL.
  • 2025 — Crescita degli agenti AI e aumento delle vulnerabilità secondo l’UK AI Safety Institute e l’EU AI Office, che pubblicano analisi su rischi operativi e agentici.
  • Novembre 2025 — Lancio Claude Opus 4.5 con nuove valutazioni di sicurezza sulle funzionalità di automazione.

Consigli di approfondimento


Abstract: Pro, rischi e possibili conseguenze future

Pro:

  • Miglioramento nelle capacità di codifica, automazione e uso del computer.
  • Introduzione di valutazioni di sicurezza più ampie.
  • Potenziamento degli agenti per attività complesse su desktop e browser.

Rischi:

  • Persistenza di vulnerabilità in prompt injection avanzata.
  • Potenziale abuso in scenari agentici non controllati.
  • Necessità di governance più rigorosa per prevenire sorveglianza, truffe e automazioni intrusive.

Conseguenze future:

  • Rafforzamento delle politiche di sicurezza nell’AI Act e nei framework internazionali.
  • Maggior attenzione alla trasparenza delle system card e alle valutazioni indipendenti.
  • Necessità di nuove pratiche sociali e operative per limitare l’impatto di agenti troppo autonomi.

Claude Opus 4.5: il nuovo modello di Anthropic avanza nella corsa agli agenti AI ma restano criticità di sicurezza

NEWS AIopenmind su:

3D (13)6G (39)Accademia di Comunicazione (4)Acer (1)Adobe (55)Aeronautica (11)Africa (6)Agenti AI (265)Agenti autonomi (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (74)AGID (1)Agricoltura (6)AI AnthropoCosmic (0)Amazon (87)Ambiente (5)AMD (7)America Latina (1)Android (10)Animali (7)Animazione (6)Anthropic (96)Anziani (1)App (14)Apple (99)Archeologia (3)Architettura (4)Archivi storici (1)Armi (4)Arredamento interni (2)Arte (36)Asia (1)Assistente vocale (8)Astronomia (3)Asus (2)AT&T (1)Audi (1)Audio (72)Autoapprendimento (1)Avatar (8)Aviazione (2)Avvocati (4)Aziende (27)Banca (7)Bard (3)BCE (1)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)California (5)Canva (10)Cattolicesimo (3)Certificazioni (1)Character (2)Chataudio (1)Chatbot IA (56)Chip (4)Cina (208)Cinema (20)Claude (31)Clima (6)CNR (1)Coca-Cola (2)Commercio (3)Commissione Europea (6)Compagnie aeree (1)Computer (8)Computer quantistici (79)Computer Vision (3)Comuni italiani (1)Comunicazione (10)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (2)Contabilità (2)Convegno (17)Copilot (7)Copyright (33)Corea del Nord (1)Corea del Sud (5)Criptovalute (2)Cybersecurity (121)Dalle-2 (3)Danimarca (1)Dark web (3)Data center (50)Dating (1)Deepfake (6)DeepSeek (31)Design automobilistico (3)Design Industriale (7)Diritti Autore (1)Disney (3)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)Dubai (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (18)ENEA (2)Esercito (2)etc (0)Etica (1157)Europol (3)Eventi (10)Evento (9)Facebook (6)FakeNews (24)Falegnameria (1)Fauna selvatica (1)Film (7)Finanza (90)Finanziamenti Italia (4)Firefly (3)Firefox (3)Fondo Monetario Internazionale (2)Formazione (127)Fotografia (124)Francia (6)Free lance (1)Fujitsu (1)Fusione nucleare (2)G7 (1)Gaming (3)Garante privacy (21)Gelati (1)Giappone (52)Giochi (12)Giornalismo (32)Giustizia (4)Google (636)Governo (9)Governo Italiano (6)Grafica (6)Grok (35)Guerra (35)Guida autonoma (10)Hong Kong (41)Hugging Face (6)IBM (12)Illustrazioni (1)iMessage (1)Immobiliare (1)India (19)Indossabili (4)Influencer (1)Informazione (13)Inghilterra (19)INPS (2)Intel (10)Interfacce neurali (1)ISO (1)Israele (3)Istruzione (18)Jailbreaking (1)Kamala Harris (1)Lavoro (286)Libri (5)Linguistica computazionale (12)Linkedin (12)Linux (1)Luma AI (1)Luna (1)Maltrattamento infantile (1)Marina (1)Marketing (333)Medicina (39)Medio Oriente (1)Mercedes-Benz (1)Meta (180)Metaverso (17)Meteo (2)Microsoft (308)Midjourney (18)Mistral (13)Mobilità sostenibile (2)Moda (7)Modelli AI (156)Motori di Ricerca (14)Motorola (1)Mozilla (3)Museo (1)Musica (63)NASA (5)Nato (2)Natura (8)Natural Language Processing (2)Nazioni Unite (1)NBA (1)Netflix (3)Neuralink (1)NFT (3)Norvegia (1)Nvidia (138)Occhiali (8)Occhiali Intelligenti (21)Occhiali Smart (1)Oculistica (1)Odore (1)Offerte lavoro (2)OMS (1)ONU (3)Open Source (27)OpenAI (539)Opera (17)Opera Browser (1)Oppo (3)Oracle (5)Orologio (1)papa Leone XIV (2)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (33)Pianeta (2)PlayStation (1)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (34)Programmazione (22)Prompt (5)Pubblicazione (1)Pubblicità (19)QR Code (1)Qualcomm (5)Ray-Ban (7)Realtà mista (5)Reddit (8)Relazioni internazionali (2)Relazioni Pubbliche (3)Religione (1)Report (350)Ricerca scientifica (18)Riconoscimento emotivo (1)Risorse online (100)Ristorazione (5)Robotica (190)Runway (18)Russia (3)Salute (136)Samsung (26)Sanità (24)Satelliti (5)Sceneggiatura (1)Semiconduttori (11)SEO (3)Shopping online (4)Sicurezza (39)Sicurezza informatica (94)SMS (1)Snapchat (12)Soccorso (1)Società (32)SoftBank (1)Software (5)Sony (3)Sora (1)Sport (8)Spotify (12)Stability (5)Stable Animation SDK (1)Stable Diffusion (12)Stampanti (1)Standard (7)Startup (593)streaming live (1)Supercomputer (6)Superintelligenza (3)Sviluppatori (1)Sviluppo sostenibile (1)Svizzera (1)Synthesia (1)Taiwan (50)Taxi (2)Telecomunicazioni (7)Telegram (4)Televisione (2)Tesla (10)TikTok (13)Tinder (5)Torah (1)Traduttore AI (7)Trasporti (54)Truffa (2)Twitter (13)Ucraina (4)Udito (1)UE (16)UNESCO (4)UNICEF (1)Unione Europea (86)Unitree Robotics (1)Università (5)Uomo (1)USA (130)Vaticano (8)Video (155)Videocomunicazione (4)Videogiochi (21)Vietnam (1)Vigili del fuoco (1)Violenza domestica (1)Visualizzazione dati (1)Vodafone (2)Vogue Business - As Gen Z matures (0)Volkswagen (1)VPN (3)Website (14)WhatsApp (12)Wikimedia (1)Wikipedia (4)Wordpress (6)X (13)xAI (11)Xiaomi (1)Yahoo (4)Youtube (33)Zoom (11)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

AI e Data Center: il raffreddamento diventa strategico nell’era dell’AI

Fonte originale dell’articolo / documento (White Paper):Frost & Sullivan Whitepaper – Strategic Cooling for the AI Era L’intelligenza artificiale sta cambiando radicalmente le infrastrutture digitali...

All Digital Weeks: L’importanza di un approccio armonizzato

REGISTRATI SU Stati Generali dell’Innovazione – SGI _____________ L’avvento dell’Intelligenza Artificiale – L’importanza di un approccio armonizzato L’avvento dell’Intelligenza Artificiale (AI) rappresenta una delle più significative rivoluzioni...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines