Anthropic ha annunciato due nuove versioni del modello di intelligenza artificiale Claude, ampliando le capacità della piattaforma. Il primo, Claude 3.5 Sonnet, rappresenta un’evoluzione rispetto al predecessore, eccellendo in modo particolare nel coding e nelle funzioni di tool use, fondamentali per applicazioni complesse. Claude 3.5 Haiku, invece, raggiunge prestazioni pari a Claude 3 Opus a costi contenuti, mantenendo un alto livello di velocità e precisione.
Una delle novità principali è la capacità di utilizzo del computer in versione beta pubblica, che consente al modello di navigare interfacce e svolgere azioni come il clic, la digitazione e il controllo del cursore. Sebbene ancora in fase sperimentale, questo aggiornamento permette al modello di eseguire compiti complessi che richiedono più passaggi. Diverse aziende, tra cui Canva, Replit e The Browser Company, hanno già iniziato a esplorare le possibilità di questa funzione per sviluppare applicazioni automatizzate.
Claude 3.5 Sonnet ha dimostrato significativi miglioramenti su benchmark di settore, come il SWE-bench Verified, dove ha ottenuto un punteggio del 49%, superando molti dei modelli più avanzati attualmente disponibili. La sua capacità di reasoning avanzato ha reso Claude 3.5 Sonnet ideale per supportare processi di sviluppo software multi-step, come dimostrato dai test condotti da GitLab e Cognition.
Infine, la funzione di computer use introduce anche nuove sfide di sicurezza, che Anthropic affronta con classificatori avanzati per prevenire utilizzi non etici della tecnologia. Con questi sviluppi, Anthropic punta a esplorare il potenziale dell’IA nell’interazione con l’ambiente digitale, aprendo nuove opportunità per gli sviluppatori.