Un nuovo studio condotto da ricercatori dell’ETH di Zurigo e della società di intelligenza artificiale Anthropic suggerisce che i modelli linguistici di grandi dimensioni (LLM) possono identificare utenti pseudonimi su Internet con sorprendente precisione. L’esperimento dimostra che l’intelligenza artificiale è in grado di collegare post anonimi a identità reali analizzando solo lo stile linguistico e le tracce digitali. I risultati sollevano forti preoccupazioni sulla privacy online e sul futuro dell’anonimato digitale.
L’intelligenza artificiale e la fine dello pseudonimato online
Per decenni lo pseudonimato ha rappresentato uno strumento chiave per proteggere l’identità degli utenti su Internet. Blog, forum e social network hanno consentito a milioni di persone di esprimersi liberamente senza rivelare la propria identità reale, riducendo il rischio di ritorsioni, stalking o doxxing.
Tuttavia, secondo una ricerca ancora in fase di revisione scientifica realizzata da ricercatori dell’ETH Zurich in collaborazione con Anthropic, i modelli linguistici avanzati potrebbero cambiare radicalmente questo scenario. Gli scienziati hanno dimostrato che gli LLM possono essere utilizzati per eseguire operazioni di deanonimizzazione su larga scala, collegando contenuti anonimi a profili reali presenti su altre piattaforme.
Esperimenti su Reddit e Hacker News
Nel corso dello studio, i ricercatori hanno analizzato dati pubblici provenienti da piattaforme come Reddit, Hacker News e LinkedIn. Dopo aver rimosso le informazioni identificative dai post, hanno addestrato un modello linguistico per ricostruire l’identità degli autori partendo solo dal contenuto testuale.
I risultati sono stati significativi: l’agente di intelligenza artificiale è riuscito a identificare correttamente circa due terzi degli utenti analizzati. In altri test, utilizzando risposte anonime a questionari sull’uso dell’intelligenza artificiale, il modello è stato in grado di identificare gli autori nel 7% dei casi, un dato considerato rilevante dagli autori dello studio.
Secondo il ricercatore Simon Lermen, questa capacità rappresenta una novità tecnologica: a differenza dei metodi precedenti, che richiedevano dati strutturati, gli LLM riescono a partire da testo libero per risalire all’identità delle persone.
Implicazioni per la privacy digitale
Gli autori avvertono che la diffusione di strumenti di questo tipo potrebbe cambiare profondamente il panorama della privacy online. L’intelligenza artificiale potrebbe infatti consentire:
- ai governi di identificare dissidenti o attivisti online;
- alle aziende di collegare commenti anonimi a profili clienti per pubblicità mirata;
- ai criminali informatici di costruire profili dettagliati per truffe di ingegneria sociale.
Gli studiosi sottolineano quindi la necessità di ripensare i modelli di sicurezza e privacy su cui si basa gran parte dell’Internet contemporaneo.
Approfondimento: cronologia della ricerca sulla deanonimizzazione
- 2015 – Narayanan & Shmatikov (Princeton University) dimostrano la deanonimizzazione dei dati di Netflix collegando dataset pubblici.
https://arxiv.org/abs/cs/0610105 - 2019 – Stanford University evidenzia che lo stile linguistico può identificare gli autori nei forum online.
https://web.stanford.edu - 2023 – European Data Protection Board avverte che i sistemi di IA possono amplificare i rischi di reidentificazione dei dati anonimi.
https://edpb.europa.eu - 2026 – ETH Zurich & Anthropic mostrano che gli LLM possono identificare utenti pseudonimi su larga scala.
Consigli di approfondimento
- ETH Zurich – ricerca su privacy e machine learning
https://ethz.ch - Anthropic – ricerca sulla sicurezza dei modelli linguistici
https://www.anthropic.com - Electronic Frontier Foundation – privacy e anonimato online
https://www.eff.org
Abstract: benefici e rischi etici
L’uso dell’intelligenza artificiale per analizzare il linguaggio e collegare identità digitali apre nuove opportunità per la sicurezza informatica e la ricerca investigativa. Tuttavia comporta anche rischi significativi per la libertà di espressione, la protezione dei dati personali e i diritti civili.
La possibilità di identificare utenti pseudonimi su larga scala potrebbe ridurre l’anonimato online, con conseguenze rilevanti per giornalisti, attivisti e whistleblower. In futuro, la governance dell’intelligenza artificiale dovrà affrontare il delicato equilibrio tra innovazione tecnologica, sicurezza e tutela delle libertà fondamentali.







