Bluesky, la piattaforma social fondata da Jay Graber, si trova al centro di una polemica relativa all’uso improprio dei dati degli utenti. Nonostante l’impegno dichiarato dall’azienda a non utilizzare i contenuti degli iscritti per l’addestramento di modelli di intelligenza artificiale, un sviluppatore ha creato un dataset con un milione di post, sfruttando le API aperte della piattaforma. Il dataset, che includeva testo, data di pubblicazione e identificatore decentralizzato (DID) di ogni utente, è stato inizialmente reso disponibile su Hugging Face, una nota piattaforma per il machine learning. In seguito alla pubblicazione, il dataset è stato rimosso, con l’autore che ha chiesto scusa per aver violato i principi di trasparenza e consenso.
Il caso solleva preoccupazioni più ampie sulla protezione dei dati personali e sulla sicurezza delle piattaforme social, che possono diventare vulnerabili a pratiche di scraping, nonostante i tentativi di limitare l’accesso tramite il Robots Exclusion Protocol. Bluesky, pur avendo già preso posizione contro l’uso improprio dei contenuti, non può impedire completamente l’uso delle API da parte di sviluppatori esterni. La piattaforma si è trovata costretta a fare chiarezza sulla questione, sottolineando che il file robots.txt non blocca efficacemente lo scraping, e che sono in corso valutazioni per trovare soluzioni più robuste per proteggere i dati degli utenti.
Nel frattempo, la discussione sul rispetto della privacy online continua a crescere, con i social network sempre più sotto il mirino di esperti e utenti per come gestiscono e proteggono le informazioni personali.