DarkBERT: Il modello linguistico per il lato oscuro di Internet che rivoluziona la ricerca sul Dark Web

Un gruppo di ricercatori provenienti dal KAIST in Corea del Sud e da S2W Inc. ha sviluppato DarkBERT, un modello linguistico addestrato su dati provenienti dal Dark Web. Questa ricerca è stata motivata dalla constatazione di differenze significative tra il linguaggio utilizzato nel Dark Web e quello del Surface Web. Poiché gli studi sul Dark Web richiedono comunemente l’analisi testuale dei domini, l’utilizzo di modelli linguistici specifici per il Dark Web potrebbe offrire importanti spunti di ricerca.

L’obiettivo principale di DarkBERT è quello di superare la diversità estrema, sia lessicale che strutturale, del Dark Web, che potrebbe essere dannosa per la costruzione di una rappresentazione accurata del dominio. I ricercatori hanno descritto le fasi di filtraggio e compilazione dei dati testuali utilizzati per addestrare DarkBERT, al fine di affrontare questa sfida.

Per valutare l’efficacia di DarkBERT, i ricercatori hanno confrontato le sue prestazioni con quelle di altri modelli linguistici ampiamente utilizzati, nonché con la controparte “vanilla” di DarkBERT. Le valutazioni hanno dimostrato che DarkBERT supera gli attuali modelli linguistici e può essere una risorsa preziosa per la ricerca futura sul Dark Web.

Il Dark Web è una parte dell’Internet non indicizzata dai motori di ricerca come Google e non accessibile tramite un normale browser web. Per accedere al Dark Web, sono necessarie applicazioni specializzate come Tor (The Onion Router). Tor ospita anche servizi nascosti (onion services), in cui gli indirizzi IP del client e del server sono nascosti l’uno dall’altro. Tuttavia, l’anonimato offerto agli utenti del Dark Web ha un lato oscuro, dato che molte delle attività svolte in questo contesto sono immorali o illegali, come la vendita di droga o il hosting di contenuti illegali.

Gli esperti di sicurezza e i ricercatori nel campo della cybersecurity stanno utilizzando sempre di più metodi di elaborazione del linguaggio naturale per affrontare le minacce informatiche moderne. L’utilizzo di strumenti di elaborazione del linguaggio naturale è stato esteso anche al Dark Web, poiché rappresenta un ambito di ricerca essenziale per la cybersecurity.

In uno studio precedente, si è osservato che un modello di classificazione basato su BERT ottiene prestazioni all’avanguardia tra i metodi di elaborazione del linguaggio naturale disponibili per il Dark Web. Tuttavia, BERT è stato addestrato su contenuti del Surface Web, come Wikipedia e BookCorpus, che presentano caratteristiche linguistiche diverse rispetto al Dark Web. Ciò implica che i modelli linguistici preaddestrati popolari come BERT non sono ideali per la ricerca sul Dark Web, in quanto non riescono a estrarre informazioni utili a causa delle differenze linguistiche tra i due domini. Pertanto, un modello di elaborazione del linguaggio naturale adatto al Dark Web potrebbe essere

utile per gli sforzi in corso nella cybersecurity del Dark Web.

Nel presente articolo, viene presentato DarkBERT, un nuovo modello linguistico preaddestrato su un corpus del Dark Web. Per valutare l’utilità di DarkBERT nella gestione delle minacce informatiche presenti nel Dark Web, è stato sottoposto a valutazione in compiti legati alla rilevazione delle attività sotterranee. DarkBERT è stato confrontato con altri modelli e ha dimostrato prestazioni superiori.

I risultati delle valutazioni mostrano che DarkBERT offre vantaggi significativi rispetto ai modelli linguistici attuali e può essere uno strumento prezioso per la ricerca sul Dark Web. Questo modello specifico per il Dark Web potrebbe consentire di estrarre informazioni utili, migliorando le capacità di individuazione delle attività illecite e l’intelligence sulla minaccia cibernetica.

La continua crescita delle attività criminali nel Dark Web rende necessario uno sforzo costante per migliorare la cybersecurity in questo contesto. L’uso di modelli linguistici specifici come DarkBERT potrebbe contribuire in modo significativo a tali sforzi, fornendo agli esperti di sicurezza e ai ricercatori gli strumenti necessari per comprendere meglio e affrontare le minacce presenti nel Dark Web.

DarkBERT si presenta come una soluzione promettente per affrontare le sfide linguistiche e strutturali del Dark Web. La sua efficacia dimostrata e la sua capacità di superare i modelli linguistici esistenti indicano che potrebbe diventare un punto di riferimento per la ricerca futura sulla cybersecurity del Dark Web.

NEWS AIopenmind su:

3D (5)6G (1)Accademia di Comunicazione (4)Acer (1)Adobe (33)Aeronautica (9)Africa (2)Agenzia delle Entrate (1)Agenzia Spaziale Europea (ESA) (1)Agenzia viaggi (1)AGI (Intelligenza artificiale generalizzata) (4)AGID (1)Amazon (30)Ambiente (2)AMD (1)Android (6)Animali (6)Animazione (4)Anthropic (8)Anziani (1)App (10)Apple (53)Archeologia (3)Architettura (4)Armi (3)Arredamento interni (2)Arte (27)Assistente vocale (3)Astronomia (2)Asus (1)AT&T (1)Audi (1)Audio (52)Autoapprendimento (1)Avatar (3)Aviazione (1)Avvocati (2)Aziende (18)Banca (3)Bard (3)Biblioteca (1)Bill Gates (2)Bing (9)Biologia (1)Birra (1)Blockchain (2)Boston Dynamics (2)Calcio (2)Canva (6)Cattolicesimo (3)Certificazioni (1)Cesintes (1)chataudio (1)Chatbot IA (42)Chip (3)Cina (52)Cinema (8)Claude (17)Clima (3)CNR (1)Coca-Cola (1)Commercio (2)Commissione Europea (2)Compagnie aeree (1)Computer (3)Computer quantistici (31)Computer Vision (3)Comuni italiani (1)Comunicazione (9)Comunicazioni vocali (2)Concorso bellezza AI (1)Consiglio d'Europa (1)Contabilità (1)Convegno (13)Copilot (5)Copyright (12)Criptovalute (1)Cybersecurity (1)Dalle-2 (3)Dark web (2)Data center (1)Dating (1)Deepfake (2)Design automobilistico (2)Design Industriale (6)Diritti Autore (1)Doppiaggio (1)Drone (1)Droni (1)Dropbox (1)E-commerce (1)eBay (1)Editing fotografico (3)Editoria (9)Email (1)ENEA (2)Esercito (2)Etica (125)Europol (1)Eventi (6)Evento (7)Facebook (4)FakeNews (18)Falegnameria (1)Fauna selvatica (1)Film (3)Finanza (7)Finanziamenti Italia (3)Firefly (3)Firefox (1)Fondo Monetario Internazionale (1)Formazione (12)Fotografia (107)Francia (1)Free lance (1)G7 (1)Gaming (1)Garante privacy (19)Giappone (9)Giochi (7)Giornalismo (11)Giustizia (1)Google (259)Governo (7)Governo Italiano (2)Grafica (5)Guerra (12)Guida autonoma (3)Hong Kong (1)Hugging Face (3)IBM (7)Illustrazioni (1)iMessage (1)Immobiliare (1)India (3)Indossabili (3)Influencer (1)Informazione (9)Inghilterra (7)INPS (2)Intel (6)ISO (1)Istruzione (16)Jailbreaking (1)Kamala Harris (1)Lavoro (44)Libri (3)Linguistica computazionale (7)Linkedin (7)Linux (1)Luma AI (1)Maltrattamento infantile (1)Marina (1)Marketing (44)Medicina (24)Mercedes-Benz (1)Meta (69)Metaverso (16)Microsoft (162)Midjourney (16)Mobilità sostenibile (1)Moda (5)Modelli AI (29)Motori di Ricerca (11)Mozilla (2)Musica (34)NASA (1)Nato (2)Natura (2)Natural Language Processing (2)Nazioni Unite (1)NBA (1)NFT (3)Nvidia (32)Occhiali (7)Occhiali Intelligenti (2)Occhiali Smart (1)Oculistica (1)OMS (1)ONU (1)Open Source (2)OpenAI (214)Opera (9)Opera Browser (1)Oppo (3)Oracle (2)Orologio (1)Parlamento Europeo (4)Patente di guida (1)Pensieri (1)Perplexity (5)Pianeta (2)Plugin (1)Polizia (2)Ponti (1)Presentazioni aziendali (4)Privacy (23)Programmazione (10)Prompt (5)Pubblicazione (1)



AI open mind

Insieme per riflettere sull’intelligenza - umana e artificiale - tra studi, esperienze, democrazia e innovazione.

Oltre 100 aziende si impegnano per un’IA sicura e trasparente

Oltre cento aziende, tra multinazionali e piccole e medie imprese europee, hanno sottoscritto il Patto sull'Intelligenza Artificiale (IA) dell'Unione Europea, impegnandosi a rispettare le...

ProWritingAid: L’Arte di Scrivere con Sicurezza

ProWritingAid si propone come un alleato indispensabile per gli scrittori, offrendo strumenti innovativi per migliorare la qualità della scrittura. Fondato nel 2012 a Londra,...

Mi sono imparato la scienza?

Fahrenheit.iit e il potere della narrazione. Mercoledì 13 marzo, ore 17:00 in Accademia di Comunicazione e in streaming Registrati La narrazione può essere la lama...

Iscrizione NEWSLETTER

I dati da Lei forniti non saranno comunicati ad altri soggetti terzi e non saranno trasferiti né in Stati membri dell’Unione Europea né in paesi terzi extra UE.

Visita le sezioni del sito

Link utili

Casi studio, contributi

AI governance: A research agenda, Governance of AI program, Future of Umanity Institute, University of Oxford, Dafoe A., 2017 Artificial intelligence (AI) is a po-tent...

Libri

Ricerche

Piattaforme Corsi Gratuiti

White paper, guidelines