La piattaforma LinkedIn è stata ideata per permettere ai membri di tutto il mondo di condividere le loro conoscenze e le loro prospettive, nonché per discutere di temi importanti. L’obiettivo principale di LinkedIn è quello di fornire un ambiente sicuro, affidabile e professionale. Tuttavia, può capitare che alcuni contenuti, in rari casi, vadano contro le regole di LinkedIn o vengano segnalati dagli utenti e non vengano rilevati dai meccanismi di difesa.
Per questo motivo, la creazione di modelli per la rilevazione dei contenuti spam virali è estremamente importante per la piattaforma. Per capire come questi contenuti vengono rilevati prima di diventare virali, è necessario rimanere aggiornati sui diversi tipi di spam caricati sulla piattaforma e modificare di conseguenza i modelli.
LinkedIn sta implementando molte misure di rilevamento dei contenuti spam e di quelli che violano le politiche, utilizzando diversi modelli di intelligenza artificiale (AI). Questi modelli possono essere classificati in due categorie principali: difese attive e difese reattive.
Le difese attive agiscono il prima possibile per prevedere i contenuti spam virali, mentre le difese reattive monitorano le attività intorno ai contenuti pubblicati e cercano di prevedere la loro potenziale diffusione.
LinkedIn sta utilizzando algoritmi di deep learning e di Boosted Trees, ovvero modelli di machine learning, per identificare i contenuti spam virali. Inoltre, vengono utilizzate varie tecniche per prevedere la virilità dei contenuti, come l’analisi delle caratteristiche del post e del membro.
Per individuare contenuti che violano le politiche di LinkedIn, la piattaforma utilizza diversi tipi di classificatori, tra cui quelli addestrati su categorie specifiche di spam o su determinati tipi di contenuti come video e articoli. Questi classificatori sono addestrati su varie caratteristiche che forniscono un segnale precoce per i contenuti virali e di spam.
Infine, la piattaforma monitora costantemente i segnali di ingaggio, i segnali temporali e quelli relativi allo spam per individuare il potenziale per i contenuti virali durante il ciclo di vita del contenuto sulla piattaforma.