FAILSafe: proteggere l’IA dalle operazioni di influenza straniera che prendono di mira i modelli linguistici di grandi dimensioni

Il servizio di sicurezza FAILSafe (“Foreign Adversary Influence in LLMs Safety Service”) di NewsGuard aiuta le aziende di IA a rilevare e a difendersi dalle operazioni di influenza straniera volte a contaminare le risposte dell’IA con narrazioni di disinformazione e propaganda sponsorizzate dagli Stati.

Creato in risposta a un audit di NewsGuard che ha rilevato come le reti di disinformazione russa abbiano contaminato i principali strumenti di IA, inducendoli a ripetere narrazioni di propaganda il 33% delle volte, FAILSafe fornisce alle aziende di IA dati in tempo reale, verificati da ricercatori di disinformazione esperti in influenza straniera, sulle narrazioni e le fonti coinvolte in operazioni di influenza gestite dai governi russo, cinese e iraniano.

Per saperne di più

NewsGuard nei media

Dati in tempo reale sulle narrazioni di disinformazione straniera

FAILSafe fornisce alle aziende di IA un flusso di dati costantemente aggiornato a proposito delle narrazioni false diffuse dalle operazioni di influenza russa, cinese e iraniana. Il servizio è stato progettato per consentire alle aziende di IA di garantire che i loro sistemi non ripetano inavvertitamente queste narrazioni in risposta alle domande degli utenti.

Dati su domini e account usati nelle operazioni di influenza estera

Le aziende di IA possono accedere al database FAILSafe, costantemente aggiornato, che include siti, account dei social network, handle di piattaforme e altri spazi direttamente coinvolti in operazioni di influenza estera. FAILSafe è costruito per permettere alle aziende di IA di garantire che i loro sistemi non si basino su contenuti provenienti da questi siti e account.

Red-teaming e monitoraggio da esperti della disinformazione

Gli analisti di NewsGuard possono effettuare stress-test periodici dei prodotti IA per rilevare se, e in che misura, la disinformazione russa, cinese e iraniana e le narrazioni di propaganda abbiano contaminato le risposte dei chatbot. Questi test sono condotti dagli analisti di NewsGuard utilizzando dati proprietari sulle narrazioni di disinformazione identificate.

Integrazione rapida e semplice tramite API o datastream nel cloud

FAILSafe: proteggere l’IA dalle operazioni di influenza straniera che prendono di mira i modelli linguistici di grandi dimensioni

Una rete globale di siti di “notizie” finanziata da Mosca ha “contaminato” gli strumenti di intelligenza artificiale occidentali in tutto il mondo con la propaganda russa

NewsGuard lancia un nuovo servizio per proteggere i modelli linguistici di grandi dimensioni dalle operazioni di influenza straniera

I 10 principali modelli di intelligenza artificiale generativa ripetono le narrazioni della disinformazione russa un terzo delle volte, citando come fonti autorevoli siti fake di notizie locali creati da Mosca

Dati in tempo reale sulle narrazioni di disinformazione straniera

Dati su domini e account usati nelle operazioni di influenza estera

Red-teaming e monitoraggio da esperti della disinformazione

Integrazione rapida e semplice tramite API o datastream nel cloud