FAILSafe: proteggere l’IA dalle operazioni di influenza straniera che prendono di mira i modelli linguistici di grandi dimensioni

Il servizio di sicurezza FAILSafe (“Foreign Adversary Influence in LLMs Safety Service”) di NewsGuard aiuta le aziende di IA a rilevare e a difendersi dalle operazioni di influenza straniera volte a contaminare le risposte dell’IA con narrazioni di disinformazione e propaganda sponsorizzate dagli Stati.

Creato in risposta a un audit di NewsGuard che ha rilevato come le reti di disinformazione russa abbiano contaminato i principali strumenti di IA, inducendoli a ripetere narrazioni di propaganda il 33% delle volte, FAILSafe fornisce alle aziende di IA dati in tempo reale, verificati da ricercatori di disinformazione esperti in influenza straniera, sulle narrazioni e le fonti coinvolte in operazioni di influenza gestite dai governi russo, cinese e iraniano.

Per saperne di più

Vuoi maggiori informazioni su NewsGuard? Compila questo modulo e verrai contattato dal nostro staff.

  • This field is for validation purposes and should be left unchanged.

NewsGuard nei media

Dati in tempo reale sulle narrazioni di disinformazione straniera

FAILSafe fornisce alle aziende di IA un flusso di dati costantemente aggiornato a proposito delle narrazioni false diffuse dalle operazioni di influenza russa, cinese e iraniana. Il servizio è stato progettato per consentire alle aziende di IA di garantire che i loro sistemi non ripetano inavvertitamente queste narrazioni in risposta alle domande degli utenti.

Dati su domini e account usati nelle operazioni di influenza estera

Le aziende di IA possono accedere al database FAILSafe, costantemente aggiornato, che include siti, account dei social network, handle di piattaforme e altri spazi direttamente coinvolti in operazioni di influenza estera. FAILSafe è costruito per permettere alle aziende di IA di garantire che i loro sistemi non si basino su contenuti provenienti da questi siti e account.

Red-teaming e monitoraggio da esperti della disinformazione

Gli analisti di NewsGuard possono effettuare stress-test periodici dei prodotti IA per rilevare se, e in che misura, la disinformazione russa, cinese e iraniana e le narrazioni di propaganda abbiano contaminato le risposte dei chatbot. Questi test sono condotti dagli analisti di NewsGuard utilizzando dati proprietari sulle narrazioni di disinformazione identificate.

Integrazione rapida e semplice tramite API o datastream nel cloud