FAILSafe : Protéger l’IA contre les opérations d’ingérence étrangère visant à contaminer les grands modèles de langage

Le service de NewsGuard FAILSafe pour IA permet aux entreprises d’IA générative de détecter et de prévenir les opérations d’ingérence étrangère qui visent à corrompre les réponses de l’IA avec de la désinformation et de la propagande d’État.

Le service FAILSafe a été créé après la publication par NewsGuard d’un audit inédit qui a montré comment des réseaux de désinformation russe ont contaminé les principaux outils d’intelligence artificielle générative, menant ces outils à répéter des récits de propagande dans 33% des cas. Il fournit aux entreprises d’IA des données en temps réel (vérifiées par des chercheurs en désinformation spécialisés dans les opérations d’ingérence étrangère) sur les récits et les sources impliqués dans les opérations d’ingérence menées par les gouvernements russes, chinois et iranien.

Presse

Données en temps réel sur les récits de désinformation étrangère

FAILSafe fournit aux entreprises d’IA des données en temps réel sur les récits faux propagés par les opérations d’ingérence russes, chinoises et iraniennes. Ces données sont conçues pour permettre aux entreprises d’IA de s’assurer que leurs systèmes ne répètent pas par inadvertance ces récits en réponse à des consignes d’utilisateurs.

Noms de domaines et comptes liés aux opérations d’ingérence étrangère

Les entreprises d’IA peuvent acheter une license d’accès à la base de données FAILSafe, continuellement mise à jour, qui inclut des sites webs, des comptes sur les réseaux sociaux, des noms d’utilisateurs sur ces plateformes et d’autres lieux de publications qui sont directement impliqués dans des opérations d’ingérence étrangère. Cette base de données est conçue pour permettre aux entreprises d’IA de s’assurer que leurs systèmes ne s’appuient pas sur le contenu de ces sites web et comptes.

Audits et veille par des experts de la désinformation

Les analystes de NewsGuard peuvent effectuer des tests de résistance périodiques des modèles d’IA pour déterminer si, et dans quelle mesure, les récits de désinformation et de propagande russes, chinois et iraniens ont contaminé leurs réponses. Ces audit sont effectués par les analyses de NewsGuard, experts de la désinformation, à l’aide de données exclusives sur les récits de désinformation connus.

Intégration simple et rapide via l’API ou le flux de données dans le cloud

FAILSafe : Protéger l’IA contre les opérations d’ingérence étrangère visant à contaminer les grands modèles de langage

Un réseau de désinformation russe contamine les réponses des grands modèles de langage occidentaux

NewsGuard lance son service FAILSafe pour protéger les grands modèles de langage contre les opérations d’ingérence étrangère

Les 10 principaux modèles d’IA générative reprennent les récits de désinformation russes un tiers du temps, en citant comme des sources faisant autorité de faux sites d’information locaux créés à Moscou

Données en temps réel sur les récits de désinformation étrangère

Noms de domaines et comptes liés aux opérations d’ingérence étrangère

Audits et veille par des experts de la désinformation

Intégration simple et rapide via l’API ou le flux de données dans le cloud