Les modèles IA face à la propagande russe : résultats clés
Un benchmark de l'Institut de la langue estonienne évalue la vulnérabilité de 60 modèles IA à la propagande russe. Claude d'Anthropic arrive en tête, tandis que Mistral se classe dans le tiers inférieur avec un taux de désinformation de 36,67%.
« Mistral had a steady misinformation rate of 36.67 percent. » — The Decoder
Que faut-il retenir ?
- 60 modèles IA ont été testés avec 75 questions en trois langues couvrant 14 récits de propagande.
- Claude Fable 5 d'Anthropic mène avec un score de 95,2, suivi de Claude Opus 4.7.
- Mistral a un taux de désinformation stable de 36,67%.
- OpenAI a récemment fermé une campagne russe utilisant ChatGPT pour propager de la propagande.
Pourquoi cette nouvelle compte-t-elle ?
Ce benchmark révèle des différences significatives dans la capacité des modèles IA à détecter la propagande, un enjeu crucial pour la lutte contre la désinformation. Les résultats pourraient influencer le choix des modèles par les entreprises et les gouvernements.
36,67% de taux de désinformation pour Mistral.
Public concerné : entreprises, développeurs
Quels modèles IA sont les plus résistants à la propagande russe ?
Les modèles Claude d'Anthropic, notamment Claude Fable 5 et Claude Opus 4.7, sont les plus performants pour détecter et rejeter la propagande russe, selon un benchmark récent.