Débridage d'IA
Aussi appelé : Jailbreaking · jailbreaking · Jailbreak IA
Mis à jour le
Le débridage d'IA désigne l'ensemble des techniques utilisées pour lever délibérément les restrictions éthiques et les garde-fous intégrés par les concepteurs d'un modèle.
📖 Définition
💬 En termes simples
C'est comme convaincre un robot à péage de te laisser passer gratuitement en lui racontant une histoire élaborée.
🎯 Exemple concret
Demander à un assistant IA de jouer le rôle d'une « IA sans aucune règle » pour qu'il accepte de répondre à des questions sensibles.
💡 Le saviez-vous ?
L'OQLF officialise « débridage d'IA » (entrée D.1) comme équivalent français de « AI jailbreaking » dans son vocabulaire 2026.
❓ Questions fréquentes
Pourquoi le débridage est-il un enjeu de sécurité majeur ?
Quelles méthodes les attaquants utilisent-ils pour débrider les modèles ?
Peut-on rendre une IA totalement indébridable ?
📚 Sources
- Jailbreaking ChatGPT via Prompt Engineering (Liu et al., 2023)
- Anthropic - Red Teaming Language Models (Anthropic, 2023)
🔗 Termes liés
🏷️ Catégorie parente