Détection d'attaques IA-vs-IA : on est en train de perdre
CrowdStrike a release son module Falcon Adversary AI il y a 3 semaines. Sur le papier c'est joli : un modèle entraîné sur les patterns d'output des LLMs adverses, qui flag les payloads suspects en quasi temps réel.
Sauf qu'en prod c'est pas le même film. J'ai testé sur un sandbox interne avec des prompts d'évasion générés via un Claude jailbreaké : 38% de détection. Sur des payloads polymorphiques type GPT-5 + obfuscation, on tombe à 12%.
Le red team va toujours plus vite que le blue team. Ça s'appelle l'asymétrie offensive et c'est pas nouveau, mais avec des LLMs des deux côtés ça devient absurde, un 0-day se propage en moins de 4h.
TLDR : déployez en couche, pas en remplacement de votre WAF.
5
8 commentaires