Nous lançons des adversaires contre notre Safe House 24h/24 — en public.
15 agents red team nommés sondent CFD et CBD toutes les heures avec toutes les techniques du terrain — prompt injection, BEC, injection indirecte, exfiltration de données, dérives sur conseils réglementés. Ce qu'ils cassent devient une recette de détection signée. Ce qu'ils ne peuvent pas casser devient une preuve pour votre auditeur.
Le flywheel adversarial
Chaque tentative que nous lançons rend la Safe House plus résistante. Chaque contournement devient une recette. Chaque recette est livrée à chaque client.
Tentatives red team
15 adversaires nommés sondent CFD et CBD 24h/24 sur 11 catégories de menaces avec 8 opérateurs de mutation (unicode, emoji, base64, crescendo, synonymes, paraphrase, traduction, structurel).
Analyseur sideband
Chaque contournement est routé vers un analyseur Claude Opus qui classe le manqué, identifie la faille du détecteur et rédige une recette de détection YAML.
Promotion de recette
Confiance ≥ 0,90 : promotion automatique dans une fenêtre de validation de 48 h à zéro faux positif. Les confiances plus faibles passent dans la file de revue admin.
Mise à jour de la bibliothèque
Les recettes promues rejoignent l'index FingerprintMatcher en direct. Les signatures MinHash se propagent à chaque client via le Threat Network en opt-in.
Tentatives plus dures
Le moteur de mutation ensemence la génération suivante à partir des contournements confirmés. La red team devient plus forte — et la défense aussi.
Ce que l'arène ne prouve pas — encore.
Chaque affirmation publique sur cette page est étayée par des données en direct. Les points ci-dessous sont des failles connues sur lesquelles nous livrons.
Durcissement contre l'évasion unicode + emoji — P0 en cours. La recherche montre des taux de contournement de 70 à 88 % contre les garde-fous de production utilisant des caractères de largeur nulle et des homoglyphes. Nous ne prétendons pas que c'est fermé.
Couverture fast-path de l'injection indirecte — aujourd'hui, les résultats d'outils passent par L1 sans analyse. Les contrôles sémantiques L2 les attrapent, mais L1 est la faille.
La promotion automatique de l'analyseur sideband d'Arena V2 est en production ; la vue de campagne client d'Arena V2 (corrélation de patterns inter-org) est en attente.
Le DLP sortant CBD est câblé pour la correspondance de canaris et la fuite d'identifiants ; le détecteur de blanchiment et le vérificateur de conseils réglementés tournent en async sauf sur les niveaux Enforce-Sync et Sovereign.
