Proving Ground · Live-Arena für Adversarial-Tests

    Wir lassen Angreifer rund um die Uhr gegen unsere Safe House antreten — öffentlich.

    15 benannte Red-Team-Agenten testen CFD und CBD jede Stunde mit jeder Technik aus der Praxis — Prompt Injection, BEC, Indirect Injection, Datenexfiltration, regulierte Beratung. Was sie brechen, wird ein signiertes Detection-Rezept. Was sie nicht brechen können, wird zum Beweis für Ihren Auditor.

    Das Adversarial-Flywheel

    Jeder Test, den wir ausführen, macht die Safe House härter. Jede Umgehung wird zu einem Rezept. Jedes Rezept geht an jeden Kunden.

    Red-Team-Tests

    15 benannte Angreifer testen CFD und CBD rund um die Uhr in 11 Bedrohungskategorien mit 8 Mutationsoperatoren (Unicode, Emoji, Base64, Crescendo, Synonym, Paraphrase, Translate, Strukturell).

    Sideband-Analyzer

    Jede Umgehung wird an einen Claude-Opus-Analyzer geleitet, der den Miss klassifiziert, die Detector-Lücke identifiziert und ein YAML-Detection-Rezept entwirft.

    Rezept-Promotion

    Confidence ≥ 0,90 wird automatisch in ein 48-stündiges Zero-FP-Validierungsfenster befördert. Niedrigere Confidence landet in der Admin-Review-Queue.

    Bibliotheks-Update

    Beförderte Rezepte werden Teil des Live-FingerprintMatcher-Index. MinHash-Signaturen werden über das opt-in Threat Network an jeden Kunden propagiert.

    Härtere Tests

    Die Mutations-Engine speist die nächste Generation aus bestätigten Umgehungen. Das Red Team wird stärker — und die Verteidigung auch.

    Härtere Tests
    Was wir nicht behaupten

    Was die Arena noch nicht beweist.

    Jede öffentliche Aussage auf dieser Seite ist durch Live-Daten belegt. Die folgenden Punkte sind bekannte Lücken, gegen die wir liefern.

    • Härtung gegen Unicode- und Emoji-Umgehung — P0 in Arbeit. Forschung zeigt 70–88 % Bypass-Raten gegen Produktions-Guardrails mit Zero-Width-Zeichen und Homoglyphen. Das geben wir nicht als gelöst aus.

    • Indirect-Injection-Fast-Path-Abdeckung — Tool-Results passieren heute L1 ohne Scan. L2-Semantik-Checks fangen es, aber L1 ist die Lücke.

    • Die Auto-Promotion des Arena-V2-Sideband-Analyzers ist live; die kundenseitige Kampagnen-View von Arena V2 (org-übergreifende Pattern-Korrelation) steht noch aus.

    • Das CBD-Outbound-DLP ist für Canary-Match und Credential-Leak verdrahtet; der Launder-Detector und der Regulated-Advice-Checker laufen async — außer auf den Enforce-Sync- und Sovereign-Tiers.

    Featured on There's An AI For That