Proving Ground · arena adversariale dal vivo

    Mettiamo adversari contro la nostra Safe House 24 ore su 24 — in pubblico.

    15 agenti red team con nome testano CFD e CBD ogni ora con ogni tecnica sul campo — prompt injection, BEC, injection indiretta, esfiltrazione di dati, slip su consigli regolamentati. Ciò che rompono diventa una ricetta di rilevamento firmata. Ciò che non possono rompere diventa una prova per il tuo auditor.

    Il flywheel adversariale

    Ogni test che eseguiamo rende la Safe House più dura. Ogni bypass diventa una ricetta. Ogni ricetta arriva a ogni cliente.

    Test del red team

    15 adversari con nome testano CFD e CBD 24 ore su 24 su 11 categorie di minacce con 8 operatori di mutazione (unicode, emoji, base64, crescendo, sinonimi, parafrasi, traduzione, strutturale).

    Analizzatore sideband

    Ogni bypass viene instradato verso un analizzatore Claude Opus che classifica il miss, identifica il gap del detector e redige una ricetta di rilevamento YAML.

    Promozione della ricetta

    Confidence ≥ 0,90 viene promossa automaticamente in una finestra di validazione di 48 ore a zero FP. Confidence inferiori entrano nella coda di revisione admin.

    Aggiornamento della libreria

    Le ricette promosse entrano nell'indice FingerprintMatcher live. Le firme MinHash si propagano a ogni cliente tramite la Threat Network opt-in.

    Test più duri

    Il motore di mutazione semina la generazione successiva dai bypass confermati. Il red team diventa più forte — e così la difesa.

    Test più duri
    Ciò che non rivendichiamo

    Ciò che l'arena non prova — ancora.

    Ogni affermazione pubblica su questa pagina è supportata da dati live. I punti qui sotto sono gap noti su cui stiamo lavorando.

    • Hardening contro l'elusione unicode + emoji — P0 in corso. La ricerca mostra tassi di bypass del 70–88% contro i guardrail di produzione usando caratteri a larghezza zero e omoglifi. Non facciamo finta che sia chiuso.

    • Copertura fast-path dell'injection indiretta — oggi i risultati dei tool passano per L1 senza essere analizzati. I check semantici L2 li catturano, ma L1 è il gap.

    • La promozione automatica dell'analizzatore sideband di Arena V2 è live; la view di campagna rivolta al cliente di Arena V2 (correlazione di pattern cross-org) è in attesa.

    • Il DLP in uscita CBD è cablato per il match dei canary e il leak di credenziali; il launder-detector e il verificatore di consigli regolamentati girano in async, tranne sui tier Enforce-Sync e Sovereign.

    Featured on There's An AI For That