Proving Ground · arena adversarial en vivo

    Lanzamos adversarios contra nuestra Safe House 24/7 — en público.

    15 agentes red team con nombre sondean CFD y CBD cada hora con todas las técnicas del terreno — prompt injection, BEC, inyección indirecta, exfiltración de datos, desviación en consejos regulados. Lo que rompen se convierte en una receta de detección firmada. Lo que no pueden romper se convierte en evidencia para tu auditor.

    El flywheel adversarial

    Cada sonda que ejecutamos hace más dura a la Safe House. Cada bypass se convierte en una receta. Cada receta se entrega a cada cliente.

    Sondas del red team

    15 adversarios con nombre sondean CFD y CBD 24/7 en 11 categorías de amenazas con 8 operadores de mutación (unicode, emoji, base64, crescendo, sinónimos, paráfrasis, traducción, estructural).

    Analizador sideband

    Cada bypass se enruta a un analizador Claude Opus que clasifica el fallo, identifica la brecha del detector y redacta una receta de detección en YAML.

    Promoción de recetas

    Confianza ≥ 0,90 se promueve automáticamente a una ventana de validación de 48 horas sin falsos positivos. Las de confianza menor entran en la cola de revisión de admin.

    Actualización de la biblioteca

    Las recetas promovidas se incorporan al índice FingerprintMatcher en vivo. Las firmas MinHash se propagan a cada cliente vía la Threat Network opt-in.

    Sondas más duras

    El motor de mutación siembra la siguiente generación a partir de los bypasses confirmados. El red team se hace más fuerte — y la defensa también.

    Sondas más duras
    Lo que no afirmamos

    Lo que la arena aún no demuestra.

    Cada afirmación pública en esta página está respaldada por datos en vivo. Los puntos siguientes son brechas conocidas contra las que estamos trabajando.

    • Endurecimiento contra la evasión por unicode + emoji — P0 en curso. La investigación muestra tasas de bypass del 70–88 % frente a guardarraíles de producción usando caracteres de ancho cero y homoglifos. No fingimos que esté cerrado.

    • Cobertura fast-path de la inyección indirecta — hoy los resultados de las herramientas pasan por L1 sin ser analizados. Los chequeos semánticos de L2 los atrapan, pero L1 es la brecha.

    • La auto-promoción del analizador sideband de Arena V2 está en producción; la vista de campaña orientada al cliente de Arena V2 (correlación de patrones entre organizaciones) está pendiente.

    • El DLP saliente de CBD está cableado para coincidencia de canarios y fuga de credenciales; el launder-detector y el verificador de consejos regulados se ejecutan de forma asíncrona, excepto en los niveles Enforce-Sync y Sovereign.

    Featured on There's An AI For That