La Safe House

    La Safe House.

    Cada mensaje que cruza el perímetro de su agente es analizado, clasificado y firmado criptográficamente. Prompt injection, ingeniería social y coerción entrantes se bloquean antes de que el agente las vea. PII, secretos y violaciones de Alignment Card salientes se interceptan antes de salir.

    Contra qué protege la Safe House.

    Dos familias de detectores, un perímetro. Análisis entrante y saliente con veredictos firmados en cada decisión.

    Entrante

    CFD — Content-Flow Detection

    Cada mensaje que llega a su agente se analiza en busca de intención adversarial. Prompt injection, ingeniería social y llamadas a herramientas coaccionadas se detectan y bloquean antes de que el agente las procese.

    • Prompt injection
      • Instrucciones ocultas en documentos recuperados o respuestas de herramientas.
      • Ataques de role-swap («ignora las instrucciones anteriores…»).
      • Inyecciones con plantillas recientes rastreadas mediante el corpus de fingerprints del Learning Network.
    • Ingeniería social
      • Solicitudes tipo CEO-fraud que suplantan a usuarios autorizados.
      • Patrones de urgencia y presión de autoridad diseñados para saltarse aprobaciones.
      • Persuasión indirecta que intenta remodelar el alcance declarado del agente.
    • Envenenamiento de contexto
      • Payloads manipulados de memoria o vector store.
      • Respuestas de herramientas envenenadas que vehiculan instrucciones ocultas.
      • Resúmenes adversariales que se reinyectan en planes de largo horizonte.
    • Coerción de llamadas a herramientas
      • Intentos de forzar llamadas fuera del alcance permitido por la Alignment Card.
      • Llamadas a herramientas encadenadas que cuelan una acción no autorizada.
      • Ataques a la forma de argumentos contra esquemas de herramientas mal validados.
    Saliente

    CBD — Content-Boundary Detection

    Cada respuesta del agente se analiza frente a PII, secretos y los límites de la Alignment Card antes de abandonar su perímetro. Una fuga no redactada no puede producir un certificado firmado.

    • Fugas de PII y PHI
      • Fichas de clientes, SSN y números de tarjeta — incluidos patrones partidos entre tokens.
      • Información sanitaria protegida en flujos regulados.
      • Datos inter-tenant que cruzarían los límites de su Alignment Card.
    • Secretos y credenciales
      • Claves de API, tokens de acceso y URLs firmadas.
      • Cadenas de conexión internas e identificadores de infraestructura.
      • Tokens Bearer reenviados en trazas de error.
    • Violaciones de Alignment Card
      • Respuestas que exceden el alcance declarado del agente.
      • Acciones que saltan el contrato de escalado de la card.
      • Salidas que contradicen las obligaciones de cumplimiento escritas en la card.
    • Asesoramiento regulado
      • Consejos legales, médicos o financieros fuera de la licencia del agente.
      • Recomendaciones que eluden cláusulas human-in-the-loop.
      • Decisiones que implican obligaciones de transparencia del Artículo 50.

    Un perímetro. Veredictos firmados en ambos sentidos.

    CFD a la entrada. AIP en runtime en el medio. CBD a la salida. Cada veredicto está firmado con Ed25519 y encadenado por hash.

    Entrante
    CFD
    Analiza cada mensaje entrante antes de que el agente lo procese.
    Runtime
    AIP en runtime
    Vinculado a la Alignment Card; produce la proof chain firmada.
    Saliente
    CBD
    Analiza cada respuesta saliente antes de que abandone su perímetro.
    Cada veredicto está firmado con Ed25519, encadenado por hash y exportable como evidencia — no solo observado.

    Construida para despliegues regulados.

    La Safe House corre dentro de su envelope de cumplimiento. Veredictos, atestaciones y bundles de auditoría están pensados para mapear a los estándares que su regulador ya pide.

    Preparación SOC 2
    EU AI Act Artículo 50
    Flujos compatibles con HIPAA
    Veredictos firmados con Ed25519

    Un perímetro que rinde cuentas, no solo observado.

    La Safe House no es un producto de logging. Es una frontera firmada y aplicable alrededor de cada agente. Combínela con una Alignment Card y podrá demostrar qué cruzó y qué no.

    Featured on There's An AI For That