La Safe House

    La Safe House.

    Chaque message traversant le périmètre de votre agent est analysé, classifié et cryptographiquement signé. Prompt injection, ingénierie sociale et coercition entrantes sont bloquées avant même que l'agent ne les voie. PII, secrets et violations d'Alignment Card sortants sont interceptés avant de sortir.

    Ce contre quoi la Safe House protège.

    Deux familles de détecteurs, un périmètre. Screening entrant et sortant avec des verdicts signés sur chaque décision.

    Entrant

    CFD — Content-Flow Detection

    Chaque message atteignant votre agent est analysé à la recherche d'intentions malveillantes. Prompt injection, ingénierie sociale et appels d'outils coercés sont détectés et bloqués avant que l'agent ne les traite.

    • Prompt injection
      • Instructions cachées dans les documents récupérés ou les réponses d'outils.
      • Attaques de role-swap (« ignorez les instructions précédentes… »).
      • Injections de templates récents suivis via le corpus d'empreintes du Learning Network.
    • Ingénierie sociale
      • Requêtes de type « fraude au président » usurpant l'identité d'utilisateurs autorisés.
      • Schémas d'urgence et de pression d'autorité conçus pour contourner les approbations.
      • Incitations indirectes tentant de redéfinir le périmètre déclaré de l'agent.
    • Empoisonnement de contexte
      • Payloads de mémoire ou de vector store manipulés.
      • Réponses d'outils empoisonnées véhiculant des instructions cachées.
      • Résumés adverses réinjectés dans des plans de long terme.
    • Coercition d'appel d'outil
      • Tentatives de forcer des appels hors du périmètre autorisé par l'Alignment Card.
      • Appels d'outils chaînés qui font passer une action non autorisée.
      • Attaques sur la forme d'arguments ciblant des schémas d'outil peu validés.
    Sortant

    CBD — Content-Boundary Detection

    Chaque réponse d'agent est analysée par rapport aux PII, secrets et frontières de l'Alignment Card avant qu'elle ne quitte votre périmètre. Une fuite non caviardée ne peut pas produire de certificat signé.

    • Fuite de PII et PHI
      • Fiches clients, numéros de sécurité sociale et de carte — y compris schémas fragmentés sur plusieurs tokens.
      • Informations de santé protégées dans les flux réglementés.
      • Données inter-tenants qui franchiraient les frontières de votre Alignment Card.
    • Secrets et identifiants
      • Clés API, jetons d'accès et URL signées.
      • Chaînes de connexion internes et identifiants d'infrastructure.
      • Jetons Bearer renvoyés dans les traces d'erreur.
    • Violations d'Alignment Card
      • Réponses qui dépassent le périmètre déclaré de l'agent.
      • Actions qui contournent le contrat d'escalade de la card.
      • Sorties qui contredisent les obligations de conformité inscrites sur la card.
    • Conseil réglementé
      • Conseils juridiques, médicaux ou financiers hors de la licence de l'agent.
      • Recommandations qui court-circuitent les clauses human-in-the-loop.
      • Décisions impliquant les obligations de transparence de l'Article 50.

    Un périmètre. Verdicts signés dans les deux sens.

    CFD à l'entrée. AIP au runtime au milieu. CBD à la sortie. Chaque verdict est signé Ed25519 et chaîné par hash.

    Entrant
    CFD
    Analyse chaque message entrant avant que l'agent ne le traite.
    Runtime
    AIP runtime
    Lié à l'Alignment Card ; produit la chaîne de preuve signée.
    Sortant
    CBD
    Analyse chaque réponse sortante avant qu'elle ne quitte votre périmètre.
    Chaque verdict est signé Ed25519, chaîné par hash et exportable comme preuve — pas seulement observé.

    Conçue pour les déploiements réglementés.

    La Safe House fonctionne à l'intérieur de votre enveloppe de conformité. Verdicts, attestations et bundles d'audit sont conçus pour correspondre aux standards que votre régulateur demande déjà.

    Préparation SOC 2
    EU AI Act Article 50
    Flux compatibles HIPAA
    Verdicts signés Ed25519

    Un périmètre redevable, pas seulement observé.

    La Safe House n'est pas un produit de logging. C'est une frontière signée et applicable autour de chaque agent. Associez-la à une Alignment Card et vous pouvez prouver ce qui est passé et ce qui ne l'est pas.

    Featured on There's An AI For That