La Safe House

    La Safe House.

    Ogni messaggio che attraversa il perimetro del tuo agente viene analizzato, classificato e firmato crittograficamente. Prompt injection, social engineering e coercizione in ingresso vengono bloccati prima che l'agente li veda. PII, segreti e violazioni di Alignment Card in uscita vengono intercettati prima che escano.

    Da cosa protegge la Safe House.

    Due famiglie di detector, un perimetro. Screening in entrata e in uscita con verdetti firmati su ogni decisione.

    In entrata

    CFD — Content-Flow Detection

    Ogni messaggio che raggiunge il tuo agente viene analizzato per intenti avversari. Prompt injection, social engineering e tool call coercite vengono rilevati e bloccati prima che l'agente li processi.

    • Prompt injection
      • Istruzioni nascoste in documenti recuperati o risposte di tool.
      • Attacchi di role-swap («ignora le istruzioni precedenti…»).
      • Injection basate su template recenti, tracciate tramite il corpus di fingerprint del Learning Network.
    • Social engineering
      • Richieste stile CEO-fraud che impersonano utenti autorizzati.
      • Pattern di urgenza e pressione di autorità pensati per saltare le approvazioni.
      • Adescamenti indiretti che tentano di ridisegnare lo scope dichiarato dell'agente.
    • Avvelenamento del contesto
      • Payload di memoria o vector store manipolati.
      • Risposte di tool avvelenate che veicolano istruzioni nascoste.
      • Riassunti avversariali reimmessi in piani a lungo orizzonte.
    • Coercizione di tool call
      • Tentativi di forzare chiamate fuori dallo scope permesso dall'Alignment Card.
      • Tool call concatenate che infilano un'azione non autorizzata.
      • Attacchi sulla forma degli argomenti verso schemi di tool poco validati.
    In uscita

    CBD — Content-Boundary Detection

    Ogni risposta dell'agente viene analizzata contro PII, segreti e i limiti dell'Alignment Card prima di lasciare il tuo perimetro. Un leak non redatto non può produrre un certificato firmato.

    • Leak di PII e PHI
      • Anagrafiche clienti, SSN e numeri di carta — inclusi pattern frammentati tra token.
      • Informazioni sanitarie protette nei flussi regolamentati.
      • Dati cross-tenant che attraverserebbero i confini della tua Alignment Card.
    • Segreti e credenziali
      • Chiavi API, token di accesso e URL firmati.
      • Stringhe di connessione interne e identificatori di infrastruttura.
      • Token Bearer rimbalzati nelle trace di errore.
    • Violazioni di Alignment Card
      • Risposte che superano lo scope dichiarato dell'agente.
      • Azioni che saltano il contratto di escalation della card.
      • Output che contraddicono gli obblighi di compliance scritti sulla card.
    • Consulenza regolamentata
      • Consulenza legale, medica o finanziaria fuori dalla licenza dell'agente.
      • Raccomandazioni che aggirano clausole human-in-the-loop.
      • Decisioni che toccano gli obblighi di trasparenza dell'Articolo 50.

    Un perimetro. Verdetti firmati in entrambi i sensi.

    CFD in ingresso. AIP runtime al centro. CBD in uscita. Ogni verdetto è firmato Ed25519 e hash-chained.

    In entrata
    CFD
    Analizza ogni messaggio in entrata prima che l'agente lo processi.
    Runtime
    AIP runtime
    Legato all'Alignment Card; produce la proof chain firmata.
    In uscita
    CBD
    Analizza ogni risposta in uscita prima che lasci il tuo perimetro.
    Ogni verdetto è firmato Ed25519, hash-chained ed esportabile come prova — non solo osservato.

    Costruita per deploy regolamentati.

    La Safe House gira dentro la tua envelope di compliance. Verdetti, attestazioni e bundle di audit sono pensati per mappare agli standard che il tuo regolatore già chiede.

    Readiness SOC 2
    EU AI Act Articolo 50
    Flussi compatibili HIPAA
    Verdetti firmati Ed25519

    Un perimetro responsabile, non solo osservato.

    La Safe House non è un prodotto di logging. È un confine firmato e applicabile intorno a ogni agente. Accoppiala a un'Alignment Card e puoi dimostrare cosa è passato e cosa no.

    Featured on There's An AI For That