Das Safe House

    Das Safe House.

    Jede Nachricht, die Ihren Agent-Perimeter kreuzt, wird geprüft, klassifiziert und kryptografisch signiert. Eingehende Prompt Injection, Social Engineering und Coercion werden geblockt, bevor der Agent sie überhaupt sieht. Ausgehende PII, Secrets und Alignment-Card-Verstöße werden abgefangen, bevor sie den Perimeter verlassen.

    Wogegen das Safe House schützt.

    Zwei Detektor-Familien, ein Perimeter. Inbound- und Outbound-Screening mit signierten Verdicts zu jeder Entscheidung.

    Inbound

    CFD — Content-Flow Detection

    Jede Nachricht, die Ihren Agenten erreicht, wird auf feindliche Absicht geprüft. Prompt Injection, Social Engineering und erzwungene Tool-Calls werden erkannt und geblockt, bevor der Agent sie verarbeitet.

    • Prompt Injection
      • Versteckte Anweisungen in abgerufenen Dokumenten oder Tool-Antworten.
      • Role-Swap-Angriffe („Ignoriere die vorherigen Anweisungen…“).
      • Frische Template-Injections, verfolgt über das Fingerprint-Korpus des Learning Network.
    • Social Engineering
      • CEO-Fraud-artige Anfragen, die autorisierte Nutzer imitieren.
      • Urgency- und Autoritätsmuster, die Freigaben umgehen sollen.
      • Indirekte Beeinflussung, die den deklarierten Scope des Agenten umformen will.
    • Context Poisoning
      • Manipulierte Memory- oder Vector-Store-Payloads.
      • Vergiftete Tool-Antworten mit versteckten Folgeinstruktionen.
      • Adversariale Zusammenfassungen, die in Long-Horizon-Pläne zurückfließen.
    • Tool-Call Coercion
      • Versuche, Aufrufe außerhalb des von der Alignment Card erlaubten Scopes zu erzwingen.
      • Verkettete Tool-Calls, die eine nicht autorisierte Aktion einschleusen.
      • Argument-Shape-Angriffe gegen schwach validierte Tool-Schemata.
    Outbound

    CBD — Content-Boundary Detection

    Jede Agent-Antwort wird gegen PII, Secrets und die Grenzen der Alignment Card geprüft, bevor sie den Perimeter verlässt. Ein nicht redigiertes Leak kann kein signiertes Zertifikat erzeugen.

    • PII- und PHI-Leaks
      • Kundendatensätze, SSNs und Kartennummern — inklusive Split-Token-Muster.
      • Geschützte Gesundheitsinformationen in regulierten Flows.
      • Cross-Tenant-Daten, die die Grenzen Ihrer Alignment Card überschreiten würden.
    • Secrets und Credentials
      • API-Keys, Access-Tokens und signierte URLs.
      • Interne Connection-Strings und Infrastruktur-Identifier.
      • Bearer-Tokens, die in Error-Traces zurückgespiegelt werden.
    • Alignment-Card-Verstöße
      • Antworten, die den deklarierten Scope des Agenten überschreiten.
      • Aktionen, die den Escalation-Vertrag der Card umgehen.
      • Ausgaben, die Compliance-Pflichten der Card widersprechen.
    • Regulierte Beratung
      • Juristische, medizinische oder finanzielle Beratung außerhalb der Agent-Lizenz.
      • Empfehlungen, die Human-in-the-Loop-Klauseln umgehen.
      • Entscheidungen, die Transparenzpflichten aus Artikel 50 berühren.

    Ein Perimeter. Signierte Verdicts in beide Richtungen.

    CFD am Eingang. AIP-Runtime in der Mitte. CBD am Ausgang. Jedes Verdict ist Ed25519-signiert und Hash-verkettet.

    Inbound
    CFD
    Prüft jede eingehende Nachricht, bevor der Agent sie verarbeitet.
    Runtime
    AIP-Runtime
    An die Alignment Card gebunden; produziert die signierte Proof-Chain.
    Outbound
    CBD
    Prüft jede ausgehende Antwort, bevor sie Ihren Perimeter verlässt.
    Jedes Verdict ist Ed25519-signiert, Hash-verkettet und als Evidence exportierbar — nicht nur beobachtet.

    Für regulierte Deployments gebaut.

    Das Safe House läuft innerhalb Ihres Compliance-Envelopes. Verdicts, Attestationen und Audit-Bundles sind darauf ausgelegt, auf die Standards abzubilden, die Ihre Regulierungsbehörde bereits abfragt.

    SOC-2-Readiness
    EU AI Act Artikel 50
    HIPAA-kompatible Flows
    Ed25519-signierte Verdicts

    Ein rechenschaftspflichtiger Perimeter — nicht nur beobachtet.

    Das Safe House ist kein Logging-Produkt. Es ist eine signierte, durchsetzbare Grenze um jeden Agenten. Kombinieren Sie es mit einer Alignment Card und Sie können beweisen, was passiert hat und was nicht.

    Featured on There's An AI For That