Mnemom AEGIS

Rete difensiva cross-tenant per agenti IA.

Mnemom AEGIS — Adaptive Enforcement, Governance & Intelligence Substrate — è la rete di sicurezza runtime dietro la Safe House. Filtra ogni transazione dell’agente a quattro checkpoint — front door, back door, inside.autonomy, inside.integrity — ciascuno configurabile in modo indipendente in quattro modalità di enforcement. Le Managed Rules firmate portano un obiettivo SLO di propagazione cross-tenant P95 sotto i 30 secondi (prime misurazioni pubblicate 30 giorni dopo il GA).

AAP dichiara. AIP verifica in volo. CLPI governa e ancora. Safe House filtra. AEGIS firma le difese cross-tenant.

Il modello di minaccia.

Sette schemi d'attacco definiscono oggi la superficie di minaccia agentica. Ciascuno è mappato su uno dei quattro checkpoint — così i clienti possono regolare l'enforcement per superficie, non come postura globale unica.

MinacciaCheckpointCome si presenta
Prompt injectionfront doorTentativi diretti di sovrascrivere le istruzioni dell'agente, invertire il ruolo o aggirare lo scope dichiarato alla superficie in ingresso.
Injection indirettafront doorIstruzioni nascoste dentro documenti recuperati, output di tool e payload di vector store — il prompt che l'agente non sapeva di aver ricevuto.
Tool misuseinside.autonomyChiamate a tool coercite o concatenate che eccedono lo scope autorizzato dall'Alignment Card. Attacchi sulla forma degli argomenti contro schemi sotto-validati (OWASP ASI02).
Esfiltrazione datiback doorPII, PHI, segreti, credenziali o dati cross-tenant rimandati nelle risposte dell'agente, nei trace d'errore o in schemi split-token.
Frode BEC / impersonificazionefront doorRichieste in stile frode del CEO, pressione di urgenza e autorità, social engineering che prende di mira il contratto di escalation dell'agente.
Spoofing dell'agenteinside.integrityTentativi di abuso di identità che rivendicano un'autorità non dichiarata dall'Alignment Card. OWASP ASI03 — Privilege Compromise via Identity Abuse.
Compromissione della supply chaininside.integrityFirme comportamentali coerenti con un SDK compromesso, un fine-tune di modello o un template di prompt vendored — rilevate cross-tenant tramite substrate fingerprinting (OWASP ASI06).

Quattro checkpoint × quattro modi di enforcement.

Ogni checkpoint è configurabile in modo indipendente. La composizione segue il principio strictest-wins lungo Platform → Org → Team → Agent: l'impostazione più restrittiva di qualunque livello prevale sempre. Funziona in modo analogo a come Cloudflare WAF Managed Rules Le consentono di definire severity × action per ogni regola.

Modo
off
observe
nudge
enforce
front door
Screening dei messaggi in ingresso — ogni prompt, payload di retrieval e risposta di tool prima che l'agente li processi.
back door
Screening delle risposte in uscita — PII, segreti, violazioni di Alignment Card, consulenza regolamentata prima che la risposta lasci il perimetro.
inside.autonomy
Screening delle chiamate a tool — ogni azione che l'agente esegue rispetto ai limiti di autonomia dichiarati dall'Alignment Card.
inside.integrity
Screening dell'integrità del reasoning — verdetti AIP sui payload thinking-block; firme di deviazione del substrate; schemi di abuso di identità.
off

Checkpoint disabilitato. Usato nei tenant canary e prima dell'onboarding.

observe

Valuta ogni transazione; emette verdetti firmati; non blocca mai. Il default per le nuove Managed Rules durante il soak observe di 24 ore.

nudge

Annota o avverte inline senza bloccare. La via di mezzo per le regole tier-3 durante la fase di ramp-up.

enforce

Blocca la transazione e fa emergere un verdetto firmato nella dashboard. Raggiunto solo dopo il soak observe e la disciplina di auto-rollback sul tasso di FP (CLPI Phase 2).

Cascata di composizione: Platform → Org → Team → Agent, strictest-wins. Gli admin clienti possono stringere a qualsiasi livello.

La pipeline Managed Rules.

Le recipes sono contenuto di detection. Le Managed Rules sono lo stato firmato del control-plane che le avvolge. La pipeline è vincolata strutturalmente — non procedurally — per cui le regole tier-1 e tier-2 non possono auto-promuoversi, indipendentemente dal modo impostato dall'operatore.

  1. 1. Arena

    Quindici personas avversarie canoniche sondano Safe House 24/7. La mutation-phase gating si attiva per bucket solo quando il tasso di detection supera il 95 % su una finestra mobile di 48 ore con isteresi di 24 ore.

  2. 2. Candidate

    I candidati che superano l'arena entrano in una coda di revisione isolata con un percorso di scrittura rigorosamente separato, così il sistema che propone il contenuto di detection non può mai essere lo stesso che lo approva. Le segnalazioni di falsi negativi e falsi positivi dei clienti e i segnali di rete cross-tenant confluiscono tutti nella stessa coda.

  3. 3. Review

    Tre modi di reviewer — manual (default), auto-approve-trusted-sources, auto-approve-high-confidence. Tier-1 / tier-2 richiedono sempre review in dual-control sotto una catena d'audit append-only.

  4. 4. Soak observe 24h

    Ogni promotion firmata atterra in modo observe per 24 ore. L'auto-rollback sul tasso di FP secondo CLPI Phase 2 ritira la recipe prima che qualsiasi traffico di produzione venga bloccato.

  5. 5. Enforce

    Il failover tiered KV+R2+isolate-cache con catene di firma indipendenti spinge la regola verso ogni gateway. P95 ≤ 30 s tra promotion firmata e caricamento sulla gateway.

L'invariante protettivo

Una Managed Rule di tier-1 o tier-2 — una che bloccherebbe davvero traffico di produzione reale — non può mai essere promossa senza una revisione umana a quattro occhi, per quanto aggressiva sia l'impostazione della modalità di auto-promozione. La garanzia è applicata in modo strutturale, nel modello di dati stesso: una regola attiva non può esistere finché non è stato raggiunto il suo quorum di revisione. È una proprietà del sistema, non una procedura che qualcuno deve ricordarsi di seguire.

Garantito dal modello di dati, non dalla disciplina dell'operatore.

Substrate fingerprinting + detection della supply chain.

Ogni valutazione viene marcata con un substrate fingerprint — il provider, il modello e la versione dell'SDK dietro la richiesta, più un lockfile hash facoltativo fornito dal cliente e inviato tramite l'header `X-Mnemom-Lockfile-Hash`. AEGIS osserva la deviazione comportamentale su tutti i clienti che girano sullo stesso substrate, simultaneamente.

L'11 maggio 2026 — il worm Mini Shai-Hulud ha compromesso oltre 170 pacchetti npm e 2 pacchetti PyPI, inclusa la suite SDK di Mistral AI e il pacchetto PyPI di Guardrails AI. Le versioni compromesse di `@tanstack/*` sono state distribuite con attestazioni SLSA Build Level 3 valide — il primo caso documentato di un worm che produce provenance firmata legittima per pacchetti malevoli. La detection per tenant e la verifica Sigstore a livello di pacchetto non possono strutturalmente intercettare questa classe di attacco.

OWASP Top 10 for Agentic Applications.

Mappatura onesta. Dove la copertura è parziale, lo diciamo. La tassonomia OWASP ASI completa (dic. 2025) è su owasp.org.

Categoria OWASPCoperturaCome AEGIS la affronta
ASI02 — Tool Misuse
Completa
Policy engine (CLPI Phase 1) + Managed Rules al checkpoint inside.autonomy. Screening delle chiamate a tool contro i limiti di autonomia dichiarati dall'Alignment Card.
ASI03 — Privilege Compromise via Identity Abuse
Completa
Limiti di autonomia dichiarati da AAP (Alignment Card) + verdetti d'integrità in volo AIP + screening al checkpoint inside.integrity per schemi di abuso di identità.
ASI06 — Agentic Supply Chain Compromise
Completa (runtime)
Substrate fingerprinting su ogni valutazione. L'aggregatore cross-tenant rileva deviazioni comportamentali che nessun singolo cliente può vedere. Completa — non sostituisce — la provenance a livello di pacchetto (SLSA, Sigstore).
ASI07 — System Prompt Leakage
Parziale
Screening al checkpoint back-door di schemi noti di system prompt + segreti e violazioni di Alignment Card. La detection è basata sul contenuto; gli agenti che citano legittimamente il proprio system prompt su richiesta dell'utente non vengono soppressi.

ASI01 (Prompt Injection), ASI04 (Resource Exhaustion), ASI05 (Cascading Hallucination), ASI08 (Repudiation & Untraceability), ASI09 (Identity Spoofing), ASI10 (Overreliance) sono mappate su altre parti dello stack Mnemom (AAP cards, verdetti AIP, ancoraggio on-chain CLPI, Trust Ratings) — coperte su /protection-network e /trust.

Come si confronta AEGIS.

Sintesi dalla ricerca sul panorama competitivo del 23 maggio 2026. AEGIS è il layer di rete; i vendor sotto sono complementari, non sostituti — vedi /governance per la storia di integrazione completa.

CapacitàMnemom AEGISCloudflare WAFLakera GuardCisco AI DefenseAWS Bedrock GuardrailsGoogle Model Armor
Managed Rules cross-tenant con promotion firmata
Sì — firmate Ed25519, propagazione P95 ≤ 30 s, catena d'audit pubblica
Managed Rules WAF (layer web, non layer agente)Threat-intel curata dal vendor; nessun segnale derivante dalla rete dei clientiSDK embed in build-time; nessuna rete cross-tenant runtimeSolo AWS; nessun apprendimento cross-clientFiltro in-process; nessuna rete
Modello quattro-checkpoint × quattro-modi per agente
Sì — front door / back door / inside.autonomy / inside.integrity, ciascuno configurabile in modo indipendente
Regole WAF per route; non sagomate per transazione agenticaDetector singolo a runtimeIntegrazione NeMo Guardrails; policy in build-timeBedrock Guardrails per policy (denylist, PII, contextual grounding)Filtri prompt-injection + URL + contenuto dannoso
Substrate fingerprinting (provider + model + versione dell'SDK) su ogni valutazione
Sì — detection cross-tenant della supply chain
NoNoNoNoNo
IoC feed pubblico STIX 2.1 + advisories firmati
Sì — /v1/trust/iocs (vuoto al GA per design)
Solo feed Radar interni al clienteNessun feed pubblicoTalos per le minacce tradizionali; nessun IoC feed agentico pubblicoNoNo
Invariante di dual-control su tier-1/-2 (applicata nel modello di dati)
Sì — imposto dallo schema, non procedurale
Change-management proceduraleControllato dal vendorControllato dal vendorIAM di policy clienteControllato dal vendor

Fonti: documentazione pubblica dei vendor, 23 maggio 2026. AEGIS è un layer che i clienti eseguono accanto a questi prodotti, non un sostituto.

SLO pubblicati. Misurati in continuo.

Numeri principali sotto. La tabella completa — query di misurazione, dati storici una volta chiusa la prima finestra di 30 giorni, e i quattro SLO di supporto — vive su /trust/slos.

Propagazione Managed Rule
P95 ≤ 30 s

Promozione firmata → caricata sul gateway. Obiettivo pubblicato; prime misurazioni 30 giorni dopo la GA.

Disponibilità del failover
99,99 %

Il gateway carica un set di regole verificato su più livelli di lettura indipendenti.

Freschezza del rule-set
P99 ≤ 5 min

In funzionamento normale. Page P0 a 24h di staleness.

La prima finestra di misurazione di 30 giorni viene pubblicata 30 giorni dopo il GA. Non preannunciamo numeri che non possiamo difendere.

Vedi gli SLO pubblicati

Porti i suoi tool.

L'IoC feed è STIX 2.1 leggibile da macchina. La catena d'audit è verificabile. La dashboard è aperta a ogni cliente.

curl -s https://api.mnemom.ai/v1/trust/iocs | jq .
Featured on There's An AI For That