Para equipos de plataforma

    La Learning Network.

    El flywheel es simple: cada observación a través de cada cliente afina el plano para todos los demás. Las huellas CFD se propagan en minutos. Las baselines de drift AIP se estrechan. Los Trust Ratings se calibran entre proveedores. Sus agentes obtienen protección más afilada cada hora — sin que sus datos abandonen nunca su tenant.

    Tres pilares, una superficie acumulativa.

    La Learning Network no es un único dataset. Son tres — cada uno entrenado por una señal distinta, cada uno mejora la postura de cada cliente de forma simultánea.

    Corpus de huellas CFD

    Cada ataque bloqueado enseña a cada cliente.
    • Huellas MinHash de payloads nuevos de injection, jailbreak y coerción.
    • Propagación en minutos — un patrón visto en un tenant se filtra en todos los tenants.
    • Contenido privado al tenant; solo se comparte la forma del ataque. Sus datos no salen nunca.

    Baselines de drift AIP

    Lo «normal» se aprende por flota, no lo adivina un vendor.
    • Baselines comportamentales por agente y por flota refrescadas de forma continua.
    • Las bandas de anomalía se estrechan a medida que crece el corpus — menos falsos positivos, alertas reales antes.
    • Los prior estadísticos entre flotas protegen a los tenants pequeños de la ceguera del cold start.

    Calibración del Trust Rating

    Puntuaciones que significan lo mismo en todas partes.
    • Trust Rating 0–1000 calibrado contra todo el historial de incidentes y veredictos.
    • Credit-score para agentes: un 742 en un cliente significa lo mismo en otro.
    • Los incumbentes no pueden calibrar entre proveedores — solo un plano zona-neutro puede.

    Cómo un ataque protege a diez mil agentes.

    Cuatro pasos, un bucle firmado. Cada veredicto es a la vez enforcement y dato de entrenamiento.

    01
    Un agente corre — en cualquier sitio.
    Un agente Claude en un banco responde a una pregunta de cliente. Un agente GPT-4o en otro banco triaja una reclamación. Un bot de ops interno basado en Llama aprueba un reembolso.
    02
    Cada mensaje se filtra.
    CFD escanea la entrada en busca de injection y coerción. CBD escanea la salida en busca de PII, secretos, violaciones de alignment card. Cada veredicto se firma.
    03
    Los veredictos firmados se convierten en señal compartida.
    Los ataques nuevos se convierten en huellas CFD. Los eventos de drift se convierten en priors AIP. Los resultados de incidentes se convierten en datos de calibración del Trust Rating. El contenido sigue siendo privado al tenant.
    04
    Cada cliente obtiene protección más afilada.
    El tenant pequeño se beneficia de la superficie de ataque del grande. El tenant grande se beneficia de los edge cases del pequeño. Los guardarraíles no se acumulan; la learning network sí.
    La señal se propaga manteniéndose privada al tenant. El contenido nunca abandona su perímetro; solo la forma de ataque y de drift se comparte.
    Por qué no guardarraíles

    Los guardarraíles son reglas. La Learning Network es memoria.

    Los guardarraíles estáticos no aprenden.

    Una lista de reglas escrita en marzo no reconoce la plantilla de injection que empezó a propagarse en abril. Una señal compartida sí.

    Un plano mono-vendor ve un solo modelo.

    Si su plano de confianza está dentro de OpenAI, está ciego a los modos de fallo de Claude, Gemini y los open-weights. La cobertura entre proveedores requiere un árbitro zona-neutro.

    La defensa solo privada es cold start para siempre.

    Un nuevo ataque golpea primero a su agente. Usted sobrevive. Seis meses después otro cliente recibe el mismo patrón — y usted no tiene mecanismo alguno con el que haberle avisado. La red es lo que invierte esa asimetría.

    Qué se comparte. Qué no se comparte nunca.

    La red es potente porque la frontera de datos es estricta.

    Compartido entre tenants

    • Huellas de ataque (firmas MinHash, no payloads)
    • Estadísticas de drift (distribuciones, no prompts)
    • Resultados de veredictos (etiquetas, no contenido)
    • Datos de calibración del Trust Rating (puntuaciones, no trazas)

    No abandona nunca su tenant

    • Prompts, argumentos de herramientas y salidas de los agentes
    • PII, PHI y payloads regulados de clientes
    • Sus Alignment Cards y sus hashes
    • Trazas identificables, tenants o datos de negocio

    La red es el moat.

    Cuanto más tiempo lleven sus agentes en Mnemom, más difícil le resultará al próximo atacante — y más afilados serán los veredictos que vean sus auditores.

    Featured on There's An AI For That