Pour les équipes plateforme

    Le Learning Network.

    Le flywheel est simple : chaque observation à travers chaque client affine le plan pour tous les autres. Les empreintes CFD propagent en minutes. Les baselines de drift AIP se resserrent. Les Trust Ratings se calibrent à travers les fournisseurs. Vos agents obtiennent une protection plus aiguisée chaque heure — sans que vos données ne quittent jamais votre tenant.

    Trois piliers, une surface cumulative.

    Le Learning Network n'est pas un seul dataset. C'est trois — chacun entraîné par un signal différent, chacun améliorant la posture de chaque client simultanément.

    Corpus d'empreintes CFD

    Chaque attaque bloquée apprend à chaque client.
    • Empreintes MinHash de nouveaux payloads d'injection, jailbreak et coercition.
    • Propagation en minutes — un pattern vu chez un tenant est filtré chez tous les tenants.
    • Contenu privé au tenant ; seule la forme d'attaque est partagée. Vos données ne partent jamais.

    Baselines de drift AIP

    Le « normal » est appris par flotte, pas deviné par un vendeur.
    • Baselines comportementales par agent et par flotte rafraîchies en continu.
    • Les bandes d'anomalie se resserrent à mesure que le corpus croît — moins de faux positifs, alertes réelles plus tôt.
    • Les priors statistiques inter-flottes protègent les petits tenants de la cécité du démarrage à froid.

    Calibration du Trust Rating

    Des scores qui signifient la même chose partout.
    • Trust Rating 0–1000 calibré face à tout l'historique d'incidents et de verdicts.
    • Credit-score pour agents : un 742 chez un client signifie la même chose chez un autre.
    • Les dominants ne peuvent pas calibrer à travers les fournisseurs — seul un plan zone-neutre le peut.

    Comment une attaque protège dix mille agents.

    Quatre étapes, une boucle signée. Chaque verdict est à la fois enforcement et donnée d'entraînement.

    01
    Un agent tourne — n'importe où.
    Un agent Claude dans une banque répond à une question client. Un agent GPT-4o dans une autre banque trie une réclamation. Un bot ops interne basé sur Llama approuve un remboursement.
    02
    Chaque message est filtré.
    CFD scanne l'entrant pour injection et coercition. CBD scanne le sortant pour PII, secrets, violations d'alignment card. Chaque verdict est signé.
    03
    Les verdicts signés deviennent signal partagé.
    Les attaques nouvelles deviennent des empreintes CFD. Les événements de drift deviennent des priors AIP. Les résultats d'incidents deviennent des données de calibration du Trust Rating. Le contenu reste privé au tenant.
    04
    Chaque client obtient une protection plus aiguisée.
    Le petit tenant bénéficie de la surface d'attaque du grand tenant. Le grand tenant bénéficie des cas limites du petit. Les garde-fous ne se cumulent pas ; le learning network, si.
    Le signal propage en restant privé au tenant. Le contenu ne quitte jamais votre périmètre ; seule la forme d'attaque et de drift est partagée.
    Pourquoi pas les garde-fous

    Les garde-fous sont des règles. Le Learning Network est une mémoire.

    Les garde-fous statiques n'apprennent pas.

    Une liste de règles écrite en mars ne reconnaît pas le template d'injection qui a commencé à se répandre en avril. Un signal partagé, si.

    Un plan mono-vendeur ne voit qu'un modèle.

    Si votre plan de confiance est à l'intérieur d'OpenAI, il est aveugle aux modes de défaillance de Claude, de Gemini et des open-weights. La couverture inter-fournisseurs exige un arbitre zone-neutre.

    La défense uniquement privée est un démarrage à froid permanent.

    Une attaque nouvelle touche votre agent en premier. Vous y survivez. Six mois plus tard, un autre client est touché par le même pattern — et vous n'avez aucun mécanisme pour l'avoir averti. Le réseau inverse cette asymétrie.

    Ce qui est partagé. Ce qui ne l'est jamais.

    Le réseau est puissant parce que la frontière de données est stricte.

    Partagé entre tenants

    • Empreintes d'attaque (signatures MinHash, pas payloads)
    • Statistiques de drift (distributions, pas prompts)
    • Résultats de verdicts (étiquettes, pas contenu)
    • Données de calibration du Trust Rating (scores, pas traces)

    Ne quitte jamais votre tenant

    • Prompts, arguments d'outils, sorties des agents
    • PII, PHI et payloads régulés des clients
    • Vos Alignment Cards et hashes de cards
    • Traces identifiables, tenants ou données business

    Le réseau est le moat.

    Plus vos agents restent longtemps sur Mnemom, plus c'est difficile pour le prochain attaquant — et plus les verdicts que verront vos auditeurs seront nets.

    Featured on There's An AI For That