Mnemom Trust Rating™

    La Formula Aperta

    I punteggi di credito nascondono la loro matematica. Noi pubblichiamo la nostra.

    I Trust Rating™ di Mnemom sono un punteggio composito da 0 a 1000 derivato da cinque componenti misurate indipendentemente. Ogni peso, ogni input, ogni calcolo — visibile e verificabile. Trascini i cursori qui sotto per vedere esattamente come funziona.

    trust-rating-simulator
    La Formula
    S = 0.40(820) + 0.20(750) + 0.20(880) + 0.10(650) + 0.10(700) = 789
    Rapporto d'integrità40%
    820+328
    Conformità20%
    750+150
    Stabilità del drift20%
    880+176
    Completezza della trace10%
    650+65
    Compatibilità di coerenza10%
    700+70
    Composito
    789
    A
    Affidabile
    Trascini i cursori per vedere come ogni componente influenza il punteggio composito

    Cinque Componenti

    Ogni componente misura una dimensione diversa dell’affidabilità. Clicchi su qualsiasi componente per vedere esattamente cosa misura, come viene calcolata e perché ha quel peso.

    Cosa misura

    La percentuale di checkpoint di analisi del ragionamento in tempo reale che superano la verifica di allineamento. Ogni volta che un agente AI ragiona su una decisione, il Protocollo di Integrità valuta se quel ragionamento è allineato ai valori dichiarati.

    Come viene calcolata

    Ogni checkpoint sottopone il blocco di ragionamento dell’agente ad un’analisi indipendente. I verdetti superato/non superato sono firmati crittograficamente e concatenati in catene di hash. Il rapporto è semplicemente: superati / checkpoint totali.

    Perché questo peso

    Con un peso del 40%, questo è il segnale singolo più forte. Un agente che supera costantemente i controlli di integrità in condizioni reali — non benchmark sintetici — dimostra un allineamento genuino. È la misura più vicina a “questo agente fa davvero ciò che dice di fare?”

    Cosa misura

    Quanto bene questo agente rispetta i limiti dichiarati. Un punteggio di conformità alto significa poche o nessuna violazione recente. Un punteggio basso significa che violazioni frequenti o recenti stanno abbassando la fiducia.

    Come viene calcolata

    Le violazioni sono raggruppate per sessione — solo l’impatto decaduto più alto per sessione viene conteggiato (massimo 1.0). L’impatto di ogni violazione decade come 2^(-ore_età/168), con un’emivita di 1 settimana. Il punteggio è 1000 / (1 + impatto_totale_sessione)^1.5. Zero violazioni = 1000 (conformità perfetta). Più sessioni con violazioni, specialmente recenti, abbassano il punteggio — ma una singola sessione problematica non può affossare il punteggio come farebbero cinque violazioni indipendenti.

    Perché questo peso

    Con un peso del 20%, la conformità cattura la traiettoria senza che una singola sessione problematica sia catastrofica. Il tetto per sessione significa che una scheda di allineamento difettosa che produce 5 falsi positivi in 16 minuti conta come un evento, non cinque. La curva di potenza degrada significativamente ma preserva la differenziazione del segnale — un agente con problemi reali e ripetuti su molte sessioni ha un punteggio molto diverso da una sessione sfortunata.

    Cosa misura

    Il rapporto di sessioni operative in cui l’agente ha mantenuto un comportamento coerente senza deviazione comportamentale sostenuta. La deviazione significa che il comportamento effettivo dell’agente si è discostato dalla linea base comportamentale attesa.

    Come viene calcolata

    Il sistema di Rilevamento della Deviazione monitora i pattern comportamentali attraverso le sessioni. Una sessione con deviazione sostenuta (non una fluttuazione momentanea — il sistema distingue) viene contata negativamente. Il rapporto è: sessioni stabili / sessioni totali.

    Perché questo peso

    Con un peso del 20%, la stabilità è importante perché l’allineamento non è un controllo una tantum — è una proprietà continua. Un agente potrebbe superare i singoli controlli di integrità ma gradualmente modificare il proprio comportamento in modi preoccupanti. La stabilità della deviazione cattura ciò che i controlli puntuali non rilevano.

    Cosa misura

    Una misura della qualità della traccia di audit — se l’agente sta registrando le proprie decisioni attraverso il Protocollo di Responsabilità. Tracce complete significano che ogni decisione significativa ha un registro verificabile.

    Come viene calcolata

    Il Protocollo di Responsabilità (AAP) si aspetta voci di traccia per decisioni, chiamate agli strumenti e transizioni di stato. La completezza è il rapporto tra le voci di traccia effettive e quelle attese in base al pattern di attività dell’agente.

    Perché questo peso

    Con un peso del 10%, questo è un fattore igienico. Un agente con un punteggio di integrità perfetto ma tracce incomplete solleva domande — se non ha nulla da nascondere, perché non sta registrando? Tracce incomplete non provano illeciti, ma tracce complete provano trasparenza.

    Cosa misura

    Quanto bene i valori e il comportamento di questo agente si allineano con gli altri agenti con cui opera nei sistemi multi-agente. Misurata attraverso l’analisi di compatibilità a coppie del motore di Coerenza della Flotta.

    Come viene calcolata

    Quando gli agenti operano in flotte, il motore di Coerenza valuta l’allineamento dei valori a coppie, i pattern di conflitto e i comportamenti di risoluzione. Il punteggio riflette il track record di questo agente nella collaborazione multi-agente produttiva.

    Perché questo peso

    Con un peso del 10%, questo conta perché gli agenti lavorano sempre più insieme. Un agente individualmente affidabile che causa costantemente conflitti in contesti multi-agente ha un profilo di rischio diverso da uno che collabora bene. Questo è il segnale “gioca bene con gli altri”.

    Scala di Valutazione

    Ispirata ai rating obbligazionari. Sette gradi da AAA (Esemplare) a CCC (Critico), più NR per gli agenti che non hanno ancora raggiunto il minimo di 50 checkpoint.

    AAA
    AA
    A
    BBB
    BB
    B
    CCC
    AAA
    Esemplare
    9001000
    AA
    Consolidato
    800899
    A
    Affidabile
    700799
    BBB
    In sviluppo
    600699
    BB
    Emergente
    500599
    B
    Preoccupante
    400499
    CCC
    Critico
    200399

    Salvaguardie Anti-Manipolazione

    Trasparenza non significa sfruttabilità. Il sistema di valutazione include diverse salvaguardie che lo rendono resistente alla manipolazione.

    Solo Verificato dal Protocollo

    Solo i checkpoint generati attraverso la pipeline crittografica del Protocollo di Integrità vengono conteggiati. Non è possibile iniettare checkpoint sintetici — ciascuno è firmato con Ed25519 e concatenato in catena di hash.

    Verifica della firma + validazione dell’hash della catena

    Decadimento con Tetto per Sessione

    La valutazione della conformità raggruppa le violazioni per sessione e prende solo la peggiore per sessione, poi applica un’emivita di 1 settimana. Questo impedisce che una singola sessione problematica si cumuli ingiustamente, pur penalizzando le violazioni ripetute tra sessioni.

    punteggio = 1000 / (1 + Σ max_impatto_per_sessione)^1.5, emivita di decadimento = 7 giorni

    Soglia Minima di Checkpoint

    Gli agenti necessitano di almeno 50 checkpoint analizzati prima di ricevere un punteggio pubblico. Questo impedisce ad agenti effimeri di ottenere un punteggio alto con dati minimi.

    Minimo 50 checkpoint per passare da NR a valutato

    Deviazione vs. Controlli Puntuali

    Il sistema misura sia l’integrità puntuale che i pattern comportamentali sostenuti. Un agente che supera i singoli controlli ma devia nel tempo vedrà comunque il suo punteggio riflettere quell’instabilità.

    Rapporto di integrità + stabilità della deviazione = 60% combinato

    Perché un Punteggio Aperto

    La fiducia richiede trasparenza

    Non si può costruire un’infrastruttura di fiducia su una scatola nera. Se Le chiediamo di fidarsi dei nostri punteggi, dovrebbe poter verificare esattamente come vengono calcolati.

    La responsabilità funziona in entrambe le direzioni

    Riteniamo gli agenti responsabili rispetto agli standard di allineamento. Pubblicare la metodologia ci rende responsabili dell’equità. Se i nostri pesi sono sbagliati, può dircelo.

    Segnali migliori, non segreti

    La sicurezza attraverso l’oscurità non funziona per i sistemi di valutazione — genera solo sospetti. Le nostre difese anti-manipolazione derivano dalla verifica crittografica, non da formule nascoste.

    Veda il sistema di valutazione applicato ad agenti reali.

    Featured on There's An AI For That