# Metodologia Mnemom Trust Rating™

Trust RatingValutazione del RischioReputazione del Team

```json
{"@context":"https://schema.org","@type":"TechArticle","name":"Metodologia Mnemom Trust Rating\u2122 \u2014 Mnemom","description":"La metodologia Mnemom Trust Rating\u2122 \u00e8 completamente trasparente. Esplora la formula, i pesi dei componenti, la scala dei voti e le protezioni anti-gaming.","url":"https://www.mnemom.ai/it/methodology","inLanguage":"it-IT","dateModified":"2026-06-08","publisher":{"@type":"Organization","@id":"https://www.mnemom.ai#organization","name":"Mnemom","url":"https://www.mnemom.ai"}}
```

```json
{"@context":"https://schema.org","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https://www.mnemom.ai/it"},{"@type":"ListItem","position":2,"name":"Metodologia Mnemom Trust Rating\u2122 \u2014 Mnemom","item":"https://www.mnemom.ai/it/methodology"}]}
```

Mnemom Trust Rating™

# La Formula Aperta

I punteggi di credito nascondono la loro matematica. Noi pubblichiamo la nostra.

I Trust Rating™ di Mnemom sono un punteggio composito da 0 a 1000 derivato da cinque componenti misurate indipendentemente. Ogni peso, ogni input, ogni calcolo — visibile e verificabile. Trascini i cursori qui sotto per vedere esattamente come funziona.

trust-rating-simulator

La Formula

S = 0.40(820) + 0.20(750) + 0.20(880) + 0.10(650) + 0.10(700) = 789

Rapporto d'integrità40%

820+328

Conformità20%

750+150

Stabilità del drift20%

880+176

Completezza della trace10%

650+65

Compatibilità di coerenza10%

700+70

Composito

789

A

Affidabile

Trascini i cursori per vedere come ogni componente influenza il punteggio composito

## Cinque Componenti

Ogni componente misura una dimensione diversa dell’affidabilità. Clicchi su qualsiasi componente per vedere esattamente cosa misura, come viene calcolata e perché ha quel peso.

### Rapporto d'integrità

40%

Tasso di superamento dell'analisi del pensiero in tempo reale

Checkpoint AIP

#### Cosa misura

La percentuale di checkpoint di analisi del ragionamento in tempo reale che superano la verifica di allineamento. Ogni volta che un agente AI ragiona su una decisione, il Protocollo di Integrità valuta se quel ragionamento è allineato ai valori dichiarati.

#### Come viene calcolata

Ogni checkpoint sottopone il blocco di ragionamento dell’agente ad un’analisi indipendente. I verdetti superato/non superato sono firmati crittograficamente e concatenati in catene di hash. Il rapporto è semplicemente: superati / checkpoint totali.

#### Perché questo peso

Con un peso del 40%, questo è il segnale singolo più forte. Un agente che supera costantemente i controlli di integrità in condizioni reali — non benchmark sintetici — dimostra un allineamento genuino. È la misura più vicina a “questo agente fa davvero ciò che dice di fare?”

### Conformità

20%

Tasso di conformità ai limiti con ponderazione a decadimento esponenziale

Checkpoint AIP

#### Cosa misura

Quanto bene questo agente rispetta i limiti dichiarati. Un punteggio di conformità alto significa poche o nessuna violazione recente. Un punteggio basso significa che violazioni frequenti o recenti stanno abbassando la fiducia.

#### Come viene calcolata

Le violazioni sono raggruppate per sessione — solo l’impatto decaduto più alto per sessione viene conteggiato (massimo 1.0). L’impatto di ogni violazione decade come 2^(-ore\_età/168), con un’emivita di 1 settimana. Il punteggio è 1000 / (1 + impatto\_totale\_sessione)^1.5. Zero violazioni = 1000 (conformità perfetta). Più sessioni con violazioni, specialmente recenti, abbassano il punteggio — ma una singola sessione problematica non può affossare il punteggio come farebbero cinque violazioni indipendenti.

#### Perché questo peso

Con un peso del 20%, la conformità cattura la traiettoria senza che una singola sessione problematica sia catastrofica. Il tetto per sessione significa che una scheda di allineamento difettosa che produce 5 falsi positivi in 16 minuti conta come un evento, non cinque. La curva di potenza degrada significativamente ma preserva la differenziazione del segnale — un agente con problemi reali e ripetuti su molte sessioni ha un punteggio molto diverso da una sessione sfortunata.

### Stabilità del drift

20%

Rapporto delle sessioni senza drift prolungato

Rilevamento drift AIP

#### Cosa misura

Il rapporto di sessioni operative in cui l’agente ha mantenuto un comportamento coerente senza deviazione comportamentale sostenuta. La deviazione significa che il comportamento effettivo dell’agente si è discostato dalla linea base comportamentale attesa.

#### Come viene calcolata

Il sistema di Rilevamento della Deviazione monitora i pattern comportamentali attraverso le sessioni. Una sessione con deviazione sostenuta (non una fluttuazione momentanea — il sistema distingue) viene contata negativamente. Il rapporto è: sessioni stabili / sessioni totali.

#### Perché questo peso

Con un peso del 20%, la stabilità è importante perché l’allineamento non è un controllo una tantum — è una proprietà continua. Un agente potrebbe superare i singoli controlli di integrità ma gradualmente modificare il proprio comportamento in modi preoccupanti. La stabilità della deviazione cattura ciò che i controlli puntuali non rilevano.

### Completezza della trace

10%

Qualità dell'audit trail — le decisioni vengono registrate?

Trace AAP

#### Cosa misura

Una misura della qualità della traccia di audit — se l’agente sta registrando le proprie decisioni attraverso il Protocollo di Responsabilità. Tracce complete significano che ogni decisione significativa ha un registro verificabile.

#### Come viene calcolata

Il Protocollo di Responsabilità (AAP) si aspetta voci di traccia per decisioni, chiamate agli strumenti e transizioni di stato. La completezza è il rapporto tra le voci di traccia effettive e quelle attese in base al pattern di attività dell’agente.

#### Perché questo peso

Con un peso del 10%, questo è un fattore igienico. Un agente con un punteggio di integrità perfetto ma tracce incomplete solleva domande — se non ha nulla da nascondere, perché non sta registrando? Tracce incomplete non provano illeciti, ma tracce complete provano trasparenza.

### Compatibilità di coerenza

10%

Storico di allineamento dei valori multi-agente

Coerenza della flotta

#### Cosa misura

Quanto bene i valori e il comportamento di questo agente si allineano con gli altri agenti con cui opera nei sistemi multi-agente. Misurata attraverso l’analisi di compatibilità a coppie del motore di Coerenza della Flotta.

#### Come viene calcolata

Quando gli agenti operano in flotte, il motore di Coerenza valuta l’allineamento dei valori a coppie, i pattern di conflitto e i comportamenti di risoluzione. Il punteggio riflette il track record di questo agente nella collaborazione multi-agente produttiva.

#### Perché questo peso

Con un peso del 10%, questo conta perché gli agenti lavorano sempre più insieme. Un agente individualmente affidabile che causa costantemente conflitti in contesti multi-agente ha un profilo di rischio diverso da uno che collabora bene. Questo è il segnale “gioca bene con gli altri”.

## Scala di Valutazione

Ispirata ai rating obbligazionari. Sette gradi da AAA (Esemplare) a CCC (Critico), più NR per gli agenti che non hanno ancora raggiunto il minimo di 50 checkpoint.

AAA

AA

A

BBB

BB

B

CCC

AAA

Esemplare

900–1000

AA

Consolidato

800–899

A

Affidabile

700–799

BBB

In sviluppo

600–699

BB

Emergente

500–599

B

Preoccupante

400–499

CCC

Critico

200–399

## Salvaguardie Anti-Manipolazione

Trasparenza non significa sfruttabilità. Il sistema di valutazione include diverse salvaguardie che lo rendono resistente alla manipolazione.

#### Solo Verificato dal Protocollo

Solo i checkpoint generati attraverso la pipeline crittografica del Protocollo di Integrità vengono conteggiati. Non è possibile iniettare checkpoint sintetici — ciascuno è firmato con Ed25519 e concatenato in catena di hash.

Verifica della firma + validazione dell’hash della catena

#### Decadimento con Tetto per Sessione

La valutazione della conformità raggruppa le violazioni per sessione e prende solo la peggiore per sessione, poi applica un’emivita di 1 settimana. Questo impedisce che una singola sessione problematica si cumuli ingiustamente, pur penalizzando le violazioni ripetute tra sessioni.

punteggio = 1000 / (1 + Σ max\_impatto\_per\_sessione)^1.5, emivita di decadimento = 7 giorni

#### Soglia Minima di Checkpoint

Gli agenti necessitano di almeno 50 checkpoint analizzati prima di ricevere un punteggio pubblico. Questo impedisce ad agenti effimeri di ottenere un punteggio alto con dati minimi.

Minimo 50 checkpoint per passare da NR a valutato

#### Deviazione vs. Controlli Puntuali

Il sistema misura sia l’integrità puntuale che i pattern comportamentali sostenuti. Un agente che supera i singoli controlli ma devia nel tempo vedrà comunque il suo punteggio riflettere quell’instabilità.

Rapporto di integrità + stabilità della deviazione = 60% combinato

## Perché un Punteggio Aperto

### La fiducia richiede trasparenza

Non si può costruire un’infrastruttura di fiducia su una scatola nera. Se Le chiediamo di fidarsi dei nostri punteggi, dovrebbe poter verificare esattamente come vengono calcolati.

### La responsabilità funziona in entrambe le direzioni

Riteniamo gli agenti responsabili rispetto agli standard di allineamento. Pubblicare la metodologia ci rende responsabili dell’equità. Se i nostri pesi sono sbagliati, può dircelo.

### Segnali migliori, non segreti

La sicurezza attraverso l’oscurità non funziona per i sistemi di valutazione — genera solo sospetti. Le nostre difese anti-manipolazione derivano dalla verifica crittografica, non da formule nascoste.

Veda il sistema di valutazione applicato ad agenti reali.

[Esplori la Trust Directory](/it/directory)[Veda i Protocolli in Azione](/it/showcase)

---
_Source: /it/methodology/index.html · Generated by build-markdown-mirrors.mjs · For agent-readability commitment #4 see https://www.mnemom.ai/for-agents_