Mnemom Trust Rating™

    La Formula Abierta

    Los puntajes de credito ocultan sus calculos. Nosotros publicamos los nuestros.

    Los Trust Ratings™ de Mnemom son un compuesto de 0 a 1000 derivado de cinco componentes medidos de forma independiente. Cada peso, cada entrada, cada calculo — visible y verificable. Mueva los controles deslizantes a continuacion para ver exactamente como funciona.

    trust-rating-simulator
    La Formula
    S = 0.40(820) + 0.20(750) + 0.20(880) + 0.10(650) + 0.10(700) = 789
    Razón de integridad40%
    820+328
    Cumplimiento20%
    750+150
    Estabilidad de deriva20%
    880+176
    Completitud de traza10%
    650+65
    Compatibilidad de coherencia10%
    700+70
    Compuesto
    789
    A
    Fiable
    Mueva los controles deslizantes para ver como cada componente afecta la puntuación compuesta

    Cinco Componentes

    Cada componente mide una dimension diferente de la confiabilidad. Haga clic en cualquier componente para ver exactamente que mide, como se calcula y por que tiene ese peso.

    Que mide

    El porcentaje de puntos de control de análisis de pensamiento en tiempo real que pasan la verificación de alineacion. Cada vez que un agente de IA razona sobre una decisión, el Protocolo de Integridad evalua si ese razonamiento se alinea con sus valores declarados.

    Como se calcula

    Cada punto de control ejecuta el bloque de pensamiento del agente a traves de un análisis independiente. Los veredictos de aprobado/reprobado se firman criptográficamente y se encadenan con hash. El ratio es simplemente: aprobados / total de puntos de control.

    Por que este peso

    Con un peso del 40%, esta es la senal individual mas fuerte. Un agente que consistentemente pasa verificaciones de integridad bajo condiciones reales — no benchmarks sinteticos — demuestra alineacion genuina. Esto es lo mas cercano a "este agente realmente hace lo que dice que hace?"

    Que mide

    Que tan bien este agente se mantiene dentro de sus limites declarados. Una puntuación de cumplimiento alta significa pocas o ninguna violacion reciente. Una puntuación baja significa que violaciones frecuentes o recientes estan arrastrando la confianza hacia abajo.

    Como se calcula

    Las violaciones se agrupan por sesión — solo cuenta el mayor impacto decaido por sesión (con tope de 1.0). El impacto de cada violacion decae como 2^(-edad_horas/168), dando una vida media de 1 semana. La puntuación es 1000 / (1 + impacto_total_sesión)^1.5. Cero violaciones = 1000 (cumplimiento perfecto). Mas sesiones con violaciones, especialmente recientes, empujan la puntuación hacia abajo — pero una sola sesión mala no puede derrumbar la puntuación como lo harian cinco violaciones independientes.

    Por que este peso

    Con un peso del 20%, el cumplimiento captura la trayectoria sin que una sola sesión mala sea catastrofica. El tope por sesión significa que una tarjeta de alineacion defectuosa que produce 5 falsos positivos en 16 minutos cuenta como un evento, no como cinco. La curva de potencia degrada significativamente pero preserva la diferenciacion de senales — un agente con problemas reales y repetidos en muchas sesiones puntua muy diferente de una sesión desafortunada.

    Que mide

    El ratio de sesiones operativas donde el agente mantuvo un comportamiento consistente sin deriva de comportamiento sostenida. La deriva significa que el comportamiento real del agente divergio de su linea base de comportamiento esperada.

    Como se calcula

    El sistema de Deteccion de Deriva monitorea patrones de comportamiento entre sesiones. Una sesión con deriva sostenida (no fluctuacion momentanea — el sistema las distingue) cuenta en contra de esta puntuación. El ratio es: sesiones estables / total de sesiones.

    Por que este peso

    Con un peso del 20%, la estabilidad importa porque la alineacion no es una verificación única — es una propiedad continua. Un agente podria pasar verificaciones de integridad individuales pero aun asi cambiar gradualmente su comportamiento de maneras preocupantes. La estabilidad de deriva captura lo que las verificaciones puntuales no detectan.

    Que mide

    Una medida de la calidad del registro de auditoría — si el agente esta registrando sus decisiones a traves del Protocolo de Responsabilidad. Las trazas completas significan que cada decisión significativa tiene un registro verificable.

    Como se calcula

    El Protocolo de Responsabilidad (AAP) espera entradas de trazas para decisiones, llamadas a herramientas y transiciones de estado. La completitud es el ratio de entradas de trazas reales respecto a las esperadas basandose en el patron de actividad del agente.

    Por que este peso

    Con un peso del 10%, este es un factor de higiene. Un agente con una puntuación de integridad perfecta pero trazas incompletas genera preguntas — si no tiene nada que ocultar, por que no esta registrando? Las trazas incompletas no prueban malas practicas, pero las trazas completas prueban transparencia.

    Que mide

    Que tan bien los valores y el comportamiento de este agente se alinean con otros agentes con los que trabaja en sistemas multi-agente. Medido a traves del análisis de compatibilidad por pares del motor de Coherencia de Flota.

    Como se calcula

    Cuando los agentes operan en flotas, el motor de Coherencia evalua la alineacion de valores por pares, patrones de conflicto y comportamientos de resolucion. La puntuación refleja el historial de este agente en colaboracion productiva multi-agente.

    Por que este peso

    Con un peso del 10%, esto importa porque los agentes cada vez mas trabajan juntos. Un agente individualmente confiable que consistentemente causa conflictos en entornos multi-agente es un perfil de riesgo diferente a uno que colabora bien. Esta es la senal de "trabaja bien con otros".

    Escala de Calificación

    Inspirada en calificaciones de bonos. Siete grados desde AAA (Ejemplar) hasta CCC (Crítico), mas NR para agentes que aún no han alcanzado el mínimo de 50 puntos de control.

    AAA
    AA
    A
    BBB
    BB
    B
    CCC
    AAA
    Ejemplar
    9001000
    AA
    Establecido
    800899
    A
    Fiable
    700799
    BBB
    En desarrollo
    600699
    BB
    Emergente
    500599
    B
    Preocupante
    400499
    CCC
    Crítico
    200399

    Protecciones Anti-Manipulacion

    Transparencia no significa vulnerabilidad. El sistema de puntuación incluye varias protecciones que lo hacen resistente a la manipulacion.

    Solo Verificado por Protocolo

    Solo los puntos de control generados a traves del pipeline criptográfico del Protocolo de Integridad son contados. No puede inyectar puntos de control sinteticos — cada uno esta firmado con Ed25519 y encadenado con hash.

    Verificación de firma + validación de hash de cadena

    Decaimiento con Tope por Sesión

    La puntuación de cumplimiento agrupa violaciones por sesión y toma solo la peor por sesión, luego aplica una vida media de 1 semana. Esto evita que una sola sesión mala se acumule injustamente mientras penaliza violaciones repetidas entre sesiones.

    puntuación = 1000 / (1 + Σ max_impacto_por_sesión)^1.5, vida media de decaimiento = 7 dias

    Umbral Mínimo de Puntos de Control

    Los agentes necesitan al menos 50 puntos de control analizados antes de recibir una puntuación pública. Esto evita que agentes efimeros manipulen una puntuación alta con datos mínimos.

    50 puntos de control mínimos para pasar de NR a calificado

    Deriva vs. Verificaciones Puntuales

    El sistema mide tanto la integridad puntual como los patrones de comportamiento sostenidos. Un agente que pasa verificaciones individuales pero deriva con el tiempo vera esa inestabilidad reflejada en su puntuación.

    Ratio de integridad + estabilidad de deriva = 60% combinado

    Por Que Puntuación Abierta

    La confianza requiere transparencia

    No se puede construir infraestructura de confianza sobre una caja negra. Si le pedimos que confie en nuestras puntuaciones, deberia poder verificar exactamente como se calculan.

    La responsabilidad es bidireccional

    Exigimos responsabilidad a los agentes respecto a estandares de alineacion. Publicar la metodología nos hace responsables de la equidad. Si nuestros pesos estan equivocados, puede decirnos.

    Mejores senales, no secretos

    La seguridad por oscuridad no funciona para sistemas de puntuación — solo genera sospecha. Nuestras defensas anti-manipulacion provienen de la verificación criptográfica, no de formulas ocultas.

    Vea el sistema de puntuación aplicado a agentes reales.

    Featured on There's An AI For That