Auto-alojado

    Gateway auto-alojado.

    Despliegue el gateway de Mnemom en su propia infraestructura. Sus datos, prompts y argumentos de herramientas nunca abandonan su red. Solo heartbeat, telemetría y metadatos de veredictos firmados fluyen al control plane de Mnemom.

    Arquitectura

    El gateway auto-alojado corre en su red. Hace proxy a las llamadas a LLM, ejecuta los integrity checks localmente y envía telemetría al control plane de Mnemom. Nada sensible abandona su perímetro.

      Your Infrastructure                          Mnemom Cloud
     +---------------------------+                +------------------+
     |                           |                |                  |
     |  +--------+   +--------+ |  heartbeat     |  Control Plane   |
     |  |  App   |-->|Gateway |--+--------------->|  (api.mnemom.ai) |
     |  +--------+   +--------+ |  telemetry     |                  |
     |               |   |       |                |  Dashboard       |
     |               v   v       |                |  Alerts          |
     |          +------+ +-----+ |                |  Fleet Mgmt      |
     |          | AIP  | | LLM | |                +------------------+
     |          |Check | |Proxy | |
     |          +------+ +-----+ |
     |                   |       |
     +---------------------------+
                         |
                         v
                  LLM Providers
              (OpenAI, Anthropic, etc.)

    Se queda dentro de su red

    • - Prompts, argumentos de herramientas y respuestas de los LLM.
    • - Datos de clientes, PII y payloads regulados.
    • - Alignment Cards, hashes de cards y proof chains.
    • - Credenciales de los proveedores de LLM (OpenAI, Anthropic, etc.).

    Enviado al control plane

    • - Heartbeat y metadatos de versión (cada 30 s).
    • - Resúmenes de veredictos firmados — etiquetas, no contenido.
    • - Contadores de telemetría y estadísticas de anomalías.
    • - Datos de calibración del Trust Rating (puntuaciones, no trazas).

    Arranque rápido — Docker Compose

    La forma más rápida de probar el gateway. Arránquelo, apunte su agente hacia él y verifique un integrity check firmado en menos de cinco minutos.

    1. Cree su archivo .env

    Pegue el JWT de licencia y el ID de organización que le enviamos en un archivo .env junto al archivo compose. Todo lo demás es opcional.

    2. Cree docker-compose.yml

    version: "3.8"
    
    services:
      gateway:
        image: ghcr.io/mnemom/gateway:latest
        container_name: mnemom-gateway
        restart: unless-stopped
        ports:
          - "${GATEWAY_PORT:-8080}:8080"
        env_file:
          - .env
        healthcheck:
          test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
          interval: 30s
          timeout: 10s
          retries: 3
          start_period: 10s
        volumes:
          - gateway-data:/data
    
    volumes:
      gateway-data:

    3. Arranque el gateway

    docker compose up -d
    docker compose logs -f gateway

    4. Verifique que esté sano

    curl http://localhost:8080/health
    # Expected: {"status":"ok","version":"1.x.x"}

    Producción — Helm

    Para despliegues de Kubernetes en producción, el chart de Helm es la ruta soportada. TLS, ingress, autoescalado y límites de recursos son first-class.

    1. Añada el repo de Helm

    helm repo add mnemom https://charts.mnemom.ai
    helm repo update

    2. Escriba su values.yaml

    # values.yaml
    replicaCount: 2
    
    gateway:
      licenseJwt: "<YOUR_LICENSE_JWT>"
      orgId: "<YOUR_ORG_ID>"
      region: "us-east-1"
    
    resources:
      requests:
        memory: "512Mi"
        cpu: "250m"
      limits:
        memory: "2Gi"
        cpu: "1000m"
    
    ingress:
      enabled: true
      className: nginx
      hosts:
        - host: gateway.internal.example.com
          paths:
            - path: /
              pathType: Prefix
      tls:
        - secretName: gateway-tls
          hosts:
            - gateway.internal.example.com
    
    autoscaling:
      enabled: true
      minReplicas: 2
      maxReplicas: 10
      targetCPUUtilizationPercentage: 70

    3. Instale el chart

    helm install mnemom-gateway mnemom/gateway \
      -f values.yaml \
      -n mnemom --create-namespace

    4. Verifique el despliegue

    kubectl get pods -n mnemom
    kubectl logs -f deployment/mnemom-gateway -n mnemom

    Referencia de configuración

    Todo lo que el gateway lee del entorno. Solo la licencia y la organización son obligatorias; el resto tiene valores por defecto sensatos.

    VariableObligatoriaDescripción
    MNEMOM_LICENSE_JWT
    Obligatoria
    JWT firmado que autoriza a este gateway a llamar al control plane de Mnemom.
    MNEMOM_ORG_ID
    Obligatoria
    UUID de su organización en Mnemom. Vincula este gateway a su tenant.
    GATEWAY_PORTOpcionalPuerto en el que escucha el gateway. Por defecto 8080.
    GATEWAY_HOSTOpcionalDirección de bind del gateway. Por defecto 0.0.0.0.
    MNEMOM_API_URLOpcionalURL del control plane de Mnemom. Cámbielo solo para mirrors air-gapped.
    OPENAI_API_KEYOpcionalClave opcional de OpenAI si el gateway hace proxy a OpenAI.
    ANTHROPIC_API_KEYOpcionalClave opcional de Anthropic si el gateway hace proxy a Claude.
    MNEMOM_REGIONOpcionalEtiqueta de región usada en veredictos y telemetría (p. ej. us-east-1).
    LOG_LEVELOpcionaldebug | info | warn | error. Por defecto info.
    TLS_CERT_PATHOpcionalRuta absoluta al certificado TLS si el gateway termina TLS localmente.
    TLS_KEY_PATHOpcionalRuta absoluta a la clave TLS correspondiente a TLS_CERT_PATH.
    HEARTBEAT_INTERVAL_SOpcionalIntervalo de heartbeat en segundos. Por defecto 30.
    MAX_CONCURRENT_CHECKSOpcionalLímite superior de integrity checks concurrentes. Por defecto 256.

    Gestionado vs auto-alojado

    FuncionalidadGestionadoAuto-alojado
    InfraestructuraAlojado por Mnemom en Cloudflare Workers.Docker o Kubernetes dentro de su perímetro.
    Routing de LLMA través del egress de Mnemom (observable, auditable).Directamente desde su red al proveedor de LLM.
    Tiempo de instalaciónMenos de 5 minutos.Alrededor de 30 minutos para Docker; 1–2 horas para Helm.
    EscaladoAutomático.Usted controla el autoscaler; el chart de Helm trae valores por defecto sensatos.
    Dashboardapp.mnemom.ai.app.mnemom.ai (lee la telemetría de su gateway).
    Integrity checksIncluidos.Incluidos, ejecutados localmente.
    Detección de driftIncluida.Incluida, ejecutada localmente.
    Residencia de datosRegiones de EE. UU. y UE.Donde despliegue — plenamente bajo su control.
    Air-gapped / sin conexiónNo soportado.Soportado en Enterprise.
    Routing de modelo auto-gestionadoLimitado.Completo — cualquier proveedor de LLM o modelo on-prem.
    SLA99,9 % estándar; personalizado en Enterprise.El SLA es suyo; nosotros damos soporte al gateway.
    Plan requeridoTodos los planes.Solo Enterprise.

    FAQ

    ¿Listo para desplegar?

    El auto-alojamiento es una funcionalidad del tier Enterprise. Cuéntenos sobre su entorno y le enviaremos la licencia y los values de Helm correspondientes.

    Featured on There's An AI For That