Auto-alojado

Gateway auto-alojado.

Despliegue el gateway de Mnemom en su propia infraestructura. Sus datos, prompts y argumentos de herramientas nunca abandonan su red. Solo heartbeat, telemetría y metadatos de veredictos firmados fluyen al control plane de Mnemom.

Arquitectura

El gateway auto-alojado corre en su red. Hace proxy a las llamadas a LLM, ejecuta los integrity checks localmente y envía telemetría al control plane de Mnemom. Nada sensible abandona su perímetro.

  Your Infrastructure                          Mnemom Cloud
 +---------------------------+                +------------------+
 |                           |                |                  |
 |  +--------+   +--------+ |  heartbeat     |  Control Plane   |
 |  |  App   |-->|Gateway |--+--------------->|  (api.mnemom.ai) |
 |  +--------+   +--------+ |  telemetry     |                  |
 |               |   |       |                |  Dashboard       |
 |               v   v       |                |  Alerts          |
 |          +------+ +-----+ |                |  Fleet Mgmt      |
 |          | AIP  | | LLM | |                +------------------+
 |          |Check | |Proxy | |
 |          +------+ +-----+ |
 |                   |       |
 +---------------------------+
                     |
                     v
              LLM Providers
          (OpenAI, Anthropic, etc.)

Se queda dentro de su red

- Prompts, argumentos de herramientas y respuestas de los LLM.
- Datos de clientes, PII y payloads regulados.
- Alignment Cards, hashes de cards y proof chains.
- Credenciales de los proveedores de LLM (OpenAI, Anthropic, etc.).

Enviado al control plane

- Heartbeat y metadatos de versión (cada 30 s).
- Resúmenes de veredictos firmados — etiquetas, no contenido.
- Contadores de telemetría y estadísticas de anomalías.
- Datos de calibración del Trust Rating (puntuaciones, no trazas).

Arranque rápido — Docker Compose

La forma más rápida de probar el gateway. Arránquelo, apunte su agente hacia él y verifique un integrity check firmado en menos de cinco minutos.

1. Cree su archivo .env

Pegue el JWT de licencia y el ID de organización que le enviamos en un archivo .env junto al archivo compose. Todo lo demás es opcional.

2. Cree docker-compose.yml

version: "3.8"

services:
  gateway:
    image: ghcr.io/mnemom/gateway:latest
    container_name: mnemom-gateway
    restart: unless-stopped
    ports:
      - "${GATEWAY_PORT:-8080}:8080"
    env_file:
      - .env
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 10s
    volumes:
      - gateway-data:/data

volumes:
  gateway-data:

3. Arranque el gateway

docker compose up -d
docker compose logs -f gateway

4. Verifique que esté sano

curl http://localhost:8080/health
# Expected: {"status":"ok","version":"1.x.x"}

Producción — Helm

Para despliegues de Kubernetes en producción, el chart de Helm es la ruta soportada. TLS, ingress, autoescalado y límites de recursos son first-class.

1. Añada el repo de Helm

helm repo add mnemom https://charts.mnemom.ai
helm repo update

2. Escriba su values.yaml

# values.yaml
replicaCount: 2

gateway:
  licenseJwt: "<YOUR_LICENSE_JWT>"
  orgId: "<YOUR_ORG_ID>"
  region: "us-east-1"

resources:
  requests:
    memory: "512Mi"
    cpu: "250m"
  limits:
    memory: "2Gi"
    cpu: "1000m"

ingress:
  enabled: true
  className: nginx
  hosts:
    - host: gateway.internal.example.com
      paths:
        - path: /
          pathType: Prefix
  tls:
    - secretName: gateway-tls
      hosts:
        - gateway.internal.example.com

autoscaling:
  enabled: true
  minReplicas: 2
  maxReplicas: 10
  targetCPUUtilizationPercentage: 70

3. Instale el chart

helm install mnemom-gateway mnemom/gateway \
  -f values.yaml \
  -n mnemom --create-namespace

4. Verifique el despliegue

kubectl get pods -n mnemom
kubectl logs -f deployment/mnemom-gateway -n mnemom

Referencia de configuración

Todo lo que el gateway lee del entorno. Solo la licencia y la organización son obligatorias; el resto tiene valores por defecto sensatos.

Variable	Obligatoria	Descripción
MNEMOM_LICENSE_JWT	Obligatoria	JWT firmado que autoriza a este gateway a llamar al control plane de Mnemom.
MNEMOM_ORG_ID	Obligatoria	UUID de su organización en Mnemom. Vincula este gateway a su tenant.
GATEWAY_PORT	Opcional	Puerto en el que escucha el gateway. Por defecto 8080.
GATEWAY_HOST	Opcional	Dirección de bind del gateway. Por defecto 0.0.0.0.
MNEMOM_API_URL	Opcional	URL del control plane de Mnemom. Cámbielo solo para mirrors air-gapped.
OPENAI_API_KEY	Opcional	Clave opcional de OpenAI si el gateway hace proxy a OpenAI.
ANTHROPIC_API_KEY	Opcional	Clave opcional de Anthropic si el gateway hace proxy a Claude.
MNEMOM_REGION	Opcional	Etiqueta de región usada en veredictos y telemetría (p. ej. us-east-1).
LOG_LEVEL	Opcional	debug \| info \| warn \| error. Por defecto info.
TLS_CERT_PATH	Opcional	Ruta absoluta al certificado TLS si el gateway termina TLS localmente.
TLS_KEY_PATH	Opcional	Ruta absoluta a la clave TLS correspondiente a TLS_CERT_PATH.
HEARTBEAT_INTERVAL_S	Opcional	Intervalo de heartbeat en segundos. Por defecto 30.
MAX_CONCURRENT_CHECKS	Opcional	Límite superior de integrity checks concurrentes. Por defecto 256.

Gestionado vs auto-alojado

Funcionalidad	Gestionado	Auto-alojado
Infraestructura	Alojado por Mnemom en Cloudflare Workers.	Docker o Kubernetes dentro de su perímetro.
Routing de LLM	A través del egress de Mnemom (observable, auditable).	Directamente desde su red al proveedor de LLM.
Tiempo de instalación	Menos de 5 minutos.	Alrededor de 30 minutos para Docker; 1–2 horas para Helm.
Escalado	Automático.	Usted controla el autoscaler; el chart de Helm trae valores por defecto sensatos.
Dashboard	app.mnemom.ai.	app.mnemom.ai (lee la telemetría de su gateway).
Integrity checks	Incluidos.	Incluidos, ejecutados localmente.
Detección de drift	Incluida.	Incluida, ejecutada localmente.
Residencia de datos	Regiones de EE. UU. y UE.	Donde despliegue — plenamente bajo su control.
Air-gapped / sin conexión	No soportado.	Soportado en Enterprise.
Routing de modelo auto-gestionado	Limitado.	Completo — cualquier proveedor de LLM o modelo on-prem.
SLA	99,9 % estándar; personalizado en Enterprise.	El SLA es suyo; nosotros damos soporte al gateway.
Plan requerido	Todos los planes.	Solo Enterprise.

FAQ

¿Listo para desplegar?

El auto-alojamiento es una funcionalidad del tier Enterprise. Cuéntenos sobre su entorno y le enviaremos la licencia y los values de Helm correspondientes.