Gateway auto-alojado.
Despliegue el gateway de Mnemom en su propia infraestructura. Sus datos, prompts y argumentos de herramientas nunca abandonan su red. Solo heartbeat, telemetría y metadatos de veredictos firmados fluyen al control plane de Mnemom.
Arquitectura
El gateway auto-alojado corre en su red. Hace proxy a las llamadas a LLM, ejecuta los integrity checks localmente y envía telemetría al control plane de Mnemom. Nada sensible abandona su perímetro.
Your Infrastructure Mnemom Cloud
+---------------------------+ +------------------+
| | | |
| +--------+ +--------+ | heartbeat | Control Plane |
| | App |-->|Gateway |--+--------------->| (api.mnemom.ai) |
| +--------+ +--------+ | telemetry | |
| | | | | Dashboard |
| v v | | Alerts |
| +------+ +-----+ | | Fleet Mgmt |
| | AIP | | LLM | | +------------------+
| |Check | |Proxy | |
| +------+ +-----+ |
| | |
+---------------------------+
|
v
LLM Providers
(OpenAI, Anthropic, etc.)Se queda dentro de su red
- - Prompts, argumentos de herramientas y respuestas de los LLM.
- - Datos de clientes, PII y payloads regulados.
- - Alignment Cards, hashes de cards y proof chains.
- - Credenciales de los proveedores de LLM (OpenAI, Anthropic, etc.).
Enviado al control plane
- - Heartbeat y metadatos de versión (cada 30 s).
- - Resúmenes de veredictos firmados — etiquetas, no contenido.
- - Contadores de telemetría y estadísticas de anomalías.
- - Datos de calibración del Trust Rating (puntuaciones, no trazas).
Arranque rápido — Docker Compose
La forma más rápida de probar el gateway. Arránquelo, apunte su agente hacia él y verifique un integrity check firmado en menos de cinco minutos.
1. Cree su archivo .env
Pegue el JWT de licencia y el ID de organización que le enviamos en un archivo .env junto al archivo compose. Todo lo demás es opcional.
2. Cree docker-compose.yml
version: "3.8"
services:
gateway:
image: ghcr.io/mnemom/gateway:latest
container_name: mnemom-gateway
restart: unless-stopped
ports:
- "${GATEWAY_PORT:-8080}:8080"
env_file:
- .env
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
interval: 30s
timeout: 10s
retries: 3
start_period: 10s
volumes:
- gateway-data:/data
volumes:
gateway-data:3. Arranque el gateway
docker compose up -d docker compose logs -f gateway
4. Verifique que esté sano
curl http://localhost:8080/health
# Expected: {"status":"ok","version":"1.x.x"}Producción — Helm
Para despliegues de Kubernetes en producción, el chart de Helm es la ruta soportada. TLS, ingress, autoescalado y límites de recursos son first-class.
1. Añada el repo de Helm
helm repo add mnemom https://charts.mnemom.ai helm repo update
2. Escriba su values.yaml
# values.yaml
replicaCount: 2
gateway:
licenseJwt: "<YOUR_LICENSE_JWT>"
orgId: "<YOUR_ORG_ID>"
region: "us-east-1"
resources:
requests:
memory: "512Mi"
cpu: "250m"
limits:
memory: "2Gi"
cpu: "1000m"
ingress:
enabled: true
className: nginx
hosts:
- host: gateway.internal.example.com
paths:
- path: /
pathType: Prefix
tls:
- secretName: gateway-tls
hosts:
- gateway.internal.example.com
autoscaling:
enabled: true
minReplicas: 2
maxReplicas: 10
targetCPUUtilizationPercentage: 703. Instale el chart
helm install mnemom-gateway mnemom/gateway \ -f values.yaml \ -n mnemom --create-namespace
4. Verifique el despliegue
kubectl get pods -n mnemom kubectl logs -f deployment/mnemom-gateway -n mnemom
Referencia de configuración
Todo lo que el gateway lee del entorno. Solo la licencia y la organización son obligatorias; el resto tiene valores por defecto sensatos.
| Variable | Obligatoria | Descripción |
|---|---|---|
| MNEMOM_LICENSE_JWT | Obligatoria | JWT firmado que autoriza a este gateway a llamar al control plane de Mnemom. |
| MNEMOM_ORG_ID | Obligatoria | UUID de su organización en Mnemom. Vincula este gateway a su tenant. |
| GATEWAY_PORT | Opcional | Puerto en el que escucha el gateway. Por defecto 8080. |
| GATEWAY_HOST | Opcional | Dirección de bind del gateway. Por defecto 0.0.0.0. |
| MNEMOM_API_URL | Opcional | URL del control plane de Mnemom. Cámbielo solo para mirrors air-gapped. |
| OPENAI_API_KEY | Opcional | Clave opcional de OpenAI si el gateway hace proxy a OpenAI. |
| ANTHROPIC_API_KEY | Opcional | Clave opcional de Anthropic si el gateway hace proxy a Claude. |
| MNEMOM_REGION | Opcional | Etiqueta de región usada en veredictos y telemetría (p. ej. us-east-1). |
| LOG_LEVEL | Opcional | debug | info | warn | error. Por defecto info. |
| TLS_CERT_PATH | Opcional | Ruta absoluta al certificado TLS si el gateway termina TLS localmente. |
| TLS_KEY_PATH | Opcional | Ruta absoluta a la clave TLS correspondiente a TLS_CERT_PATH. |
| HEARTBEAT_INTERVAL_S | Opcional | Intervalo de heartbeat en segundos. Por defecto 30. |
| MAX_CONCURRENT_CHECKS | Opcional | Límite superior de integrity checks concurrentes. Por defecto 256. |
Gestionado vs auto-alojado
| Funcionalidad | Gestionado | Auto-alojado |
|---|---|---|
| Infraestructura | Alojado por Mnemom en Cloudflare Workers. | Docker o Kubernetes dentro de su perímetro. |
| Routing de LLM | A través del egress de Mnemom (observable, auditable). | Directamente desde su red al proveedor de LLM. |
| Tiempo de instalación | Menos de 5 minutos. | Alrededor de 30 minutos para Docker; 1–2 horas para Helm. |
| Escalado | Automático. | Usted controla el autoscaler; el chart de Helm trae valores por defecto sensatos. |
| Dashboard | app.mnemom.ai. | app.mnemom.ai (lee la telemetría de su gateway). |
| Integrity checks | Incluidos. | Incluidos, ejecutados localmente. |
| Detección de drift | Incluida. | Incluida, ejecutada localmente. |
| Residencia de datos | Regiones de EE. UU. y UE. | Donde despliegue — plenamente bajo su control. |
| Air-gapped / sin conexión | No soportado. | Soportado en Enterprise. |
| Routing de modelo auto-gestionado | Limitado. | Completo — cualquier proveedor de LLM o modelo on-prem. |
| SLA | 99,9 % estándar; personalizado en Enterprise. | El SLA es suyo; nosotros damos soporte al gateway. |
| Plan requerido | Todos los planes. | Solo Enterprise. |
FAQ
¿Listo para desplegar?
El auto-alojamiento es una funcionalidad del tier Enterprise. Cuéntenos sobre su entorno y le enviaremos la licencia y los values de Helm correspondientes.
