Passerelle auto-hébergée.
Déployez la passerelle Mnemom sur votre propre infrastructure. Vos données, prompts et arguments d'outils ne quittent jamais votre réseau. Seuls le heartbeat, la télémétrie et les métadonnées de verdicts signés sont transmis à la control plane Mnemom.
Architecture
La passerelle auto-hébergée tourne dans votre réseau. Elle fait proxy sur les appels LLM, exécute les contrôles d'intégrité localement et envoie la télémétrie à la control plane Mnemom. Rien de sensible ne quitte votre périmètre.
Your Infrastructure Mnemom Cloud
+---------------------------+ +------------------+
| | | |
| +--------+ +--------+ | heartbeat | Control Plane |
| | App |-->|Gateway |--+--------------->| (api.mnemom.ai) |
| +--------+ +--------+ | telemetry | |
| | | | | Dashboard |
| v v | | Alerts |
| +------+ +-----+ | | Fleet Mgmt |
| | AIP | | LLM | | +------------------+
| |Check | |Proxy | |
| +------+ +-----+ |
| | |
+---------------------------+
|
v
LLM Providers
(OpenAI, Anthropic, etc.)Reste à l'intérieur de votre réseau
- - Prompts, arguments d'outils et réponses des LLM.
- - Données clients, PII et payloads réglementés.
- - Alignment Cards, hashes de cards et chaînes de preuves.
- - Identifiants des fournisseurs de LLM (OpenAI, Anthropic, etc.).
Envoyé à la control plane
- - Heartbeat et métadonnées de version (toutes les 30 s).
- - Résumés de verdicts signés — étiquettes, pas contenu.
- - Compteurs de télémétrie et statistiques d'anomalies.
- - Données de calibration du Trust Rating (scores, pas traces).
Démarrage rapide — Docker Compose
Le moyen le plus rapide d'essayer la passerelle. Démarrez-la, pointez votre agent vers elle et vérifiez un contrôle d'intégrité signé en moins de cinq minutes.
1. Créez votre fichier .env
Déposez le JWT de licence et l'ID d'organisation que nous vous avons envoyés dans un fichier .env à côté du fichier compose. Tout le reste est optionnel.
2. Créez docker-compose.yml
version: "3.8"
services:
gateway:
image: ghcr.io/mnemom/gateway:latest
container_name: mnemom-gateway
restart: unless-stopped
ports:
- "${GATEWAY_PORT:-8080}:8080"
env_file:
- .env
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
interval: 30s
timeout: 10s
retries: 3
start_period: 10s
volumes:
- gateway-data:/data
volumes:
gateway-data:3. Démarrez la passerelle
docker compose up -d docker compose logs -f gateway
4. Vérifiez qu'elle est en bonne santé
curl http://localhost:8080/health
# Expected: {"status":"ok","version":"1.x.x"}Production — Helm
Pour les déploiements Kubernetes en production, le chart Helm est le chemin supporté. TLS, ingress, autoscaling et limites de ressources sont first-class.
1. Ajoutez le dépôt Helm
helm repo add mnemom https://charts.mnemom.ai helm repo update
2. Rédigez votre values.yaml
# values.yaml
replicaCount: 2
gateway:
licenseJwt: "<YOUR_LICENSE_JWT>"
orgId: "<YOUR_ORG_ID>"
region: "us-east-1"
resources:
requests:
memory: "512Mi"
cpu: "250m"
limits:
memory: "2Gi"
cpu: "1000m"
ingress:
enabled: true
className: nginx
hosts:
- host: gateway.internal.example.com
paths:
- path: /
pathType: Prefix
tls:
- secretName: gateway-tls
hosts:
- gateway.internal.example.com
autoscaling:
enabled: true
minReplicas: 2
maxReplicas: 10
targetCPUUtilizationPercentage: 703. Installez le chart
helm install mnemom-gateway mnemom/gateway \ -f values.yaml \ -n mnemom --create-namespace
4. Vérifiez le déploiement
kubectl get pods -n mnemom kubectl logs -f deployment/mnemom-gateway -n mnemom
Référence de configuration
Tout ce que la passerelle lit depuis l'environnement. Seuls la licence et l'organisation sont requis ; le reste a des défauts raisonnables.
| Variable | Requis | Description |
|---|---|---|
| MNEMOM_LICENSE_JWT | Requis | JWT signé qui autorise cette passerelle à appeler la control plane Mnemom. |
| MNEMOM_ORG_ID | Requis | UUID de votre organisation Mnemom. Lie cette passerelle à votre tenant. |
| GATEWAY_PORT | Optionnel | Port d'écoute de la passerelle. 8080 par défaut. |
| GATEWAY_HOST | Optionnel | Adresse de bind de la passerelle. 0.0.0.0 par défaut. |
| MNEMOM_API_URL | Optionnel | URL de la control plane Mnemom. À changer uniquement pour les miroirs air-gapped. |
| OPENAI_API_KEY | Optionnel | Clé OpenAI optionnelle si la passerelle fait proxy sur OpenAI. |
| ANTHROPIC_API_KEY | Optionnel | Clé Anthropic optionnelle si la passerelle fait proxy sur Claude. |
| MNEMOM_REGION | Optionnel | Étiquette de région utilisée dans les verdicts et la télémétrie (ex. us-east-1). |
| LOG_LEVEL | Optionnel | debug | info | warn | error. info par défaut. |
| TLS_CERT_PATH | Optionnel | Chemin absolu vers le certificat TLS si la passerelle termine le TLS localement. |
| TLS_KEY_PATH | Optionnel | Chemin absolu vers la clé TLS correspondant à TLS_CERT_PATH. |
| HEARTBEAT_INTERVAL_S | Optionnel | Intervalle de heartbeat en secondes. 30 par défaut. |
| MAX_CONCURRENT_CHECKS | Optionnel | Borne supérieure sur les contrôles d'intégrité concurrents. 256 par défaut. |
Managé vs auto-hébergé
| Fonctionnalité | Managé | Auto-hébergé |
|---|---|---|
| Infrastructure | Hébergé par Mnemom sur Cloudflare Workers. | Docker ou Kubernetes dans votre périmètre. |
| Routage LLM | Via la sortie Mnemom (observable, auditable). | Directement depuis votre réseau vers le fournisseur LLM. |
| Temps d'installation | Moins de 5 minutes. | Environ 30 minutes pour Docker ; 1–2 heures pour Helm. |
| Scaling | Automatique. | Vous contrôlez l'autoscaler ; le chart Helm fournit des défauts sensés. |
| Tableau de bord | app.mnemom.ai. | app.mnemom.ai (lit la télémétrie de votre passerelle). |
| Contrôles d'intégrité | Inclus. | Inclus, exécutés localement. |
| Détection de drift | Inclus. | Inclus, exécutés localement. |
| Résidence des données | Régions US, UE. | Où que vous déployiez — entièrement sous votre contrôle. |
| Air-gapped / hors-ligne | Non pris en charge. | Pris en charge sur Enterprise. |
| Routage de modèle auto-géré | Limité. | Complet — tout fournisseur LLM ou modèle on-prem. |
| SLA | 99,9 % standard ; custom sur Enterprise. | Vous détenez le SLA ; nous supportons la passerelle. |
| Offre requise | Toutes les offres. | Enterprise uniquement. |
FAQ
Prêt à déployer ?
L'auto-hébergement est une fonctionnalité du palier Enterprise. Parlez-nous de votre environnement et nous vous enverrons la licence et les values Helm adaptées.
