Auto-hébergé

Passerelle auto-hébergée.

Déployez la passerelle Mnemom sur votre propre infrastructure. Vos données, prompts et arguments d'outils ne quittent jamais votre réseau. Seuls le heartbeat, la télémétrie et les métadonnées de verdicts signés sont transmis à la control plane Mnemom.

Architecture

La passerelle auto-hébergée tourne dans votre réseau. Elle fait proxy sur les appels LLM, exécute les contrôles d'intégrité localement et envoie la télémétrie à la control plane Mnemom. Rien de sensible ne quitte votre périmètre.

  Your Infrastructure                          Mnemom Cloud
 +---------------------------+                +------------------+
 |                           |                |                  |
 |  +--------+   +--------+ |  heartbeat     |  Control Plane   |
 |  |  App   |-->|Gateway |--+--------------->|  (api.mnemom.ai) |
 |  +--------+   +--------+ |  telemetry     |                  |
 |               |   |       |                |  Dashboard       |
 |               v   v       |                |  Alerts          |
 |          +------+ +-----+ |                |  Fleet Mgmt      |
 |          | AIP  | | LLM | |                +------------------+
 |          |Check | |Proxy | |
 |          +------+ +-----+ |
 |                   |       |
 +---------------------------+
                     |
                     v
              LLM Providers
          (OpenAI, Anthropic, etc.)

Reste à l'intérieur de votre réseau

- Prompts, arguments d'outils et réponses des LLM.
- Données clients, PII et payloads réglementés.
- Alignment Cards, hashes de cards et chaînes de preuves.
- Identifiants des fournisseurs de LLM (OpenAI, Anthropic, etc.).

Envoyé à la control plane

- Heartbeat et métadonnées de version (toutes les 30 s).
- Résumés de verdicts signés — étiquettes, pas contenu.
- Compteurs de télémétrie et statistiques d'anomalies.
- Données de calibration du Trust Rating (scores, pas traces).

Démarrage rapide — Docker Compose

Le moyen le plus rapide d'essayer la passerelle. Démarrez-la, pointez votre agent vers elle et vérifiez un contrôle d'intégrité signé en moins de cinq minutes.

1. Créez votre fichier .env

Déposez le JWT de licence et l'ID d'organisation que nous vous avons envoyés dans un fichier .env à côté du fichier compose. Tout le reste est optionnel.

2. Créez docker-compose.yml

version: "3.8"

services:
  gateway:
    image: ghcr.io/mnemom/gateway:latest
    container_name: mnemom-gateway
    restart: unless-stopped
    ports:
      - "${GATEWAY_PORT:-8080}:8080"
    env_file:
      - .env
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 10s
    volumes:
      - gateway-data:/data

volumes:
  gateway-data:

3. Démarrez la passerelle

docker compose up -d
docker compose logs -f gateway

4. Vérifiez qu'elle est en bonne santé

curl http://localhost:8080/health
# Expected: {"status":"ok","version":"1.x.x"}

Production — Helm

Pour les déploiements Kubernetes en production, le chart Helm est le chemin supporté. TLS, ingress, autoscaling et limites de ressources sont first-class.

1. Ajoutez le dépôt Helm

helm repo add mnemom https://charts.mnemom.ai
helm repo update

2. Rédigez votre values.yaml

# values.yaml
replicaCount: 2

gateway:
  licenseJwt: "<YOUR_LICENSE_JWT>"
  orgId: "<YOUR_ORG_ID>"
  region: "us-east-1"

resources:
  requests:
    memory: "512Mi"
    cpu: "250m"
  limits:
    memory: "2Gi"
    cpu: "1000m"

ingress:
  enabled: true
  className: nginx
  hosts:
    - host: gateway.internal.example.com
      paths:
        - path: /
          pathType: Prefix
  tls:
    - secretName: gateway-tls
      hosts:
        - gateway.internal.example.com

autoscaling:
  enabled: true
  minReplicas: 2
  maxReplicas: 10
  targetCPUUtilizationPercentage: 70

3. Installez le chart

helm install mnemom-gateway mnemom/gateway \
  -f values.yaml \
  -n mnemom --create-namespace

4. Vérifiez le déploiement

kubectl get pods -n mnemom
kubectl logs -f deployment/mnemom-gateway -n mnemom

Référence de configuration

Tout ce que la passerelle lit depuis l'environnement. Seuls la licence et l'organisation sont requis ; le reste a des défauts raisonnables.

Variable	Requis	Description
MNEMOM_LICENSE_JWT	Requis	JWT signé qui autorise cette passerelle à appeler la control plane Mnemom.
MNEMOM_ORG_ID	Requis	UUID de votre organisation Mnemom. Lie cette passerelle à votre tenant.
GATEWAY_PORT	Optionnel	Port d'écoute de la passerelle. 8080 par défaut.
GATEWAY_HOST	Optionnel	Adresse de bind de la passerelle. 0.0.0.0 par défaut.
MNEMOM_API_URL	Optionnel	URL de la control plane Mnemom. À changer uniquement pour les miroirs air-gapped.
OPENAI_API_KEY	Optionnel	Clé OpenAI optionnelle si la passerelle fait proxy sur OpenAI.
ANTHROPIC_API_KEY	Optionnel	Clé Anthropic optionnelle si la passerelle fait proxy sur Claude.
MNEMOM_REGION	Optionnel	Étiquette de région utilisée dans les verdicts et la télémétrie (ex. us-east-1).
LOG_LEVEL	Optionnel	debug \| info \| warn \| error. info par défaut.
TLS_CERT_PATH	Optionnel	Chemin absolu vers le certificat TLS si la passerelle termine le TLS localement.
TLS_KEY_PATH	Optionnel	Chemin absolu vers la clé TLS correspondant à TLS_CERT_PATH.
HEARTBEAT_INTERVAL_S	Optionnel	Intervalle de heartbeat en secondes. 30 par défaut.
MAX_CONCURRENT_CHECKS	Optionnel	Borne supérieure sur les contrôles d'intégrité concurrents. 256 par défaut.

Managé vs auto-hébergé

Fonctionnalité	Managé	Auto-hébergé
Infrastructure	Hébergé par Mnemom sur Cloudflare Workers.	Docker ou Kubernetes dans votre périmètre.
Routage LLM	Via la sortie Mnemom (observable, auditable).	Directement depuis votre réseau vers le fournisseur LLM.
Temps d'installation	Moins de 5 minutes.	Environ 30 minutes pour Docker ; 1–2 heures pour Helm.
Scaling	Automatique.	Vous contrôlez l'autoscaler ; le chart Helm fournit des défauts sensés.
Tableau de bord	app.mnemom.ai.	app.mnemom.ai (lit la télémétrie de votre passerelle).
Contrôles d'intégrité	Inclus.	Inclus, exécutés localement.
Détection de drift	Inclus.	Inclus, exécutés localement.
Résidence des données	Régions US, UE.	Où que vous déployiez — entièrement sous votre contrôle.
Air-gapped / hors-ligne	Non pris en charge.	Pris en charge sur Enterprise.
Routage de modèle auto-géré	Limité.	Complet — tout fournisseur LLM ou modèle on-prem.
SLA	99,9 % standard ; custom sur Enterprise.	Vous détenez le SLA ; nous supportons la passerelle.
Offre requise	Toutes les offres.	Enterprise uniquement.

FAQ

Prêt à déployer ?

L'auto-hébergement est une fonctionnalité du palier Enterprise. Parlez-nous de votre environnement et nous vous enverrons la licence et les values Helm adaptées.