Auto-hébergé

    Passerelle auto-hébergée.

    Déployez la passerelle Mnemom sur votre propre infrastructure. Vos données, prompts et arguments d'outils ne quittent jamais votre réseau. Seuls le heartbeat, la télémétrie et les métadonnées de verdicts signés sont transmis à la control plane Mnemom.

    Architecture

    La passerelle auto-hébergée tourne dans votre réseau. Elle fait proxy sur les appels LLM, exécute les contrôles d'intégrité localement et envoie la télémétrie à la control plane Mnemom. Rien de sensible ne quitte votre périmètre.

      Your Infrastructure                          Mnemom Cloud
     +---------------------------+                +------------------+
     |                           |                |                  |
     |  +--------+   +--------+ |  heartbeat     |  Control Plane   |
     |  |  App   |-->|Gateway |--+--------------->|  (api.mnemom.ai) |
     |  +--------+   +--------+ |  telemetry     |                  |
     |               |   |       |                |  Dashboard       |
     |               v   v       |                |  Alerts          |
     |          +------+ +-----+ |                |  Fleet Mgmt      |
     |          | AIP  | | LLM | |                +------------------+
     |          |Check | |Proxy | |
     |          +------+ +-----+ |
     |                   |       |
     +---------------------------+
                         |
                         v
                  LLM Providers
              (OpenAI, Anthropic, etc.)

    Reste à l'intérieur de votre réseau

    • - Prompts, arguments d'outils et réponses des LLM.
    • - Données clients, PII et payloads réglementés.
    • - Alignment Cards, hashes de cards et chaînes de preuves.
    • - Identifiants des fournisseurs de LLM (OpenAI, Anthropic, etc.).

    Envoyé à la control plane

    • - Heartbeat et métadonnées de version (toutes les 30 s).
    • - Résumés de verdicts signés — étiquettes, pas contenu.
    • - Compteurs de télémétrie et statistiques d'anomalies.
    • - Données de calibration du Trust Rating (scores, pas traces).

    Démarrage rapide — Docker Compose

    Le moyen le plus rapide d'essayer la passerelle. Démarrez-la, pointez votre agent vers elle et vérifiez un contrôle d'intégrité signé en moins de cinq minutes.

    1. Créez votre fichier .env

    Déposez le JWT de licence et l'ID d'organisation que nous vous avons envoyés dans un fichier .env à côté du fichier compose. Tout le reste est optionnel.

    2. Créez docker-compose.yml

    version: "3.8"
    
    services:
      gateway:
        image: ghcr.io/mnemom/gateway:latest
        container_name: mnemom-gateway
        restart: unless-stopped
        ports:
          - "${GATEWAY_PORT:-8080}:8080"
        env_file:
          - .env
        healthcheck:
          test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
          interval: 30s
          timeout: 10s
          retries: 3
          start_period: 10s
        volumes:
          - gateway-data:/data
    
    volumes:
      gateway-data:

    3. Démarrez la passerelle

    docker compose up -d
    docker compose logs -f gateway

    4. Vérifiez qu'elle est en bonne santé

    curl http://localhost:8080/health
    # Expected: {"status":"ok","version":"1.x.x"}

    Production — Helm

    Pour les déploiements Kubernetes en production, le chart Helm est le chemin supporté. TLS, ingress, autoscaling et limites de ressources sont first-class.

    1. Ajoutez le dépôt Helm

    helm repo add mnemom https://charts.mnemom.ai
    helm repo update

    2. Rédigez votre values.yaml

    # values.yaml
    replicaCount: 2
    
    gateway:
      licenseJwt: "<YOUR_LICENSE_JWT>"
      orgId: "<YOUR_ORG_ID>"
      region: "us-east-1"
    
    resources:
      requests:
        memory: "512Mi"
        cpu: "250m"
      limits:
        memory: "2Gi"
        cpu: "1000m"
    
    ingress:
      enabled: true
      className: nginx
      hosts:
        - host: gateway.internal.example.com
          paths:
            - path: /
              pathType: Prefix
      tls:
        - secretName: gateway-tls
          hosts:
            - gateway.internal.example.com
    
    autoscaling:
      enabled: true
      minReplicas: 2
      maxReplicas: 10
      targetCPUUtilizationPercentage: 70

    3. Installez le chart

    helm install mnemom-gateway mnemom/gateway \
      -f values.yaml \
      -n mnemom --create-namespace

    4. Vérifiez le déploiement

    kubectl get pods -n mnemom
    kubectl logs -f deployment/mnemom-gateway -n mnemom

    Référence de configuration

    Tout ce que la passerelle lit depuis l'environnement. Seuls la licence et l'organisation sont requis ; le reste a des défauts raisonnables.

    VariableRequisDescription
    MNEMOM_LICENSE_JWT
    Requis
    JWT signé qui autorise cette passerelle à appeler la control plane Mnemom.
    MNEMOM_ORG_ID
    Requis
    UUID de votre organisation Mnemom. Lie cette passerelle à votre tenant.
    GATEWAY_PORTOptionnelPort d'écoute de la passerelle. 8080 par défaut.
    GATEWAY_HOSTOptionnelAdresse de bind de la passerelle. 0.0.0.0 par défaut.
    MNEMOM_API_URLOptionnelURL de la control plane Mnemom. À changer uniquement pour les miroirs air-gapped.
    OPENAI_API_KEYOptionnelClé OpenAI optionnelle si la passerelle fait proxy sur OpenAI.
    ANTHROPIC_API_KEYOptionnelClé Anthropic optionnelle si la passerelle fait proxy sur Claude.
    MNEMOM_REGIONOptionnelÉtiquette de région utilisée dans les verdicts et la télémétrie (ex. us-east-1).
    LOG_LEVELOptionneldebug | info | warn | error. info par défaut.
    TLS_CERT_PATHOptionnelChemin absolu vers le certificat TLS si la passerelle termine le TLS localement.
    TLS_KEY_PATHOptionnelChemin absolu vers la clé TLS correspondant à TLS_CERT_PATH.
    HEARTBEAT_INTERVAL_SOptionnelIntervalle de heartbeat en secondes. 30 par défaut.
    MAX_CONCURRENT_CHECKSOptionnelBorne supérieure sur les contrôles d'intégrité concurrents. 256 par défaut.

    Managé vs auto-hébergé

    FonctionnalitéManagéAuto-hébergé
    InfrastructureHébergé par Mnemom sur Cloudflare Workers.Docker ou Kubernetes dans votre périmètre.
    Routage LLMVia la sortie Mnemom (observable, auditable).Directement depuis votre réseau vers le fournisseur LLM.
    Temps d'installationMoins de 5 minutes.Environ 30 minutes pour Docker ; 1–2 heures pour Helm.
    ScalingAutomatique.Vous contrôlez l'autoscaler ; le chart Helm fournit des défauts sensés.
    Tableau de bordapp.mnemom.ai.app.mnemom.ai (lit la télémétrie de votre passerelle).
    Contrôles d'intégritéInclus.Inclus, exécutés localement.
    Détection de driftInclus.Inclus, exécutés localement.
    Résidence des donnéesRégions US, UE.Où que vous déployiez — entièrement sous votre contrôle.
    Air-gapped / hors-ligneNon pris en charge.Pris en charge sur Enterprise.
    Routage de modèle auto-géréLimité.Complet — tout fournisseur LLM ou modèle on-prem.
    SLA99,9 % standard ; custom sur Enterprise.Vous détenez le SLA ; nous supportons la passerelle.
    Offre requiseToutes les offres.Enterprise uniquement.

    FAQ

    Prêt à déployer ?

    L'auto-hébergement est une fonctionnalité du palier Enterprise. Parlez-nous de votre environnement et nous vous enverrons la licence et les values Helm adaptées.

    Featured on There's An AI For That