Self-Hosted

    Self-Hosted Gateway.

    Deployen Sie das Mnemom-Gateway auf Ihrer eigenen Infrastruktur. Ihre Daten, Prompts und Tool-Argumente verlassen Ihr Netzwerk nie. Nur Heartbeat, Telemetrie und signierte Verdict-Metadaten fließen zur Mnemom Control Plane.

    Architektur

    Das Self-Hosted Gateway läuft in Ihrem Netzwerk. Es proxyt LLM-Calls, führt Integrity Checks lokal aus und streamt Telemetrie zur Mnemom Control Plane zurück. Nichts Sensitives verlässt Ihren Perimeter.

      Your Infrastructure                          Mnemom Cloud
     +---------------------------+                +------------------+
     |                           |                |                  |
     |  +--------+   +--------+ |  heartbeat     |  Control Plane   |
     |  |  App   |-->|Gateway |--+--------------->|  (api.mnemom.ai) |
     |  +--------+   +--------+ |  telemetry     |                  |
     |               |   |       |                |  Dashboard       |
     |               v   v       |                |  Alerts          |
     |          +------+ +-----+ |                |  Fleet Mgmt      |
     |          | AIP  | | LLM | |                +------------------+
     |          |Check | |Proxy | |
     |          +------+ +-----+ |
     |                   |       |
     +---------------------------+
                         |
                         v
                  LLM Providers
              (OpenAI, Anthropic, etc.)

    Bleibt in Ihrem Netzwerk

    • - Prompts, Tool-Argumente und LLM-Responses.
    • - Kundendaten, PII und regulierte Payloads.
    • - Alignment Cards, Card-Hashes und Proof-Chains.
    • - Credentials der LLM-Provider (OpenAI, Anthropic usw.).

    An die Control Plane gesendet

    • - Heartbeat und Versions-Metadaten (alle 30 Sekunden).
    • - Zusammenfassungen signierter Verdicts — Labels, kein Content.
    • - Telemetrie-Counter und Anomalie-Statistiken.
    • - Kalibrierungsdaten für das Trust Rating (Scores, keine Traces).

    Quickstart — Docker Compose

    Der schnellste Weg, das Gateway zu testen. Hochfahren, Agent draufzeigen, signierten Integrity Check in unter fünf Minuten verifizieren.

    1. Legen Sie Ihre .env-Datei an

    Legen Sie das von uns gesendete Lizenz-JWT und die Org-ID in eine Datei .env neben die Compose-Datei. Alles andere ist optional.

    2. Legen Sie docker-compose.yml an

    version: "3.8"
    
    services:
      gateway:
        image: ghcr.io/mnemom/gateway:latest
        container_name: mnemom-gateway
        restart: unless-stopped
        ports:
          - "${GATEWAY_PORT:-8080}:8080"
        env_file:
          - .env
        healthcheck:
          test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
          interval: 30s
          timeout: 10s
          retries: 3
          start_period: 10s
        volumes:
          - gateway-data:/data
    
    volumes:
      gateway-data:

    3. Starten Sie das Gateway

    docker compose up -d
    docker compose logs -f gateway

    4. Prüfen Sie, dass es gesund ist

    curl http://localhost:8080/health
    # Expected: {"status":"ok","version":"1.x.x"}

    Produktion — Helm

    Für Kubernetes-Produktions-Deployments ist der Helm-Chart der unterstützte Pfad. TLS, Ingress, Autoscaling und Resource-Limits sind First-Class.

    1. Fügen Sie das Helm-Repo hinzu

    helm repo add mnemom https://charts.mnemom.ai
    helm repo update

    2. Schreiben Sie Ihre values.yaml

    # values.yaml
    replicaCount: 2
    
    gateway:
      licenseJwt: "<YOUR_LICENSE_JWT>"
      orgId: "<YOUR_ORG_ID>"
      region: "us-east-1"
    
    resources:
      requests:
        memory: "512Mi"
        cpu: "250m"
      limits:
        memory: "2Gi"
        cpu: "1000m"
    
    ingress:
      enabled: true
      className: nginx
      hosts:
        - host: gateway.internal.example.com
          paths:
            - path: /
              pathType: Prefix
      tls:
        - secretName: gateway-tls
          hosts:
            - gateway.internal.example.com
    
    autoscaling:
      enabled: true
      minReplicas: 2
      maxReplicas: 10
      targetCPUUtilizationPercentage: 70

    3. Installieren Sie den Chart

    helm install mnemom-gateway mnemom/gateway \
      -f values.yaml \
      -n mnemom --create-namespace

    4. Prüfen Sie das Rollout

    kubectl get pods -n mnemom
    kubectl logs -f deployment/mnemom-gateway -n mnemom

    Konfigurationsreferenz

    Alles, was das Gateway aus der Umgebung liest. Nur Lizenz und Org sind Pflicht; der Rest hat sinnvolle Defaults.

    VariablePflichtBeschreibung
    MNEMOM_LICENSE_JWT
    Pflicht
    Signiertes JWT, das dieses Gateway berechtigt, die Mnemom Control Plane aufzurufen.
    MNEMOM_ORG_ID
    Pflicht
    UUID Ihrer Mnemom-Organisation. Bindet dieses Gateway an Ihren Tenant.
    GATEWAY_PORTOptionalPort, auf dem das Gateway lauscht. Default 8080.
    GATEWAY_HOSTOptionalBind-Adresse des Gateways. Default 0.0.0.0.
    MNEMOM_API_URLOptionalURL der Mnemom Control Plane. Nur für Air-Gapped-Spiegel ändern.
    OPENAI_API_KEYOptionalOptionaler OpenAI-Key, falls das Gateway OpenAI-Calls proxyt.
    ANTHROPIC_API_KEYOptionalOptionaler Anthropic-Key, falls das Gateway Claude-Calls proxyt.
    MNEMOM_REGIONOptionalRegion-Label für Verdicts und Telemetrie (z. B. us-east-1).
    LOG_LEVELOptionaldebug | info | warn | error. Default info.
    TLS_CERT_PATHOptionalAbsoluter Pfad zum TLS-Zertifikat, wenn das Gateway TLS lokal terminiert.
    TLS_KEY_PATHOptionalAbsoluter Pfad zum TLS-Key passend zu TLS_CERT_PATH.
    HEARTBEAT_INTERVAL_SOptionalHeartbeat-Intervall in Sekunden. Default 30.
    MAX_CONCURRENT_CHECKSOptionalObergrenze an parallelen Integrity Checks. Default 256.

    Managed vs Self-Hosted

    FeatureManagedSelf-Hosted
    InfrastrukturVon Mnemom auf Cloudflare Workers gehostet.Docker oder Kubernetes in Ihrem Perimeter.
    LLM-RoutingÜber den Mnemom-Egress (observable, auditierbar).Direkt aus Ihrem Netzwerk zum LLM-Provider.
    InstallationszeitUnter 5 Minuten.Ca. 30 Minuten für Docker; 1–2 Stunden für Helm.
    ScalingAutomatisch.Sie steuern den Autoscaler; der Helm-Chart bringt sinnvolle Defaults.
    Dashboardapp.mnemom.ai.app.mnemom.ai (liest die Telemetrie Ihres Gateways).
    Integrity ChecksEnthalten.Enthalten, lokal ausgeführt.
    Drift DetectionEnthalten.Enthalten, lokal ausgeführt.
    DatenresidenzUS- und EU-Regionen.Wo immer Sie deployen — vollständig unter Ihrer Kontrolle.
    Air-Gapped / OfflineNicht unterstützt.Auf Enterprise unterstützt.
    Selbstverwaltetes Modell-RoutingEingeschränkt.Voll — jeder LLM-Provider oder On-Prem-Modell.
    SLA99,9 % Standard; individuell auf Enterprise.Sie halten das SLA; wir supporten das Gateway.
    Erforderlicher PlanAlle Pläne.Nur Enterprise.

    FAQ

    Bereit zum Deployen?

    Self-Hosted ist ein Enterprise-Tier-Feature. Erzählen Sie uns von Ihrer Umgebung und wir senden Ihnen Lizenz und passende Helm-Values.

    Featured on There's An AI For That