Self-Hosted Gateway.
Deployen Sie das Mnemom-Gateway auf Ihrer eigenen Infrastruktur. Ihre Daten, Prompts und Tool-Argumente verlassen Ihr Netzwerk nie. Nur Heartbeat, Telemetrie und signierte Verdict-Metadaten fließen zur Mnemom Control Plane.
Architektur
Das Self-Hosted Gateway läuft in Ihrem Netzwerk. Es proxyt LLM-Calls, führt Integrity Checks lokal aus und streamt Telemetrie zur Mnemom Control Plane zurück. Nichts Sensitives verlässt Ihren Perimeter.
Your Infrastructure Mnemom Cloud
+---------------------------+ +------------------+
| | | |
| +--------+ +--------+ | heartbeat | Control Plane |
| | App |-->|Gateway |--+--------------->| (api.mnemom.ai) |
| +--------+ +--------+ | telemetry | |
| | | | | Dashboard |
| v v | | Alerts |
| +------+ +-----+ | | Fleet Mgmt |
| | AIP | | LLM | | +------------------+
| |Check | |Proxy | |
| +------+ +-----+ |
| | |
+---------------------------+
|
v
LLM Providers
(OpenAI, Anthropic, etc.)Bleibt in Ihrem Netzwerk
- - Prompts, Tool-Argumente und LLM-Responses.
- - Kundendaten, PII und regulierte Payloads.
- - Alignment Cards, Card-Hashes und Proof-Chains.
- - Credentials der LLM-Provider (OpenAI, Anthropic usw.).
An die Control Plane gesendet
- - Heartbeat und Versions-Metadaten (alle 30 Sekunden).
- - Zusammenfassungen signierter Verdicts — Labels, kein Content.
- - Telemetrie-Counter und Anomalie-Statistiken.
- - Kalibrierungsdaten für das Trust Rating (Scores, keine Traces).
Quickstart — Docker Compose
Der schnellste Weg, das Gateway zu testen. Hochfahren, Agent draufzeigen, signierten Integrity Check in unter fünf Minuten verifizieren.
1. Legen Sie Ihre .env-Datei an
Legen Sie das von uns gesendete Lizenz-JWT und die Org-ID in eine Datei .env neben die Compose-Datei. Alles andere ist optional.
2. Legen Sie docker-compose.yml an
version: "3.8"
services:
gateway:
image: ghcr.io/mnemom/gateway:latest
container_name: mnemom-gateway
restart: unless-stopped
ports:
- "${GATEWAY_PORT:-8080}:8080"
env_file:
- .env
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
interval: 30s
timeout: 10s
retries: 3
start_period: 10s
volumes:
- gateway-data:/data
volumes:
gateway-data:3. Starten Sie das Gateway
docker compose up -d docker compose logs -f gateway
4. Prüfen Sie, dass es gesund ist
curl http://localhost:8080/health
# Expected: {"status":"ok","version":"1.x.x"}Produktion — Helm
Für Kubernetes-Produktions-Deployments ist der Helm-Chart der unterstützte Pfad. TLS, Ingress, Autoscaling und Resource-Limits sind First-Class.
1. Fügen Sie das Helm-Repo hinzu
helm repo add mnemom https://charts.mnemom.ai helm repo update
2. Schreiben Sie Ihre values.yaml
# values.yaml
replicaCount: 2
gateway:
licenseJwt: "<YOUR_LICENSE_JWT>"
orgId: "<YOUR_ORG_ID>"
region: "us-east-1"
resources:
requests:
memory: "512Mi"
cpu: "250m"
limits:
memory: "2Gi"
cpu: "1000m"
ingress:
enabled: true
className: nginx
hosts:
- host: gateway.internal.example.com
paths:
- path: /
pathType: Prefix
tls:
- secretName: gateway-tls
hosts:
- gateway.internal.example.com
autoscaling:
enabled: true
minReplicas: 2
maxReplicas: 10
targetCPUUtilizationPercentage: 703. Installieren Sie den Chart
helm install mnemom-gateway mnemom/gateway \ -f values.yaml \ -n mnemom --create-namespace
4. Prüfen Sie das Rollout
kubectl get pods -n mnemom kubectl logs -f deployment/mnemom-gateway -n mnemom
Konfigurationsreferenz
Alles, was das Gateway aus der Umgebung liest. Nur Lizenz und Org sind Pflicht; der Rest hat sinnvolle Defaults.
| Variable | Pflicht | Beschreibung |
|---|---|---|
| MNEMOM_LICENSE_JWT | Pflicht | Signiertes JWT, das dieses Gateway berechtigt, die Mnemom Control Plane aufzurufen. |
| MNEMOM_ORG_ID | Pflicht | UUID Ihrer Mnemom-Organisation. Bindet dieses Gateway an Ihren Tenant. |
| GATEWAY_PORT | Optional | Port, auf dem das Gateway lauscht. Default 8080. |
| GATEWAY_HOST | Optional | Bind-Adresse des Gateways. Default 0.0.0.0. |
| MNEMOM_API_URL | Optional | URL der Mnemom Control Plane. Nur für Air-Gapped-Spiegel ändern. |
| OPENAI_API_KEY | Optional | Optionaler OpenAI-Key, falls das Gateway OpenAI-Calls proxyt. |
| ANTHROPIC_API_KEY | Optional | Optionaler Anthropic-Key, falls das Gateway Claude-Calls proxyt. |
| MNEMOM_REGION | Optional | Region-Label für Verdicts und Telemetrie (z. B. us-east-1). |
| LOG_LEVEL | Optional | debug | info | warn | error. Default info. |
| TLS_CERT_PATH | Optional | Absoluter Pfad zum TLS-Zertifikat, wenn das Gateway TLS lokal terminiert. |
| TLS_KEY_PATH | Optional | Absoluter Pfad zum TLS-Key passend zu TLS_CERT_PATH. |
| HEARTBEAT_INTERVAL_S | Optional | Heartbeat-Intervall in Sekunden. Default 30. |
| MAX_CONCURRENT_CHECKS | Optional | Obergrenze an parallelen Integrity Checks. Default 256. |
Managed vs Self-Hosted
| Feature | Managed | Self-Hosted |
|---|---|---|
| Infrastruktur | Von Mnemom auf Cloudflare Workers gehostet. | Docker oder Kubernetes in Ihrem Perimeter. |
| LLM-Routing | Über den Mnemom-Egress (observable, auditierbar). | Direkt aus Ihrem Netzwerk zum LLM-Provider. |
| Installationszeit | Unter 5 Minuten. | Ca. 30 Minuten für Docker; 1–2 Stunden für Helm. |
| Scaling | Automatisch. | Sie steuern den Autoscaler; der Helm-Chart bringt sinnvolle Defaults. |
| Dashboard | app.mnemom.ai. | app.mnemom.ai (liest die Telemetrie Ihres Gateways). |
| Integrity Checks | Enthalten. | Enthalten, lokal ausgeführt. |
| Drift Detection | Enthalten. | Enthalten, lokal ausgeführt. |
| Datenresidenz | US- und EU-Regionen. | Wo immer Sie deployen — vollständig unter Ihrer Kontrolle. |
| Air-Gapped / Offline | Nicht unterstützt. | Auf Enterprise unterstützt. |
| Selbstverwaltetes Modell-Routing | Eingeschränkt. | Voll — jeder LLM-Provider oder On-Prem-Modell. |
| SLA | 99,9 % Standard; individuell auf Enterprise. | Sie halten das SLA; wir supporten das Gateway. |
| Erforderlicher Plan | Alle Pläne. | Nur Enterprise. |
FAQ
Bereit zum Deployen?
Self-Hosted ist ein Enterprise-Tier-Feature. Erzählen Sie uns von Ihrer Umgebung und wir senden Ihnen Lizenz und passende Helm-Values.
