KB
Plattform-Berater
Architektur · Compliance · Sicherheit · Operations
🛠️ Baumeister
CEO · Strategie
CFO · Kosten
Datenschutz
Security
IT-Leitung
Compliance
Allgemein
NVIDIA-DGX-HARDWARE · 4× GB10 CLUSTER · DEUTSCHLAND

Souveräne KI-Plattform.
Made in Germany.

Eine adaptierbare Enterprise-KI-Plattform-Grundlage auf eigener NVIDIA-DGX-Hardware. Vier GB10-Knoten clustered, ergänzt um eine wachsende Schicht aus autonomen Agenten und Standard-Frameworks für die häufigsten Branchen-Use-Cases. Eigene Evidence, eigene Guardrails, volle Kontrolle. 7 lokale Modelle plus 559+ Modelle über OpenRouter — mit Vorrang auf EU-Datenverarbeitung.

DSGVO & EU-AI-Act
21 CFR Part 11
ALCOA+ Integrität
Frozen Models
Eigene Guardrails
Multi-Tenant
Open-Source-Stack
0× GB10
DGX-Cluster
0 + 559
LiteLLM · Lokal · Cloud
0 Live
Container · Healthy
0 Wellen
Roadmap · 11 LIVE
0 Controls
Engineering · GDPR/EU-AI-Act
0%
Souverän · Made in Germany

Wir haben einen Plan.
Und der ist sauber durchdacht.

Diese Plattform vereint, was sonst auf 25+ SaaS-Verträge, 5+ Cloud-Provider und mehrere Datenschutz-Risiken verteilt wäre — als geschlossener, regulatorisch verteidigbarer Stack auf eigener Hardware. Jede Komponente bewusst gewählt, jede Datenflusskante dokumentiert, jede Modell-Version eingefroren. Was so entsteht, ist keine zusammengewürfelte Installation, sondern ein verteidigbares System mit nachvollziehbarer Architektur — vom ersten Prompt bis zum letzten Audit-Log.

01
Souveränität
Vier NVIDIA-DGX-GB10-Knoten clustered in Deutschland. Kein US-Cloud-Provider hat physischen Zugriff. Keine Drittland-Übermittlung. Privacy-by-Design auf Hardware-Ebene.
02
Kontrollierte Intelligenz
7 Modelle laufen permanent auf eigenen GPUs. Über LiteLLM optional Zugriff auf 559+ OpenRouter-Modelle — mit explizitem EU-First-Routing als Default-Regel.
03
Eigene Evidence
Jeder Prompt, jede Antwort, jede Latenz, jede Modell-Version, jede Konfig-Änderung — protokolliert in Langfuse, pgaudit, GitOps-Commit-Historie. Externe Auditoren können jeden Pfad rekonstruieren.
04
Eigene Guardrails
NeMo Guardrails plus Custom-Rules legen fest, was Agenten dürfen — und was nicht. Prompts sind validierter Zustand (Änderung nur via SOP). Letztverantwortung beim Menschen.

Vier GB10-Knoten.
Eine Plattform.

Die produktive Infrastruktur besteht aus vier vernetzten NVIDIA-DGX-GB10-Knoten. Workloads über die Cluster-Knoten verteilt, GPU-Pooling transparent für die Apps, Modelle konsolidiert geladen. Cluster-interne Kommunikation privat — externer Zugriff ausschließlich über den Cloudflare-Tunnel auf öffentliche Service-Endpoints.

N-01 spark-prod-01 N-02 spark-prod-02 N-03 spark-prod-03 N-04 spark-prod-04 CLUSTER 4 × GB10
GPU-Pool (gesamt)4 × GB10 · ARM64
Lokale Modelle7 permanent geladen
Cluster-Networkprivat, mTLS
Externer ZugriffCloudflare-Tunnel · QUIC
SpeicherMinIO WORM · S3-API
Backuprestic · täglich

Alle Komponenten.
Eine Mosaik.

Schneller Überblick über jede produktive Komponente — Hover für Detail, Click navigiert zur App. Live-Status der Service-Pulse über jedem Tile.

Vier Schichten. 50+ Services. Eine Identität.

Jede App hat ihren spezifischen Job. Alle teilen sich Identity (Keycloak), LLM-Gateway (LiteLLM), GPU-Pool (Cluster), S3-Storage (MinIO). Single Sign-On überall. Jede Karte verlinkt zur Anwendung selbst und zur Endanwender-Anleitung.

// LLM & InferenzSprache · Vision · Embeddings
// Apps & WorkflowsAnwendungs-Logik & Automation
// Daten & OrchestrierungDatenplattform & Katalog
// Identity, Storage & ComplianceDatenfundament & Vertrauensschicht

Autonome Agenten als zweite Plattform-Ebene.

Über dem App-Stack legen wir eine Schicht aus spezialisierten KI-Agenten — jeder mit eingegrenzter Aufgabe, jeder in eigener Sandbox, jeder auditierbar. Eine Plattform, die nicht nur reagiert, sondern proaktiv überwacht, optimiert und schützt.

Strategie-Transformation als App-Suite.

Eine bewährte Beratungs-Methodik aus 30 Jahren Praxis — übersetzt in vier intelligente Tools auf der Plattform. Skalierbare Exzellenz durch die Verbindung von Mensch und KI.

KPI-getriebene Steuerung.
KI-gestützt, messbar, sofort einsatzbereit.

Eine integrierte Enterprise-Plattform für datengetriebene Unternehmenssteuerung — 12 Module, 80+ KPIs, 50+ KI-Use-Cases. Bewährtes 6-Phasen-Workshop-Modell. Integriert in den Plattform-Stack: nutzt eigene Modelle, eigene Daten, eigene Guardrails.

LIVE · DASHBOARD
Q4-2026
EBIT-Marge14,3 % ▲
Personalkosten-Quote+2,1 % ⚠
Auftrags-Durchlauf−6,4 d ▼
Cash-Conversion-Cycle38 d
KI-Adoption71 / 100
KI-Insight — Personalkostenquote +2,1 % über Ziel. Empfehlung: Prozess-Automatisierung in Phase 3 prüfen, geschätzter Effekt −1,4 % bei 8 Wochen Implementierung.

Compliance ist kein Anbau.
Sie ist die Architektur.

Regulatorische Einhaltung wird nicht durch Vertragsklauseln erreicht, sondern durch technische Maßnahmen in der Architektur. Jede Zeile entspricht einem konkreten Kontroll-Punkt für DSGVO, EU-AI-Act, ALCOA+, 21 CFR Part 11 und ISO-27001.

KomponenteTechnologieKonfiguration & UmsetzungRegulatorik-Fokus
InfrastrukturDocker ComposeVerbot von :latest-Tags. Fixe Hashes. Immutable Container-States.Reproduzierbarkeit · Prod = Q-System
Security / IPSCrowdSec / TraefikLückenloses Logging. Anbindung an Keycloak-Logs. Zero-Trust TLS 1.3.Datenintegrität am Netzwerkrand
Image-SicherheitDocker Trust / TrivyKryptografische Signierung. Automatisierte CVE-Scans in CI/CD.Sichere Supply-Chain · Anti-Malware
DatenbankPostgreSQLEinsatz von pgaudit. Strikte Trennung von Volumes & Containern.Anti-Tampering durch Admins
Speicher (WORM)MinIOObject Versioning + Object Lock im Compliance-Modus.ALCOA+ · Unveränderbarkeit
Auth (RBAC)Entra ID / KeycloakSegregation of Duties. Trennung IT-Support ↔ Auditoren.21 CFR Part 11
KI-Gateway / DLPLiteLLM / PresidioFrozen-Model-Prinzip. Pre-Call-Hooks zur PII/PHI-Maskierung.DSGVO · DLP at Gateway
TracingLangfuseTracing maskierter Prompts, Modell-Parameter, exakter Versionen.Audit-Trail · Rekonstruktion
Agenten-LogikDify / n8nWorkflow-Versioning. Human-in-the-Loop bei kritischen Schritten.Letztverantwortung Mensch
Semantik / GuardNeMo GuardrailsStrikte Erlaubnispfade. Prompt = validierter Zustand (SOP).Prävention Halluzinationen
Modell-GovernancePrometheus / GrafanaDrift-Metrik-Überwachung. Change-Control bei Retraining.Model-Lifecycle-Control
DokumentationGit / MkDocsDeployment-YAMLs & Specs in versioniertem Repo.CSV-Doku · Change-Mgmt
Testen (OQ/PQ)Cucumber (BDD)Automatisierte Tests in ephemeren Containern vor Prod-Freigabe.Spezifikations-Konformität

Wo wir stehen.
Wohin es geht.

Die Plattform ist live und produktiv. Die nächsten Wellen erweitern sie um klassisches ML, Compliance-Automation und autonome Security-Agents.

WELLE 0–2
Foundation
Bootstrap · Backup · Multi-Tenancy
WELLE 3
Hub
Public Pages · GitOps
WELLE 4
Core Apps
Open-WebUI · LiteLLM · n8n
WELLE 5
Identity
Keycloak · Multi-Realm
WELLE 6
Storage + Trace
MinIO · Langfuse · Dify
WELLE 13
ML + ELT (LIVE)
h2o-3 ARM64 Custom-Build · Meltano · 600+ Konnektoren
WELLE 8
Security-Agents
CrowdSec · Trivy · NeMo
WELLE 9–12
Compliance
21 CFR · ALCOA+ · Audit