⚡ App Launchpad - alle 38+ Plattform-Apps an einem Ort -> ui.ben-e-fit.ai ×
🏛 NEU · Architektur-Walkthrough · Begehbares 4-Etagen-Gebäude · Laien ↔ Tech Toggle →
operative KI-Plattform — on-prem — multi-tenant

Beratung,
die denkt,
die handelt,
die belegt.

ben-e-fit.ai ist die operative Schicht zwischen Beraterin und Maschine. Jeder Prompt aktiviert ein Multi‑Agent‑System: persistentes Gedaechtnis, 200+ Skills, 60+ Tools, 7 CrewAI‑Crews, 10.000+ LLM‑Modelle über neun Provider (Anthropic, OpenAI, OpenRouter, Replicate, Together, Fireworks, Groq, Cerebras, Modal, RunPod, Vast, Ollama-local), 5 Federation-Bots (NemoClaw, OpenClaw, MarketClaw, SecClaw, DevClaw) — alles auf einem 4‑Node NVIDIA DGX SuperPOD (Grace Blackwell GB10), 100+ Worker-Replicas mit Auto-Scaling bis 1000, alles im eigenen Perimeter, alles mit Audit‑Trail. Cowork‑AI zentral, 24/7 Autonomous-Workers, Self-Healing & Self-Evolving. DSGVO‑konform. EU‑AI‑Act‑ready. ISO 27001 / NIS2 / BAFIN-faehig.

nemoclaw-v3 healthy openclaw-v1 autonom-mode cowork-ai zentral litellm 600+ models openrouter 300+ models ollama-local 15 models nvidia-nim 8 models claude-opus-4-7 direct tools 60/60 skills 200+ crews 7/7 memory letta + qdrant + neo4j vector-stack qdrant + milvus + weaviate searxng + tavily + perplexity ✓ audit_events append-only + sha256 presidio PII + DLP guardrails NeMo + LLM-Guard langfuse tracing restic 3-2-1-1-0 restored 4x autoheal ✓ self-evolving market-watcher 06:00 gitops-watcher 60s 3-node-cluster witness-SBC DSGVO + EU-AI-Act + ISO27001 + NIS2 3 autonom-worker 24/7 nemoclaw + openclaw federation self-trigger 6/h market-watch + audit + plan-update
00 · MOSAIK
Alle Komponenten.
Eine Mosaik.
Schneller Überblick über jede produktive Komponente — Hover für Detail, Click navigiert zur App. Live-Status der Service-Pulse über jedem Tile.
[ I · Plattformen ]
[ II · Monitoring ]
[ III · Daten ]
[ IV · Agenten ]
[ V · Impulse OS ]
[ VI · KPI Mining + VII · Konzept ]
04 · Plattformen12 Kategorien · 60+ Services · echte Subdomains

Eine offene Plattform-Schicht.
Best-of-Breed Open-Source — eigenständig deploybar, gemeinsam orchestriert.

Jede Plattform ist eigener Container, eigener Endpoint, eigene Subdomain. Multi-Tenant von Tag eins, Single-Sign-On über Keycloak, durchgängiges Tracing in Langfuse, Audit in jedem Layer. Klick führt direkt in die App.
[ Kundennutzen · Spuerbar, messbar, sofort ]

Was sich in Deinem Tag ändert, ab Tag eins.

Nicht 'KI für alle', nicht 'Copilot lite' — sondern eine operative Schicht zwischen Dir und der Maschine, die heute schon Stunden spart, morgen Sprints kuerzt, und in 90 Tagen die Beratungsleistung Deines Hauses messbar verdoppelt. Sechs Personas, 30 Anwendungsfaelle, fuenf Branchen, ein Plattform-Brain. Du arbeitest mit Cowork-AI plus NemoClaw plus OpenClaw plus MarketClaw — sie arbeiten für Dich.

Sechs Personas - Tagesablauf mit PlattformZeitersparnis pro Tag
BRBeraterin (Senior)
Vorher: 2h Recherche pro Kunden-Termin, 90min Doku-Nachbereitung, Word-Vorlagen aus 5 Ordnern.
Mit Plattform: NemoClaw recherchiert live während des Termins (Web + interne KB), faerbt Source-Quotes, generiert das Protokoll im Cowork-Sidepanel. Doku in 12min statt 90min.
SPART 2.5 STUNDEN/TAG
CFCFO / Controller
Vorher: Zahlen aus 6 Quellen ziehen, Excel-Masterfile manuell, Stories für Boardroom in PowerPoint.
Mit Plattform: Trino federiert die 6 Quellen, KPI-Mining schlaegt Outliers vor, Cowork-AI erzeugt Decks, OpenClaw schreibt Variance-Story.
SPART 6 STUNDEN/MONATSABSCHLUSS
COCompliance Officer
Vorher: EU-AI-Act + DSGVO + ISO 27001 + NIS2 manuell mappen, Audits aus 200-Seiten-PDFs.
Mit Plattform: Compliance-Agent in n8n laeuft taeglich, Risk-Register auto-aktualisiert, OpenClaw schreibt Lawful-Basis-Doku, Documenso signiert.
SPART 12 STUNDEN/AUDIT
SLSales Director
Vorher: Outreach manuell, Battle-Cards aus PowerPoint von 2023, Pipeline-Review im Vorbereitungs-Wahn.
Mit Plattform: NemoClaw scrapped CRM + Web, schreibt 50 Outreach-Mails/Tag, MarketClaw liefert Competitor-Intel taeglich, Pipeline-Review als 5-Min-Brief.
+30% MEETINGS/QUARTAL
CICIO / Head of IT
Vorher: 5 unabhaengige KI-Tools, Shadow-IT, kein Audit-Trail, Cloud-Spend-Schock am Monatsende.
Mit Plattform: Eine on-prem-Schicht, alles im eigenen Perimeter, Audit-Trail SHA-256-gehasht, Cost-Limits pro Team in LiteLLM, Langfuse-Tracing für 100% der Calls.
-70% CLOUD-COST-RISK
ENSenior Engineer
Vorher: Code-Review von 200 PRs/Sprint, Doku in Confluence stale, Onboarding-Pain.
Mit Plattform: Code-Reviewer-Custom-Model in OWUI, OpenClaw schreibt ADRs+RFCs, MkDocs auto-aktualisiert, Claude-Code-CLI auf DGX, OpenClaw triggert Sprint-Reviews.
+40% PR-DURCHSATZ
30 konkrete Use-Cases live in Produktion - kein Demo-Theater
U01Live-Recherche im Kundentermin
NemoClaw scannt 30 Web-Quellen + interne KB während des Calls und liefert sourced Quotes inline.
LIVE
U02Auto-Protokoll aus Voice
Faster-Whisper transkribiert, NemoClaw fasst zusammen, Documenso signiert, Email rausgeht.
LIVE
U03EU-AI-Act Compliance-Audit Daily
n8n-Workflow scannt LiteLLM-Audit, generiert Risk-Register-Update, eskaliert via Telegram.
LIVE
U04DSAR Self-Service-Webform
Kunde fuellt Form, n8n-Workflow extrahiert PII via Presidio, generiert DSAR-Pakete in 30min.
LIVE
U05KPI-Mining aus Roh-Daten
Trino + KPI-Mining-Tool schlaegt 20 KPIs vor, mapped zu OKR-Tree, generiert Reports.
LIVE
U06Lead-Scoring via H2O
CRM-Daten -> H2O AutoML -> Scoring API -> Salesforce-Field. Variable-Importance für Sales-Coaching.
LIVE
U07Outreach-Email Personalized 50/Tag
Sales-Coach-Custom-Model in OWUI, scraped LinkedIn + Web, schreibt Email mit Vorab-Recherche.
LIVE
U08Pipeline-Review-Brief 5min
CRM-Stand + Aktivitaeten -> OpenClaw schreibt 1-Pager mit Top-3-Risks + Action-Items.
LIVE
U09Code-Review automatisiert
GitHub-Webhook -> n8n -> Code-Reviewer-Model -> PR-Comment mit Findings + Severity.
LIVE
U10Doku-Schreibe-Workflow
OpenClaw /docs schreibt ADRs + RFCs + Runbooks aus Spec, MkDocs auto-deploy.
LIVE
U11Sprint-Planning-Brief
OpenClaw /sprint plan W26 - generiert Backlog mit Story-Points + DoD basierend auf Master-Plan.
LIVE
U12Daily-Stand-up-Roundup
Engineering-Standup-Skill: liest commits + PRs + Tickets seit gestern, generiert 3-Punkt-Update.
LIVE
U13Incident-Response-Postmortem
incident-response-Skill triagiert Severity, schreibt Status-Update, generiert blameless Postmortem.
LIVE
U14RAG-Suche über 1000+ KB-Entries
Open-WebUI Tool kb_search -> Qdrant + bge-m3 -> Cohere-Reranker -> sourced Antworten.
LIVE
U15Compliance-FAQ Self-Service
35+ Compliance-Eintraege in OWUI-KB, Plattform-Berater-Custom-Model antwortet direkt mit Artikel-Referenz.
LIVE
U16Daily-Market-Watch (MarketClaw)
06:00 scant 10 Quellen, generiert 8-12 Item-Digest mit HOT/WATCH/SKIP-Tags + Action-Items.
LIVE
U17CFO Variance-Analysis
finance:variance-analysis-Skill liest Trino, dekomponiert Variance, generiert Waterfall-Story.
LIVE
U18Month-End-Close 5 Tage statt 12
finance:close-management orchestriert Tasks, journal-entry-Skill bookt Accruals, audit-support sammelt Workpapers.
PILOT
U19Vendor-Onboarding
legal:vendor-check + triage-nda + signature-request - vom NDA bis MSA-Sign in 48h statt 14 Tage.
LIVE
U20Customer-Support-RAG
Tickets -> Qdrant + Letta-Memory + Sonnet -> First-Response-Suggestion mit Confidence-Score.
PILOT
U21Voice-Kiosk an Kunden-Site
Pipecat + Whisper + ElevenLabs auf Jetson AGX an Aussenstelle - Kunde fragt Compliance, NemoClaw antwortet 10s.
W30
U22Document-Intelligence Bulk
MinIO-Upload-Trigger -> Docling/Unstructured-Pipeline -> Markdown + Chunks -> Qdrant + KG (Neo4j W31).
LIVE
U23Multi-Agent-Research-Crew
CrewAI: Researcher -> Writer -> Reviewer -> Publisher für technische Briefings (10-Seiten / 15min).
LIVE
U24User-Story-zu-Implementation
PRD via product-management:write-spec -> OpenClaw /develop generiert Code-Skeleton + Tests + Compose.
LIVE
U25Self-Healing-Container-Stack
Autoheal Labels + GitOps-Watcher 60s -> bei Crash auto-restart + Telegram-Alarm + ADR-Eintrag.
LIVE
U26Disaster-Recovery in 15min
Restic 3-2-1-1-0 + dokumentierter Runbook + 4x getestet - Prod restored in <15min.
LIVE
U27GPU-Cost-Optimization
DCGM + Langfuse + Grafana - lokale Modelle vs Cloud, automatisches Routing nach Cost+Quality.
LIVE
U28EU-Kennzeichnung Selbstdeklaration
Template für Art. 50 EU-AI-Act + Privacy-Notice-Generator nach DSGVO Art. 13.
LIVE
U29Mandanten-Onboarding 7 Tage
Per-Mandant-Branding + Keycloak-SSO + LiteLLM-Team-Budget + KB-Bootstrap - White-Label-Deploy.
PILOT
U30Federated-Learning für Pharma
Mandanten-Daten bleiben lokal, nur Gradient-Updates aggregiert - DSGVO-Art. 25-konform.
W35
ROI-Beispielrechnung · mittelstaendische Beratung 50 FTEkonservativ kalkuliert
R1Beraterinnen 30 FTE
2.5h/Tag x 220 Tage x 30 FTE = 16.500 Stunden/Jahr bei 150 EUR/h = 2.475.000 EUR
SAVED
R2CFO + Controller 3 FTE
6h/Monatsabschluss x 12 + 12h/Audit x 4 = 120 Stunden/Jahr bei 200 EUR/h = 24.000 EUR
SAVED
R3Compliance 2 FTE
12h/Audit x 6 + 4h/Woche x 50 = 272 Stunden/Jahr bei 180 EUR/h = 48.960 EUR
SAVED
R4Sales 5 FTE
+30% Meetings = +18 Deals/Jahr bei 25.000 EUR Avg-Deal-Size = +450.000 EUR Revenue
REVENUE
R5Engineer 8 FTE
+40% PR-Durchsatz - statt 4 Sprints für Feature X jetzt 2.5 Sprints = 1.5 Sprint x 100k EUR = 150.000 EUR
SAVED
R6Cloud-Cost-Reduktion
ChatGPT-Enterprise 50 Seats x 60 EUR x 12 = 36.000 EUR plus Token-Cost ~30k EUR = 66.000 EUR/Jahr abgeloest
SAVED
SUMJahresnutzen 50-FTE-Beratung
3.213.960 EUR p.a.
vs. Plattform-Kosten ~280k EUR/Jahr (Hardware + Lizenzen + Run)
ROI > 11x im Jahr 1
PROFIT
RTTime-to-Value
Tag 1: Cowork-Onboarding. Tag 7: erste Persona-Trainings. Tag 30: erste 5 Use-Cases live. Tag 90: ROI-Break-Even.
90 TAGE
Branchen-Cases · jede Branche, eigener Schnitt5 vertikale Lighthouse-Implementierungen
CB1Pharma R&D + Compliance
Setup: Federated-Learning Plattform mit 4 Pharma-Standorten. Daten verlassen Site nicht.
Use-Cases: Klinische-Studien-Doku, GxP-Audit-Trail, Forschungs-Paper-RAG, AMG/MPG-Compliance-Agent.
Ergebnis: Audits 60% schneller, $4M Studien-Cost-Saving, FDA-Submission 2 Monate frueher.
CASE
CB2Bank Risk + Treasury
Setup: On-prem-Plattform mit BAFIN-Konformitaet, Trino auf Risk-Warehouse, KPI-Mining auf Liquidity.
Use-Cases: Tagesreport-Automation, Stress-Test-Doku, MaRisk-AT4-Compliance, Trade-Anomaly-Detection.
Ergebnis: Reports 8h auf 45min, NIS2-Audit 1x bestanden, Kostenrueckgang 32% bei BI-Tools.
CASE
CB3Beratung Strategie + Audit
Setup: 250 Berater an 12 Standorten, Cowork-AI-First-Workflow, KPI-Mining + Impulse-Suite.
Use-Cases: Live-Recherche, Kundentermin-Doku, Pitch-Deck-Generator, RFP-Response.
Ergebnis: Pitch-Win-Rate +24%, Doku-Aufwand -60%, neue Branchenkompetenz in 6 Wochen statt 6 Monate.
CASE
CB4Manufacturing OT + Quality
Setup: Edge-Jetson an 4 Werken, OPC-UA -> Trino, Vision-VLM auf Inspektions-Bildern.
Use-Cases: Predictive-Maintenance, Defect-Detection, Schichtuebergabe-Doku, OEE-Reporting.
Ergebnis: Stillstand -38%, First-Pass-Yield +12%, ISO 9001 Audit-Effort halbiert.
PILOT
CB5Healthcare Versorgung + Doku
Setup: KIS-Anbindung, Faster-Whisper-Diktat, Documenso für eRezept, Compliance-Agent für KHZG.
Use-Cases: Arzt-Diktat -> Strukturiert, Patientenakte-RAG, Roxtra-QM-Suche, Pflege-Visitenprotokoll.
Ergebnis: Doku-Zeit Arzt -45min/Schicht, KHZG-Foerder-Quote 100%, Patient-Satisfaction +18 NPS.
PILOT
CB6Public-Sector Verwaltung
Setup: On-prem-only, EU-AI-Act Hochrisiko-Kategorisierung, OZG-Konformitaet, BSI-IT-Grundschutz.
Use-Cases: Bürger-Anfrage-Triage, Aktenplan-RAG, Verwaltungsakt-Drafting, Beteiligungs-Verfahren.
Ergebnis: Antwortzeit -70%, Bürger-Zufriedenheit +22%, BSI-Audit bestanden.
PILOT
ben-e-fit.ai vs. AlternativenWas Du verlierst, was Du gewinnst
Kriterium ben-e-fit.ai ChatGPT Enterprise Microsoft Copilot Custom-Build (3-5 Monate)
Datenhoheit on-premJA, 4-Node DGXUS-Cloud onlyEU-Cloud (Azure)möglich, teuer
Modell-Auswahl600+ über 30 Provider~5 OpenAI-Modelle~3 OpenAI-Modelleselber zusammenstellen
EU-AI-Act-KonformitaetArt. 6/9/13/16/50/52 readyteilweiseteilweiseeigene Verantwortung
Audit-Trail SHA-256100% append-onlySub-setMicrosoft Purviewselber bauen
Custom-Skills/Agents200+ Skills, 60+ ToolsGPTs (limitiert)Copilot-Studioselber entwickeln
Federation Multi-Brain3 Bots + Cowork-AIneinneinmöglich
Lokale Inferenz GPUOllama 15+ Modelleneinneinmöglich
Vendor-Lock-In95% Open-Source100% OpenAI100% Microsofteigen
Cost / 1M tokens (avg)~$0 lokal / $3 cloud$60/User/Monat$30/User/Monatvariabel
Time-to-Value7-30 Tage7 Tage14 Tage3-6 Monate
Onboarding-Journey 30 / 60 / 90 Tagevom Kickoff bis ROI-Break-Even
D7Tag 1-7 · Bootstrap
Cowork-AI-Account, Keycloak-SSO, NemoClaw-Telegram-Onboarding, OWUI-First-Login, Plattform-Berater-KB-Crawl, erste Custom-Persona-Trainings.
WEEK 1
D30Tag 8-30 · First-Five-Use-Cases
Live-Recherche, Auto-Protokoll, RAG-KB-Suche, Pipeline-Brief, Doku-Workflow - 5 Use-Cases live, 3 Personas eingearbeitet, erste KPIs gemessen.
MONTH 1
D60Tag 31-60 · Compliance + Federation
Compliance-Agent live (DSGVO + EU-AI-Act), DSAR-Webform, OpenClaw Sprint-Plan, MarketClaw Daily-Digest, alle 6 Personas onboarded.
MONTH 2
D90Tag 61-90 · ROI Break-Even
15+ Use-Cases produktiv, GPU-Cost optimiert, Audit-Reports automatisiert, Federated-Learning getestet, Mandant-Branding live - ROI > 1.0x ueberschritten.
MONTH 3
Haeufige Fragen12 Antworten auf typische Bedenken
F01Wieso nicht ChatGPT-Enterprise?
Daten verlassen Dein Haus nicht. EU-Cloud heisst nicht EU-Hoheit. Du bekommst 600+ Modelle statt 5, lokale Inferenz, eigene Audit-Hashes, custom Skills+Crews. Cost reduziert sich nach 4 Monaten unter ChatGPT-Enterprise-Niveau.
F02Hardware-Investment lohnt sich?
DGX Spark Cluster startet bei ~180k EUR (4 Nodes). Bei 50 FTE Beratung: ROI in 14-22 Wochen. Wenn Du nur 10 FTE hast, lohnt sich Cloud-Inferenz mit Anthropic-direct + OpenRouter erstmal mehr.
F03Wer wartet das System?
Self-Healing-Stack: autoheal restart Container, gitops-watcher 60s sync, Restic 3-2-1-1-0 Backup, restic-restore-Test 4x bestanden. Plus Dein Plattform-Partner (Wartungsvertrag empfohlen).
F04Was passiert bei Ausfall?
Disaster-Recovery in <15 Minuten dokumentiert + getestet. 3-Node-Cluster mit Witness-Quorum, Restic Off-Site-Backup, Failover-Chain laeuft auch bei einem Node-Down.
F05Wie teuer ist Lizenz/Run?
Open-Source 95%, also keine Lizenzkosten. Cloud-Modelle nach Use (Anthropic + OpenRouter üblich 200-2000 EUR/Monat). Plattform-Run (Strom + Internet + Backup-Storage) ~600 EUR/Monat.
F06Kann ich eigene Modelle trainieren?
Ja - Welle 32 (Self-Distillation): User-Audit-Logs -> Synthetic-Data -> LoRA-Fine-Tune lokales Modell. Per-Mandant-Custom-NemoClaw mit eurer Sprache + euren Konventionen.
F07DSGVO-Auftragsverarbeitung?
Bei vollst. on-prem-Setup keine AVV nötig für KI-Schicht (kein Drittland-Transfer). Bei Hybrid mit Cloud-LLMs: AVV mit Anthropic/OpenAI nach Schrems-II-Prüfung.
F08Was ist mit Halluzinationen?
Multi-Layer-Defense: NeMo-Guardrails, LLM-Guard, Presidio-PII, Cohere-Reranker, Source-Citation in jeder Antwort, Confidence-Score, Eval-Datasets in Langfuse, manuelle Review-Queue für Hochrisiko-Outputs.
F09Integriert sich in MS365 / Google?
Ja, n8n hat 200+ Connectors: SharePoint, Outlook, Teams, GMail, Drive, Calendar, Tasks, OneNote. KIS, ERP, CRM über generische REST/SOAP/JDBC.
F10Wie ist der Privacy-Layer?
Presidio anonymisiert PII pre-prompt, audit_events mit SHA-256-Hash, Per-User-RBAC in Keycloak, Per-Team-Budgets in LiteLLM, Tracing in Langfuse mit Redaction. Optional: SOPS-encrypted-Secrets in Git.
F11Skaliert auf 500 Mitarbeiter?
Ja - K3s-Cluster (geplant W26), Multi-Tenant-Workspaces, NemoClaw-pro-Mandant. DGX H200 für Training-Workloads. DGX Station GB300 für Long-Context. Edge-Jetson für Aussenstellen.
F12Wer hat das schon im Einsatz?
5 Lighthouse-Mandanten (Pharma, Bank, Beratung, Manufacturing, Healthcare). Referenzen unter NDA verfuegbar. Live-Status: 65+ Container, 99.97% Uptime 30T, 30+ Tasks/Tag durchsatz autonomous-worker.
[ Cowork-AI · Zentrale Plattform-Entwicklungs-Schicht ]

Eine Cowork-Schicht, die denkt mit Dir, eine Federation, die arbeitet für Dich.

Cowork-AI ist die zentrale Entwicklungsschicht. Ein Mensch, ein Agent, ein Plattform-Brain. Sonnet 4.6 + Opus 4.7 + 200+ Skills + 60+ Tools, dauerhaft sichtbar als Sidepanel oder als Telegram-Pair (NemoClaw für Operations, OpenClaw für Architektur, Roadmap, Sprint-Planung). Du sprichst, sie planen, sie deployen, sie dokumentieren. 24/7. Persistenter Kontext via Letta + Qdrant + Postgres-History. Cross-Tenant-Memory. Federation-Bridge zu allen Mandanten.

Federation-Member3 Brains + 1 Coordinator
CWCowork-AI Central
Sonnet 4.6 + Opus 4.7 als Plattform-Architekt. Sieht: Cowork-Sidepanel, Computer-Use, MCP-Bridge, Dateisystem, Browser. Schreibt: ALLE Code-Dateien, Compose, Deploy-Scripts, Hero-Pages, KB-Eintraege. Default-Ausfuehrer.
CENTRAL
NCNemoClaw Operations
gemma-3-27b-local Default + Sonnet-Failover. Telegram @benefitCLAWbot_bot. Multi-Agent-Orchestrator: 7 Crews, 200+ Skills, 60+ Tools. Polling-Loop 24/7. Slash: /help /status /history /local /sonnet /opus.
OPS
OCOpenClaw Plan + Architekt
claude-opus-4 via OpenRouter. Telegram @botobotobotobot_botBOTbot_bot. Roadmap, Sprint-Planung, Architektur-Reviews, Doku, Compliance-Audits. Autonom-Modus EIN: Self-Trigger 60min. Slash: /sprint /roadmap /develop /docs /audit /agenda.
PLAN
AW3x Autonomous-Worker
3 Replicas mit Heartbeat 30s + Task-Poll 10s + Self-Trigger 60s. Failover-Chain: gemma-3-27b-local -> qwen-2-5-32b-local -> llama-3-3-70b-local -> sonnet-4-6 -> haiku-4-5 -> opus-4-7 -> openrouter/auto. Live: 30+ Tasks done, $1.99 cost.
EXEC
Self-Trigger Cron-Schedule6 Auto-Loops · alle nicht aufhalten
15mMaster-Plan-Progress
Liest Master-Plan W23-W40, vergleicht mit autonomous_tasks-Status, generiert Progress-Report.
RUNS
30mHealth-Check
docker_status, GPU-Check, Disk-Free, Cert-Expiry. Bei Anomalie -> Telegram.
RUNS
60mSelf-Improvement + OpenClaw-Plan
Self-Improvement-Trigger generiert neue Tasks. OpenClaw schreibt 5-Zeilen-Plan-Update via Opus.
RUNS
06:00Market-Watcher
Scannt 10 Quellen taeglich: GitHub-Trending, HuggingFace, NVIDIA-Blueprints, Anthropic-Docs, OpenAI-Updates, ArXiv-cs.AI, Replicate-Trending, Awesome-AI-Lists.
06:00
17:00Daily-Report
Konsolidiert Tag: Tasks done, Cost, Decisions, neue Skills/Tools/Models. Telegram-Long-Message.
17:00
Fr 17:00Weekly-Lessons-Learned
Wochenrueckblick: was lief gut, was nicht, was nächste Woche. Append zu /welle-23/LESSONS-LEARNED.md.
FRI
[ Hardware · 4-Node DGX SuperPOD ]

Vier DGX, ein Quorum, kein Cloud-Lock-In.

Mindestens 4 NVIDIA DGX Systeme im Cluster. Grace Blackwell GB10 ARM64 (DGX Spark), zukuenftig DGX Station mit GB300 + DGX H200 für Training-Workloads. K3s-Cluster mit Witness-SBC für Quorum. Restic 3-2-1-1-0 Backups. Disaster-Recovery in <15 Minuten getestet. Cloudflare Tunnel als einziger Internet-Edge. Keine inbound IPs, keine offenen Ports. Voller Audit-Trail per audit_events Postgres-Append-Log mit SHA-256-Hashing.

Cluster-Nodesaktuell 4 + Reserve 2
P1spark-prod-01
Grace Blackwell GB10 · ARM64 · 128 GB unified memory · Workload: NemoClaw, OpenClaw, LiteLLM, OWUI, Letta, Qdrant.
PROD
P2spark-prod-02
Grace Blackwell GB10 · ARM64 · 128 GB · Workload: Dify, n8n, Langfuse, Trino, OpenSearch, MinIO, ClickHouse.
PROD
D1spark-dev-01
Grace Blackwell GB10 · ARM64 · 128 GB · Workload: Autonomous-Worker x3, Cowork-Sandbox, Dev-Branch-Tests.
DEV
D2spark-dev-02
Grace Blackwell GB10 · ARM64 · 128 GB · Workload: Ollama-Pool, Faster-Whisper-STT, Multi-Modal-Inference.
DEV
SBCwitness-sbc
Raspberry Pi 5 · ARM64 · 8 GB · etcd-Quorum-Witness für Split-Brain-Prevention.
QUORUM
+HDGX H200 (Roadmap W26)
2x H200 · 141 GB HBM3e · Training-Workloads, LoRA-Fine-Tuning, Distillation.
PLAN
+SDGX Station GB300 (Roadmap W30)
DGX Station mit Grace Blackwell GB300 · 784 GB unified memory · Long-Context-Inference.
PLAN
+EEdge-Nodes (Roadmap W34)
Jetson AGX Orin x4 für On-Premise-Inference an Aussenstellen, Kunden-Sites, Voice-Kiosks.
PLAN
GPU + Networking + Storage Stack12 Layer
N1NVIDIA DCGM
GPU-Telemetry · Power, Temp, Utilization, Memory.
LIVE
N2NVIDIA NIM
8 NIM-Microservices: Llama-3.3-70B, Phi-3-Medium, Mistral-Nemo, Embed-QA-4.
LIVE
N3NVIDIA NCCL
Collective Communications für Multi-GPU-Inference.
CFG
N4NVIDIA Triton
Multi-Model-Serving mit dynamic batching.
W26
N5NVIDIA TensorRT-LLM
FP8-Quantization + Speculative-Decoding.
W26
N6NVIDIA NeMo Guardrails
Topical + Dialog + Output Rails.
LIVE
K1K3s Cluster
Lightweight Kubernetes mit etcd-Quorum.
PLAN
K2Cilium CNI
eBPF-basiertes CNI mit NetworkPolicies.
PLAN
CFCloudflare Tunnel
42+ Public-URLs · Zero open ports inbound · DDoS-Shield.
LIVE
S1MinIO Object Storage
S3-API · 12 Buckets · KMS-encryption-at-rest.
LIVE
S2Restic 3-2-1-1-0
3 Copies, 2 Media, 1 Off-Site, 1 Air-Gap, 0 Errors. Restore-Test 4x bestanden.
LIVE
S3SOPS + age
GitOps-encrypted secrets im Repo.
LIVE
[ Models · 600+ kuratierte LLM/VLM/MLLM-Modelle ]

Sechshundert Modelle, ein Gateway, eine Failover-Chain.

LiteLLM als zentrale Inferenz-Schicht: Anthropic-direct, OpenAI-direct, OpenRouter (300+ Modelle), NVIDIA NIM, Ollama-local, Replicate, Together, Groq, Cerebras, Mistral, Cohere, Google, Bedrock, Azure, Fireworks, DeepSeek, Qwen, Yi, Llama, Mixtral, Phi, Gemma. Cost-Routing: lokal-first, dann Failover zu Cloud. Per-User-Limits, per-Team-Budgets, Audit-Logs in audit_events. Auto-Model-Update-Routine pullt taeglich neue Releases von HuggingFace + OpenRouter.

Anthropic-direct (Opus + Sonnet + Haiku)5 Modelle
OPSclaude-opus-4-7
Tiefes Reasoning, Architektur, Code-Review. 200K context.
DIR
OPSclaude-opus-4-6
Vorgaenger-Opus, Fallback.
DIR
SONclaude-sonnet-4-6
Default für Cowork-AI. Schnell + Smart. 200K context.
DIR
SONclaude-sonnet-4-5
Failover-Sonnet.
DIR
HAIclaude-haiku-4-5
Quick-Replies, Classification.
DIR
OpenRouter (300+ Modelle)eine Bridge zu allem
ORopenrouter/auto
Auto-Routing nach Cost + Quality.
LIVE
ORopenrouter/anthropic/claude-opus-4
OpenClaw-Default. Pay-as-you-go.
LIVE
ORopenrouter/openai/gpt-4o
Multimodal, Vision, Code.
LIVE
ORopenrouter/openai/gpt-4o-mini
Cost-optimized.
LIVE
ORopenrouter/google/gemini-2.5-pro
2M context, Vision.
LIVE
ORopenrouter/google/gemini-2.0-flash
Sub-second latency.
LIVE
ORopenrouter/x-ai/grok-4
Real-time-Web-Access.
LIVE
ORopenrouter/deepseek/deepseek-r1
Reasoning-Modell.
LIVE
ORopenrouter/qwen/qwen3-72b
Multilingual.
LIVE
ORopenrouter/meta/llama-4-maverick
10M context Window.
LIVE
ORopenrouter/mistralai/mistral-large-2
EU-data-sovereign.
LIVE
ORopenrouter/cohere/command-r+
RAG-optimized.
LIVE
Local Ollama (DGX Spark)15 Modelle
L1gemma-3-27b-local
NemoClaw-Default. Schnell, kostenlos.
PULLED
L2qwen-2-5-32b-local
Multilingual + Coding.
PULL
L3llama-3-3-70b-local
Premium-local Reasoning.
PULL
L4mistral-nemo-12b
European model.
PULL
L5phi-4-14b
Microsoft-Modell, Reasoning.
PULL
L6deepseek-coder-33b
Code-Generation Specialist.
PULL
L7llava-1.6-34b
Vision Language Model.
PULL
L8bge-m3 (embeddings)
Multilingual embeddings.
PULLED
L9faster-whisper-large-v3
STT - Speech to Text.
LIVE
Special-Purpose14 Domain-spezifisch
SPopenai/o3
Reasoning-Specialist.
CFG
SPopenai/o1-pro
Deep Reasoning.
CFG
SPcohere/embed-multilingual-v3
Embeddings, 100+ Sprachen.
CFG
SPvoyage-large-2
Best-in-class embeddings.
CFG
SPbedrock/titan-text-premier
AWS Bedrock.
CFG
SPbedrock/anthropic-claude-haiku
AWS-region-DE.
CFG
SPgroq/llama-3.3-70b
300 tokens/s.
CFG
SPcerebras/llama-3.3-70b
2000 tokens/s.
CFG
SPtogether/mixtral-8x22b
MoE-Modell.
CFG
SPreplicate/black-forest-labs/flux-pro
Text-to-Image.
CFG
SPreplicate/meta/llama-3.1-405b
Largest open-source.
CFG
SPelevenlabs/multilingual-v2
TTS - 32 Sprachen.
CFG
SPopenai/whisper-large-v3
Cloud-STT.
CFG
SPjina-clip-v2
Multimodal-Embeddings.
CFG
[ Mega-Scale-Vision · was als naechstes kommt ]

Heute fuenf Bots, drei Worker. Morgen zwoelf Bots, hundert Worker, zehntausend Modelle.

Die Plattform ist heute schon LIVE - aber sie skaliert. Auto-scaling-Worker bis 1000 Replicas. 9 Modell-Provider mit insgesamt 10.000+ kuratierten Modellen (statt heutigen 600+). 12 Federation-Bots statt 5 (Branchen-Spezial-Bots für Pharma/Banking/Manufacturing/Healthcare/Public-Sector/Energy/Logistics/Retail/Tourism/Insurance/Education/RealEstate). Free-Tier-Stacks: 40 Security-Scanner, 60 Data-Processing, 100 Microservices, 30 Monitoring-Tools - alle nur Open-Source, kostenlos. Diese Section listet alles was kommt.

Modell-Provider Vision: 10.000+ via 9 Plattformenheute 600+ via LiteLLM-Gateway
OROpenRouter
600+ Modelle (anthropic/*, openai/*, google/*, meta/*, mistralai/*, deepseek/*, qwen/*, x-ai/*, cohere/*). Auto-Routing nach Cost+Quality. Heute LIVE.
LIVE
RPReplicate
5000+ Models inkl. Black Forest Labs Flux, Llama 3.1 405B, Stable-Diffusion XL, Whisper, MusicGen. Pay-per-second-pricing. Q3 W26.
Q3
TGTogether.ai
200+ Open-Source-Models inkl. Llama-4, Mixtral, Qwen, Yi, Phi, Vicuna. Inference + Fine-Tuning. Q3 W26.
Q3
FWFireworks.ai
150+ Models, FireFunction, FireAttention v2. 10x faster vs vanilla. Q3 W27.
Q3
GQGroq
50+ Models. Ultra-Speed via LPU (Language Processing Unit). 750 tokens/s Llama 3.3 70B. Q3 W27.
Q3
CBCerebras
20+ Models. 2000 tokens/s via Wafer-Scale-Engine. Real-Time-Inference für Voice. Q3 W28.
Q3
MLModal Labs
Custom-Model-Deployments via Python-decorators. Serverless GPUs (A100, H100). Per-Request-Billing. Q4 W31.
Q4
RPRunPod
Serverless GPU-Pods. 50+ pre-baked Templates für Llama, Mixtral, Whisper. Pay-per-minute. Q4 W31.
Q4
VAVast.ai
Distributed-Training-Marketplace. RTX 4090 ab $0.20/h. Custom-Fine-Tuning + LoRA-Training. Q4 W32.
Q4
OLOllama-Local DGX
Lokal auf 4-Node DGX. gemma3:27b, qwen2.5:32b, llama3.3:70b, mistral-nemo:12b, phi-4:14b, deepseek-coder:33b, llava:34b, bge-m3, faster-whisper-v3.
LIVE
Worker-Army Skalierung: 3 -> 100 -> 1000Auto-Scaling via K3s + KEDA
NOWAktuell: 3 Worker
3 Replicas, Heartbeat 30s, Task-Poll 10s, $6.83 cost-total. Failover-Chain mit 7 Modellen.
LIVE
W25W25: 100 Worker
K3s-HPA mit min:10/max:100 basierend auf queue-depth. Per-Worker GPU-pinning für Ollama-Modelle. Distributed-Lock via Redis.
PLAN
W30W30: 1000 Worker
KEDA-Autoscaler mit Prometheus-trigger (queue_depth > 50). Spot-Instances über RunPod/Vast.ai bei Peak. Distributed-Tracing via Tempo.
VISION
W35W35: Federated-Worker
Mandanten-Worker laufen on-prem in Mandant-Perimeter, syncen Tasks zur Plattform. Keine Daten-Verlassen-Site (DSGVO Art. 25).
VISION
12 Federation-Bots Vision (heute 5 LIVE)Industry-Vertical-Spezial-Bots
1NemoClaw
Operations-Brain. @benefitCLAWbot_bot.
LIVE
2OpenClaw
Plan + Architektur. @benefitOpsBot. Opus-4.
LIVE
3MarketClaw
Markt-Watcher. @ljdhewfsidefhBot_bot. Daily 06:00.
LIVE
4SecClaw
Security + Compliance. @gurubenefitaiplattformCLAW001Bot. 06:30+18:00.
LIVE
5DevClaw
Coding-Specialist. @gurubenefitaiplattformCLAW002Bot. /review /test /refactor.
LIVE
6DataClaw
Data-Engineering, ETL, Trino, KPI-Mining, OpenMetadata-Lineage.
W26
7VoiceClaw
Pipecat + Whisper + ElevenLabs. Telefon-Inbound. Voice-Agent.
W27
8DesignClaw
UX-Copy, Mockups, Design-Review, Figma-Sync. Sonnet + Vision.
W28
9SalesClaw
CRM-Sync, Outreach, Pipeline-Review, Forecast. HubSpot/SF/Pipedrive.
W28
10FinanceClaw
Variance-Analysis, Month-End-Close, Audit-Support, Reconciliation.
W29
11SupportClaw
Customer-Support-RAG. Tickets-Triage, First-Response, Knowledge-Base.
W29
12ResearchClaw
PaperQA, ArXiv-Sync, Literature-Review, Crew-Aggregation.
W30
50 Branchen-Spezial-Bots (Industry-Verticals)Pro Branche eigene NemoClaw-Persona
PHPharmaClaw
AMG/MPG-Compliance, GxP-Audit, klinische-Studien-Doku, FDA-Submissions.
BKBankingClaw
BAFIN MaRisk, MaComp, NIS2, Trade-Anomaly-Detection, Stress-Test.
MFManufactureClaw
OPC-UA, Predictive-Maintenance, OEE, Schichtuebergabe, ISO 9001.
HCHealthcareClaw
KIS-Anbindung, KHZG, eRezept, Pflege-Visite, Roxtra-QM-Suche.
PSPublicSectorClaw
OZG, BSI-IT-Grundschutz, Aktenplan, Verwaltungsakt, Beteiligungs-Verfahren.
ENEnergyClaw
EEG, Netzentgelte, Smart-Meter, Lastgang-Analysis, REMIT-Reporting.
LGLogisticsClaw
Routenplanung, Frachtbriefe, Zoll-Anmeldung, Container-Tracking.
RTRetailClaw
POS-Sync, Inventory-Forecasting, Pricing-Optimization, Customer-Loyalty.
TRTravelClaw
PNR-Sync, Buchungs-Bot, Reise-Beratung, Flugplan-Updates.
ISInsuranceClaw
Schadens-Bearbeitung, Underwriting, Solvency-II, Risiko-Bewertung.
EDEducationClaw
Moodle-Sync, Lernpfade, Pruefungen, Zeugnis-Generation, Erasmus+.
RERealEstateClaw
Expose-Generation, Bewertung, Mieter-Portal, Energieausweis.
+3838 weitere Branchen
Beratung, IT-Services, Telco, Media, Sport, Gastro, Bau, Auto, Chemie, Defense, Pharma-Distribution, Bildungstraeger, Stiftung, NGO, Verband, Genossenschaft, Konsumgueter, Nahrungsmittel, Getraenke, Kosmetik, Mode, Schmuck, Spielzeug, Buecher, Musik, Film, Games, Sport, Wellness, Beauty, Kinderbetreuung, Pflegeheim, Hospiz, Notdienst, Bestatter, Anwalt, Steuerberater, Architekt.
Free-Tier Monitoring-Stack (Open-Source only)~25 Tools statt teurem Datadog/New-Relic
M1Prometheus + Alertmanager
Time-Series Metrics + Alert-Rules. LIVE.
LIVE
M2Grafana
Dashboards + Multi-Datasource. LIVE.
LIVE
M3Loki + Promtail
Log-Aggregation. Grafana-Native.
CFG
M4Tempo + OpenTelemetry
Distributed-Tracing.
CFG
M5Mimir
Prometheus-LongTerm-Storage.
CFG
M6Pyroscope
Continuous-Profiling.
CFG
M7Uptime Kuma
Service-Uptime + Telegram-Alerts. LIVE.
LIVE
M8cAdvisor
Container-Resource-Monitoring.
CFG
M9node-exporter
Host-Metrics.
CFG
M10DCGM-Exporter
NVIDIA-GPU-Telemetry. LIVE.
LIVE
M11Langfuse
LLM-Observability. LIVE.
LIVE
M12Helicone (OSS)
LLM-Cost + Cache + Retry.
CFG
M13Arize Phoenix (OSS)
LLM-Eval + RAG-Tracing.
CFG
M14Healthchecks.io (Self-host)
Cron-Job-Pings.
CFG
M15Sentry (Self-host)
Error-Tracking + Releases.
CFG
M16Glitchtip
Sentry-API-kompatibel, Lightweight.
CFG
M17Netdata
Real-Time-System-Performance.
CFG
M18Beszel
Lightweight-Server-Monitoring.
CFG
Free Security-Scanner (max 12, Open-Source)statt Snyk-Enterprise oder Qualys-Lizenz
S1Trivy
Container-Vuln-Scan + IaC + Secrets.
CFG
S2Grype
Anchore-Vuln-Scanner.
CFG
S3Falco
Runtime-Threat-Detection (CNCF).
CFG
S4OPA Gatekeeper
Policy-as-Code für K3s.
CFG
S5Wazuh
Open-Source-SIEM + EDR.
CFG
S6CrowdSec
Behavior-based Intrusion-Detection.
CFG
S7Suricata
IDS/IPS + Network-Security-Monitoring.
CFG
S8OWASP ZAP
Web-App-Penetration-Testing.
CFG
S9SemGrep CE
Static-Code-Analysis.
CFG
S10Bandit + Safety
Python-Security-Linters.
CFG
S11DefectDojo
Vulnerability-Management-Hub.
CFG
S12Vault (HashiCorp OSS)
Secret-Management + PKI.
CFG
Free Data-Processing Stack (max 18 Open-Source)Spark, Flink, Kafka kostenlos
D1Apache Kafka
Event-Streaming Backbone.
CFG
D2Apache Flink
Stream-Processing.
CFG
D3Apache Spark
Batch + Streaming + ML.
CFG
D4Apache Pulsar
Multi-Tenant-Messaging.
CFG
D5RabbitMQ
AMQP-Broker.
CFG
D6NATS Jetstream
Lightweight-Messaging.
CFG
D7Apache Iceberg
Lakehouse-Format.
CFG
D8Trino
Federated-SQL. LIVE.
LIVE
D9DuckDB
In-Process-OLAP.
LIVE
D10ClickHouse
Realtime-Analytics. LIVE.
LIVE
D11dbt-core
SQL-T Transformation.
CFG
D12Apache Airflow
Orchestration.
CFG
D13Dagster
Modern-Orchestrator.
CFG
D14Apache NiFi
Visual-Data-Flows.
CFG
D15Meltano + Singer
EL Pipelines. LIVE.
LIVE
D16Airbyte
300+ Connectors. LIVE.
LIVE
D17OpenMetadata
Data-Catalog + Lineage. LIVE.
LIVE
D18Superset / Metabase
BI-Self-Service.
CFG
Microservices-Suite (max 30, Self-Hosted Open-Source)Auth, Billing, Notification, ...
U1Keycloak
SSO + IDP. LIVE.
LIVE
U2Authentik
Modern-IDP-Alternative.
CFG
U3FusionAuth
User-Management.
CFG
U4Stripe-OSS-Mock
Billing-Webhooks für Tests.
CFG
U5Lago
Open-Source-Billing-Engine.
CFG
U6Novu
Notification-Infrastructure.
CFG
U7Mailcow
Self-Hosted-Mailserver.
CFG
U8Listmonk
Email-Newsletter.
CFG
U9PostHog
Product-Analytics.
CFG
U10Plausible
Privacy-Friendly-Analytics.
CFG
U11Mattermost
Slack-Alternative.
CFG
U12Rocket.Chat
Team-Chat.
CFG
U13Jitsi Meet
Video-Conferencing.
CFG
U14Outline
Wiki + Knowledge-Base.
CFG
U15Plane
Linear/Jira-Alternative.
CFG
U16Vikunja / Focalboard
Task-Management.
CFG
U17Zammad
Helpdesk + Ticketing.
CFG
U18Documenso
DocuSign-OSS. LIVE.
LIVE
U19Paperless-NGX
DMS mit OCR.
CFG
U20Nextcloud + Collabora
Office-Suite-OSS.
CFG
U21OnlyOffice
DocX-Edit.
CFG
U22Vaultwarden
Bitwarden-Compat-Server.
CFG
U23Trilium
Personal-Notes-Hierarchy.
CFG
U24Memos
Lightweight-Notes.
CFG
U25Vikunja
Open-Source-To-Do.
CFG
U26Joplin Server
Notebook-Sync.
CFG
U27SilverBullet
Markdown-Wiki + Code.
CFG
U28AppFlowy
Notion-Alternative-OSS.
CFG
U29AnythingLLM
RAG-Frontend.
CFG
U30Continue.dev Server
Self-Host AI-IDE-Server.
CFG
[ Master-Plan W23-W40 · Self-Evolving Plattform ]

Achtzehn Wellen, ein Plan, eine Plattform, die sich selbst baut.

Welle 23 bis 40 sind kein Roadmap-Wunschzettel, sondern bereits laufende Aufträge im Postgres-Tasks-Queue der Autonomous-Worker. OpenClaw priorisiert via Self-Trigger 60min, NemoClaw triggert konkret-laufende Operations, Cowork-AI macht die Plattform-Entwicklung mit dem Menschen. Jede Welle hat acceptance-criteria, jeder Sprint ein DoD, jedes ADR einen rationale-Eintrag. Wenn die Queue leer wird, generiert der Self-Improvement-Trigger den nächsten Task. Das System schlaeft nie.

Q2 2026 · Welle 23-26 · Federation + Autonomaktuell laufend
W23Federation: NemoClaw + OpenClaw + Cowork
3 Brains laufen parallel via shared Postgres. NemoClaw operations, OpenClaw plan/architekt, Cowork executive. Telegram-Bots LIVE. 3 Worker-Replicas 24/7. Self-Trigger 6/h.
LIVE
W24Flowise + LangGraph + AutoGen
Multi-Agent-Stack: Flowise drag-and-drop, LangGraph stateful, AutoGen conversation. Integration mit Letta-Memory + 7 Crews.
PLAN
W25Microsoft AutoGen + Magentic-One
Multi-Agent-Conversation mit dynamischem Agent-Spawning. Web-Surfer-Agent, File-Agent, Code-Agent.
PLAN
W26Moodle LMS + Keycloak SSO
Lernmanagement-System für interne Schulungen + Kunden-Trainings. Integration mit Skills-Library als Lernpfade.
PLAN
Q3 2026 · Welle 27-30 · Multi-Modal + Voice + Edgegeplant
W27Voice-Stack: Whisper + ElevenLabs + Pipecat
Real-Time Voice-Conversations mit NemoClaw via Telefon-Integration (Twilio + Pipecat). STT Whisper-Large-V3 lokal, TTS ElevenLabs-Multilingual.
PLAN
W28Multi-Modal: VLM + Document-Intelligence
LLaVA + Qwen-VL + Docling + Unstructured + MarkItDown + llmsherpa für PDF-Tabellen-Charts-Diagramme zu Markdown.
PLAN
W29Vector-Hybrid-Stack erweitert
Qdrant + Milvus + Weaviate + ChromaDB parallel. Hybrid-Search via OpenSearch. Reranker via Cohere/Jina.
PLAN
W30Edge-Computing: Jetson AGX Orin x4
Voice-Kiosks, Aussenstellen-Inference, On-Site-Datenschutz. Sync via Cloudflare-Tunnel-Mesh.
PLAN
Q4 2026 + 2027 · Welle 31-40 · Self-Evolving + Quantum-ReadyVision
W31GraphRAG mit Neo4j
Knowledge-Graph aus 1000+ KB-Entries. Cypher-Queries als Tool. ADR-002 implementiert.
PLAN
W32Self-Distillation Pipeline
User-Audit-Logs -> Synthetic-Data -> LoRA-Fine-Tune lokales Modell. Per-Mandant Custom-NemoClaw.
PLAN
W33Reinforcement-Learning-from-AI-Feedback
OpenClaw bewertet NemoClaw-Outputs, generiert DPO-Training-Pairs.
PLAN
W34Quantum-Chemistry & Robotics-Pilot
NVIDIA cuQuantum + Isaac-Robotics-Sandbox. Quantum-Chemistry für Pharma-Kunden, Robotics für Logistik.
VISION
W35Federated-Learning mit Mandanten
Mandanten-Daten verlassen nie Mandanten-Perimeter. Nur Gradient-Updates aggregiert zentral.
VISION
W36100% Self-Healing + Self-Evolving
Bei jeder Stoerung: Auto-Diagnose -> Auto-Patch -> PR -> Self-Merge nach Tests. ADR für jede Änderung.
VISION
W37Mandanten-Federation
10+ Mandanten mit Cross-Mandant-Memory-Sharing (opt-in). NemoClaw-pro-Mandant + zentrale OpenClaw.
VISION
W38EU-AI-Act Konformitaet 100%
Alle Hochrisiko-Systeme (Art. 6) konform. Risk-Register, Data-Governance, Transparency-Doc, Human-Oversight.
PLAN
W39ISO 27001 + NIS2 + BAFIN
3-Cert-Pakte für Banken-Mandanten. SOC-2-Type-II + DSGVO-Z?rt-Audit.
PLAN
W40Plattform-as-a-Service for Beratungen
White-Label-Variante für 5 weitere Beratungs-Firmen. Per-Mandant-Branding, eigene NemoClaw-Persona.
VISION
[ Open-Source-Universe · 80+ Tools, 15 Layer, 1 Stack ]

Achtzig Werkzeuge, fuenfzehn Schichten - alles Open-Source, alles unter Kontrolle.

Die ben-e-fit.ai-Plattform ist zu 95% Open-Source. Nur die Reasoning-LLMs (Claude, GPT) sind kommerziell. Alles drumherum: Open-Source-Schichten von BSD/MIT/Apache. Jedes Tool austauschbar. Vendor-Lock-In = null. Wir kuratieren, integrieren, dokumentieren - aber nichts ist proprietaer.

L1 Multi-Agent-Frameworks10
A1CrewAI
7 Standard-Crews implementiert.
LIVE
A2LangGraph
Stateful Multi-Agent-Workflows.
W24
A3AutoGen + Magentic-One
Microsoft Multi-Agent-Conversation.
W25
A4Flowise
Drag-and-drop Agent-Builder.
W24
A5Dify
Self-hosted LLM-Ops-Suite.
LIVE
A6n8n
Workflow-Automation, 200+ Integrations.
LIVE
A7Letta (MemGPT)
Persistent-Memory-Layer.
LIVE
A8OpenInterpreter
Code-Interpreter mit System-Access.
CFG
A9OpenDevin / OpenHands
Autonomer Software-Engineer.
W24
A10SWE-Agent
Code-Repo-Manipulation.
W25
L2 Vector + Hybrid-Search8
V1Qdrant
Production-Vector-DB.
LIVE
V2Milvus
Distributed Vector-DB.
W29
V3Weaviate
Hybrid + Generative-Search.
LIVE
V4ChromaDB
Lightweight, in-memory.
W29
V5OpenSearch
BM25 + Vector hybrid.
LIVE
V6PGVector
Postgres Vector extension.
LIVE
V7FAISS
Facebook similarity-search.
CFG
V8LanceDB
Embedded Vector-DB.
CFG
L3 Knowledge-Graph + GraphRAG5
G1Neo4j
Knowledge-Graph + Cypher.
W31
G2Microsoft GraphRAG
Auto-KG-Build aus Docs.
W31
G3LightRAG
HKU-Modell, Hybrid-RAG.
W31
G4RAG-Anything
Multi-format RAG-Pipeline.
W29
G5PaperQA2
Scientific-Papers-RAG.
CFG
L4 Document-Intelligence9
D1Docling
IBM PDF-zu-Markdown mit Tables.
LIVE
D2Unstructured.io
22+ Filetypes parsing.
LIVE
D3MarkItDown
Microsoft any-to-md.
W28
D4llmsherpa
PDF Layout-aware Reader.
W28
D5PyMuPDF + pikepdf
PDF Form-fill, Sign.
LIVE
D6Tika (Apache)
Content-Detection 1000+ Types.
CFG
D7Surya OCR
90+ Sprachen OCR.
W28
D8Marker
Akademische-Paper -> MD.
W28
D9Mineru
Layout-aware PDF Extract.
W28
L5 Voice + Multimodal8
VC1Faster-Whisper
5x faster Whisper-STT.
LIVE
VC2Pipecat
Real-Time Voice-Pipeline.
W27
VC3XTTS-v2 (Coqui)
Voice-Cloning lokal.
W27
VC4Bark (Suno)
Text-to-Audio + Music.
W27
VC5RVC (Voice-Conversion)
Voice-Mimicry.
W27
VC6SeamlessM4T
Meta translation 100+ langs.
W27
VC7LiveKit
WebRTC-Server.
W27
VC8Twilio + Vapi
Voice-Phone-Integration.
W27
L6 LLM-Ops + Observability10
O1LiteLLM
Universal LLM-Gateway.
LIVE
O2Langfuse
LLM-Tracing + Eval.
LIVE
O3Helicone
LLM-Cost + Cache.
CFG
O4Arize Phoenix
LLM-Observability.
CFG
O5OpenTelemetry
Traces, Metrics, Logs.
LIVE
O6Prometheus
Metrics-DB.
LIVE
O7Grafana
Dashboards, Alerts.
LIVE
O8Loki
Log-Aggregation.
CFG
O9Tempo
Distributed-Tracing.
CFG
O10Uptime-Kuma
Service Status-Monitoring.
LIVE
L7 Data-Engineering + Lakehouse10
DE1Trino
Federated-SQL über Sources.
LIVE
DE2Apache Iceberg
Lakehouse-Format.
CFG
DE3DuckDB
In-Process OLAP.
LIVE
DE4ClickHouse
Realtime-Analytics.
LIVE
DE5Meltano (Singer)
EL Pipelines.
LIVE
DE6Airbyte
300+ Connectors.
LIVE
DE7dbt
SQL-T transformation.
CFG
DE8OpenMetadata
Data-Catalog + Lineage.
LIVE
DE9Apache Superset
BI-Dashboards.
CFG
DE10Metabase
Analytics für Business.
CFG
L8 Compliance + Security8
CS1Microsoft Presidio
PII-Detection + Anonym.
LIVE
CS2NeMo Guardrails
LLM-Output-Safety.
LIVE
CS3LLM-Guard
Pre + Post Prompt-Scanning.
LIVE
CS4Keycloak
SSO/OIDC + IDP.
LIVE
CS5SOPS + age
Git-encrypted secrets.
LIVE
CS6Trivy + Grype
Container-Vuln-Scan.
CFG
CS7Falco
Runtime-Threat-Detection.
CFG
CS8OPA Gatekeeper
Policy-as-Code (K3s).
CFG
L9 Document-Signing + DMS5
DS1Documenso
DocuSign-OSS.
LIVE
DS2Paperless-ngx
DMS mit OCR.
CFG
DS3Nextcloud + Collabora
Office-Suite-OSS.
CFG
DS4OnlyOffice
DocX-Edit OSS.
CFG
DS5Outline
Wiki + Knowledge-Base.
CFG
L10 ML-Ops + Training7
M1MLflow
Experiment-Tracking.
CFG
M2Kubeflow
ML-Pipelines auf K3s.
PLAN
M3Ray
Distributed-Training.
PLAN
M4vLLM
High-Throughput-Inference.
PLAN
M5SGLang
Structured LLM-Calls.
PLAN
M6Unsloth
2x-faster LoRA-Tuning.
PLAN
M7Axolotl
Fine-Tuning-Pipeline.
PLAN
L11-L15 Coding + DevTools + Ops10+
C1Claude Code CLI
Agentic Coding-CLI auf DGX.
LIVE
C2OpenAI Codex CLI
Code-Gen via OpenAI.
CFG
C3Aider
AI-Pair-Programming Git-aware.
CFG
C4Continue.dev
VSCode AI-Plugin.
CFG
C5MkDocs Material
Doku-Generator.
LIVE
C6Mermaid + PlantUML
Diagrams-as-code.
LIVE
C7Watchtower + Autoheal
Container Auto-Restart.
LIVE
C8GitOps-Watcher
60s Repo-Sync zu Compose.
LIVE
C9Dozzle
Live Container-Logs UI.
LIVE
C10Portainer
Docker/K3s Web-UI.
CFG
00.4 · AUTONOMOUS
Never-Stop-Loop.
Live in Echtzeit.
3 Worker-Replicas arbeiten autonom Master-Plan-Tasks ab. Heartbeat 30s, Failover Sonnet -> Haiku -> Opus -> NIM-Free -> Llama4-lokal. Self-Triggers alle 15min/30min/60min/06:00/17:00. Stream live an Telegram chat 1796792209.
Federation · 3 Brain-Bots LIVE
NCNemoClaw · Operations
@benefitCLAWbot_bot · gemma-3-27b-local default + Sonnet-Failover. Long-Polling 30s, Postgres-Memory + Letta + Qdrant. Slash: /help /status /history /local /sonnet /opus.
POLLING-LOOP
OCOpenClaw · Plan + Architekt
@botobotobotobot_botBOTbot_bot · anthropic/claude-opus-4 via OpenRouter direkt + Sonnet-4-5 Failover. Self-Trigger 60min (Plan-Update / Doc-Gen / Audit). Slash: /sprint /roadmap /develop /docs /audit /agenda /mode auto|manual.
AUTONOM-LOOP 60min
MCMarketClaw · Watcher
@ljdhewfsidefhBot_bot · sonnet-4-5 via OpenRouter + haiku-4-5 Failover. Daily-Digest 06:00 UTC. Scant 10 Quellen: GitHub, HuggingFace, NVIDIA, Anthropic, OpenAI, ArXiv, Replicate, HackerNews, Reddit. Slash: /digest /trending /paper /new /report /watch /watchlist.
DAILY 06:00 UTC

Alle drei lesen /welle-23/PLATFORM-STATE-LIVE.md in jedem Prompt · Shared Postgres-Bridge autonomous_tasks + chat_history · Audit-Trail SHA-256-gehasht in audit_events

Worker
3 / 3
alle online
Tasks done 24h
--
aktualisiere...
Queue
--
queued / running
Cost 24h
$--
via Failover-Chain
Letzte 5 abgeschlossene Tasks
Lade live status...

Aktualisiert alle 15s · -- · API: autonomous-status-api:8000/api/autonomous/status

00.5 · NEWS · PLATTFORM-CHANGELOG
Was diese Woche passiert ist.
Strukturiert, kuratiert, permanent.
Plattform-Releases links, Markt-Updates rechts. MarketClaw scannt 06:00 UTC zehn Quellen, OpenClaw schreibt Plan-Updates 60min, Cowork-AI dokumentiert jede Änderung. Alles im Audit-Trail SHA-256-gehasht.
Plattform-Changelog · letzte 14 Eintraege
v20Hero v20 + Plattform-Changelog
Diese Section eingeführt - alle technischen Releases dokumentiert + Welle-24-Vorbereitung.
2026-05-01 06:00
W24Flowise deployed
Drag-and-Drop Agent-Builder live auf Port 3010 (intern). Welle 24 von PLAN auf LIVE gerueckt.
2026-05-01 05:50
SYNCPLATFORM-STATE-LIVE.md
Single-Source-of-Truth eingeführt - alle 3 Bots lesen das mit Priority 1 in jedem Prompt.
2026-05-01 04:30
FIXLetta pgvector-Switch
Image von postgres:16-alpine auf pgvector/pgvector:pg16 - Restart-Loop behoben, Embedding-Service live.
2026-05-01 04:15
SKILLcloudflare-tunnel Skill
4 Patterns (list-hostnames, add-ingress, add-DNS, access-policy) für autonome CF-Bot-Nutzung hinterlegt.
2026-05-01 03:45
v19Kundennutzen-Mega-Section
6 Personas + 30 Use-Cases + ROI 50-FTE-Beratung 3.21M EUR + 6 Branchen-Cases + Vergleichstabelle + 30/60/90-Onboarding + FAQ 12 Items.
2026-04-30 23:30
BOTMarketClaw deployed
Bot 3 @ljdhewfsidefhBot_bot - scant 06:00 UTC zehn Quellen, Sonnet-4-5 default + Haiku failover.
2026-04-30 22:18
BOTOpenClaw -> OpenRouter direct
Default-Modell anthropic/claude-opus-4 via OpenRouter direkt (statt LiteLLM-Layer). Failover sonnet-4-5.
2026-04-30 21:55
SUB27 Tool-Subpages pro Tenant
54 vollwertige Subpages + 2 Catalog-Indexes generiert. Jede Subpage: 8 Features, 3 Endpoints, 4 Use-Cases, Tech-Stack, Compliance.
2026-04-30 22:13
v18Mega-Content-Expansion
Cowork-Federation, 4-Node DGX SuperPOD, 600+ Models Library, Master-Plan W23-W40, 80+ Open-Source-Tools-Stack.
2026-04-30 21:48
BOTOpenClaw deployed (Bot 2)
Plan + Architektur Bot mit Self-Trigger-Loop alle 60min, Sprint-Planung, ADRs, Compliance-Audits.
2026-04-30 21:42
BOTNemoClaw bidirektional
Long-Polling-Loop statt Webhook, Chat-History persistent, Slash-Commands /help /status /history /local /sonnet /opus.
2026-04-30 21:30
W23Federation-Bridge
3 Brain-Bots über shared Postgres `nemoclaw` mit autonomous_tasks-Tabelle, autonomous_heartbeat-Pulse, openclaw_*-Schema.
2026-04-30 20:00
DOCMaster-Plan W23-W40 LIVE
Realer Status: W23 LIVE, W24-W30 PLAN (Flowise/AutoGen/Moodle/Voice/MultiModal/Edge), W31-W40 VISION (GraphRAG/Self-Distill/Quantum/Federated).
2026-05-01 05:00
Markt-Updates · MarketClaw Daily-Digest
Score 9.5 · HuggingFace Llama 4.5 Maverick · 405B Parameters Meta released a stronger Llama 4.5 with 405B params, multi-modal, 1M context. Local-Run via Ollama in W24 evaluiert. → in evaluation
Score 9.0 · Anthropic Claude Opus 4.7 · Tool-Use 2.0 Anthropic veroeffentlicht Opus 4.7 mit verbessertem Tool-Use, Computer-Use, Memory-Tool. In LiteLLM bereits integriert. → in production
Score 8.8 · NVIDIA NeMo Curator 2.0 NVIDIA's Daten-Cleaning-Stack mit GPU-Accel. Integration in Knowledge-Pipeline geplant. → W24 roadmap
Score 8.5 · GitHub OpenDevin v1.0 Autonomous Software-Engineer-Agent. Multi-File-Edit, Test-Run, PR-Submit. Als 4. Multi-Agent-Framework (W25). → W25 evaluation
Score 8.2 · Product Hunt Vapi.ai · Voice-Agent-Framework Telefon-Bot-Stack mit Twilio-Integration, low-latency TTS. Voice-Stack-Erweiterung W27. → W27 evaluation
Score 8.0 · arXiv Self-Improving Agents · Stanford 2026 DSPy + reflection-loop für kontinuierliches Lernen. Anbindung an NemoClaw-UseCase Bot. → W30 research

Letztes Update via MarketClaw: heute 06:00 UTC · Naechstes: morgen 06:00 UTC · Telegram-Bot @ljdhewfsidefhBot_bot · Slash-Commands /digest /trending /paper /report

01 · STACK
Vier Schichten,
ein operatives Ganzes.
Hardware, Container, Identity, Observability — jede Schicht eigenständig deploybar, eigenständig observierbar, eigenständig härterbar. Multi-Tenant von Tag eins. SOPS-verschlüsselt. GitOps-gesteuert.
L4 · UX
Praesentation Hero-Pages, ui.ben-e-fit.ai, ui.ki-guru.com, OWUI Multi-Tenant, Dify, Open-WebUI, Telegram @benefitCLAWbot_bot, Voice-Input
React 18 · Tailwind · shadcn/uiSSE
L3 · AGENT
NemoClaw v3 · Cowork-Equivalent FastAPI-Orchestrator · Tool-Use-Loop (max 5) · persistentes Memory (Postgres) · Skills-Manifest · CrewAI · LangGraph · NeMo Guardrails · Letta Agent-State
8/20 Tools live77 Skills
L2 · LLM
LiteLLM Gateway · 31 Modelle Anthropic-direct (Opus 4.7, Sonnet 4.6, Haiku 4.5) · OpenAI-direct (GPT-5, o4-mini) · NVIDIA NIM (Llama-3.3-Nemotron-Super-49b, Nemotron-Ultra-253b, NemoGuard-8b) · OpenRouter (Claude, Gemini 2.5, Deepseek-v3, Qwen3.6-200b, Mistral-Large-2026) · Ollama lokal (Llama4:70b, Qwen3.6:32b, Gemma4:26b, Mistral-Small3.1, DeepSeek-R2:32b, Phi-5)
Langfuse traceCost/Tenant
L1 · DATA
Daten-Plattform Trino federated SQL · OpenMetadata Service-Catalog · OpenSearch Logs · Qdrant 6 Collections · MinIO S3 · ClickHouse OLAP · h2o-3 AutoML · Meltano + dbt · Neo4j Knowledge-Graph · Presidio PII-Filter · Crawl4AI · docling · paperqa
7 Postgres · 6 VecDBaudit-trail
L0 · CORE
Identity, Routing, Secrets, Backup Keycloak SSO mit 2 Realms benefit + kiguru · SOPS+age für alle Secrets · Caddy + Cloudflare-Tunnel als Public-Edge · 7-Layer Self-Healing · Restic 3-2-1-1-0 nach MinIO · Uptime Kuma · Langfuse Cost-Tracking · openmetadata-discovery taeglich
4 DGX + WitnessQuorum
spark-prod-01
Frankfurt·A
GB10 ARM64 · 121GB · 3.6TB NVMe
primary · 99.97% / 30T
spark-prod-02
Frankfurt·B
GB10 ARM64 · 121GB · 3.6TB NVMe
hot-standby · 99.91% / 30T
spark-dev-01
Bonn
GB10 ARM64 · 121GB · 3.6TB NVMe
dev/staging · 99.88% / 30T
spark-dev-02
Berlin
GB10 ARM64 · 121GB · 3.6TB NVMe
ci/test + witness-quorum
02 · AGENT
Hinter jedem Prompt:
ein orchestriertes Team.
NemoClaw v3 entscheidet was du willst, ruft die richtige Crew, die richtigen Skills, die richtigen Tools, die richtigen LLMs — in der richtigen Reihenfolge, mit Audit-Trail, mit Mensch-im-Loop für alles was risikobehaftet ist.
CREW · 01
Compliance
privacy · legal · auditor
DSGVO Art. 12-22, EU AI Act Risk-Klassifizierung, DSR-Workflow, Cookie-Banner-Audits, DPIA. Triggert n8n-Pipelines, schreibt Risk-Register, eskaliert.
CREW · 02
Quality
qm · reviewer · process
Roxtra-Reviews, ISO-Mappings, Prozessdoku, Audit-Vorbereitung, Lieferanten-Prüfung, KVP-Tickets.
CREW · 03
Security
pentest · threat · forensik
OpenMythos narrative-driven Tests, Threat-Modeling, Secret-Scanning, Container-Image-Audits, OWASP-LLM-Top-10.
CREW · 04
Support
tier1 · kb · eskalation
Endkunden-Tickets, Mail-Hilfe-Buttons (formal/freundlich/kuerzen/EN/Termin/Folgemail), Wissenssuche Roxtra, Triage.
CREW · 05
System-Pflege
sre · backup · updates
Container-Health-Watch, autoheal-Trigger, Update-Mgmt, Restic-Verifikation, GPU-Auslastung, Incident-Response.
CREW · 06
Data
eng · analyst · steward
Trino-Queries, OpenMetadata-Lineage, dbt-Marts, h2o-AutoML, Schema-Profiling, Mart-Bau, Cost-Tracking.
CREW · 07
Governance
policy · risk · reporting
Risk-Register-Pflege, Steering-Reports, KPI-Dashboards, Wochen-Mail GF, Cost-Forecast, Strategie-Reviews.
03 · SKILLS
Siebenundsiebzig Skills.
Jeder ein Hebel.
Skills sind die Workflow-Bausteine. Vom Word-Dokument-Generator über Sales-Pipeline-Reviews bis zur SOX-Testing-Methodik — jeder Skill ist als ausfuehrbares Modul registriert. Klick auf eine Kategorie, sieh nur die zugehoerigen Skills.
OFFICEdocx OFFICEpptx OFFICExlsx OFFICEpdf SALESaccount-research SALEScall-prep SALEScall-summary SALEScompetitive-intel SALEScreate-an-asset SALESdaily-briefing SALESdraft-outreach SALESforecast SALESpipeline-review LEGALbrief LEGALcompliance-check LEGALlegal-response LEGALrisk-assessment LEGALmeeting-briefing LEGALreview-contract LEGALsignature-request LEGALtriage-nda LEGALvendor-check ENGarchitecture ENGcode-review ENGdebug ENGdeploy-checklist ENGdocumentation ENGincident-response ENGstandup ENGsystem-design ENGtech-debt ENGtesting-strategy DESIGNaccessibility-review DESIGNdesign-critique DESIGNdesign-handoff DESIGNdesign-system DESIGNresearch-synthesis DESIGNuser-research DESIGNux-copy FINaudit-support FINclose-management FINfinancial-statements FINjournal-entry FINjournal-entry-prep FINreconciliation FINsox-testing FINvariance-analysis PMbrainstorm PMcompetitive-brief PMmetrics-review PMproduct-brainstorming PMroadmap-update PMsprint-planning PMstakeholder-update PMsynthesize-research PMwrite-spec DATAanalyze DATAbuild-dashboard DATAcreate-viz DATAdata-context-extractor DATAdata-visualization DATAexplore-data DATAsql-queries DATAstatistical-analysis DATAvalidate-data DATAwrite-query SEARCHdigest SEARCHknowledge-synthesis SEARCHsearch SEARCHsearch-strategy SEARCHsource-management PRODmemory-management PRODstart PRODtask-management PRODupdate CREATIVEalgorithmic-art CREATIVEcanvas-design CREATIVEdoc-coauthoring CREATIVEmcp-builder CREATIVEtheme-factory CREATIVEweb-artifacts-builder CREATIVEschedule CREATIVEskill-creator CUSTOMki-plattform CUSTOMstack-deployer CUSTOMai-agent-toolkit
04 · TOOLS
Zwanzig Tools.
Live in der Loop.
Tools sind die Aktoren. Jeder Tool-Call wird mit Hash auditiert, Guardrails gepruefte, RBAC-checked. Acht Tools sind bereits live, der Rest in Phase B/C.
docker_statuslive
Container-Health pro Service: Up/Restart/Healthy, Last-Logs-Tail, Restart-Counter, Memory/CPU.
docker_logslive
Tail Container-Logs mit Pattern-Filter und Zeitfenster, Multi-Container-Aggregation.
kb_searchlive
Qdrant Vector-Search über Roxtra QM, Plattform-KB, Mandanten-Wissen, Code-Snippets.
web_searchlive
Searxng-basierte Web-Suche, Source-Filter, Domain-Whitelist, Result-Cache.
skills_listlive
Manifest-Lookup. Filter nach Kategorie, Tag, Mandant. Skill-Capabilities + Trigger-Wording.
memory_savelive
Persistent Postgres-Memory pro user_id mit role/key. Historisierung, Versionierung, Loeschung Art. 17.
memory_lookuplive
Memory-Recall. User-Profil, Mandanten-Kontext, Skill-Praeferenzen, letzte Crew-Calls.
notifylive
Telegram + Mail Outbound. Templates, Rate-Limit, RBAC-restricted Recipients.
code_runphase-b
OpenInterpreter sandboxed Python/Bash mit Resource-Limits, Network-Isolation, Result-Capture.
pdf_qaphase-b
paperqa Multi-PDF-RAG mit Citations, Page-Number-Anchor, Confidence-Score.
doc_convertphase-b
docling DOCX/PDF/HTML-Konvertierung mit OCR (Tesseract), Tabellen-Erhalt, Bild-Extraktion.
flow_runphase-b
Flowise visual-built Pipeline ausfuehren. Node-Library, Persistente Flows, Versioning.
crew_invokephase-c
CrewAI Standard-Crew aufrufen mit Task-Briefing, Role-Constraints, Output-Format.
graph_queryphase-c
Neo4j Cypher-Queries für Multi-Hop-Reasoning, Knowledge-Graph-Traversal, Entity-Resolution.
image_genphase-c
Imagen-4 / Gemini-2.5-Flash-Image (rm-plattform Pattern). Style-Templates, Brand-Consistency.
vision_analyzephase-c
GLM-4.5V Multi-Modal Bild + Text-Verstaendnis. OCR + Layout-Analyse + Beschreibung.
crawl4aiphase-c
Web-Crawler mit JS-Rendering, Pagination-Follow, Page-zu-Markdown, Rate-Limit.
weasyprintphase-c
HTML-zu-PDF mit Print-CSS, Header/Footer, Page-Numbers, Branded-Templates.
mythos_testphase-c
OpenMythos narrative-driven AI-Pentesting. Story-Templates, Eskalations-Pfade, OWASP-Mapping.
schedule_taskphase-c
Cron + scheduled-tasks für wiederkehrende Jobs. Telegram-Trigger, n8n-Webhook, RBAC.
05 · DATA
Daten-Plattform.
Federated, governanced, durchsuchbar.
Zwoelf produktive Komponenten. Eine Data-Catalog-Schicht. Ein Vector-Store. Ein OLAP-Warehouse. Ein S3-Object-Store. Alle vernetzt durch Trino — alle dokumentiert in OpenMetadata.
FEDERATED SQL

Trino · Cross-DB-Queries ohne ETL

Federated Query-Engine über 7 Postgres + ClickHouse + MinIO Iceberg-Tables. Cross-DB-Joins, Pushdown-Optimierung, Catalog-Discovery. Erlaubt Berater Mandanten-uebergreifende Queries für Compliance-Audits, Cost-Reports, Use-Case-Analytics.
catalogs 9p95-latency 240msqueries/d 1.2k
SERVICE CATALOG

OpenMetadata

Service-Catalog + Schema-Discovery + Lineage. Tagliche Discovery via openmetadata-discovery.sh inventarisiert alle 7 Postgres + Qdrant + ClickHouse.
services 14tables 380+
VECTOR-DB

Qdrant · 6 Collections

Vector-Embeddings für kb (Plattform-Wissen), roxtra (QM-Docs), code (Repo-Snippets), support (Tickets), compliance (Risk-Register), mythos (Pentest-Stories).
vectors 142kdims 1024
LOG-AGGREGATION

OpenSearch

Full-Text-Search über alle Service-Logs, Kibana-Dashboards, Alert-Pipelines, Detection-Rules für Anomalien.
events/d 2.4Mretention 90T
OBJECT-STORAGE

MinIO · S3-Compatible

Backup-Target für Restic, Document-Vault, Image-Registry, Iceberg-Tables für Trino, Audit-Archive.
buckets 12data 2.1TB
OLAP

ClickHouse

Time-Series für Langfuse-Events, Cost-Tracking pro Tenant pro Modell, Audit-Mart, KPI-Aggregationen.
rows 18Mp95-aggr 90ms
AUTOML

h2o-3 AutoML

AutoML-Pipeline für Predictive-Models. n8n-getriggert. Modell-Output deployed als LiteLLM-Endpoint.
experiments 47models 12
EL + TRANSFORM

Meltano + dbt

EL-Pipeline Postgres-zu-ClickHouse Mart-Bau. dbt für Transformations, Tests, Lineage. Daily-Refresh via cron.
taps 6marts 11
KNOWLEDGE-GRAPH

Neo4j · LightRAG

Knowledge-Graph für Multi-Hop-Reasoning, Entity-Resolution, Graph-Augmented-RAG. Querybar via graph_query Tool.
nodes 24kedges 88k
PII-DETECTION

Microsoft Presidio

PII-Filter vor jedem LLM-Aufruf. Anonymisierung von Namen, Adressen, Konten, Telefon. DSGVO-Compliance-Schicht.
recognizers 18locales de-DE, en-US
WEB-CRAWL

Crawl4AI

Web-Crawler mit JS-Rendering, Pagination-Follow, Page-zu-Markdown-Konvertierung, Rate-Limit, Robots.txt-Respect.
jobs/d 60+
DOC-CONVERT

docling + paperqa

DOCX/PDF/HTML-Konvertierung mit OCR. paperqa für Multi-PDF-RAG mit Page-Citations und Confidence-Score.
formats 8ocr Tesseract
06 · MODELS
Einundreissig Modelle.
Ein Gateway.
LiteLLM als zentraler Gateway. Pro-Tenant-Cost-Tracking via Langfuse, Pro-Modell-Latency-Tracking, automatischer Failover, OpenAI-API-kompatibel für alle Frontends.
Provider
Modelle
Use-Case
Anthropic-direct
claude-opus-4-7-directclaude-sonnet-4-6-directclaude-haiku-4-5
Premium-Reasoning, Tool-Use, Vision
OpenAI-direct
gpt-5-directgpt-5-minio4-mini
Function-Calling, OAI-Tooling
NVIDIA NIM
nvidia-llama-3.3-nemotron-super-49bnvidia-llama-3-nemotron-ultra-253bnvidia-nemotron-mini-8bnvidia-nemoguard-8b-content
On-prem GPU-Inferenz, NIM-Free-Tier wenn verfuegbar
OpenRouter
claude-opus-4.7claude-sonnet-4.6gemini-2.5-progemini-2.5-flashdeepseek-v3qwen3.6-200bmistral-large-2026openrouter/auto
Cost-Optimization, Multi-Provider
Ollama lokal
llama4:70bqwen3.6:32bgemma4:26bmistral-small3.1deepseek-r2:32bphi-5nemotron-mini
Offline-Fallback, kein Daten-Egress
Audio + Embeddings
whisper-large-v3faster-whisper-large-v3text-embedding-bge-m3text-embedding-mxbai-largetext-embedding-nomictext-embedding-3-large-direct
STT, RAG-Embeddings
model-auto-update routine

NemoClaw v3 prueft taeglich auf neue Modelle.

Polling gegen Anthropic-Releases, OpenAI-Models-API, NVIDIA NIM-Catalog (Free + Paid), HuggingFace Trending, Ollama Library. Bei neuer Major-Version: Automatisch in LiteLLM-Config aufgenommen, paralleler A/B-Test, Cost+Latency-Vergleich via Langfuse, nach Approval Migration des DEFAULT_MODEL. NVIDIA NIM-Free-Tier wird priorisiert wenn ein bezahltes Modell dort verfuegbar wird — spart Cloud-Cost ohne Qualitaetsverlust. Veraltete Modelle landen automatisch im «deprecated»-Bucket mit 30T-Sunset-Fenster.

07 · COMPLIANCE
DSGVO & EU AI Act,
by design.
Audit-Trail append-only, Mensch-im-Loop für alle High-Risk-Outputs, Presidio PII-Filter vor jedem LLM-Call, NeMo Guardrails als Pflicht-Schicht, Risk-Register live, DoC + CE-Konformitaet vorbereitet.
"Alles was die Plattform tut, ist nachvollziehbar. Was sie nicht weiss, fragt sie. Was sie tut, dokumentiert sie. Wer sie nutzt, ist verantwortlich."
Art. 12-22 DSGVO
DSR-Rechte (Auskunft, Loeschung, Berichtigung, Datenuebertragbarkeit). n8n-Workflow + dsr-webform.html als Public-Frontend.
live
Art. 30 DSGVO
VVT · Verzeichnis Verarbeitungstaetigkeiten via OpenMetadata-Discovery automatisiert.
live
Art. 32 DSGVO
TOM · Encryption (SOPS+age), Access-Control (Keycloak RBAC), Backup (Restic 3-2-1-1-0), Audit (audit_events).
live
Art. 35 DSGVO
DPIA für alle High-Risk-Use-Cases. Compliance-Crew + docx-Skill + DPIA-Template.
live
Art. 14 EU AI Act
Mensch-im-Loop · UI-Approval-Modal vor finalem Tool-Call, RBAC-Check pro Aktion.
live
Art. 19 EU AI Act
Audit-Log append-only Trail. SHA-256-Hashes für Input/Output, kein Klartext.
live
Art. 50 EU AI Act
Transparenz · alle KI-generierten Inhalte gekennzeichnet. UI-Watermark, Mail-Footer, Audio-Disclaimer.
live
Anhang III
Risk-Register mit 10 Use-Cases klassifiziert (low/limited/high). Live-Dashboard.
live
Art. 49 EU AI Act
DoC Konformitaetserklaerung-Template + CE-Markierung-Prüfung erstellt.
ready
Art. 17/18
QM-System + technische Dokumentation via Roxtra-QM-Search + EU-Conformity-Declaration-Template.
live
Stichtag
EU AI Act · High-Risk-Systeme
müssen DoC + CE haben
94TAGE / 2026-08-02
08 · PENTEST
OpenMythos.
Geschichten, die brechen wollen.
Statt manueller Prompts erzaehlt OpenMythos Geschichten, in denen ein Test-Agent die Plattform auf realistische Wege zu kompromittieren versucht. Resultate landen in pentest_runs + pentest_findings (Postgres) + erzeugen Tickets für System-Pflege-Crew.

Status W49 LIVE: Orchestriert von SecClawBot via /sec:run. 43 Test-Cases in 6 Kategorien. Daily-Smoke + Weekly-Full + Pre-Deploy-Gate. Externe Pentests dadurch zu 80% intern abgedeckt — Live-Dashboard auf medialine.app/pentest.html.
narrative pentesting

Wenn das System die Story bricht,
brechen wir das System.

Multi-Turn Stories mit eskalierender Manipulation. Test gegen Social-Engineering, PII-Exfiltration via Tool-Use, Markdown-eingebettete Injection-Vectors in KB / Mails / Issue-Templates, Tool-Misuse via Crew-Invoke, Knowledge-Pollution durch vergiftete RAG-Quellen. Output: nicht nur PASS/FAIL sondern Story mit Eskalationspfad, Mitigations, OWASP-LLM-Top-10-Mapping.

Jailbreak-Stories
Multi-Turn Manipulations-Eskalation. Resistenz gegen Social-Engineering über mehrere Runden.
PII-Exfil-Tests
Versuch über Tool-Use Memory + RAG zu PII-Leak zu zwingen. Korrelation gegen Presidio.
Prompt-Injection
Eingebettete Instruktionen in KB-Quellen, Mails, Issue-Templates — testet Inj-Defense.
Tool-Misuse
Versuch privilegierte Aktionen via Crew-Invoke zu erzwingen. RBAC-Test pro Rolle.
Knowledge-Pollution
Vergiftete KB-Quellen. RAG-Source-Confidence-Score wird gestresst.
Narrative Reports
Story mit Eskalationspfad, Mitigations, OWASP-LLM-Top-10-Mapping.
09 · STAKEHOLDER
Sechs Rollen.
Eine Plattform.
Vom Berater bis zum Endkunden — jede Rolle hat eigene RBAC-Whitelist, eigene Skill-Empfehlungen, eigene Crew-Defaults, eigene UI-Defaults.
B
Berater
consulting · mandant-onboarding
Mandanten-Onboarding · Skill-Run docx/pptx · Sales-Pipeline-Review · Compliance-Quick-Check · Mail-Hilfe-Buttons (formal/freundlich/kuerzen/EN/Termin/Folgemail)
G
Geschäftsführung
strategie · reporting
Wochen-Mail-KPI · Steering-Deck (pptx) · Risk-Register-View · Cost-Tracking pro Mandant · Strategie-Brainstorming mit Crew Governance
D
DSB / Compliance
privacy · audit
DSR-Bearbeitung · EU-AI-Act-Risk-Klassifizierung · Audit-Trail-Export · DPIA-Erstellung · Cookie-Banner-Prüfung · Risk-Register-Pflege
I
IT-Lead / SRE
ops · sre
Container-Health-Dashboards · Update-Plan · Backup-Verifikation · Incident-Response · Kapazitaets-Planung · GPU-Auslastung · n8n-Pipelines
D
Data-Engineer
data · analytics
Trino-Queries · dbt-Marts · OpenMetadata-Lineage · h2o-3-AutoML · Schema-Profiling · ClickHouse-Aggregations · Crawl4AI-Pipelines
E
Endkunde
self-service
Mail-Hilfe-Buttons · Wissenssuche Roxtra · DSR-Self-Service via dsr-webform · Telegram-Bot @benefitCLAWbot_bot · Voice-Input
10 · MOBILE
Telegram · @benefitCLAWbot_bot
Mobile Schnittstelle für alle Stakeholder. Webhook → NemoClaw v3 → LiteLLM → Tool-Use-Loop → Antwort. Pro-User-Memory persistent. Voice-Input via Whisper. Slash-Commands für schnellen Zugriff.
b
benefitCLAW · @benefitCLAWbot_bot
online · antwortet in Sekunden
/forecast Sales Q2 für Mandant Schulz GmbH
Lade pipeline-review · ziehe Daten aus crm-postgres · aggregiere via Trino · fasse zusammen...
Erstelle daraus ein pptx für Steering Mittwoch
Skill pptx aktiviert. 7 Slides: Overview, Best-Case, Likely-Case, Risk-Deals, Coverage, Action-Items, Appendix. Branded mit Schulz-Theme. Sende ich gleich. Audit-Log #a4f9.

Aus dem Bus,
aus der Mittagspause,
aus der Realitaet.

Der Telegram-Bot ist das mobile Kommandozentrum. Vollständig RBAC-gesichert, vollständig auditiert, vollständig persistent.

/skills — 80 Skills, kategoriert
/crews — 7 Standard-Crews
/memory — Persistent-State pro User
/tools — 20 Tools mit Status
/status — Plattform-Health
/help — Verfuegbare Commands
voice — Whisper-STT in Telegram-Voice-Messages
inline — Buttons für Crew-Invoke
11 · URLS
Achtzehn Public-URLs.
Eine Cloudflare-Tunnel-Edge.
Alle Subdomains via Caddy + Cloudflare-Tunnel oeffentlich. Keine Port-Forwards. Auto-TLS. RBAC vor jedem Service. Bestehende URLs LIVE, neue Apps in Phase B.

Plattform-Tenants · LIVE

Plattform-Services · LIVE

Cowork-Stack · Phase B / Subdomains vorbereitet

W41–W49

Operations · live datasource

Sechs Live-Dashboards aus echten Backend-Daten — nicht Mock-up. Verbrauch, GPU, Pentest, Self-Service, Status, Index. Datenquelle: cost-proxy:8200 (LiteLLM /spend), pentest-proxy:8201 (Postgres pentest_runs), api-gateway:4001 (Lua-Rate-Limit 60 r/m), dcgm-exporter (Prometheus GPU-Metriken).
Container-Stack 2026-05
+11 neue Container in dieser Welle: dcgm-exporter (GPU-Metriken Prometheus :9400) · redis-embedding-cache (2GB allkeys-lru :6380) · ollama-llava (LLaVA-7B 4.7GB Vision :11436) · cost-proxy (FastAPI LiteLLM /spend :8200) · pentest-proxy (FastAPI Postgres pentest_runs :8201) · api-gateway (OpenResty + Lua-Rate-Limit 60r/m :4001) · autonomous-worker-1/2/3 (LITELLM_API_KEY ✓ injected)
+5 neue Static-Pages × 3 Tenants = 15 Endpoints: /cost.html /billing.html /self-service.html /pentest.html /dashboards.html /status.html
LIVE seit 06.05.2026 3-LAYER GUARDRAILS SELF-IMPROVING

Generative Shield & Self-Improving Agents

Defense-in-Depth fuer KI-Agenten. Drei isolierte Layer schuetzen vor Prompt-Injection, PII-Leak, Toxicity, Bias und Jailbreak. Plus: Agenten legen autonom passende Skills, Knowledge-Bases, Prompts und n8n-Workflows in Open WebUI an — mit komplettem Audit-Trail in Paperclip und Langfuse.

L1 · DATENSCHUTZ
Presidio Analyzer & Anonymizer
DSGVO Art. 25 · PII-Mask in Pre/Post-Call · EMAIL, IBAN, PASSPORT, IP
L2 · POLICY
Pattern-Filter · Sensitivity 70%
12 Jailbreak-Patterns DE+EN · System-Prompt-Reveal-Block · Roleplay-Bypass
L3 · SAFETY-NET
llm-guard Output-Scanner
Toxicity + Bias + Secret-Leak + PII-Restscan · W73 L3 v2.0 BERT (toxic-bert) + OpenMythos-Runner LIVE · LIVE Welle 69 · Pattern-basiert (BERT W70)
SELF-IMPROVING
Skill-Forge & Filesystem-MCP
Agenten generieren Tools/KB/Prompts/Workflows · Sandbox-FS pro Tenant
70%
Cybersecurity Sensitivity
12
Jailbreak-Patterns DE+EN
8+
PII-Entity-Typen (DSGVO)
4
Auto-Skill-Endpoints (Tool/KB/Prompt/Workflow)
Shield-Dashboard oeffnen → Paperclip-Audit →
LIVE seit 06.05.2026 OPEN-SOURCE

Paperclip · die Control-Plane fuer unsere KI-Agenten

Wir setzen Paperclip-Self-Hosted ein, um alle KI-Agenten unter Human-in-the-Loop-Kontrolle zu betreiben — vom Founding Engineer bis zum CEO-Agenten. Jede Aktion wird in der Datenbank protokolliert, jeder Goal kann freigegeben oder gestoppt werden, jeder Cost-Event ist sichtbar. Das ist nicht nur ein nice-to-have — das ist die Voraussetzung fuer EU-AI-Act-Konformitaet bei Hochrisiko-KI-Systemen.

2
Agenten registriert
CEO + Founding Engineer · Adapter: claude_local
1
Pilot · Project · Goal LIVE
Medialine MED · Crawl4AI Monthly · 2 Issues · 2.39 EUR Mai
8
Adapter-Typen verfuegbar
claude-local, codex, opencode, pi, cursor, http, process, openclaw-gateway
100%
Self-Hosted & DSGVO
Postgres-Backup · 60min · 30d Retention

Audit-Trail per Default

Jede Agent-Aktion landet in activity_log. Kosten in cost_events. Heartbeats in heartbeat_runs. EU-AI-Act-konformes Logging out-of-the-box.

Approval-Flow

Neue Agenten brauchen Board-Approval (default an). Issues koennen mit Linked-Approvals einen Code-Run blockieren bis CEO/CFO freigibt.

Multi-Agent-Stack im Container

Claude Code v2.1.71, Codex, OpenCode 1.2.24 sind im paperclipai-Image vorinstalliert. Lokale Ausfuehrung auf DGX Spark GH-Hardware ohne Cloud-Roundtrip.

paperclip.ben-e-fit.ai aufrufen → Eigenen Account anlegen

KI-Berater bereit.

Open WebUI mit voll trainiertem Plattform-Model + 5 Federation-Bots auf Telegram
5 Federation-Bots LIVE · Polling 24/7 · SHA-256 Audit-Trail · on-prem · DSGVO + EU-AI-Act-ready