Zum Inhalt springen

SoverIQ Core

Offen. Prüfbar. Selbst betreibbar.

SoverIQ Core ist die quelloffene Grundlage, auf der SoverIQ Stack, Cloud und Box aufbauen. Wer vollständige Transparenz über jede Schicht seiner KI-Infrastruktur benötigt – oder eigene Erweiterungen tief in den Stack integrieren will – startet mit Core.

Kein proprietärer Kern. Kein versteckter Code. Kein Vertrauen erforderlich.


Was ist SoverIQ Core?

SoverIQ Core ist ein kuratiertes, produktionsreifes Deployment aus Open-Source-Komponenten für selbst gehostete generative KI. Es bringt alle Bausteine mit – von der Modell-Inferenz über die Vektordatenbank bis zur Nutzeroberfläche – und verbindet sie zu einem betriebsbereiten System.

Der Stack ist für Kubernetes ausgelegt, vollständig über Helm konfigurierbar und mit Standard-Observability-Werkzeugen ausgestattet.


Komponenten und verwendete Open-Source-Tools

Modell-Inferenz

KomponenteToolBeschreibung
LLM-RuntimeOllamaLokale Modell-Inferenz für CPU und GPU, OpenAI-kompatible API
Inferenz-Backend (alternativ)vLLMHochdurchsatz-Inferenz für GPU-Cluster, PagedAttention
Modell-HubHugging Face HubModellbezug; Modelle werden lokal gespiegelt, kein laufender Zugriff erforderlich

Unterstützte Modelle (Auswahl): Llama 3, Mistral, Phi-3, Gemma 2, Qwen 2.5 – alle in quantisierten Varianten für CPU-Deployments verfügbar.


RAG-Engine und Wissensdatenbank

KomponenteToolBeschreibung
VektordatenbankQdrantHochleistungs-Vektorspeicher, vollständig on-premise, Rust-basiert
Embedding-Modellenomic-embed-text / multilingual-e5Lokal laufende Embedding-Modelle, DSGVO-konform
RAG-FrameworkLangChain / LlamaIndexDokumentenverarbeitung, Chunking, Retrieval-Pipelines
DokumentenverarbeitungUnstructuredPDF, DOCX, XLSX, HTML, E-Mail – Extraktion und Normalisierung

API-Gateway und Orchestrierung

KomponenteToolBeschreibung
API-GatewayLiteLLM ProxyOpenAI-kompatibler Proxy, Routing zwischen Modellen, Rate Limiting, Usage Tracking
Workflow-Enginen8nLow-Code-Automatisierung für KI-Workflows und Daten-Pipelines
AuthentifizierungKeycloakIdentity-Provider, SAML 2.0, OIDC, RBAC

Nutzeroberfläche

KomponenteToolBeschreibung
Chat-InterfaceOpen WebUIVollständige Chat-Oberfläche, RAG-Integration, Modellauswahl, Konversationshistorie
Admin-InterfaceSoverIQ Admin (eigene Entwicklung, MIT-lizenziert)Nutzerverwaltung, Modell-Deployment, Audit-Log-Ansicht

Observability und Betrieb

KomponenteToolBeschreibung
MetrikenPrometheus + GrafanaInferenz-Latenz, Token-Throughput, GPU-Auslastung, API-Fehlerrate
LoggingLokiLog-Aggregation, strukturiertes Logging aller Komponenten
TracingOpenTelemetry + TempoDistributed Tracing für RAG-Pipelines und API-Calls
AlertingAlertmanager (Prometheus-Stack)Alerts für GPU-Fehler, Modellausfall, Queue-Tiefe

Repositories

SoverIQ Core besteht aus mehreren Repositories:

github.com/soveriq/
├── core                  # Helm Charts, Kubernetes-Manifeste, Konfigurationsreferenz
├── admin                 # SoverIQ Admin UI (React, MIT-Lizenz)
├── connector-framework   # Konnektoren für SAP, SharePoint, DATEV, REST
├── rag-pipelines         # Dokumentenverarbeitungs- und Retrieval-Pipelines
└── deployment-examples   # Beispiel-Deployments: Bare Metal, K3s, EKS, Hetzner

Die Repositories sind derzeit in der Vorbereitung zur Veröffentlichung. Registrieren Sie sich für Early Access.


Kubernetes-Deployment

SoverIQ Core wird vollständig über Helm Charts ausgeliefert. Das Deployment ist für Standard-Kubernetes-Cluster (K3s, RKE2, EKS, GKE mit EU-Region, Hetzner K8s) ausgelegt.

Voraussetzungen

Kubernetes   >= 1.28
Helm         >= 3.12
Storage      ReadWriteOnce PVC (min. 100 GB für Modelle)
RAM          min. 16 GB (CPU-Only), min. 32 GB (mit GPU)
GPU          optional: NVIDIA, CUDA 12.x (für GPU-Inferenz)

Schnellstart

# Repo hinzufügen
helm repo add soveriq https://charts.soveriq.ai
helm repo update

# Namespace anlegen
kubectl create namespace soveriq

# Werte-Datei anpassen
helm show values soveriq/core > values.yaml
# → values.yaml bearbeiten: Modell, Storage, Auth, Domain

# Deployment
helm install soveriq-core soveriq/core \
  --namespace soveriq \
  --values values.yaml

# Status prüfen
kubectl get pods -n soveriq

Was wird deployt?

soveriq-core/
├── ollama              # Modell-Inferenz (StatefulSet + PVC)
├── qdrant              # Vektordatenbank (StatefulSet + PVC)
├── litellm             # API-Gateway (Deployment)
├── open-webui          # Chat-Interface (Deployment)
├── keycloak            # Identity Provider (StatefulSet)
├── n8n                 # Workflow-Engine (Deployment)
├── prometheus-stack    # Metriken + Grafana + Loki (optional)
└── soveriq-admin       # Admin-UI (Deployment)

Alle Komponenten sind per values.yaml einzeln aktivier- und konfigurierbar. Wer z. B. einen bestehenden Keycloak-Server nutzt, deaktiviert einfach die interne Keycloak-Instanz.

Ressourcenprofile

ProfilBeschreibungMin. Hardware
minimalCPU-only, kleines Modell (Phi-3 Mini, Gemma 2B)4 vCPU, 16 GB RAM, 50 GB SSD
standardCPU-only, mittleres Modell (Llama 3 8B quantisiert)8 vCPU, 32 GB RAM, 200 GB SSD
gpu-singleEine NVIDIA GPU, großes Modell (Llama 3 70B quantisiert)16 vCPU, 64 GB RAM, 1× A10G oder RTX 4090
gpu-clusterMehrere GPUs, Hochdurchsatz-Betrieb (vLLM)nach Anforderung

Lizenz

SoverIQ Core ist unter der Apache-2.0-Lizenz veröffentlicht. Kommerzielle Nutzung, Modifikation und Weitergabe sind explizit erlaubt.

Für Organisationen, die SoverIQ Core produktiv einsetzen und professionellen Support, SLAs oder eine verwaltete Erweiterung (Stack, Cloud, Box) benötigen, bieten wir kommerzielle Angebote. Sprechen Sie mit uns.


Community und Beiträge

  • GitHub Discussions: Fragen, Ideen, Erfahrungsberichte
  • Issues: Bug-Reports und Feature-Requests
  • Pull Requests: willkommen – Contribution-Guide im Repository

Early Access: SoverIQ Core befindet sich kurz vor dem ersten öffentlichen Release. Wer früh dabei sein will – als Tester, als Contributor oder als Organisation, die das System produktiv einsetzen möchte – meldet sich gern bei uns.

Early Access anfragen →