Welche Hardwareanforderungen gibt es für eine On-Premises-Installation von DeepVA?
DeepVA lässt sich flexibel skalieren – für Echtzeit- oder parallele Analysen werden mehrere Worker benötigt, während bei geringeren Anforderungen auch ein einzelner Worker ausreicht, um kosteneffizient nacheinander Analysen durchzuführen.
DeepVA kann On-Premises installiert werden, um spezifische Anforderungen an Datenschutz, Sicherheit oder bestehende Infrastruktur zu erfüllen. Die Plattform basiert auf einer modularen und skalierbaren Architektur, bei der sich die Leistung durch das Hinzufügen dedizierter Worker-Nodes horizontal skalieren lässt – abhängig von Workload, Parallelisierung und Echtzeitanforderungen.
Das System besteht aus einem Basissystem, das alle zentralen Plattformdienste betreibt, sowie aus einem oder mehreren Worker-Nodes, die rechenintensive KI-Workloads ausführen. Je nach eingesetzten KI-Modulen kommen unterschiedliche Worker-Typen zum Einsatz.
Kontaktieren Sie uns:
Wenn Sie Fragen haben oder Unterstützung bei der Auswahl der optimalen Hardware-Konfiguration für Ihren Anwendungsfall benötigen, steht Ihnen unser Team jederzeit gerne zur Verfügung!
Systemanforderungen (Basis-System)
Das Basissystem betreibt die zentralen Plattformkomponenten, darunter:
-
Webserver
-
Backend-Services
-
Datenbanken
-
Message Broker
Mindestanforderungen
-
CPU: 8 Kerne
-
Arbeitsspeicher (RAM): 16 GB
-
Speicher: 512 GB Festplattenspeicher
Empfohlene Anforderungen
-
CPU: 16 Kerne
-
Arbeitsspeicher (RAM): 32 GB
-
Speicher: 512 GB Festplattenspeicher
Diese Anforderungen stellen einen stabilen Betrieb der Plattform sowie eine zuverlässige Orchestrierung der Worker-Nodes sicher, insbesondere in Produktionsumgebungen mit mehreren Workern.
Anforderungen an Worker-Nodes
Worker-Nodes übernehmen die rechenintensiven Analyseaufgaben. Anzahl und Typ der Worker können je nach Durchsatz, Latenzanforderungen und eingesetzten Modulen flexibel skaliert werden.
Mining Worker
Mining Worker verarbeiten die Workloads der Mining-Module und KI-Services.
-
CPU: 8 Kerne
-
Arbeitsspeicher (RAM): 16 GB
-
Speicher: 512 GB Festplattenspeicher
-
GPU: NVIDIA GPU mit mindestens 12 GB VRAM
Geeignet für Standard-KI-Analysen, z.B. Transkription, Gesichtserkennung, für die Metadaten Extraktion und Mining-Workloads.
LLM Worker (Visual Understanding)
LLM Worker werden für fortgeschrittene visuelle Analyse und Inferenz großer Modelle benötigt.
-
CPU: 8 Kerne
-
Arbeitsspeicher (RAM): 16 GB
-
Speicher: 512 GB Festplattenspeicher
-
GPU: NVIDIA GPU mit mindestens 24 GB VRAM
Erforderlich für leistungsintensive Modelle sowie Vision-Language-Workloads.
Skalierungsempfehlungen
-
Hochleistungs- / Echtzeit-Anwendungsfälle
→ Einsatz mehrerer Worker-Nodes mit GPU-Beschleunigung -
Geringerer Durchsatz / Sequentielle Verarbeitung
→ Weniger Worker einsetzen und bei Bedarf schrittweise skalieren
Dank des modularen Designs können unterschiedliche Worker-Typen kombiniert und unabhängig voneinander skaliert werden, wenn sich die Anforderungen ändern.
Weiteren Informationen:
Kontaktieren Sie uns:
Wenn Sie Fragen haben oder Unterstützung bei der Auswahl der optimalen Hardware-Konfiguration für Ihren Anwendungsfall benötigen, steht Ihnen unser Team jederzeit gerne zur Verfügung!