Systemkonfiguration für GPU-Betrieb

Möchten Sie KI-Modelle auf einer GPU beschleunigt betreiben, sind folgende Voraussetzungen und Konfigurationen zu beachten.

Voraussetzungen

Verwenden Sie ein Beckhoff Image für IPCs mit einer ab Werk eingebauten GPU, um sicherzustellen, dass alle erforderlichen Voraussetzungen für den Betrieb des TwinCAT Machine Learning Servers bereits erfüllt sind.

Beachten Sie, dass der TCC-mode nur auf C6043 Geräten mit GPU-Optionen ohne DisplayPort aktiviert ist. Beispiel 1: Die Option C9900-A205 ist eine NVIDIA RTX™ 2000 GPU ohne DisplayPort. Hier ist der TCC-mode bereits aktiviert. Beispiel 2: Die Option C9900-A206 ist eine NVIDIA RTX™ 2000 GPU mit DisplayPort. Hier ist der TCC-mode nicht aktiviert, weil bei aktiviertem TCC-mode die Grafikausgabe nicht funktioniert.

Sollten Sie einen Drittanbieter-PC, ein eigenes Image oder einen Beckhoff-IPC mit Drittanbieter-GPU betreiben, beachten Sie bitte

Installation der NVIDIA®-Komponenten

Wenn für die GPU-beschleunigte KI-Modellausführung keine Beckhoff-Hardware mit zugehörigem Beckhoff Image verwendet wird, sind Sie als Kunde selbstständig dafür verantwortlich, auf dem System die notwendigen Rahmenbedingungen für einen Betrieb der Grafikkarte herzustellen.

Systemkonfiguration für GPU-Betrieb 1:

Sollten Sie einen Beckhoff IPC mit GPU und zugehörigem Beckhoff Image verwenden, können Sie diesen Abschnitt überspringen.

Systemvoraussetzungen

Die Systemvoraussetzungen betreffen insbesondere die erforderlichen Komponenten von NVIDIA®. Die im folgenden aufgeführten Software-Versionen sollten nicht aktueller sein als die angegeben Versionen (z. B. nicht CUDA® 12.6 installieren), da es ansonsten zu Inkompatibilitäten kommt.

NVIDIA®-Treiber

CUDA® (Compute Unified Device Architecture)

cuDNN

In der Regel werden durch die obigen Maßnahmen die folgenden Voraussetzungen auf dem System erfüllt:

Laufzeitverhalten

Bei Verwendung von Drittanbieter-GPUs können, abhängig von der konkreten GPU und dessen Einstellungen, erhebliche Laufzeitschwankungen bei der Modellausführung auftreten.

Der TwinCAT Machine Learning Server informiert direkt nach dem Starten des Servers im Log-File über mögliche Herausforderungen der verwendeten Grafikkarte.

Konfiguration des Betriebsmodus der GPU

Sie können NVIDIA®-GPUs in den sogenannten TCC (Tesla Compute Cluster)-Modus versetzen und damit alle Rechenressourcen der GPU für Rechenaufgaben, zum Beispiel die Inferenz eines KI-Modells, reservieren.

Systemkonfiguration für GPU-Betrieb 2:

Beckhoff IPCs mit einer ab Werk eingebauten GPU ohne DisplayPort werden im TCC-Modus ausgeliefert.

Was ist der TCC- Modus?

Der NVIDIA® TCC-Modus stellt einen speziellen Betriebsmodus für NVIDIA®-GPUs dar, bei dem die Grafikausgabe deaktiviert wird, um die GPU ausschließlich für Rechenaufgaben zu optimieren.

Hinweis: Viele CPUs sind mit einer integrierten GPU (iGPU) ausgestattet, sodass trotz aktiviertem TCC-Modus ein angeschlossener Monitor weiterhin genutzt werden kann. Dies gilt beispielsweise für die IPCs der Reihe C6043.

Bitte beachten Sie, dass der TCC-Modus nicht für alle GPUs verfügbar ist. Informationen zur Kompatibilität Ihrer GPU finden Sie direkt bei NVIDIA®. Alle von Beckhoff angebotenen GPUs unterstützen den TCC-Modus.

Welche Vorteile hat der TCC-Modus?

Wie setze ich den TCC-Modus?

Öffnen sie das Windows Command Prompt mit Administratorrechten. Aktivieren Sie den TCC-Modus mit dem Befehl

nvidia-smi -g <GPU-Index> -dm 1

-g steht für die GPU-ID (z. B. 0, 1, 2 …)

-dm 1 beudetet TCC-Modus einschalten

Beispiele

Aktivieren des TCC-Modus für die erste GPU

nvidia-smi -g 0 -dm 1

Aktivieren des TCC-Modus für alle kompatiblen GPUs

nvidia-smi -dm 1

Ein Neustart des Systems wird empfohlen.