Google Cloud hat die Umbenennung des Cloud HPC Toolkit in Cluster Toolkit angekündigt und seinen Anwendungsbereich um KI/ML-Workloads erweitert. Das Toolkit vereinfacht die Erstellung und Verwaltung von Hochleistungsrechenumgebungen in Google Cloud.

Diese Änderung spiegelt die breite Akzeptanz von Cluster Toolkit in verschiedenen Bereichen wider, von wissenschaftlichem und technischem Rechnen bis hin zu KI/ML-Anwendungen.

Durch die Vereinfachung der Einrichtung und Bereitstellung von Clustern ermöglicht Cluster Toolkit den Benutzern, sich auf ihre Workloads zu konzentrieren, anstatt sich um die Infrastrukturverwaltung zu kümmern. Es bietet außerdem Flexibilität für verschiedene Rechenaufgaben durch die Unterstützung mehrerer Scheduler wie Slurm, GKE und Batch.

Zu den Hauptvorteilen von Cluster Toolkit gehören:

* Einfache Bereitstellung und Verwaltung von Clustern

* Schnellstartoptionen für HPC- und KI/ML-Workloads

* Integration von Best Practices von Google Cloud

* Regelmäßige Updates und neue Funktionen

* Open-Source-Zugänglichkeit

Zu den neuen Funktionen in Cluster Toolkit gehören:

* A3 Mega Blueprint: Zur Bereitstellung eines Clusters von A3 Mega VMs, die für das Training großer Sprachmodelle (LLMs) und anderer KI/ML-Workloads bereit sind.

* HPC VM Image: Ein VM-Image, auf dem beliebte HPC-Tools und -Bibliotheken vorinstalliert sind.

* Slurm-gcp v6: Die neueste Version der Slurm-gcp-Lösung, die eine nahtlose Ausführung von Slurm-Workloads in Google Cloud ermöglicht.

Es wird dringend empfohlen, lokale Klone und Befehlsnamen zu aktualisieren, um Verwirrung zu vermeiden.

Um mit Cluster Toolkit zu beginnen, wählen Sie einen der benutzerfreundlichen HPC- und KI/ML-Blueprints aus, die über das GitHub-Repository verfügbar sind, und richten Sie damit einen Cluster ein. Es werden außerdem verschiedene Ressourcen angeboten, die Ihnen den Einstieg erleichtern, darunter Dokumentation, Schnellstarts und Videos.