HPC-Cluster einrichten
Stellen Sie den HPC-Cluster mit den gewünschten Konfigurationseigenschaften bereit.
Architekturübersicht und NFS-Dateisystemkonfiguration
Der HPC-Cluster besteht aus einem Anmeldeknoten, einem Speicherknoten, dem der Blockspeicherdatenträger zugeordnet ist, 1-3 LSF-Managementknoten und einer Reihe von LSF-Workerknoten.
-
Der Anmeldeknoten wird als Jump-Host bereitgestellt und ist der einzige Knoten mit der öffentlichen IP-Adresse. Andere Knoten haben nur private IP-Adressen. Die einzige Möglichkeit, diese Knoten zu erreichen, ist der Anmeldeknoten. Sie können sich am primären LSF-Management-Host anmelden und die meisten Operationen vom LSF-Management-Host ausführen. Standardmäßig ist
lsfadmin
die einzige Benutzer-ID, die im Cluster erstellt wird. Die Konfiguration ohne SSH-Kennwort wird zwischen dem LSF-Management-Host und den Workern konfiguriert. Sie können jeden anderen Workerknoten mit derlsfadmin
-Benutzer-ID aus dem primären LSF erreichen. -
Der Workerknoten kann eine statische Ressource sein. In diesem Fall wird der Lebenszyklus von Schematicsverwaltet. Sie können eine Reihe statischer Workerknoten anfordern und diese Worker bleiben im LSF-Cluster verfügbar, bis die Aktion Schematics-destroy ausgeführt wird. Die LSF-Ressourcenconnectorfunktion erstellt zusätzliche Worker, wenn nicht genügend Kapazität zum Ausführen von Jobs vorhanden ist, und löscht Worker, wenn der Bedarf abnimmt. Der Lebenszyklus dieser dynamischen Worker wird vom LSF-Ressourcenconnector verwaltet. Warten Sie, bis diese dynamischen Ressourcen in die Cloud zurückgegeben werden, bevor Sie den gesamten VPC-Cluster über Schematicslöschen.
-
IBM Cloud File Storage for VPC wird für die gemeinsame Dateinutzung verwendet. Standardmäßig gibt es zwei Dateifreigabedatenträger mit jeweils 100 GB. Um diese Konfiguration zu ändern, legen Sie den Wert für die Implementierung von custom_file_shares fest.
Die HPC-Clusterlösung stellt ein angepasstes Basisimage bereit, das die LSF-Installation umfasst. Sie können Ihr eigenes angepasstes Image über dem Basisimage erstellen. Weitere Informationen finden Sie unter Angepasstes Image erstellen. Der Image-Service in VPC bietet hierfür eine Möglichkeit. Anschließend können Sie das angepasste Image angeben, das in Schematics für LSF-Managementknoten und Workerknoten verwendet werden soll. Das vom Anmeldeknoten und Speicherknoten verwendete Image ist momentan nicht konfigurierbar (standardmäßigCentOS 7).
SSH-Schlüssel erstellen
Führen Sie die folgenden Schritte aus, um Ihren SSH-Schlüssel zu erstellen:
-
Generieren Sie einen SSH-Schlüssel auf Ihrem System, indem Sie den folgenden Befehl ausführen:
ssh-keygen -t rsa
-
Kopieren und speichern Sie den gesamten Inhalt aus
.ssh/id_rsa.pub
.
SSH-Schlüssel zur VPC-Infrastruktur hinzufügen
- Melden Sie sich bei der IBM Cloud®-Konsole mit Ihren eindeutigen Berechtigungsnachweisen an.
- Klicken Sie im Dashboard auf Menüsymbol
> VPC-Infrastruktur > SSH-Schlüssel.
- Klicken Sie auf Erstellen.
- Geben Sie den SSH-Schlüsselnamen ein (z. B.
po-ibm-ssh-key
), wählen Sie die Standardressourcengruppe aus, fügen Sie Tags hinzu und wählen Sie die Region aus. - Kopieren Sie den öffentlichen Schlüssel und fügen Sie ihn in das Feld Öffentlicher Schlüssel (den Inhalt, den Sie aus
.ssh/id_rsa.pub
gespeichert haben) ein. - Klicken Sie auf SSH-Schlüssel hinzufügen.
API-Schlüssel erstellen
Führen Sie die folgenden Schritte aus, um Ihren API-Schlüssel zu erstellen:
- Wechseln Sie in der Konsole von IBM Cloud zu Verwalten > Zugriff (IAM) > API-Schlüssel.
- Klicken Sie auf IBM Cloud-API-Schlüssel erstellen.
- Geben Sie einen Namen und eine Beschreibung für den API-Schlüssel ein.
- Klicken Sie auf Erstellen.
- Klicken Sie dann auf Anzeigen, um den API-Schlüssel anzuzeigen, Kopieren, um ihn zu kopieren und für einen späteren Zeitpunkt zu speichern, oder klicken Sie auf Download.
HPC-Cluster aus dem IBM Cloud-Katalog erstellen und konfigurieren
Führen Sie die folgenden Schritte aus, um einen HPC-Cluster aus dem IBM Cloud-Katalog zu erstellen und zu konfigurieren:
-
Suchen Sie im Katalog IBM Cloud nach HPC oder _Spectrum LSF_und wählen Sie dann IBM Spectrum LSF aus.
HPC cluster solution page -
Geben Sie im Abschnitt Bereitstellungswerte festlegen die erforderlichen Werte an:
api_key
,ibm_customer_number
,remote_allowed_ips
,ssh_key_name
undzone
. -
Nachdem Sie die Lizenzvereinbarung bestätigt haben, können Sie die Standardwerte für andere Parameter verwenden und auf Installieren klicken. Der HPC-Cluster wird erstellt und innerhalb von 5 Minuten mit der Standardkonfiguration abgeschlossen.
Parameter für Clusterbereitstellung
Die folgende Tabelle enthält eine Liste der Parameter, die Sie für Ihren HPC-Cluster konfigurieren können.
Parameter | Beschreibung |
---|---|
cluster_prefix |
Das Präfix, das zum Benennen der VPC-Ressourcen verwendet wird, die zum Erstellen des HPC-Clusters bereitgestellt werden. Es gibt Ressourcen, deren Namen innerhalb desselben Cloudkontos in einer einzelnen Region eindeutig sein müssen. Stellen Sie sicher, dass der Name eindeutig ist (fügen Sie beispielsweise Ihre Initialen zum Namen po-hpc-cluster hinzu). |
hyperthreading_enabled |
Sie können Hyper-Threading in den Workerknoten des Clusters aktivieren, indem Sie diesen Wert auf 'true' (Standardwert) setzen. Andernfalls ist Hyper-Threading inaktiviert. |
image_name |
Bearbeiten Sie das angepasste Image mit LSF und fügen Sie es hinzu. Sie können das angepasste LSF-Standardimage verwenden, das von der Lösung bereitgestellt wird. Wenn Sie ein eigenes angepasstes Image erstellt haben, bearbeiten Sie den Wert in den Namen Ihres angepassten Image. |
management_node_count |
Im Cluster können bis zu drei Managementknoten vorhanden sein. Wenn die von LSF bereitgestellte Failoverunterstützung verwendet werden soll, müssen Sie einen Wert größer als eins angeben. Wenn in diesem Fall der primäre Managementknoten inaktiv ist, wird einer der potenziellen Managementknoten zum primären Managementknoten und Ihr Cluster bleibt ohne Unterbrechung funktionsfähig. |
region |
Bearbeiten Sie die Region, in der Ihr Cluster erstellt werden soll. Eine vollständige Liste der Regionen finden Sie unter VPC in einer anderen Region erstellen. |
resource_group |
Der Name der Ressourcengruppe aus Ihrem IBM Cloud-Konto, in dem die VPC-Ressourcen implementiert sind. |
vpc_name |
Sie können eine vorhandene VPC verwenden, in der die Clusterressourcen bereitgestellt werden. Wenn kein Wert angegeben ist, wird eine neue VPC für den Cluster bereitgestellt. |
vpn_enabled |
Sie können ein VPN-Gateway für VPC im Cluster implementieren. Standardmäßig ist der Wert auf ' false' gesetzt. |
vpn_peer_address |
Die öffentliche Peer-IP-Adresse, mit der das VPN verbunden ist |
vpn_peer_cidrs |
Eine durch Kommas getrennte Liste von Peer-CIDRs (z. B. 192.168.0.0/24), mit denen das VPN verbunden ist. |
vpn_preshared_key |
Der vorab verteilte Schlüssel für das VPN. |
zone |
Bearbeiten Sie die Zone basierend auf der ausgewählten Region. Eine vollständige Liste der Zonen in einer Region finden Sie unter Zonen über die Befehlszeilenschnittstelle abrufen. |
Parameter für automatische Skalierung
Sie können die folgenden Parameter für die automatische Skalierung festlegen:
-
worker_node_min_count
: Die minimale Anzahl der Workerknoten, die zum Zeitpunkt der Clustererstellung bereitgestellt werden und unabhängig vom Jobbedarf im Cluster aktiv bleiben. -
worker_node_max_count
: Die maximale Anzahl der Workerknoten in Ihrem HPC-Cluster, die die Anzahl der Maschinen begrenzt, die zum HPC-Cluster hinzugefügt werden können. Die automatische Skalierung von LSF skaliert den Cluster auf diese Anzahl von Knoten, wenn sie für Ihre Workloads benötigt werden, und skaliert zurück, damit nurworker_node_min_count
-Worker beibehalten werden, wenn sich kein Job in den Warteschlangen befindet.
Parameter für Instanzprofile
Sie können das Instanzprofil für jeden Instanztyp über die Parameter xxx_node_instance_type
steuern. Auf den Managementknoten werden die LSF-Hauptdämonen ausgeführt. Sie müssen diejenigen mit mehr Rechenleistung auswählen, wenn
Sie Jobs mit mehr als 100 Knoten ausführen möchten. Die Workerknoten sind die Knoten, auf denen die Workloadausführung stattfindet, und die Auswahl muss entsprechend dem Merkmal der Workloads getroffen werden. Der Speicherknoten ist derjenige,
der das NFS-Dateisystem für Ihren HPC-Cluster verwaltet. Die Anmeldeinstanz wird als Jump-Host bereitgestellt, sodass Sie das kleinste Profil auswählen können. Weitere Informationen hierzu finden Sie unter Instanzprofile.
Parameter für Blockdatenträger
Sie können die Speicherkapazität und den Durchsatz mithilfe der Parameter volume_xxx
konfigurieren. Der Wert für den Parameter volume_profile
kann entweder allgemein oder benutzerdefiniert sein. Wenn general-purpose
verwendet wird, werden die E/A-Operationen pro Sekunde von der Cloudinfrastruktur bestimmt und der Parameter volume_iops
hat keine Auswirkung. Wenn Sie die E/A-Operationen pro Sekunde anpassen möchten, müssen Sie die angepasste
Einstellung für volume_profiles
verwenden und die E/A-Operationen pro Sekunde über volume_iops
auf der Basis der Kapazität einrichten, die in volume_capacity
angegeben ist. Weitere Informationen finden
Sie unter Blockspeicherprofile.
Zugriff auf den HPC-Cluster
Führen Sie die folgenden Schritte aus, um auf Ihren HPC-Cluster zuzugreifen:
-
Rufen Sie Menüsymbol
> Aktivität > Plan angewendet > Protokoll anzeigen auf.
-
Kopieren Sie
ssh-command
, um auf Ihren Cluster zuzugreifen.-
ssh -J root@ip-jumphost lsfadmin@ip-managementhost
-
Der Wert für
ip-jumphost
istpublic
, der Wert fürip-managementhost
jedoch nicht. -
-J flag
: Stellt eine Verbindung zum Jump-Host her und richtet eine TCP-Weiterleitung zum endgültigen Ziel (Management-Host) ein.
-
Automatische Skalierung
Sie haben eine Mindestanzahl von Workerknoten (worker_node_min_count
). Dies ist die Anzahl der Workerknoten, die zum Zeitpunkt der Clustererstellung bereitgestellt werden. Sie können jedoch eine maximale Anzahl von Workerknoten
verwenden, die dem von worker_node_max_count
definierten Spectrum LSF-Cluster hinzugefügt werden sollen. Damit wird die Anzahl der Maschinen begrenzt, die zum Cluster Spectrum LSF hinzugefügt werden können, wenn die Konfiguration
für automatische Skalierung verwendet wird. Diese Eigenschaft kann verwendet werden, um die Kosten zu verwalten, die der Clusterinstanz Spectrum LSF zugeordnet sind.
Das folgende Beispiel zeigt worker_node_min_count=2
und worker_node_max_count=10
.
-
Führen Sie den folgenden Befehl aus, um die beiden Workerknoten zu überprüfen:
bhosts -w
Beispielausgabe:
Zwei Workerknoten -
Führen Sie zum Testen der Funktion für automatische Skalierung einen Job aus, für den mehr als zwei Knoten erforderlich sind. Für diesen Job sind beispielsweise fünf Jobs erforderlich, die 10 Sekunden lang inaktiv sind:
bsub -n 5 -R "span[ptile=1]" sleep 10
-
Der Job wird übergeben.
-
Überprüfen Sie nach einer Minute die Knoten, indem Sie den folgenden Befehl ausführen:
bhosts -w
Sie sehen, dass Ihrem Cluster jetzt fünf Knoten hinzugefügt wurden:
Fünf hinzugefügte Workerknoten -
Die Unterschiede zwischen Knoten, die von der Funktion für automatische Skalierung erstellt wurden, werden automatisch gelöscht, nachdem sie 10 Minuten lang nicht verwendet wurden.
Passen Sie Ihren HPC-Cluster an Ihre Workloads an
Sie haben zwei Möglichkeiten, Softwarepakete im Cluster für Ihre Workload hinzuzufügen. Sie können die zusätzliche Software im gemeinsam genutzten NFS-Dateisystem (z. B. /home/lsfadmin/shared
vom LSF-Management-Host) installieren,
die für alle Rechenknoten sichtbar ist. Die Dateien, die Sie zum gemeinsam genutzten NSF-Dateisystem hinzufügen, werden im Blockspeicher gespeichert, der dem Speicherknoten zugeordnet ist. Die Daten gehen verloren, wenn der gesamte HPC-Cluster
gelöscht wird. Denken Sie daran, die Daten zu speichern, die Sie behalten möchten, bevor Sie den Cluster löschen.
Die andere Option besteht darin, Ihr eigenes angepasstes Image auf dem Standardimage zu erstellen, das von der HPC-Clusterlösung verwendet wird. Die Erstellung des angepassten Image muss vorbereitet werden, bevor Sie einen HPC-Cluster erstellen
können. Wenn ein neues angepasstes Image in VPC erstellt wird, wird diesem Image ein Name zugeordnet. Sie müssen diesen Namen im Parameter image_name
verwenden. Weitere Informationen finden Sie unter Basisimage erweitern und neues angepasstes Image erstellen.
(Optional) Hybridkonnektivität einrichten
Wenn Sie eine Hybrid-Konnektivitätsumgebung mithilfe von VPN einrichten möchten, lesen Sie die Anweisungen unter VPN in HPC-Cluster installieren.
Wenn Sie Direct Linkverwenden möchten, lesen Sie die Anweisungen zum Installieren von Direct Link in einem HPC-Cluster.
Verwenden von OpenLDAP mit IBM Spectrum LSF
Weitere Informationen zu OpenLDAP mit IBM Spectrum LSFfinden Sie unter Informationen zu OpenLDAP mit IBM Spectrum LSF.
Während der Bereitstellung aktivieren Sie OpenLDAP mit Ihrem IBM Spectrum LSF-Cluster, indem Sie die Eingabewerte für die Bereitstellung enable_ldap
,ldap_basedns
, ldap_server
, ldap_admin_password
,
ldap_user_name
und ldap_user_password
festlegen.
Weitere Informationen zur Integration von OpenLDAP in Ihren IBM Spectrum LSF-Cluster finden Sie unter OpenLDAP in Ihren IBM Spectrum LSF-Cluster integrieren.
DNS-Zonen und angepassten DNS-Auflöser erstellen
Wenn Sie den Eingabewert für die dns_instance_id
-Implementierung auf null setzen, erstellt der Implementierungsprozess eine neue DNS-Serviceinstanz-ID in der entsprechenden DNS-Zone. Alternativ können Sie eine vorhandene IBM Cloud® DNS-Serviceinstanz-ID für den Bereitstellungseingabewert dns_instance_id
angeben.
Wenn Sie den Eingabewert für die dns_custom_resolver_id
-Bereitstellung auf null setzen, erstellt der Bereitstellungsprozess eine neue VPC und aktiviert einen neuen angepassten Auflöser für Ihren Cluster. Um angepasste DNS-Auflöser
mit einer vorhandenen VPC zu erstellen, geben Sie alternativ die Auflöser-ID für den Eingabewert der dns_custom_resolver_id
-Implementierung an. Weitere Informationen finden Sie unter DNS custom resolvers for your IBM Spectrum LSF cluster.
IBM Key Protect-Instanzen für die Verwaltung der Datenverschlüsselung verwenden
Verwenden Sie zum Verwalten der Datenverschlüsselung für Ihre virtuellen Serverinstanzen die IBM Key Protect-Instanz über den IBM Spectrum LSF-Cluster. Weitere Informationen zu Key Protect und Verschlüsselungsschlüsseln finden Sie in IBM® Key Protect und Verschlüsselungsschlüsseln.