Configuración de un clúster HPC
Despliegue el clúster HPC con las propiedades de configuración que elija.
Visión general de la arquitectura y configuración del sistema de archivos NFS
El clúster HPC consta de un nodo de inicio de sesión, un nodo de almacenamiento donde está conectado el volumen de almacenamiento en bloque, 1-3 nodos de gestión LSF y un número de nodos trabajadores LSF.
-
El nodo de inicio de sesión se sirve como host de salto y es el único nodo que tiene la dirección IP pública. Otros nodos sólo tienen direcciones IP privadas y la única forma de acceder a estos nodos es a través del nodo de inicio de sesión. Puede iniciar la sesión en el host de gestión de LSF primario y realizar la mayoría de las operaciones desde el host de gestión de LSF. De forma predeterminada,
lsfadmin
es el único ID de usuario creado en el clúster. La configuración sin contraseña SSH está configurada entre el host de gestión LSF y los trabajadores. Puede acceder a cualquier otro nodo trabajador con el ID de usuariolsfadmin
desde el LSF primario. -
El nodo trabajador puede ser un recurso estático. En este caso, su ciclo de vida está gestionado por Schematics. Puede solicitar un número de nodos trabajadores estáticos y estos trabajadores permanecen disponibles en el clúster LSF hasta que se realice una acción Schematics-destroy. La función de conector de recursos LSF crea trabajadores adicionales cuando no hay suficiente capacidad para ejecutar trabajos y destruye trabajadores cuando disminuyen las demandas. El ciclo de vida de estos trabajadores dinámicos está gestionado por el conector de recursos LSF. Espere a que estos recursos dinámicos se devuelvan a la nube antes de destruir todo el clúster de VPC a través de Schematics.
-
IBM Cloud File Storage for VPC se utiliza para el uso compartido de archivos. De forma predeterminada, hay dos volúmenes de compartición de archivos; cada uno es de 100 GB. Para cambiar esta configuración, establezca el valor de despliegue custom_file_shares.
La solución de clúster de HPC proporciona una imagen personalizada base, que incluye la instalación de LSF. Puede crear su propia imagen personalizada encima de la imagen base. Para obtener más información, consulte Crear imagen personalizada. El servicio de imagen en VPC proporciona una forma de hacerlo. A continuación, puede especificar la imagen personalizada que desea utilizar en Schematics para nodos de gestión de LSF y nodos trabajadores. La imagen que utiliza el nodo de inicio de sesión y el nodo de almacenamiento no se puede configurar en este momento (CentOS 7 de forma predeterminada).
Crear una clave SSH
Realice los pasos siguientes para crear la clave SSH:
-
Genere una clave SSH en el sistema ejecutando el mandato siguiente:
ssh-keygen -t rsa
-
Copie y guarde todo el contenido de
.ssh/id_rsa.pub
.
Añadir clave SSH a la infraestructura de VPC
- Inicie sesión en la consola deIBM Cloud® utilizando sus credenciales exclusivas.
- En el panel de control, pulse Icono de menú
> Infraestructura de VPC > Claves SSH.
- Pulse Crear.
- Especifique el nombre de clave SSH (por ejemplo,
po-ibm-ssh-key
), seleccione el grupo de recursos predeterminado, añada etiquetas y seleccione la región. - Copie y pegue la clave pública en el campo Clave pública (el contenido que ha guardado de
.ssh/id_rsa.pub
). - Pulse Añadir clave SSH.
Crear clave de API
Realice los pasos siguientes para crear la clave de API:
- En la consola de IBM Cloud, vaya a Gestionar > Acceso (IAM) > Claves de API.
- Pulse Crear una clave de API de IBM Cloud.
- Especifique un nombre y una descripción para su clave de API.
- Pulse Crear.
- A continuación, pulse Mostrar para visualizar la clave de API, Copiar para copiarla y guardarla para más adelante o pulse Descargar.
Crear y configurar un clúster HPC desde el catálogo de IBM Cloud
Realice los pasos siguientes para crear y configurar un clúster de HPC desde el catálogo de IBM Cloud:
-
En el catálogo IBM Cloud, busque HPC o _Spectrum LSF_y, a continuación, seleccione IBM Spectrum LSF.
Página de solución de clúster de HPC -
En la sección Establecer los valores de despliegue, proporcione los valores necesarios:
api_key
,ibm_customer_number
,remote_allowed_ips
,ssh_key_name
yzone
. -
Después de confirmar con el acuerdo de licencia, puede utilizar los valores predeterminados para otros parámetros y pulsar Instalar. El clúster HPC se crea y se completa en 5 minutos con la configuración predeterminada.
Parámetros para el despliegue de clúster
Consulte la tabla siguiente para obtener una lista de los parámetros que puede configurar para el clúster de HPC:
Parámetro | Descripción |
---|---|
cluster_prefix |
El prefijo utilizado para nombrar los recursos de VPC que se suministran para crear el clúster de HPC. Hay recursos en los que sus nombres deben ser exclusivos en la misma cuenta de nube dada una sola región. Asegúrese de que el nombre sea exclusivo (por ejemplo, añada las iniciales al nombre: po-hpc-cluster). |
hyperthreading_enabled |
Puede habilitar hyper-threading en los nodos trabajadores del clúster estableciendo este valor en true (valor predeterminado). De lo contrario, hyper-threading está inhabilitado. |
image_name |
Edite y añada la imagen personalizada con LSF. Puede utilizar la imagen personalizada LSF predeterminada que proporciona la solución. Si ha creado su propia imagen personalizada, edite el valor con el nombre de la imagen personalizada. |
management_node_count |
Puede tener hasta tres nodos de gestión en el clúster. Si desea soporte de migración tras error proporcionado por LSF, debe especificar que el valor sea mayor que uno. En este caso, cuando el nodo de gestión primario está inactivo, uno de los nodos de gestión candidatos pasa a ser el primario y el clúster permanece funcional sin interrupción. |
region |
Edite la región donde desea que se cree el clúster. Para obtener una lista completa de regiones, consulte Creación de una VPC en una región diferente. |
resource_group |
El nombre del grupo de recursos de la cuenta de IBM Cloud donde se despliegan los recursos de VPC. |
vpc_name |
Puede utilizar una VPC existente en la que se suministran los recursos de clúster. Si no se proporciona ningún valor, se suministra una nueva VPC para el clúster. |
vpn_enabled |
Puede desplegar una pasarela VPN para VPC en el clúster. De forma predeterminada, el valor se establece en false. |
vpn_peer_address |
La dirección IP pública de igual a la que está conectada la VPN. |
vpn_peer_cidrs |
Lista separada por comas de CIDR de igual (por ejemplo, 192.168.0.0/24) a los que está conectada la VPN. |
vpn_preshared_key |
La clave precompartida para la VPN. |
zone |
Edite la zona basándose en la región seleccionada. Para obtener una lista completa de zonas dentro de una región, consulte Obtener zonas utilizando la CLI. |
Parámetros para el escalado automático
Puede establecer los parámetros siguientes para el escalado automático:
-
worker_node_min_count
: el número mínimo de nodos trabajadores que se suministran en el momento en que se crea el clúster y permanecen en ejecución independientemente de las demandas de trabajo del clúster. -
worker_node_max_count
: el número máximo de nodos trabajadores en el clúster de HPC, que limita el número de máquinas que se pueden añadir al clúster de HPC. El escalado automático de LSF aumenta el clúster a este número de nodos cuando es necesario para las cargas de trabajo y se escala para mantener solo los trabajadores deworker_node_min_count
cuando no hay ningún trabajo en las colas.
Parámetros para perfiles de instancia
Puede controlar el perfil de instancia para cada tipo de instancia a través de los parámetros xxx_node_instance_type
. Los nodos de gestión son donde se ejecutan los daemons LSF principales. Debe seleccionar otros con más potencia
de cálculo si tiene previsto ejecutar trabajos utilizando más de 100 nodos. Los nodos de trabajador son los nodos en los que tiene lugar la ejecución de la carga de trabajo y es necesario realizar la elección de acuerdo con la característica
de las cargas de trabajo. El nodo de almacenamiento es el que gestiona el sistema de archivos NFS para el clúster HPC. La instancia de inicio de sesión se sirve como un host de salto, por lo que puede elegir el perfil más pequeño. Para obtener
más información, consulte Perfiles de instancia.
Parámetros para volúmenes en bloque
Puede configurar la capacidad de almacenamiento y el rendimiento utilizando los parámetros volume_xxx
. El valor del parámetro volume_profile
puede ser de finalidad general o personalizado. Cuando se utiliza general-purpose
,
la infraestructura de nube determina IOPS y el parámetro volume_iops
no tiene ningún efecto. Si desea personalizar el IOPS, debe utilizar personalizado para volume_profiles
y configurar el IOPS a través de volume_iops
en función de la capacidad especificada en volume_capacity
. Para obtener más información, consulte Perfiles de almacenamiento en bloques.
Acceso al clúster HPC
Para acceder al clúster de HPC, realice los pasos siguientes:
-
Vaya al icono Menú
> Actividad > Plan aplicado > Ver registro.
-
Copie
ssh-command
para acceder al clúster.-
ssh -J root@ip-jumphost lsfadmin@ip-managementhost
-
ip-jumphost
espublic
, mientras queip-managementhost
no lo es. -
-J flag
: se conecta al host de salto y establece un reenvío TCP al destino final (host de gestión).
-
Escalado automático
Tiene un número mínimo de nodos trabajadores (worker_node_min_count
). Este es el número de nodos trabajadores que se suministran en el momento en que se crea el clúster. Sin embargo, puede utilizar un número máximo de nodos trabajadores
que se deben añadir al clúster Spectrum LSF definido por worker_node_max_count
. Esto es para limitar el número de máquinas que se pueden añadir al clúster Spectrum LSF cuando se utiliza la configuración de escalado automático.
Esta propiedad se puede utilizar para gestionar el coste asociado con la instancia de clúster Spectrum LSF.
El ejemplo siguiente muestra worker_node_min_count=2
y worker_node_max_count=10
.
-
Para comprobar los dos nodos de trabajador, ejecute el mandato siguiente:
bhosts -w
Salida de ejemplo:
Dos nodos trabajadores -
Para probar la función de escalado automático, ejecute un trabajo que requiera más de dos nodos. Por ejemplo, este trabajo requiere que cinco trabajos duerman durante 10 segundos:
bsub -n 5 -R "span[ptile=1]" sleep 10
-
Se somete el trabajo.
-
Después de un minuto, compruebe los nodos ejecutando el mandato siguiente:
bhosts -w
Puede ver que ahora se han añadido cinco nodos al clúster:
Se han añadido cinco nodos trabajadores -
La diferencia de nodos creados por la función de escalado automático se destruye automáticamente después de 10 minutos de no utilizarse.
Personalizar el clúster de HPC para las cargas de trabajo
Tiene dos opciones para añadir paquetes de software en el clúster para la carga de trabajo. Puede instalar el software adicional en el sistema de archivos compartidos NFS (por ejemplo, /home/lsfadmin/shared
desde el host de gestión
LSF), que es visible para todos los nodos de cálculo. Los archivos que añada al sistema de archivos compartidos NSF se almacenan en el almacenamiento en bloque que está conectado al nodo de almacenamiento. Los datos se pierden cuando se destruye
todo el clúster HPC. Recuerde guardar los datos que desea conservar antes de destruir el clúster.
La otra opción es crear su propia imagen personalizada encima de la imagen predeterminada utilizada por la solución de clúster HPC. La creación de la imagen personalizada debe estar preparada antes de crear un clúster HPC. Cuando se crea una
nueva imagen personalizada en VPC, se asocia un nombre con esta imagen. Debe utilizar este nombre en el parámetro image_name
. Para obtener más información, consulte Ampliar imagen base y crear una nueva imagen personalizada.
(Opcional) Configurar la conectividad híbrida
Si desea configurar un entorno de conectividad híbrida utilizando VPN, consulte las instrucciones Instalación de una VPN en un clúster HPC.
Si desea utilizar Direct Link, consulte las instrucciones para Instalación de Direct Link en un clúster HPC.
Utilización de OpenLDAP con IBM Spectrum LSF
Si desea obtener más información sobre OpenLDAP con IBM Spectrum LSF, consulte Acerca de OpenLDAP con IBM Spectrum LSF.
Durante el despliegue, habilite OpenLDAP con el clúster IBM Spectrum LSF estableciendo los valores de entrada de despliegue enable_ldap
,ldap_basedns
, ldap_server
, ldap_admin_password
, ldap_user_name
y ldap_user_password
.
Si desea obtener más información sobre la integración de OpenLDAP con el clúster de IBM Spectrum LSF, consulte Integración de OpenLDAP con el clúster de IBM Spectrum LSF.
Crear zonas DNS y programa de resolución personalizado DNS
Si deja el valor de entrada de despliegue dns_instance_id
como nulo, el proceso de despliegue crea un nuevo ID de instancia de servicio DNS en la zona DNS respectiva. De forma alternativa, proporcione un ID de instancia de servicio DNS deIBM Cloud® existente para el valor de entrada de despliegue de dns_instance_id
.
Si deja el valor de entrada de despliegue de dns_custom_resolver_id
como nulo, el proceso de despliegue crea una nueva VPC y habilita un nuevo programa de resolución personalizado para el clúster. De forma alternativa, para crear
programas de resolución personalizados DNS con una VPC existente, proporcione el ID de resolución para el valor de entrada de despliegue de dns_custom_resolver_id
. Para obtener más información, consulte Resolver DNS personalizado para el clúster de IBM Spectrum LSF.
Utilización de instancias de IBM Key Protect para gestionar el cifrado de datos
Para gestionar el cifrado de datos en las instancias de servidor virtual, utilice la instancia de IBM Key Protect a través del clúster IBM Spectrum LSF. Para obtener más información sobre Key Protect y las claves de cifrado, consulte IBM® Key Protect y las claves de cifrado.