IBM Cloud Docs
Configuración de un clúster HPC

Configuración de un clúster HPC

Despliegue el clúster HPC con las propiedades de configuración que elija.

Visión general de la arquitectura y configuración del sistema de archivos NFS

El clúster HPC consta de un nodo de inicio de sesión, un nodo de almacenamiento donde está conectado el volumen de almacenamiento en bloque, 1-3 nodos de gestión LSF y un número de nodos trabajadores LSF.

  • El nodo de inicio de sesión se sirve como host de salto y es el único nodo que tiene la dirección IP pública. Otros nodos sólo tienen direcciones IP privadas y la única forma de acceder a estos nodos es a través del nodo de inicio de sesión. Puede iniciar la sesión en el host de gestión de LSF primario y realizar la mayoría de las operaciones desde el host de gestión de LSF. De forma predeterminada, lsfadmin es el único ID de usuario creado en el clúster. La configuración sin contraseña SSH está configurada entre el host de gestión LSF y los trabajadores. Puede acceder a cualquier otro nodo trabajador con el ID de usuario lsfadmin desde el LSF primario.

  • El nodo trabajador puede ser un recurso estático. En este caso, su ciclo de vida está gestionado por Schematics. Puede solicitar un número de nodos trabajadores estáticos y estos trabajadores permanecen disponibles en el clúster LSF hasta que se realice una acción Schematics-destroy. La función de conector de recursos LSF crea trabajadores adicionales cuando no hay suficiente capacidad para ejecutar trabajos y destruye trabajadores cuando disminuyen las demandas. El ciclo de vida de estos trabajadores dinámicos está gestionado por el conector de recursos LSF. Espere a que estos recursos dinámicos se devuelvan a la nube antes de destruir todo el clúster de VPC a través de Schematics.

  • IBM Cloud File Storage for VPC se utiliza para el uso compartido de archivos. De forma predeterminada, hay dos volúmenes de compartición de archivos; cada uno es de 100 GB. Para cambiar esta configuración, establezca el valor de despliegue custom_file_shares.

La solución de clúster de HPC proporciona una imagen personalizada base, que incluye la instalación de LSF. Puede crear su propia imagen personalizada encima de la imagen base. Para obtener más información, consulte Crear imagen personalizada. El servicio de imagen en VPC proporciona una forma de hacerlo. A continuación, puede especificar la imagen personalizada que desea utilizar en Schematics para nodos de gestión de LSF y nodos trabajadores. La imagen que utiliza el nodo de inicio de sesión y el nodo de almacenamiento no se puede configurar en este momento (CentOS 7 de forma predeterminada).

Crear una clave SSH

Realice los pasos siguientes para crear la clave SSH:

  1. Genere una clave SSH en el sistema ejecutando el mandato siguiente:

    ssh-keygen -t rsa
    
  2. Copie y guarde todo el contenido de .ssh/id_rsa.pub.

Añadir clave SSH a la infraestructura de VPC

  1. Inicie sesión en la consola deIBM Cloud® utilizando sus credenciales exclusivas.
  2. En el panel de control, pulse Icono de menú Icono de menú > Infraestructura de VPC > Claves SSH.
  3. Pulse Crear.
  4. Especifique el nombre de clave SSH (por ejemplo, po-ibm-ssh-key), seleccione el grupo de recursos predeterminado, añada etiquetas y seleccione la región.
  5. Copie y pegue la clave pública en el campo Clave pública (el contenido que ha guardado de .ssh/id_rsa.pub).
  6. Pulse Añadir clave SSH.

Crear clave de API

Realice los pasos siguientes para crear la clave de API:

  1. En la consola de IBM Cloud, vaya a Gestionar > Acceso (IAM) > Claves de API.
  2. Pulse Crear una clave de API de IBM Cloud.
  3. Especifique un nombre y una descripción para su clave de API.
  4. Pulse Crear.
  5. A continuación, pulse Mostrar para visualizar la clave de API, Copiar para copiarla y guardarla para más adelante o pulse Descargar.

Crear y configurar un clúster HPC desde el catálogo de IBM Cloud

Realice los pasos siguientes para crear y configurar un clúster de HPC desde el catálogo de IBM Cloud:

  1. En el catálogo IBM Cloud, busque HPC o _Spectrum LSF_y, a continuación, seleccione IBM Spectrum LSF.

    Página de solución de clúster de HPC
    Página de soluciónHPC Cluster

  2. En la sección Establecer los valores de despliegue, proporcione los valores necesarios: api_key, ibm_customer_number, remote_allowed_ips, ssh_key_name y zone.

  3. Después de confirmar con el acuerdo de licencia, puede utilizar los valores predeterminados para otros parámetros y pulsar Instalar. El clúster HPC se crea y se completa en 5 minutos con la configuración predeterminada.

Parámetros para el despliegue de clúster

Consulte la tabla siguiente para obtener una lista de los parámetros que puede configurar para el clúster de HPC:

Tabla 1. Valores de parámetros
Parámetro Descripción
cluster_prefix El prefijo utilizado para nombrar los recursos de VPC que se suministran para crear el clúster de HPC. Hay recursos en los que sus nombres deben ser exclusivos en la misma cuenta de nube dada una sola región. Asegúrese de que el nombre sea exclusivo (por ejemplo, añada las iniciales al nombre: po-hpc-cluster).
hyperthreading_enabled Puede habilitar hyper-threading en los nodos trabajadores del clúster estableciendo este valor en true (valor predeterminado). De lo contrario, hyper-threading está inhabilitado.
image_name Edite y añada la imagen personalizada con LSF. Puede utilizar la imagen personalizada LSF predeterminada que proporciona la solución. Si ha creado su propia imagen personalizada, edite el valor con el nombre de la imagen personalizada.
management_node_count Puede tener hasta tres nodos de gestión en el clúster. Si desea soporte de migración tras error proporcionado por LSF, debe especificar que el valor sea mayor que uno. En este caso, cuando el nodo de gestión primario está inactivo, uno de los nodos de gestión candidatos pasa a ser el primario y el clúster permanece funcional sin interrupción.
region Edite la región donde desea que se cree el clúster. Para obtener una lista completa de regiones, consulte Creación de una VPC en una región diferente.
resource_group El nombre del grupo de recursos de la cuenta de IBM Cloud donde se despliegan los recursos de VPC.
vpc_name Puede utilizar una VPC existente en la que se suministran los recursos de clúster. Si no se proporciona ningún valor, se suministra una nueva VPC para el clúster.
vpn_enabled Puede desplegar una pasarela VPN para VPC en el clúster. De forma predeterminada, el valor se establece en false.
vpn_peer_address La dirección IP pública de igual a la que está conectada la VPN.
vpn_peer_cidrs Lista separada por comas de CIDR de igual (por ejemplo, 192.168.0.0/24) a los que está conectada la VPN.
vpn_preshared_key La clave precompartida para la VPN.
zone Edite la zona basándose en la región seleccionada. Para obtener una lista completa de zonas dentro de una región, consulte Obtener zonas utilizando la CLI.

Parámetros para el escalado automático

Puede establecer los parámetros siguientes para el escalado automático:

  • worker_node_min_count: el número mínimo de nodos trabajadores que se suministran en el momento en que se crea el clúster y permanecen en ejecución independientemente de las demandas de trabajo del clúster.

  • worker_node_max_count: el número máximo de nodos trabajadores en el clúster de HPC, que limita el número de máquinas que se pueden añadir al clúster de HPC. El escalado automático de LSF aumenta el clúster a este número de nodos cuando es necesario para las cargas de trabajo y se escala para mantener solo los trabajadores de worker_node_min_count cuando no hay ningún trabajo en las colas.

Parámetros para perfiles de instancia

Puede controlar el perfil de instancia para cada tipo de instancia a través de los parámetros xxx_node_instance_type. Los nodos de gestión son donde se ejecutan los daemons LSF principales. Debe seleccionar otros con más potencia de cálculo si tiene previsto ejecutar trabajos utilizando más de 100 nodos. Los nodos de trabajador son los nodos en los que tiene lugar la ejecución de la carga de trabajo y es necesario realizar la elección de acuerdo con la característica de las cargas de trabajo. El nodo de almacenamiento es el que gestiona el sistema de archivos NFS para el clúster HPC. La instancia de inicio de sesión se sirve como un host de salto, por lo que puede elegir el perfil más pequeño. Para obtener más información, consulte Perfiles de instancia.

Parámetros para volúmenes en bloque

Puede configurar la capacidad de almacenamiento y el rendimiento utilizando los parámetros volume_xxx. El valor del parámetro volume_profile puede ser de finalidad general o personalizado. Cuando se utiliza general-purpose, la infraestructura de nube determina IOPS y el parámetro volume_iops no tiene ningún efecto. Si desea personalizar el IOPS, debe utilizar personalizado para volume_profiles y configurar el IOPS a través de volume_iops en función de la capacidad especificada en volume_capacity. Para obtener más información, consulte Perfiles de almacenamiento en bloques.

Acceso al clúster HPC

Para acceder al clúster de HPC, realice los pasos siguientes:

  1. Vaya al icono Menú icono Menú > Actividad > Plan aplicado > Ver registro.

  2. Copie ssh-command para acceder al clúster.

    • ssh -J root@ip-jumphost lsfadmin@ip-managementhost

    • ip-jumphost es public, mientras que ip-managementhost no lo es.

    • -J flag: se conecta al host de salto y establece un reenvío TCP al destino final (host de gestión).

Escalado automático

Tiene un número mínimo de nodos trabajadores (worker_node_min_count). Este es el número de nodos trabajadores que se suministran en el momento en que se crea el clúster. Sin embargo, puede utilizar un número máximo de nodos trabajadores que se deben añadir al clúster Spectrum LSF definido por worker_node_max_count. Esto es para limitar el número de máquinas que se pueden añadir al clúster Spectrum LSF cuando se utiliza la configuración de escalado automático. Esta propiedad se puede utilizar para gestionar el coste asociado con la instancia de clúster Spectrum LSF.

El ejemplo siguiente muestra worker_node_min_count=2 y worker_node_max_count=10.

  1. Para comprobar los dos nodos de trabajador, ejecute el mandato siguiente:

    bhosts -w
    

    Salida de ejemplo:

    Dos nodos trabajadores
    Dos nodos trabajadores

  2. Para probar la función de escalado automático, ejecute un trabajo que requiera más de dos nodos. Por ejemplo, este trabajo requiere que cinco trabajos duerman durante 10 segundos:

    bsub -n 5 -R "span[ptile=1]" sleep 10
    
  3. Se somete el trabajo.

  4. Después de un minuto, compruebe los nodos ejecutando el mandato siguiente:

    bhosts -w
    

    Puede ver que ahora se han añadido cinco nodos al clúster:

    Se han añadido cinco nodos trabajadores
    Dos nodos trabajadores

  5. La diferencia de nodos creados por la función de escalado automático se destruye automáticamente después de 10 minutos de no utilizarse.

Personalizar el clúster de HPC para las cargas de trabajo

Tiene dos opciones para añadir paquetes de software en el clúster para la carga de trabajo. Puede instalar el software adicional en el sistema de archivos compartidos NFS (por ejemplo, /home/lsfadmin/shared desde el host de gestión LSF), que es visible para todos los nodos de cálculo. Los archivos que añada al sistema de archivos compartidos NSF se almacenan en el almacenamiento en bloque que está conectado al nodo de almacenamiento. Los datos se pierden cuando se destruye todo el clúster HPC. Recuerde guardar los datos que desea conservar antes de destruir el clúster.

La otra opción es crear su propia imagen personalizada encima de la imagen predeterminada utilizada por la solución de clúster HPC. La creación de la imagen personalizada debe estar preparada antes de crear un clúster HPC. Cuando se crea una nueva imagen personalizada en VPC, se asocia un nombre con esta imagen. Debe utilizar este nombre en el parámetro image_name. Para obtener más información, consulte Ampliar imagen base y crear una nueva imagen personalizada.

(Opcional) Configurar la conectividad híbrida

Si desea configurar un entorno de conectividad híbrida utilizando VPN, consulte las instrucciones Instalación de una VPN en un clúster HPC.

Si desea utilizar Direct Link, consulte las instrucciones para Instalación de Direct Link en un clúster HPC.

Utilización de OpenLDAP con IBM Spectrum LSF

Si desea obtener más información sobre OpenLDAP con IBM Spectrum LSF, consulte Acerca de OpenLDAP con IBM Spectrum LSF.

Durante el despliegue, habilite OpenLDAP con el clúster IBM Spectrum LSF estableciendo los valores de entrada de despliegue enable_ldap,ldap_basedns, ldap_server, ldap_admin_password, ldap_user_name y ldap_user_password.

Si desea obtener más información sobre la integración de OpenLDAP con el clúster de IBM Spectrum LSF, consulte Integración de OpenLDAP con el clúster de IBM Spectrum LSF.

Crear zonas DNS y programa de resolución personalizado DNS

Si deja el valor de entrada de despliegue dns_instance_id como nulo, el proceso de despliegue crea un nuevo ID de instancia de servicio DNS en la zona DNS respectiva. De forma alternativa, proporcione un ID de instancia de servicio DNS deIBM Cloud® existente para el valor de entrada de despliegue de dns_instance_id.

Si deja el valor de entrada de despliegue de dns_custom_resolver_id como nulo, el proceso de despliegue crea una nueva VPC y habilita un nuevo programa de resolución personalizado para el clúster. De forma alternativa, para crear programas de resolución personalizados DNS con una VPC existente, proporcione el ID de resolución para el valor de entrada de despliegue de dns_custom_resolver_id. Para obtener más información, consulte Resolver DNS personalizado para el clúster de IBM Spectrum LSF.

Utilización de instancias de IBM Key Protect para gestionar el cifrado de datos

Para gestionar el cifrado de datos en las instancias de servidor virtual, utilice la instancia de IBM Key Protect a través del clúster IBM Spectrum LSF. Para obtener más información sobre Key Protect y las claves de cifrado, consulte IBM® Key Protect y las claves de cifrado.