IBM Cloud Docs
Gestión de GPU y aceleradores

Gestión de GPU y aceleradores

La familia de perfiles habilitados para GPU proporciona acceso bajo demanda y rentable a GPU y aceleradores. Las GPU y los aceleradores ayudan a acelerar el tiempo de procesamiento necesario para cargas de trabajo de cálculo intensivo como la IA, el aprendizaje automático, la inferencia y otras. Para utilizar las GPU y los aceleradores, asegúrate de instalar el controlador adecuado y el kit de herramientas asociado para tus cargas de trabajo.

Configuración de una instancia de servidor virtual con una GPU NVIDIA

  1. Proporcione una instancia de servidor virtual eligiendo un perfil de GPU ( NVIDIA ) en el campo Perfil. Se admiten imágenes de sistema operativo personalizadas y de stock.

  2. Instale el controlador GPU NVIDIA de la imagen y el perfil de GPU de su instancia de servidor virtual. La siguiente tabla describe los niveles mínimos de controlador y de versión de software CUDA para los sistemas operativos Linux y Windows. Para más información, consulte la página de descarga de controladores de NVIDIA. Para obtener una visión general de los controladores para los productos de centro de datos NVIDIA, consulte NVIDIA Data Center Drivers.

    NVIDIA y la versión CUDA para Linux
    GPUs y drivers mínimos NVIDIA y versiones CUDA
    GPU NVIDIA conductor Versión CUDA
    A100 550 12.4
    L4 550 12.4
    L40s 550 12.4
    V100 535 12.2
    H100 550 12.4
    H200 570 12.8
    NVIDIA controladores y versión CUDA para Windows 2019, 2022
    GPUs y drivers mínimos NVIDIA y versiones CUDA
    GPU NVIDIA conductor Versión CUDA
    A100 538 12.2
    L4 538 12.2
    L40s 538 12.2
    V100 535 12.2
    H100 N/D N/D
    H200 N/D N/D
    NVIDIA controladores y versión CUDA para Windows 2016
    GPUs y drivers mínimos NVIDIA y versiones CUDA
    GPU NVIDIA conductor Versión CUDA
    A100 529 12.0
    L4 529 12.0
    L40s N/D N/D
    V100 535 12.0
    H100 N/D N/D
    H200 N/D N/D
  3. Instale el kit de herramientas asociado a la carga de trabajo. Visite la página de descargas del kit de herramientas CUDA de NVIDIA.

Para obtener instrucciones detalladas para completar los pasos 2 y 3, otras herramientas de GPU y ejemplos, consulte Cómo utilizar V100-Based en IBM Cloud VPC.

Para obtener una guía centrada en Linux sobre la instalación de los controladores NVIDIA, consulte la Guía de instalación de controladores NVIDIA.

Si desea automatizar la instalación de los controladores, puede utilizar la sección Datos de usuario del servidor virtual. Al utilizar el campo de datos de usuario, puede introducir un script que emita los comandos para instalar los controladores de NVIDIA.

Configuración de una instancia de servidor virtual con un acelerador de IA Intel Gaudi 3

  1. Proporcione una instancia de servidor virtual eligiendo el perfil de instancia Intel® Gaudi® 3 AI Accelerator en el campo Perfil. Se admiten imágenes de sistema operativo personalizadas y de stock.
  2. Instale el software Intel Gaudi 3 AI Accelerator y los controladores para su servidor virtual. Para descargar los controladores, consulte la página de instalación de controladores y software de Intel Gaudi.

Configuración de una instancia de servidor virtual con un acelerador AMD Instinct MI300X

  1. Aprovisione una instancia de servidor virtual seleccionando el perfil de instancia AMD Instinct™ MI300X Accelerator en el campo Perfil. Se admiten imágenes de sistema operativo personalizadas y de stock.
  2. Instale los controladores necesarios para su servidor virtual. Para descargar los controladores, consulte la página Instalación de ROCm y marcos de aprendizaje automático.
  3. Si el sistema operativo invitado de su servidor virtual es Ubuntu, debe eliminar nomodeset de la línea de comandos y reiniciar el servidor virtual.
    1. Estos comandos deben ejecutarse como root. Sudo de raíz.
      sudo -i
      
    2. Elimine nomodeset del archivo de configuración. El siguiente ejemplo utiliza vi.
      vi /etc/default/grub.d/50-cloudimg-settings.cfg
      
    3. Compruebe que nomodeset se ha eliminado del archivo de configuración.
      cat /etc/default/grub.d/50-cloudimg-settings.cfg
      
    4. Actualizar grub.
      update-grub
      
    5. Reinicie el servidor virtual.

Integración de controladores en una imagen personalizada desde el volumen

  1. Suministre una instancia de servidor virtual con una GPU e instala los controladores.
  2. Cree una imagen del volumen de arranque de la imagen en stock de la instancia de servidor virtual. Para obtener más información, consulte Creación de una imagen a partir de un volumen.
  3. Repita la imagen del proceso desde el volumen para desplegar en varias instancias.

Próximos pasos

Para más información, consulte la documentación del controlador NVIDIA.