IBM Cloud Docs
Perfiles de instancia acelerados - Gen 3

Perfiles de instancia acelerados - Gen 3

La familia de perfiles acelerados proporciona acceso bajo demanda y rentable a aceleradores y GPU. Las GPU y los aceleradores ayudan a acelerar el tiempo de procesamiento necesario para cargas de trabajo de cálculo intensivo como la IA, el aprendizaje automático, la inferencia, etc.

Perfiles de instancia AMD MI300X

Los perfiles de servidor virtual acelerado AMD MI300X se construyen sobre aceleradores AMD Instinct™ MI300X de 192 GB basados en OAM. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.

Sistemas operativos

  • Linux

Generación de procesadores

  • Intel® 8570 - 5th Procesador escalable Xeon® de última generación

Acelerador

  • Aceleradores AMD Instinct MI300X (192 GB OAM)

Disponibilidad

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región Zona universal
us-east us-east-wdc06-a
us-east us-east-wdc07-a
eu-de eu-de-fra02-a
eu-de eu-de-fra05-a

Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: Sí
  • Tejido con IA interna: Sí
    • Conexiones GPU a GPU Infinity Fabric™ (XGMI) a 128 GB/s
  • Capacidad de red en clúster: No

Configuración de máquina virtual

  • Tipo de hardware: q35
  • Redes en la nube: virtio
  • Volumen de arranque en bloque: virtio
  • Volúmenes de datos en bloque: virtio
  • Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil AMD acelerado
Perfil de instancia vCPU / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Aceleradores Almacenamiento de instancia (GB)
gx3d-208x1792x8mi300x 208 / 104 1792 200 8x AMD MI300X (192 GB) 3.2, 8 TB

Este perfil amplio probablemente requiera que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de la familia AMD para volúmenes máximos e interfaces de red máximas
Perfil Número máximo de volúmenes Número máximo vNICs
gx3d-208x1792x8mi300x 15 15

Intel Gaudi 3 perfiles de instancia

Los perfiles de servidor virtual acelerado Intel Gaudi 3 se construyen sobre aceleradores de IA Intel Gaudi 3 basados en OAM de 128 GB. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.

Sistemas operativos

  • Linux

Generación de procesadores

  • Intel 8568Y+- 5th Procesador escalable Xeon® de generación

Acelerador

  • Acelerador Intel Gaudi 3 AI (128 GB OAM)

Disponibilidad

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región Zona universal
us-south us-south-dal12-a
us-east us-east-wdc06-a, us-east-wdc07-a
eu-de eu-de-fra02-a

Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: Sí
  • Tejido con IA interna: Sí
    • GbE, 21 x 200, para conexiones OAM a OAM
  • Capacidad de red en clúster: No

Configuración de máquina virtual

  • Tipo de hardware: q35
  • Redes en la nube: virtio
  • Volumen de arranque en bloque: virtio
  • Volúmenes de datos en bloque: virtio
  • Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil Intel acelerado
Perfil de instancia vCPU / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Aceleradores Almacenamiento de instancia (GB)
gx3d-160x1792x8gaudi3 160 / 80 1792 200 8x Intel Gaudi-3 (128 GB) 3.2, 8 TB

Este perfil amplio probablemente requiera que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de la familia Intel para volúmenes máximos e interfaces de red máximas
Perfil Número máximo de volúmenes Número máximo vNICs
gx3d-160x1792x8gaudi3 15 15

Perfiles de instancia NVIDIA Hopper HGX

Los perfiles de servidor virtual acelerado basados en Hopper se construyen sobre aceleradores de NVIDIA, H100 y H200. Estos aceleradores aceleradores están adaptados a las cargas de trabajo de la IA, incluidas la inferencia, el ajuste fino y la formación a gran escala a gran escala. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.

Esta solución también funciona con redes de clúster IBM Cloud®. La implementación de la red en clúster para la generación de aceleradores Generación de aceleradores Hopper se ejecuta sobre ocho NIC aceleradas, lo que proporciona una de 3.2 Tbps. La solución también proporciona RoCEv2 para soportar cargas de trabajo basadas en RDMA. Para obtener más información, consulte Acerca de las redes de clústeres.

Sistemas operativos

  • Linux

Generación de procesadores

  • Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

  • NVIDIA H100 SXM5 (80 GB)
  • NVIDIA H200 SXM5 (141 GB)

Disponibilidad

NVIDIA H100 SXM5 (80 GB)

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región Zona universal Red de clúster
Dallas (us-south) us-south-dal10-a No
Washington DC (us-east) us-east-wdc07-a
Toronto (ca-tor) ca-tor-tor05-a No
Sao Paulo (br-sao) br-sao-sao01-a No
Frankfurt (eu-de) eu-de-fra04-a
Londres (eu-gb) eu-gb-lon05-a No
Madrid eu-es) eu-es-mad05-a No
Sídney (au-syd) au-syd-syd04-a No
Tokio (jp-tok) jp-tok-tok05-a No
Osaka (jp-osa) No disponible No

Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.

NVIDIA H200 SXM5 (141 GB)

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región Zona universal Red de clúster
Washington DC (us-east) us-east-wdc07-a
Toronto (ca-tor) ca-tor-tor05-a No
Frankfurt (eu-de) eu-de-fra04-a
Londres (eu-gb) eu-gb-lon05-a No
Sídney (au-syd) au-syd-syd04-a No

Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: Sí
  • NVLink: Sí (900 GB/s)
  • Compatible con NVIDIA GPUDirect: Sí
  • Capacidad de red en clúster: Sí (regiones limitadas)
    • Ancho de banda: 3.2 Tbps8x 400 Gbps)
    • Tipo: Dedicado

Configuración de máquina virtual

  • Tipo de hardware: q35
  • Redes en la nube: virtio
  • Red de clústeres: SR-IOV
    • Tipo: NVIDIA CX-7- Función virtual
    • Cantidad: 8x NIC físicas dedicadas de 400 Gbps
  • Volumen de arranque en bloque: virtio
  • Volúmenes de datos en bloque: virtio
  • Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil NVIDIA Hopper HGX acelerado
Perfil de instancia vCPU / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Ancho de banda de red de clúster dedicado Aceleradores Almacenamiento de instancia (GB)
gx3d-160x1792x8h100 160 / 80 1792 200
  1. 3.2 Tbps 8x 400 Gbps dedicados NVIDIA CX-7 )
8x NVIDIA H100 (80 GB) 8 x 7.68 TB
gx3d-160x1792x8h200 160 / 80 1792 200 N/D 8x NVIDIA H200 (141 GB) 8 x 7.68 TB

Los perfiles grandes probablemente requieran que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de NVIDIA Hopper HGX para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU Número máximo de volúmenes Número máximo vNICs
2-16 15 5
17-48 15 10
49+ 15 15

Si configura una red de clúster habilitada para RDMA, debe disponer de 8, 16 ó 32 interfaces de red de clúster de clúster disponibles. Disponer del número correcto de interfaces de red de clúster ayuda a garantizar una distribución adecuada de las interfaces de red en la infraestructura física subyacente infraestructura física subyacente. La mayoría de los usuarios suelen utilizar sólo 8. Las interfaces de red del clúster sólo pueden configurarse cuando la instancia está apagada.

Perfiles de instancia NVIDIA L4

Los perfiles de servidor virtual se construyen sobre aceleradores NVIDIA L4. Estos aceleradores están diseñados para gráficos. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.

Sistemas operativos

  • Windows
  • Linux

Generación de procesadores

  • Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

  • GPU NVIDIA L4 (24 GB)

Disponibilidad

Estado: Generalmente disponible

Regiones:

  • Continente americano
    • Sao Paulo (br-sao)
    • Toronto (ca-tor)
    • Dallas (us-south)
    • Washington DC (us-east)
  • Europa
    • Frankfurt (eu-de)
    • Londres (eu-gb)
    • Madrid eu-es)
  • Asia Pacífico
    • Sídney (au-syd)
    • Tokio (jp-tok)

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: No
  • NVLink: No

Configuración de máquina virtual

  • Tipo de hardware: i440fx
  • Redes en la nube: virtio
  • Volumen de arranque en bloque: virtio
    • Excepción: vscsi para instancias basadas en Windows
  • Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil l4 acelerado
vCPUs / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Aceleradores
gx3-16x80x1l4 16 / 8 80 32 1x NVIDIA L4 (24 GB)
gx3-32x160x2l4 32 / 16 160 64 2x NVIDIA L4 (24 GB)
gx3-64x320x4l4 64 / 32 320 128 4x NVIDIA L4 (24 GB)

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites L4 acelerados para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU Número máximo de volúmenes Número máximo vNICs
2-16 15 5
17-48 15 10
49+ 15 15

Perfiles de instancia NVIDIA L40S

Los perfiles L40s se construyen sobre aceleradores NVIDIA L40s. Estos aceleradores están cargas de trabajo de gráficos e inferencias. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.

Sistemas operativos

  • Windows
  • Linux

Generación de procesadores

  • Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

  • GPU NVIDIA L40s (48 GB)

Disponibilidad

Estado: Generalmente disponible

Regiones:

  • Continente americano
    • Sao Paulo (br-sao)
    • Toronto (ca-tor)
    • Dallas (us-south)
    • Washington DC (us-east)
  • Europa
    • Frankfurt (eu-de)
    • Londres (eu-gb)
    • Madrid eu-es)
  • Asia Pacífico
    • Sídney (au-syd)
    • Tokio (jp-tok)

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: No
  • NVLink: No

Configuración de máquina virtual

  • Tipo de hardware: i440fx
  • Redes en la nube: virtio
  • Volumen de arranque en bloque: virtio
    • Excepción: vscsi para instancias basadas en Windows
  • Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil L40s acelerado
Perfil de instancia vCPUs / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Aceleradores
gx3-24x120x1l40s 24 / 12 120 48 1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s 48 / 24 240 96 2x NVIDIA L40s (48 GB)

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites L40s acelerados para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU Número máximo de volúmenes Número máximo vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA A100 perfiles de instancia

Los perfiles A100 están construidos sobre aceleradores NVIDIA A100 80 GB. Estos aceleradores están diseñados para HPC y las cargas de trabajo de inferencia. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.

Sistemas operativos

  • Windows
  • Linux

Generación de procesadores

  • Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

  • NVIDIA A100 GPU Tensor Core (80 GB)

Disponibilidad

Estado: Seleccionar disponibilidad

Regiones:

  • Continente americano
    • Washington DC (us-east)
  • Europa
    • Frankfurt (eu-de)
    • Londres (eu-gb)
  • Asia Pacífico
    • Tokio (jp-tok)

Prestaciones

  • Tipo de núcleo: Dedicado
  • Host dedicado: No
  • Hyperthreading: SíSMT-2)
  • Arranque seguro: No
  • Informática confidencial: No
  • Migración en directo: No
  • Almacenamiento de instancias: Sí
  • NVLink: No

Configuración de máquina virtual

  • Tipo de hardware: i440fx
  • Redes en la nube: virtio
  • Volumen de arranque en bloque: virtio
    • Excepción: vscsi para instancias basadas en Windows
  • Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil acelerado A100
Perfil de instancia vCPUs / Núcleos Memoria (GiB) Límite de ancho de banda (Gbps) Aceleradores Almacenamiento de instancia (GB)
gx3d-24x120x1a100p 24 / 12 120 48 1x NVIDIA A100 PCIe (80 GB) 780 GB
gx3d-48x240x2a100p 48 / 24 240 96 2x NVIDIA A100 PCIe (80 GB) 1560 GB

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de A100 para volúmenes máximos de vCPU, e interfaces de red máximas
Número de vCPU Número máximo de volúmenes Número máximo vNICs
2-16 15 5
17-48 15 10
49+ 15 15