Perfiles de instancia acelerados - Gen 3

La familia de perfiles acelerados proporciona acceso bajo demanda y rentable a aceleradores y GPU. Las GPU y los aceleradores ayudan a acelerar el tiempo de procesamiento necesario para cargas de trabajo de cálculo intensivo como la IA, el aprendizaje automático, la inferencia, etc.

Perfiles de instancia AMD MI300X

Los perfiles de servidor virtual acelerado AMD MI300X se construyen sobre aceleradores AMD Instinct™ MI300X de 192 GB basados en OAM. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.

Sistemas operativos

Linux

Generación de procesadores

Intel® 8570 - 5th Procesador escalable Xeon® de última generación

Acelerador

Aceleradores AMD Instinct MI300X (192 GB OAM)

Disponibilidad

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región	Zona universal
us-east	`us-east-wdc06-a`
us-east	`us-east-wdc07-a`
eu-de	`eu-de-fra02-a`
eu-de	`eu-de-fra05-a`

Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: Sí
Tejido con IA interna: Sí
Conexiones GPU a GPU Infinity Fabric™ (XGMI) a 128 GB/s
Capacidad de red en clúster: No

Configuración de máquina virtual

Tipo de hardware: q35
Redes en la nube: virtio
Volumen de arranque en bloque: virtio
Volúmenes de datos en bloque: virtio
Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil AMD acelerado
Perfil de instancia	vCPU / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Aceleradores	Almacenamiento de instancia (GB)
gx3d-208x1792x8mi300x	208 / 104	1792	200	8x AMD MI300X (192 GB)	3.2, 8 TB

Este perfil amplio probablemente requiera que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de la familia AMD para volúmenes máximos e interfaces de red máximas
Perfil	Número máximo de volúmenes	Número máximo vNICs
gx3d-208x1792x8mi300x	15	15

Intel Gaudi 3 perfiles de instancia

Los perfiles de servidor virtual acelerado Intel Gaudi 3 se construyen sobre aceleradores de IA Intel Gaudi 3 basados en OAM de 128 GB. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.

Sistemas operativos

Linux

Generación de procesadores

Intel 8568Y+- 5th Procesador escalable Xeon® de generación

Acelerador

Acelerador Intel Gaudi 3 AI (128 GB OAM)

Disponibilidad

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región	Zona universal
us-south	`us-south-dal12-a`
us-east	`us-east-wdc06-a`, `us-east-wdc07-a`
eu-de	`eu-de-fra02-a`

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: Sí
Tejido con IA interna: Sí
- GbE, 21 x 200, para conexiones OAM a OAM
Capacidad de red en clúster: No

Configuración de máquina virtual

Tipo de hardware: q35
Redes en la nube: virtio
Volumen de arranque en bloque: virtio
Volúmenes de datos en bloque: virtio
Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil Intel acelerado
Perfil de instancia	vCPU / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Aceleradores	Almacenamiento de instancia (GB)
gx3d-160x1792x8gaudi3	160 / 80	1792	200	8x Intel Gaudi-3 (128 GB)	3.2, 8 TB

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de la familia Intel para volúmenes máximos e interfaces de red máximas
Perfil	Número máximo de volúmenes	Número máximo vNICs
gx3d-160x1792x8gaudi3	15	15

Perfiles de instancia NVIDIA Hopper HGX

Los perfiles de servidor virtual acelerado basados en Hopper se construyen sobre aceleradores de NVIDIA, H100 y H200. Estos aceleradores aceleradores están adaptados a las cargas de trabajo de la IA, incluidas la inferencia, el ajuste fino y la formación a gran escala a gran escala. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.

Esta solución también funciona con redes de clúster IBM Cloud®. La implementación de la red en clúster para la generación de aceleradores Generación de aceleradores Hopper se ejecuta sobre ocho NIC aceleradas, lo que proporciona una de 3.2 Tbps. La solución también proporciona RoCEv2 para soportar cargas de trabajo basadas en RDMA. Para obtener más información, consulte Acerca de las redes de clústeres.

Sistemas operativos

Linux

Generación de procesadores

Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

NVIDIA H100 SXM5 (80 GB)
NVIDIA H200 SXM5 (141 GB)

Disponibilidad

NVIDIA H100 SXM5 (80 GB)

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región	Zona universal	Red de clúster
Dallas (`us-south`)	`us-south-dal10-a`	No
Washington DC (`us-east`)	`us-east-wdc07-a`	Sí
Toronto (`ca-tor`)	`ca-tor-tor05-a`	No
Sao Paulo (`br-sao`)	`br-sao-sao01-a`	No
Frankfurt (`eu-de`)	`eu-de-fra04-a`	Sí
Londres (`eu-gb`)	`eu-gb-lon05-a`	No
Madrid `eu-es`)	`eu-es-mad05-a`	No
Sídney (`au-syd`)	`au-syd-syd04-a`	No
Tokio (`jp-tok`)	`jp-tok-tok05-a`	No
Osaka (`jp-osa`)	No disponible	No

NVIDIA H200 SXM5 (141 GB)

Estado: Seleccionar disponibilidad

Tabla 1. Regiones y zonas
Región	Zona universal	Red de clúster
Washington DC (`us-east`)	`us-east-wdc07-a`	Sí
Toronto (`ca-tor`)	`ca-tor-tor05-a`	No
Frankfurt (`eu-de`)	`eu-de-fra04-a`	Sí
Londres (`eu-gb`)	`eu-gb-lon05-a`	No
Sídney (`au-syd`)	`au-syd-syd04-a`	No

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: Sí
NVLink: Sí (900 GB/s)
Compatible con NVIDIA GPUDirect: Sí
Capacidad de red en clúster: Sí (regiones limitadas)
- Ancho de banda: 3.2 Tbps8x 400 Gbps)
- Tipo: Dedicado

Configuración de máquina virtual

Tipo de hardware: q35
Redes en la nube: virtio
Red de clústeres: SR-IOV
- Tipo: NVIDIA CX-7- Función virtual
- Cantidad: 8x NIC físicas dedicadas de 400 Gbps
Volumen de arranque en bloque: virtio
Volúmenes de datos en bloque: virtio
Almacenamiento de instancia: NVMe

Perfiles de instancia

Opciones de perfil NVIDIA Hopper HGX acelerado
Perfil de instancia	vCPU / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Ancho de banda de red de clúster dedicado	Aceleradores	Almacenamiento de instancia (GB)
gx3d-160x1792x8h100	160 / 80	1792	200	3.2 Tbps 8x 400 Gbps dedicados NVIDIA CX-7 )	8x NVIDIA H100 (80 GB)	8 x 7.68 TB
gx3d-160x1792x8h200	160 / 80	1792	200	N/D	8x NVIDIA H200 (141 GB)	8 x 7.68 TB

Los perfiles grandes probablemente requieran que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de NVIDIA Hopper HGX para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU	Número máximo de volúmenes	Número máximo vNICs
2-16	15	5
17-48	15	10
49+	15	15

Si configura una red de clúster habilitada para RDMA, debe disponer de 8, 16 ó 32 interfaces de red de clúster de clúster disponibles. Disponer del número correcto de interfaces de red de clúster ayuda a garantizar una distribución adecuada de las interfaces de red en la infraestructura física subyacente infraestructura física subyacente. La mayoría de los usuarios suelen utilizar sólo 8. Las interfaces de red del clúster sólo pueden configurarse cuando la instancia está apagada.

Perfiles de instancia NVIDIA L4

Los perfiles de servidor virtual se construyen sobre aceleradores NVIDIA L4. Estos aceleradores están diseñados para gráficos. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.

Sistemas operativos

Windows
Linux

Generación de procesadores

Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

GPU NVIDIA L4 (24 GB)

Disponibilidad

Estado: Generalmente disponible

Regiones:

Continente americano
- Sao Paulo (br-sao)
- Toronto (ca-tor)
- Dallas (us-south)
- Washington DC (us-east)
Europa
- Frankfurt (eu-de)
- Londres (eu-gb)
- Madrid eu-es)
Asia Pacífico
- Sídney (au-syd)
- Tokio (jp-tok)

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: No
NVLink: No

Configuración de máquina virtual

Tipo de hardware: i440fx
Redes en la nube: virtio
Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil l4 acelerado
	vCPUs / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Aceleradores
gx3-16x80x1l4	16 / 8	80	32	1x NVIDIA L4 (24 GB)
gx3-32x160x2l4	32 / 16	160	64	2x NVIDIA L4 (24 GB)
gx3-64x320x4l4	64 / 32	320	128	4x NVIDIA L4 (24 GB)

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites L4 acelerados para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU	Número máximo de volúmenes	Número máximo vNICs
2-16	15	5
17-48	15	10
49+	15	15

Perfiles de instancia NVIDIA L40S

Los perfiles L40s se construyen sobre aceleradores NVIDIA L40s. Estos aceleradores están cargas de trabajo de gráficos e inferencias. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.

Sistemas operativos

Windows
Linux

Generación de procesadores

Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

GPU NVIDIA L40s (48 GB)

Disponibilidad

Estado: Generalmente disponible

Regiones:

Continente americano
- Sao Paulo (br-sao)
- Toronto (ca-tor)
- Dallas (us-south)
- Washington DC (us-east)
Europa
- Frankfurt (eu-de)
- Londres (eu-gb)
- Madrid eu-es)
Asia Pacífico
- Sídney (au-syd)
- Tokio (jp-tok)

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: No
NVLink: No

Configuración de máquina virtual

Tipo de hardware: i440fx
Redes en la nube: virtio
Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil L40s acelerado
Perfil de instancia	vCPUs / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Aceleradores
gx3-24x120x1l40s	24 / 12	120	48	1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s	48 / 24	240	96	2x NVIDIA L40s (48 GB)

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites L40s acelerados para vCPU, volúmenes máximos e interfaces de red máximas
Número de vCPU	Número máximo de volúmenes	Número máximo vNICs
2-16	15	5
17-48	15	10
49+	15	15

NVIDIA A100 perfiles de instancia

Los perfiles A100 están construidos sobre aceleradores NVIDIA A100 80 GB. Estos aceleradores están diseñados para HPC y las cargas de trabajo de inferencia. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.

Sistemas operativos

Windows
Linux

Generación de procesadores

Intel 8474C- Procesador escalable Xeon® de 4th generación

Acelerador

NVIDIA A100 GPU Tensor Core (80 GB)

Disponibilidad

Estado: Seleccionar disponibilidad

Regiones:

Continente americano
- Washington DC (us-east)
Europa
- Frankfurt (eu-de)
- Londres (eu-gb)
Asia Pacífico
- Tokio (jp-tok)

Prestaciones

Tipo de núcleo: Dedicado
Host dedicado: No
Hyperthreading: SíSMT-2)
Arranque seguro: No
Informática confidencial: No
Migración en directo: No
Almacenamiento de instancias: Sí
NVLink: No

Configuración de máquina virtual

Tipo de hardware: i440fx
Redes en la nube: virtio
Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
Volúmenes de datos en bloque: virtio

Perfiles de instancia

Opciones de perfil acelerado A100
Perfil de instancia	vCPUs / Núcleos	Memoria (GiB)	Límite de ancho de banda (Gbps)	Aceleradores	Almacenamiento de instancia (GB)
gx3d-24x120x1a100p	24 / 12	120	48	1x NVIDIA A100 PCIe (80 GB)	780 GB
gx3d-48x240x2a100p	48 / 24	240	96	2x NVIDIA A100 PCIe (80 GB)	1560 GB

Límites

Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.

Límites acelerados de A100 para volúmenes máximos de vCPU, e interfaces de red máximas
Número de vCPU	Número máximo de volúmenes	Número máximo vNICs
2-16	15	5
17-48	15	10
49+	15	15