Perfiles de instancia acelerados - Gen 3
La familia de perfiles acelerados proporciona acceso bajo demanda y rentable a aceleradores y GPU. Las GPU y los aceleradores ayudan a acelerar el tiempo de procesamiento necesario para cargas de trabajo de cálculo intensivo como la IA, el aprendizaje automático, la inferencia, etc.
Perfiles de instancia AMD MI300X
Los perfiles de servidor virtual acelerado AMD MI300X se construyen sobre aceleradores AMD Instinct™ MI300X de 192 GB basados en OAM. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.
Sistemas operativos
- Linux
Generación de procesadores
- Intel® 8570 - 5th Procesador escalable Xeon® de última generación
Acelerador
- Aceleradores AMD Instinct MI300X (192 GB OAM)
Disponibilidad
Estado: Seleccionar disponibilidad
Región | Zona universal |
---|---|
us-east | us-east-wdc06-a |
us-east | us-east-wdc07-a |
eu-de | eu-de-fra02-a |
eu-de | eu-de-fra05-a |
Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: Sí
- Tejido con IA interna: Sí
- Conexiones GPU a GPU Infinity Fabric™ (XGMI) a 128 GB/s
- Capacidad de red en clúster: No
Configuración de máquina virtual
- Tipo de hardware: q35
- Redes en la nube: virtio
- Volumen de arranque en bloque: virtio
- Volúmenes de datos en bloque: virtio
- Almacenamiento de instancia: NVMe
Perfiles de instancia
Perfil de instancia | vCPU / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Aceleradores | Almacenamiento de instancia (GB) |
---|---|---|---|---|---|
gx3d-208x1792x8mi300x | 208 / 104 | 1792 | 200 | 8x AMD MI300X (192 GB) | 3.2, 8 TB |
Este perfil amplio probablemente requiera que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Perfil | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
gx3d-208x1792x8mi300x | 15 | 15 |
Intel Gaudi 3 perfiles de instancia
Los perfiles de servidor virtual acelerado Intel Gaudi 3 se construyen sobre aceleradores de IA Intel Gaudi 3 basados en OAM de 128 GB. Estos aceleradores están ajustados para cargas de trabajo de IA, incluyendo inferencia y ajuste fino. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 5th.
Sistemas operativos
- Linux
Generación de procesadores
- Intel 8568Y+- 5th Procesador escalable Xeon® de generación
Acelerador
- Acelerador Intel Gaudi 3 AI (128 GB OAM)
Disponibilidad
Estado: Seleccionar disponibilidad
Región | Zona universal |
---|---|
us-south | us-south-dal12-a |
us-east | us-east-wdc06-a , us-east-wdc07-a |
eu-de | eu-de-fra02-a |
Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: Sí
- Tejido con IA interna: Sí
- GbE, 21 x 200, para conexiones OAM a OAM
- Capacidad de red en clúster: No
Configuración de máquina virtual
- Tipo de hardware: q35
- Redes en la nube: virtio
- Volumen de arranque en bloque: virtio
- Volúmenes de datos en bloque: virtio
- Almacenamiento de instancia: NVMe
Perfiles de instancia
Perfil de instancia | vCPU / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Aceleradores | Almacenamiento de instancia (GB) |
---|---|---|---|---|---|
gx3d-160x1792x8gaudi3 | 160 / 80 | 1792 | 200 | 8x Intel Gaudi-3 (128 GB) | 3.2, 8 TB |
Este perfil amplio probablemente requiera que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Perfil | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
gx3d-160x1792x8gaudi3 | 15 | 15 |
Perfiles de instancia NVIDIA Hopper HGX
Los perfiles de servidor virtual acelerado basados en Hopper se construyen sobre aceleradores de NVIDIA, H100 y H200. Estos aceleradores aceleradores están adaptados a las cargas de trabajo de la IA, incluidas la inferencia, el ajuste fino y la formación a gran escala a gran escala. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.
Esta solución también funciona con redes de clúster IBM Cloud®. La implementación de la red en clúster para la generación de aceleradores Generación de aceleradores Hopper se ejecuta sobre ocho NIC aceleradas, lo que proporciona una de 3.2 Tbps. La solución también proporciona RoCEv2 para soportar cargas de trabajo basadas en RDMA. Para obtener más información, consulte Acerca de las redes de clústeres.
Sistemas operativos
- Linux
Generación de procesadores
- Intel 8474C- Procesador escalable Xeon® de 4th generación
Acelerador
- NVIDIA H100 SXM5 (80 GB)
- NVIDIA H200 SXM5 (141 GB)
Disponibilidad
NVIDIA H100 SXM5 (80 GB)
Estado: Seleccionar disponibilidad
Región | Zona universal | Red de clúster |
---|---|---|
Dallas (us-south ) |
us-south-dal10-a |
No |
Washington DC (us-east ) |
us-east-wdc07-a |
Sí |
Toronto (ca-tor ) |
ca-tor-tor05-a |
No |
Sao Paulo (br-sao ) |
br-sao-sao01-a |
No |
Frankfurt (eu-de ) |
eu-de-fra04-a |
Sí |
Londres (eu-gb ) |
eu-gb-lon05-a |
No |
Madrid eu-es ) |
eu-es-mad05-a |
No |
Sídney (au-syd ) |
au-syd-syd04-a |
No |
Tokio (jp-tok ) |
jp-tok-tok05-a |
No |
Osaka (jp-osa ) |
No disponible | No |
Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.
NVIDIA H200 SXM5 (141 GB)
Estado: Seleccionar disponibilidad
Región | Zona universal | Red de clúster |
---|---|---|
Washington DC (us-east ) |
us-east-wdc07-a |
Sí |
Toronto (ca-tor ) |
ca-tor-tor05-a |
No |
Frankfurt (eu-de ) |
eu-de-fra04-a |
Sí |
Londres (eu-gb ) |
eu-gb-lon05-a |
No |
Sídney (au-syd ) |
au-syd-syd04-a |
No |
Para más información sobre regiones y zonas universales, véase Regiones. Puede revisar la asignación de zonas asignada para una cuenta en la página Visión general de la infraestructura de VPC en la sección Dispositivo. El mapeo de zonas muestra cómo la zona se corresponde con el nombre de zona universal que representa la ubicación física.
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: Sí
- NVLink: Sí (900 GB/s)
- Compatible con NVIDIA GPUDirect: Sí
- Capacidad de red en clúster: Sí (regiones limitadas)
- Ancho de banda: 3.2 Tbps8x 400 Gbps)
- Tipo: Dedicado
Configuración de máquina virtual
- Tipo de hardware: q35
- Redes en la nube: virtio
- Red de clústeres: SR-IOV
- Tipo: NVIDIA CX-7- Función virtual
- Cantidad: 8x NIC físicas dedicadas de 400 Gbps
- Volumen de arranque en bloque: virtio
- Volúmenes de datos en bloque: virtio
- Almacenamiento de instancia: NVMe
Perfiles de instancia
Perfil de instancia | vCPU / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Ancho de banda de red de clúster dedicado | Aceleradores | Almacenamiento de instancia (GB) |
---|---|---|---|---|---|---|
gx3d-160x1792x8h100 | 160 / 80 | 1792 | 200 |
|
8x NVIDIA H100 (80 GB) | 8 x 7.68 TB |
gx3d-160x1792x8h200 | 160 / 80 | 1792 | 200 | N/D | 8x NVIDIA H200 (141 GB) | 8 x 7.68 TB |
Los perfiles grandes probablemente requieran que abra un ticket de soporte para solicitar un aumento de cuota. Revise sus niveles de cuota y determine si la cuenta que suministra el recurso requiere un cambio en las cuotas. Tenga en cuenta que este servidor utiliza vCPU, de RAM, almacenamiento de instancias y cuotas de GPU.
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Número de vCPU | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
Si configura una red de clúster habilitada para RDMA, debe disponer de 8, 16 ó 32 interfaces de red de clúster de clúster disponibles. Disponer del número correcto de interfaces de red de clúster ayuda a garantizar una distribución adecuada de las interfaces de red en la infraestructura física subyacente infraestructura física subyacente. La mayoría de los usuarios suelen utilizar sólo 8. Las interfaces de red del clúster sólo pueden configurarse cuando la instancia está apagada.
Perfiles de instancia NVIDIA L4
Los perfiles de servidor virtual se construyen sobre aceleradores NVIDIA L4. Estos aceleradores están diseñados para gráficos. La solución se combina con los procesadores escalables Intel® Xeon® de la generación 4th.
Sistemas operativos
- Windows
- Linux
Generación de procesadores
- Intel 8474C- Procesador escalable Xeon® de 4th generación
Acelerador
- GPU NVIDIA L4 (24 GB)
Disponibilidad
Estado: Generalmente disponible
Regiones:
- Continente americano
- Sao Paulo (
br-sao
) - Toronto (
ca-tor
) - Dallas (
us-south
) - Washington DC (
us-east
)
- Sao Paulo (
- Europa
- Frankfurt (
eu-de
) - Londres (
eu-gb
) - Madrid
eu-es
)
- Frankfurt (
- Asia Pacífico
- Sídney (
au-syd
) - Tokio (
jp-tok
)
- Sídney (
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: No
- NVLink: No
Configuración de máquina virtual
- Tipo de hardware: i440fx
- Redes en la nube: virtio
- Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
- Volúmenes de datos en bloque: virtio
Perfiles de instancia
vCPUs / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Aceleradores | |
---|---|---|---|---|
gx3-16x80x1l4 | 16 / 8 | 80 | 32 | 1x NVIDIA L4 (24 GB) |
gx3-32x160x2l4 | 32 / 16 | 160 | 64 | 2x NVIDIA L4 (24 GB) |
gx3-64x320x4l4 | 64 / 32 | 320 | 128 | 4x NVIDIA L4 (24 GB) |
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Número de vCPU | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
Perfiles de instancia NVIDIA L40S
Los perfiles L40s se construyen sobre aceleradores NVIDIA L40s. Estos aceleradores están cargas de trabajo de gráficos e inferencias. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.
Sistemas operativos
- Windows
- Linux
Generación de procesadores
- Intel 8474C- Procesador escalable Xeon® de 4th generación
Acelerador
- GPU NVIDIA L40s (48 GB)
Disponibilidad
Estado: Generalmente disponible
Regiones:
- Continente americano
- Sao Paulo (
br-sao
) - Toronto (
ca-tor
) - Dallas (
us-south
) - Washington DC (
us-east
)
- Sao Paulo (
- Europa
- Frankfurt (
eu-de
) - Londres (
eu-gb
) - Madrid
eu-es
)
- Frankfurt (
- Asia Pacífico
- Sídney (
au-syd
) - Tokio (
jp-tok
)
- Sídney (
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: No
- NVLink: No
Configuración de máquina virtual
- Tipo de hardware: i440fx
- Redes en la nube: virtio
- Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
- Volúmenes de datos en bloque: virtio
Perfiles de instancia
Perfil de instancia | vCPUs / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Aceleradores |
---|---|---|---|---|
gx3-24x120x1l40s | 24 / 12 | 120 | 48 | 1x NVIDIA L40s (48 GB) |
gx3-48x240x-2l40s | 48 / 24 | 240 | 96 | 2x NVIDIA L40s (48 GB) |
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Número de vCPU | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
NVIDIA A100 perfiles de instancia
Los perfiles A100 están construidos sobre aceleradores NVIDIA A100 80 GB. Estos aceleradores están diseñados para HPC y las cargas de trabajo de inferencia. La solución se combina con la 4th generación de procesadores Intel® Xeon® Procesadores escalables.
Sistemas operativos
- Windows
- Linux
Generación de procesadores
- Intel 8474C- Procesador escalable Xeon® de 4th generación
Acelerador
- NVIDIA A100 GPU Tensor Core (80 GB)
Disponibilidad
Estado: Seleccionar disponibilidad
Regiones:
- Continente americano
- Washington DC (
us-east
)
- Washington DC (
- Europa
- Frankfurt (
eu-de
) - Londres (
eu-gb
)
- Frankfurt (
- Asia Pacífico
- Tokio (
jp-tok
)
- Tokio (
Prestaciones
- Tipo de núcleo: Dedicado
- Host dedicado: No
- Hyperthreading: SíSMT-2)
- Arranque seguro: No
- Informática confidencial: No
- Migración en directo: No
- Almacenamiento de instancias: Sí
- NVLink: No
Configuración de máquina virtual
- Tipo de hardware: i440fx
- Redes en la nube: virtio
- Volumen de arranque en bloque: virtio
- Excepción: vscsi para instancias basadas en Windows
- Volúmenes de datos en bloque: virtio
Perfiles de instancia
Perfil de instancia | vCPUs / Núcleos | Memoria (GiB) | Límite de ancho de banda (Gbps) | Aceleradores | Almacenamiento de instancia (GB) |
---|---|---|---|---|---|
gx3d-24x120x1a100p | 24 / 12 | 120 | 48 | 1x NVIDIA A100 PCIe (80 GB) | 780 GB |
gx3d-48x240x2a100p | 48 / 24 | 240 | 96 | 2x NVIDIA A100 PCIe (80 GB) | 1560 GB |
Límites
Una instancia tiene un límite para el número de volúmenes e interfaces de red virtuales que se pueden adjuntar. Este límite se basa en el tamaño de la instancia.
Número de vCPU | Número máximo de volúmenes | Número máximo vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |