IBM Cloud Docs
Profils d'instance accélérés - Gen 3

Profils d'instance accélérés - Gen 3

La gamme de profils accélérés offre un accès à la demande et économique aux accélérateurs et aux processeurs graphiques. Les GPU et les accélérateurs permettent d'accélérer le temps de traitement requis pour les charges de travail à forte intensité de calcul telles que l'IA, l'apprentissage automatique, l'inférence, etc.

Profils d'instance AMD MI300X

Les profils de serveurs virtuels accélérés AMD MI300X sont construits sur des accélérateurs AMD Instinct™ MI300X de 192 Go basés sur OAM. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.

Systèmes d'exploitation

  • Linux

Génération de processeurs

  • Intel® 8570 - 5th Génération de processeurs Xeon® Scalable

Accélérateur

  • Accélérateurs AMD Instinct MI300X (192 Go OAM)

Disponibilité

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région Zone universelle
us-east us-east-wdc06-a
us-east us-east-wdc07-a
eu-de eu-de-fra02-a
eu-de eu-de-fra05-a

Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage d'instances : Oui
  • Tissu IA interne : Oui
    • Infinity Fabric™ (XGMI) 128 GB/s connexions GPU-to-GPU
  • Réseau de clusters capable : Non

Configuration de machine virtuelle

  • Type de matériel : q35
  • Réseau en nuage : virtio
  • Volume de démarrage en bloc : virtio
  • Volumes de données en bloc : virtio
  • Stockage d'instance : NVMe

Profils d'instance

Options de profil AMD accéléré
Profil d'instance vCPU / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Accélérateurs Stockage d'instance (Go)
gx3d-208x1792x8mi300x 208 / 104 1792 200 8x AMD MI300X (192 GO) 3.2, 8 To

Ce profil important nécessite probablement que vous ouvriez un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites de la famille AMD accélérée pour les volumes maximums et les interfaces réseau maximums
Profil Nombre maximal de volumes Nombre maximal de vNICs
gx3d-208x1792x8mi300x 15 15

Intel Gaudi 3 profils d'instance

Les profils de serveur virtuel accélérés Intel Gaudi 3 sont construits sur des accélérateurs IA Intel Gaudi 3 basés sur OAM de 128 Go. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.

Systèmes d'exploitation

  • Linux

Génération de processeurs

  • Intel 8568Y+- 5th Processeur évolutif Xeon® de génération

Accélérateur

  • Intel Gaudi 3 AI Accelerator (128 Go OAM)

Disponibilité

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région Zone universelle
us-south us-south-dal12-a
us-east us-east-wdc06-a, us-east-wdc07-a
eu-de eu-de-fra02-a

Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage d'instances : Oui
  • Tissu IA interne : Oui
    • GbE s 21 x 200 pour les connexions OAM-à-OAM
  • Réseau de clusters capable : Non

Configuration de machine virtuelle

  • Type de matériel : q35
  • Réseau en nuage : virtio
  • Volume de démarrage en bloc : virtio
  • Volumes de données en bloc : virtio
  • Stockage d'instance : NVMe

Profils d'instance

Options de profil Intel accélérées
Profil d'instance vCPU / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Accélérateurs Stockage d'instance (Go)
gx3d-160x1792x8gaudi3 160 / 80 1792 200 8x Gaudi-3 s Intel (128 Go) 3.2, 8 To

Ce profil important nécessite probablement que vous ouvriez un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites accélérées de la famille Intel pour les volumes maximum et les interfaces réseau maximum
Profil Nombre maximal de volumes Nombre maximal de vNICs
gx3d-160x1792x8gaudi3 15 15

Profils d'instance NVIDIA Hopper HGX

Les profils de serveur virtuel accélérés basés sur Hopper sont construits sur des accélérateurs d' NVIDIA, H100 et H200. Ces accélérateurs ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence, le réglage fin et l'entraînement à grande échelle à grande échelle. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».

Cette solution fonctionne également avec les réseaux de clusters IBM Cloud® La mise en œuvre du réseau de cluster pour la génération d'accélérateurs Génération d'accélérateurs Hopper s'exécute sur huit NIC accélérés, fournissant un débit total agrégé de 3,2 Tbps de 3.2 Tbps. La solution propose également RoCEv2 pour prendre en charge les charges de travail basées sur RDMA. Pour plus d'informations, voir À propos des réseaux de clusters.

Systèmes d'exploitation

  • Linux

Génération de processeurs

  • Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

  • NVIDIA H100 SXM5 (80 GO)
  • NVIDIA H200 SXM5 (141 Go)

Disponibilité

NVIDIA H100 SXM5 (80 GO)

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région Zone universelle Réseau du cluster
Dallas (us-south) us-south-dal10-a Non
Washington DC (us-east) us-east-wdc07-a Oui
Toronto (ca-tor) ca-tor-tor05-a Non
Sao Paulo (br-sao) br-sao-sao01-a Non
Francfort (eu-de) eu-de-fra04-a Oui
Londres (eu-gb) eu-gb-lon05-a Non
Madrid eu-es eu-es-mad05-a Non
Sydney (au-syd) au-syd-syd04-a Non
Tokyo (jp-tok) jp-tok-tok05-a Non
Osaka (jp-osa) Non disponible Non

Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.

NVIDIA H200 SXM5 (141 Go)

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région Zone universelle Réseau du cluster
Washington DC (us-east) us-east-wdc07-a Oui
Toronto (ca-tor) ca-tor-tor05-a Non
Francfort (eu-de) eu-de-fra04-a Oui
Londres (eu-gb) eu-gb-lon05-a Non
Sydney (au-syd) au-syd-syd04-a Non

Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage d'instances : Oui
  • NVLink : Oui (900 Go/s)
  • NVIDIA GPUDirect Capable: Oui
  • Possibilité de réseau en grappe : Oui (régions limitées)
    • Largeur de bande : 3.2 Tbps8x 400 Gbps)
    • Type : Dédié

Configuration de machine virtuelle

  • Type de matériel : q35
  • Réseau en nuage : virtio
  • Mise en réseau des grappes : SR-IOV
    • Type : NVIDIA CX-7- Fonction virtuelle
    • Quantité : 8x NIC physiques dédiés à 400 Gbps
  • Volume de démarrage en bloc : virtio
  • Volumes de données en bloc : virtio
  • Stockage d'instance : NVMe

Profils d'instance

Options de profil NVIDIA Hopper HGX accéléré
Profil d'instance vCPU / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Bande passante dédiée au réseau de la grappe Accélérateurs Stockage d'instance (Go)
gx3d-160x1792x8h100 160 / 80 1792 200
  1. 3.2 Tbps 8x 400 Gbps dédiés NVIDIA CX-7 )
8x NVIDIA H100 (80 GO) 8 x 7.68 TB
gx3d-160x1792x8h200 160 / 80 1792 200 N/A 8x NVIDIA H200 (141 Go) 8 x 7.68 TB

Les profils importants nécessitent probablement l'ouverture d'un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites NVIDIA Hopper HGX accélérées pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU Nombre maximal de volumes Nombre maximal de vNICs
2-16 15 5
17-48 15 10
49+ 15 15

Si vous configurez un réseau de cluster compatible RDMA, vous devez disposer de 8, 16 ou 32 interfaces de réseau de cluster disponibles. Le fait de disposer d'un nombre correct d'interfaces réseau pour les clusters permet d'assurer une bonne répartition des interfaces réseau dans l'infrastructure physique sous-jacente physique sous-jacente. La plupart des utilisateurs n'en utilisent généralement que 8. Les interfaces réseau du cluster ne peuvent être configurées que lorsque l'instance est hors tension.

Profils d'instance NVIDIA L4

Les profils de serveurs virtuels sont basés sur les accélérateurs NVIDIA L4. Ces accélérateurs sont adaptés aux charges de travail graphiques. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».

Systèmes d'exploitation

  • Windows
  • Linux

Génération de processeurs

  • Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

  • GPU NVIDIA L4 (24 GB)

Disponibilité

Statut : Généralement disponible

Régions :

  • Amériques
    • Sao Paulo (br-sao)
    • Toronto (ca-tor)
    • Dallas (us-south)
    • Washington DC (us-east)
  • Europe
    • Francfort (eu-de)
    • Londres (eu-gb)
    • Madrid eu-es
  • Asie Pacifique
    • Sydney (au-syd)
    • Tokyo (jp-tok)

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage de l'instance : Non
  • NVLink : Non

Configuration de machine virtuelle

  • Type de matériel : i440fx
  • Réseau en nuage : virtio
  • Volume de démarrage en bloc : virtio
    • Exception : vscsi pour les instances basées sur Windows
  • Volumes de données en bloc : virtio

Profils d'instance

Options de profil l4 accéléré
vCPUs / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Accélérateurs
gx3-16x80x1l4 16 / 8 80 32 1x NVIDIA L4 (24 GB)
gx3-32x160x2l4 32 / 16 160 64 2x NVIDIA L4 (24 GB)
gx3-64x320x4l4 64 / 32 320 128 4x NVIDIA L4 (24 GB)

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites L4 accélérées pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU Nombre maximal de volumes Nombre maximal de vNICs
2-16 15 5
17-48 15 10
49+ 15 15

Profils d'instance NVIDIA L40S

Les profils L40s sont basés sur les accélérateurs NVIDIA L40s. Ces accélérateurs sont adaptés aux charges de travail graphiques et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.

Systèmes d'exploitation

  • Windows
  • Linux

Génération de processeurs

  • Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

  • GPU NVIDIA L40s (48 Go)

Disponibilité

Statut : Généralement disponible

Régions :

  • Amériques
    • Sao Paulo (br-sao)
    • Toronto (ca-tor)
    • Dallas (us-south)
    • Washington DC (us-east)
  • Europe
    • Francfort (eu-de)
    • Londres (eu-gb)
    • Madrid eu-es
  • Asie Pacifique
    • Sydney (au-syd)
    • Tokyo (jp-tok)

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage de l'instance : Non
  • NVLink : Non

Configuration de machine virtuelle

  • Type de matériel : i440fx
  • Réseau en nuage : virtio
  • Volume de démarrage en bloc : virtio
    • Exception : vscsi pour les instances basées sur Windows
  • Volumes de données en bloc : virtio

Profils d'instance

Options de profil L40s accéléré
Profil d'instance vCPUs / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Accélérateurs
gx3-24x120x1l40s 24 / 12 130 48 1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s 48 / 24 240 96 2x NVIDIA L40s (48 GB)

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites de la L40s accélérée pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU Nombre maximal de volumes Nombre maximal de vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA A100 profils d'instance

Les profils A100 sont construits sur NVIDIA A100 80 GB accelerators. Ces accélérateurs sont adaptés aux charges de travail HPC et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.

Systèmes d'exploitation

  • Windows
  • Linux

Génération de processeurs

  • Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

  • NVIDIA A100 GPU Tensor Core (80 Go)

Disponibilité

Statut : Sélectionner la disponibilité

Régions :

  • Amériques
    • Washington DC (us-east)
  • Europe
    • Francfort (eu-de)
    • Londres (eu-gb)
  • Asie Pacifique
    • Tokyo (jp-tok)

Capacités

  • Type de noyau : Dédié
  • Hôte dédié : Non
  • Hyperthreading : OuiSMT-2)
  • Démarrage sécurisé : Non
  • Informatique confidentielle : Non
  • Migration en direct : Non
  • Stockage d'instances : Oui
  • NVLink : Non

Configuration de machine virtuelle

  • Type de matériel : i440fx
  • Réseau en nuage : virtio
  • Volume de démarrage en bloc : virtio
    • Exception : vscsi pour les instances basées sur Windows
  • Volumes de données en bloc : virtio

Profils d'instance

Options de profil accéléré A100
Profil d'instance vCPUs / Cœurs Mémoire (Gio) Plafond de bande passante (Gbit/s) Accélérateurs Stockage d'instance (Go)
gx3d-24x120x1a100p 24 / 12 130 48 1x NVIDIA A100 PCIe (80 GB) 780 Go
gx3d-48x240x2a100p 48 / 24 240 96 2x NVIDIA A100 PCIe (80 GB) 1560 GO

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites accélérées de A100 pour les volumes maximums de vCPU, et les interfaces réseau maximums
Nombre de vCPU Nombre maximal de volumes Nombre maximal de vNICs
2-16 15 5
17-48 15 10
49+ 15 15