Profils d'instance accélérés - Gen 3
La gamme de profils accélérés offre un accès à la demande et économique aux accélérateurs et aux processeurs graphiques. Les GPU et les accélérateurs permettent d'accélérer le temps de traitement requis pour les charges de travail à forte intensité de calcul telles que l'IA, l'apprentissage automatique, l'inférence, etc.
Profils d'instance AMD MI300X
Les profils de serveurs virtuels accélérés AMD MI300X sont construits sur des accélérateurs AMD Instinct™ MI300X de 192 Go basés sur OAM. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.
Systèmes d'exploitation
- Linux
Génération de processeurs
- Intel® 8570 - 5th Génération de processeurs Xeon® Scalable
Accélérateur
- Accélérateurs AMD Instinct MI300X (192 Go OAM)
Disponibilité
Statut : Sélectionner la disponibilité
Région | Zone universelle |
---|---|
us-east | us-east-wdc06-a |
us-east | us-east-wdc07-a |
eu-de | eu-de-fra02-a |
eu-de | eu-de-fra05-a |
Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage d'instances : Oui
- Tissu IA interne : Oui
- Infinity Fabric™ (XGMI) 128 GB/s connexions GPU-to-GPU
- Réseau de clusters capable : Non
Configuration de machine virtuelle
- Type de matériel : q35
- Réseau en nuage : virtio
- Volume de démarrage en bloc : virtio
- Volumes de données en bloc : virtio
- Stockage d'instance : NVMe
Profils d'instance
Profil d'instance | vCPU / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Accélérateurs | Stockage d'instance (Go) |
---|---|---|---|---|---|
gx3d-208x1792x8mi300x | 208 / 104 | 1792 | 200 | 8x AMD MI300X (192 GO) | 3.2, 8 To |
Ce profil important nécessite probablement que vous ouvriez un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Profil | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
gx3d-208x1792x8mi300x | 15 | 15 |
Intel Gaudi 3 profils d'instance
Les profils de serveur virtuel accélérés Intel Gaudi 3 sont construits sur des accélérateurs IA Intel Gaudi 3 basés sur OAM de 128 Go. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.
Systèmes d'exploitation
- Linux
Génération de processeurs
- Intel 8568Y+- 5th Processeur évolutif Xeon® de génération
Accélérateur
- Intel Gaudi 3 AI Accelerator (128 Go OAM)
Disponibilité
Statut : Sélectionner la disponibilité
Région | Zone universelle |
---|---|
us-south | us-south-dal12-a |
us-east | us-east-wdc06-a , us-east-wdc07-a |
eu-de | eu-de-fra02-a |
Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage d'instances : Oui
- Tissu IA interne : Oui
- GbE s 21 x 200 pour les connexions OAM-à-OAM
- Réseau de clusters capable : Non
Configuration de machine virtuelle
- Type de matériel : q35
- Réseau en nuage : virtio
- Volume de démarrage en bloc : virtio
- Volumes de données en bloc : virtio
- Stockage d'instance : NVMe
Profils d'instance
Profil d'instance | vCPU / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Accélérateurs | Stockage d'instance (Go) |
---|---|---|---|---|---|
gx3d-160x1792x8gaudi3 | 160 / 80 | 1792 | 200 | 8x Gaudi-3 s Intel (128 Go) | 3.2, 8 To |
Ce profil important nécessite probablement que vous ouvriez un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Profil | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
gx3d-160x1792x8gaudi3 | 15 | 15 |
Profils d'instance NVIDIA Hopper HGX
Les profils de serveur virtuel accélérés basés sur Hopper sont construits sur des accélérateurs d' NVIDIA, H100 et H200. Ces accélérateurs ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence, le réglage fin et l'entraînement à grande échelle à grande échelle. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».
Cette solution fonctionne également avec les réseaux de clusters IBM Cloud® La mise en œuvre du réseau de cluster pour la génération d'accélérateurs Génération d'accélérateurs Hopper s'exécute sur huit NIC accélérés, fournissant un débit total agrégé de 3,2 Tbps de 3.2 Tbps. La solution propose également RoCEv2 pour prendre en charge les charges de travail basées sur RDMA. Pour plus d'informations, voir À propos des réseaux de clusters.
Systèmes d'exploitation
- Linux
Génération de processeurs
- Intel 8474C- Processeur Xeon® Scalable de 4th génération
Accélérateur
- NVIDIA H100 SXM5 (80 GO)
- NVIDIA H200 SXM5 (141 Go)
Disponibilité
NVIDIA H100 SXM5 (80 GO)
Statut : Sélectionner la disponibilité
Région | Zone universelle | Réseau du cluster |
---|---|---|
Dallas (us-south ) |
us-south-dal10-a |
Non |
Washington DC (us-east ) |
us-east-wdc07-a |
Oui |
Toronto (ca-tor ) |
ca-tor-tor05-a |
Non |
Sao Paulo (br-sao ) |
br-sao-sao01-a |
Non |
Francfort (eu-de ) |
eu-de-fra04-a |
Oui |
Londres (eu-gb ) |
eu-gb-lon05-a |
Non |
Madrid eu-es |
eu-es-mad05-a |
Non |
Sydney (au-syd ) |
au-syd-syd04-a |
Non |
Tokyo (jp-tok ) |
jp-tok-tok05-a |
Non |
Osaka (jp-osa ) |
Non disponible | Non |
Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.
NVIDIA H200 SXM5 (141 Go)
Statut : Sélectionner la disponibilité
Région | Zone universelle | Réseau du cluster |
---|---|---|
Washington DC (us-east ) |
us-east-wdc07-a |
Oui |
Toronto (ca-tor ) |
ca-tor-tor05-a |
Non |
Francfort (eu-de ) |
eu-de-fra04-a |
Oui |
Londres (eu-gb ) |
eu-gb-lon05-a |
Non |
Sydney (au-syd ) |
au-syd-syd04-a |
Non |
Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage d'instances : Oui
- NVLink : Oui (900 Go/s)
- NVIDIA GPUDirect Capable: Oui
- Possibilité de réseau en grappe : Oui (régions limitées)
- Largeur de bande : 3.2 Tbps8x 400 Gbps)
- Type : Dédié
Configuration de machine virtuelle
- Type de matériel : q35
- Réseau en nuage : virtio
- Mise en réseau des grappes : SR-IOV
- Type : NVIDIA CX-7- Fonction virtuelle
- Quantité : 8x NIC physiques dédiés à 400 Gbps
- Volume de démarrage en bloc : virtio
- Volumes de données en bloc : virtio
- Stockage d'instance : NVMe
Profils d'instance
Profil d'instance | vCPU / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Bande passante dédiée au réseau de la grappe | Accélérateurs | Stockage d'instance (Go) |
---|---|---|---|---|---|---|
gx3d-160x1792x8h100 | 160 / 80 | 1792 | 200 |
|
8x NVIDIA H100 (80 GO) | 8 x 7.68 TB |
gx3d-160x1792x8h200 | 160 / 80 | 1792 | 200 | N/A | 8x NVIDIA H200 (141 Go) | 8 x 7.68 TB |
Les profils importants nécessitent probablement l'ouverture d'un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Nombre de vCPU | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
Si vous configurez un réseau de cluster compatible RDMA, vous devez disposer de 8, 16 ou 32 interfaces de réseau de cluster disponibles. Le fait de disposer d'un nombre correct d'interfaces réseau pour les clusters permet d'assurer une bonne répartition des interfaces réseau dans l'infrastructure physique sous-jacente physique sous-jacente. La plupart des utilisateurs n'en utilisent généralement que 8. Les interfaces réseau du cluster ne peuvent être configurées que lorsque l'instance est hors tension.
Profils d'instance NVIDIA L4
Les profils de serveurs virtuels sont basés sur les accélérateurs NVIDIA L4. Ces accélérateurs sont adaptés aux charges de travail graphiques. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».
Systèmes d'exploitation
- Windows
- Linux
Génération de processeurs
- Intel 8474C- Processeur Xeon® Scalable de 4th génération
Accélérateur
- GPU NVIDIA L4 (24 GB)
Disponibilité
Statut : Généralement disponible
Régions :
- Amériques
- Sao Paulo (
br-sao
) - Toronto (
ca-tor
) - Dallas (
us-south
) - Washington DC (
us-east
)
- Sao Paulo (
- Europe
- Francfort (
eu-de
) - Londres (
eu-gb
) - Madrid
eu-es
- Francfort (
- Asie Pacifique
- Sydney (
au-syd
) - Tokyo (
jp-tok
)
- Sydney (
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage de l'instance : Non
- NVLink : Non
Configuration de machine virtuelle
- Type de matériel : i440fx
- Réseau en nuage : virtio
- Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
- Volumes de données en bloc : virtio
Profils d'instance
vCPUs / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Accélérateurs | |
---|---|---|---|---|
gx3-16x80x1l4 | 16 / 8 | 80 | 32 | 1x NVIDIA L4 (24 GB) |
gx3-32x160x2l4 | 32 / 16 | 160 | 64 | 2x NVIDIA L4 (24 GB) |
gx3-64x320x4l4 | 64 / 32 | 320 | 128 | 4x NVIDIA L4 (24 GB) |
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Nombre de vCPU | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
Profils d'instance NVIDIA L40S
Les profils L40s sont basés sur les accélérateurs NVIDIA L40s. Ces accélérateurs sont adaptés aux charges de travail graphiques et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.
Systèmes d'exploitation
- Windows
- Linux
Génération de processeurs
- Intel 8474C- Processeur Xeon® Scalable de 4th génération
Accélérateur
- GPU NVIDIA L40s (48 Go)
Disponibilité
Statut : Généralement disponible
Régions :
- Amériques
- Sao Paulo (
br-sao
) - Toronto (
ca-tor
) - Dallas (
us-south
) - Washington DC (
us-east
)
- Sao Paulo (
- Europe
- Francfort (
eu-de
) - Londres (
eu-gb
) - Madrid
eu-es
- Francfort (
- Asie Pacifique
- Sydney (
au-syd
) - Tokyo (
jp-tok
)
- Sydney (
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage de l'instance : Non
- NVLink : Non
Configuration de machine virtuelle
- Type de matériel : i440fx
- Réseau en nuage : virtio
- Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
- Volumes de données en bloc : virtio
Profils d'instance
Profil d'instance | vCPUs / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Accélérateurs |
---|---|---|---|---|
gx3-24x120x1l40s | 24 / 12 | 130 | 48 | 1x NVIDIA L40s (48 GB) |
gx3-48x240x-2l40s | 48 / 24 | 240 | 96 | 2x NVIDIA L40s (48 GB) |
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Nombre de vCPU | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
NVIDIA A100 profils d'instance
Les profils A100 sont construits sur NVIDIA A100 80 GB accelerators. Ces accélérateurs sont adaptés aux charges de travail HPC et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.
Systèmes d'exploitation
- Windows
- Linux
Génération de processeurs
- Intel 8474C- Processeur Xeon® Scalable de 4th génération
Accélérateur
- NVIDIA A100 GPU Tensor Core (80 Go)
Disponibilité
Statut : Sélectionner la disponibilité
Régions :
- Amériques
- Washington DC (
us-east
)
- Washington DC (
- Europe
- Francfort (
eu-de
) - Londres (
eu-gb
)
- Francfort (
- Asie Pacifique
- Tokyo (
jp-tok
)
- Tokyo (
Capacités
- Type de noyau : Dédié
- Hôte dédié : Non
- Hyperthreading : OuiSMT-2)
- Démarrage sécurisé : Non
- Informatique confidentielle : Non
- Migration en direct : Non
- Stockage d'instances : Oui
- NVLink : Non
Configuration de machine virtuelle
- Type de matériel : i440fx
- Réseau en nuage : virtio
- Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
- Volumes de données en bloc : virtio
Profils d'instance
Profil d'instance | vCPUs / Cœurs | Mémoire (Gio) | Plafond de bande passante (Gbit/s) | Accélérateurs | Stockage d'instance (Go) |
---|---|---|---|---|---|
gx3d-24x120x1a100p | 24 / 12 | 130 | 48 | 1x NVIDIA A100 PCIe (80 GB) | 780 Go |
gx3d-48x240x2a100p | 48 / 24 | 240 | 96 | 2x NVIDIA A100 PCIe (80 GB) | 1560 GO |
Limites
Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.
Nombre de vCPU | Nombre maximal de volumes | Nombre maximal de vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |