Profils d'instance accélérés - Gen 3

La gamme de profils accélérés offre un accès à la demande et économique aux accélérateurs et aux processeurs graphiques. Les GPU et les accélérateurs permettent d'accélérer le temps de traitement requis pour les charges de travail à forte intensité de calcul telles que l'IA, l'apprentissage automatique, l'inférence, etc.

Profils d'instance AMD MI300X

Les profils de serveurs virtuels accélérés AMD MI300X sont construits sur des accélérateurs AMD Instinct™ MI300X de 192 Go basés sur OAM. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.

Systèmes d'exploitation

Linux

Génération de processeurs

Intel® 8570 - 5th Génération de processeurs Xeon® Scalable

Accélérateur

Accélérateurs AMD Instinct MI300X (192 Go OAM)

Disponibilité

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région	Zone universelle
us-east	`us-east-wdc06-a`
us-east	`us-east-wdc07-a`
eu-de	`eu-de-fra02-a`
eu-de	`eu-de-fra05-a`

Pour plus d'informations sur les régions et les zones universelles, voir Régions. Vous pouvez consulter la cartographie des zones attribuées à un compte sur la page VPC Infrastructure Overview (Présentation de l'infrastructure VPC) dans la section Endpoint (Point de terminaison). La cartographie des zones montre comment la zone correspond au nom de zone universel qui représente l'emplacement physique.

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage d'instances : Oui
Tissu IA interne : Oui
Infinity Fabric™ (XGMI) 128 GB/s connexions GPU-to-GPU
Réseau de clusters capable : Non

Configuration de machine virtuelle

Type de matériel : q35
Réseau en nuage : virtio
Volume de démarrage en bloc : virtio
Volumes de données en bloc : virtio
Stockage d'instance : NVMe

Profils d'instance

Options de profil AMD accéléré
Profil d'instance	vCPU / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Accélérateurs	Stockage d'instance (Go)
gx3d-208x1792x8mi300x	208 / 104	1792	200	8x AMD MI300X (192 GO)	3.2, 8 To

Ce profil important nécessite probablement que vous ouvriez un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites de la famille AMD accélérée pour les volumes maximums et les interfaces réseau maximums
Profil	Nombre maximal de volumes	Nombre maximal de vNICs
gx3d-208x1792x8mi300x	15	15

Intel Gaudi 3 profils d'instance

Les profils de serveur virtuel accélérés Intel Gaudi 3 sont construits sur des accélérateurs IA Intel Gaudi 3 basés sur OAM de 128 Go. Ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence et le réglage fin. La solution est associée aux processeurs Intel® Xeon® Scalable de la génération 5th.

Systèmes d'exploitation

Linux

Génération de processeurs

Intel 8568Y+- 5th Processeur évolutif Xeon® de génération

Accélérateur

Intel Gaudi 3 AI Accelerator (128 Go OAM)

Disponibilité

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région	Zone universelle
us-south	`us-south-dal12-a`
us-east	`us-east-wdc06-a`, `us-east-wdc07-a`
eu-de	`eu-de-fra02-a`

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage d'instances : Oui
Tissu IA interne : Oui
- GbE s 21 x 200 pour les connexions OAM-à-OAM
Réseau de clusters capable : Non

Configuration de machine virtuelle

Type de matériel : q35
Réseau en nuage : virtio
Volume de démarrage en bloc : virtio
Volumes de données en bloc : virtio
Stockage d'instance : NVMe

Profils d'instance

Options de profil Intel accélérées
Profil d'instance	vCPU / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Accélérateurs	Stockage d'instance (Go)
gx3d-160x1792x8gaudi3	160 / 80	1792	200	8x Gaudi-3 s Intel (128 Go)	3.2, 8 To

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites accélérées de la famille Intel pour les volumes maximum et les interfaces réseau maximum
Profil	Nombre maximal de volumes	Nombre maximal de vNICs
gx3d-160x1792x8gaudi3	15	15

Profils d'instance NVIDIA Hopper HGX

Les profils de serveur virtuel accélérés basés sur Hopper sont construits sur des accélérateurs d' NVIDIA, H100 et H200. Ces accélérateurs ces accélérateurs sont adaptés aux charges de travail de l'IA, y compris l'inférence, le réglage fin et l'entraînement à grande échelle à grande échelle. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».

Cette solution fonctionne également avec les réseaux de clusters IBM Cloud® La mise en œuvre du réseau de cluster pour la génération d'accélérateurs Génération d'accélérateurs Hopper s'exécute sur huit NIC accélérés, fournissant un débit total agrégé de 3,2 Tbps de 3.2 Tbps. La solution propose également RoCEv2 pour prendre en charge les charges de travail basées sur RDMA. Pour plus d'informations, voir À propos des réseaux de clusters.

Systèmes d'exploitation

Linux

Génération de processeurs

Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

NVIDIA H100 SXM5 (80 GO)
NVIDIA H200 SXM5 (141 Go)

Disponibilité

NVIDIA H100 SXM5 (80 GO)

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région	Zone universelle	Réseau du cluster
Dallas (`us-south`)	`us-south-dal10-a`	Non
Washington DC (`us-east`)	`us-east-wdc07-a`	Oui
Toronto (`ca-tor`)	`ca-tor-tor05-a`	Non
Sao Paulo (`br-sao`)	`br-sao-sao01-a`	Non
Francfort (`eu-de`)	`eu-de-fra04-a`	Oui
Londres (`eu-gb`)	`eu-gb-lon05-a`	Non
Madrid `eu-es`	`eu-es-mad05-a`	Non
Sydney (`au-syd`)	`au-syd-syd04-a`	Non
Tokyo (`jp-tok`)	`jp-tok-tok05-a`	Non
Osaka (`jp-osa`)	Non disponible	Non

NVIDIA H200 SXM5 (141 Go)

Statut : Sélectionner la disponibilité

Tableau 1. Régions et zones prises en charge
Région	Zone universelle	Réseau du cluster
Washington DC (`us-east`)	`us-east-wdc07-a`	Oui
Toronto (`ca-tor`)	`ca-tor-tor05-a`	Non
Francfort (`eu-de`)	`eu-de-fra04-a`	Oui
Londres (`eu-gb`)	`eu-gb-lon05-a`	Non
Sydney (`au-syd`)	`au-syd-syd04-a`	Non

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage d'instances : Oui
NVLink : Oui (900 Go/s)
NVIDIA GPUDirect Capable: Oui
Possibilité de réseau en grappe : Oui (régions limitées)
- Largeur de bande : 3.2 Tbps8x 400 Gbps)
- Type : Dédié

Configuration de machine virtuelle

Type de matériel : q35
Réseau en nuage : virtio
Mise en réseau des grappes : SR-IOV
- Type : NVIDIA CX-7- Fonction virtuelle
- Quantité : 8x NIC physiques dédiés à 400 Gbps
Volume de démarrage en bloc : virtio
Volumes de données en bloc : virtio
Stockage d'instance : NVMe

Profils d'instance

Options de profil NVIDIA Hopper HGX accéléré
Profil d'instance	vCPU / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Bande passante dédiée au réseau de la grappe	Accélérateurs	Stockage d'instance (Go)
gx3d-160x1792x8h100	160 / 80	1792	200	3.2 Tbps 8x 400 Gbps dédiés NVIDIA CX-7 )	8x NVIDIA H100 (80 GO)	8 x 7.68 TB
gx3d-160x1792x8h200	160 / 80	1792	200	N/A	8x NVIDIA H200 (141 Go)	8 x 7.68 TB

Les profils importants nécessitent probablement l'ouverture d'un ticket de support pour demander une augmentation de quota. Veuillez vérifier vos niveaux de quotas et déterminer si le compte approvisionnant la ressource nécessite une modification des quotas. Notez que ce serveur utilise des quotas de RAM ( vCPU, ), de stockage d'instance et de GPU.

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites NVIDIA Hopper HGX accélérées pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU	Nombre maximal de volumes	Nombre maximal de vNICs
2-16	15	5
17-48	15	10
49+	15	15

Si vous configurez un réseau de cluster compatible RDMA, vous devez disposer de 8, 16 ou 32 interfaces de réseau de cluster disponibles. Le fait de disposer d'un nombre correct d'interfaces réseau pour les clusters permet d'assurer une bonne répartition des interfaces réseau dans l'infrastructure physique sous-jacente physique sous-jacente. La plupart des utilisateurs n'en utilisent généralement que 8. Les interfaces réseau du cluster ne peuvent être configurées que lorsque l'instance est hors tension.

Profils d'instance NVIDIA L4

Les profils de serveurs virtuels sont basés sur les accélérateurs NVIDIA L4. Ces accélérateurs sont adaptés aux charges de travail graphiques. La solution est associée aux processeurs évolutifs Intel® Xeon® de la génération « 4th ».

Systèmes d'exploitation

Windows
Linux

Génération de processeurs

Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

GPU NVIDIA L4 (24 GB)

Disponibilité

Statut : Généralement disponible

Régions :

Amériques
- Sao Paulo (br-sao)
- Toronto (ca-tor)
- Dallas (us-south)
- Washington DC (us-east)
Europe
- Francfort (eu-de)
- Londres (eu-gb)
- Madrid eu-es
Asie Pacifique
- Sydney (au-syd)
- Tokyo (jp-tok)

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage de l'instance : Non
NVLink : Non

Configuration de machine virtuelle

Type de matériel : i440fx
Réseau en nuage : virtio
Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
Volumes de données en bloc : virtio

Profils d'instance

Options de profil l4 accéléré
	vCPUs / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Accélérateurs
gx3-16x80x1l4	16 / 8	80	32	1x NVIDIA L4 (24 GB)
gx3-32x160x2l4	32 / 16	160	64	2x NVIDIA L4 (24 GB)
gx3-64x320x4l4	64 / 32	320	128	4x NVIDIA L4 (24 GB)

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites L4 accélérées pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU	Nombre maximal de volumes	Nombre maximal de vNICs
2-16	15	5
17-48	15	10
49+	15	15

Profils d'instance NVIDIA L40S

Les profils L40s sont basés sur les accélérateurs NVIDIA L40s. Ces accélérateurs sont adaptés aux charges de travail graphiques et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.

Systèmes d'exploitation

Windows
Linux

Génération de processeurs

Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

GPU NVIDIA L40s (48 Go)

Disponibilité

Statut : Généralement disponible

Régions :

Amériques
- Sao Paulo (br-sao)
- Toronto (ca-tor)
- Dallas (us-south)
- Washington DC (us-east)
Europe
- Francfort (eu-de)
- Londres (eu-gb)
- Madrid eu-es
Asie Pacifique
- Sydney (au-syd)
- Tokyo (jp-tok)

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage de l'instance : Non
NVLink : Non

Configuration de machine virtuelle

Type de matériel : i440fx
Réseau en nuage : virtio
Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
Volumes de données en bloc : virtio

Profils d'instance

Options de profil L40s accéléré
Profil d'instance	vCPUs / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Accélérateurs
gx3-24x120x1l40s	24 / 12	130	48	1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s	48 / 24	240	96	2x NVIDIA L40s (48 GB)

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites de la L40s accélérée pour les vCPU, volumes maximums et les interfaces réseau maximums
Nombre de vCPU	Nombre maximal de volumes	Nombre maximal de vNICs
2-16	15	5
17-48	15	10
49+	15	15

NVIDIA A100 profils d'instance

Les profils A100 sont construits sur NVIDIA A100 80 GB accelerators. Ces accélérateurs sont adaptés aux charges de travail HPC et les charges de travail d'inférence. La solution est associée à un processeur Intel® Xeon® de 4th génération Processeurs évolutifs.

Systèmes d'exploitation

Windows
Linux

Génération de processeurs

Intel 8474C- Processeur Xeon® Scalable de 4th génération

Accélérateur

NVIDIA A100 GPU Tensor Core (80 Go)

Disponibilité

Statut : Sélectionner la disponibilité

Régions :

Amériques
- Washington DC (us-east)
Europe
- Francfort (eu-de)
- Londres (eu-gb)
Asie Pacifique
- Tokyo (jp-tok)

Capacités

Type de noyau : Dédié
Hôte dédié : Non
Hyperthreading : OuiSMT-2)
Démarrage sécurisé : Non
Informatique confidentielle : Non
Migration en direct : Non
Stockage d'instances : Oui
NVLink : Non

Configuration de machine virtuelle

Type de matériel : i440fx
Réseau en nuage : virtio
Volume de démarrage en bloc : virtio
- Exception : vscsi pour les instances basées sur Windows
Volumes de données en bloc : virtio

Profils d'instance

Options de profil accéléré A100
Profil d'instance	vCPUs / Cœurs	Mémoire (Gio)	Plafond de bande passante (Gbit/s)	Accélérateurs	Stockage d'instance (Go)
gx3d-24x120x1a100p	24 / 12	130	48	1x NVIDIA A100 PCIe (80 GB)	780 Go
gx3d-48x240x2a100p	48 / 24	240	96	2x NVIDIA A100 PCIe (80 GB)	1560 GO

Limites

Une instance a une limite pour le nombre de volumes et d'interfaces réseau virtuelles qui peuvent être attachés attachées. Cette limite est basée sur la taille de l'instance.

Limites accélérées de A100 pour les volumes maximums de vCPU, et les interfaces réseau maximums
Nombre de vCPU	Nombre maximal de volumes	Nombre maximal de vNICs
2-16	15	5
17-48	15	10
49+	15	15