高速化インスタンス・プロファイル - Gen 3

アクセラレータとGPUへのオンデマンドかつコスト効率の高いアクセスを提供する、プロファイルの高速化ファミリー。 GPUとアクセラレータは、AI、機械学習、推論などのような計算集約的なワークロードに必要な処理時間を加速するのに役立つ。

AMD MI300X インスタンス・プロファイル

AMD MI300X アクセラレーションによる仮想サーバー・プロファイルは、192 GB OAMベースのAMD Instinct™ MI300X アクセラレーター上に構築されています。これらのアクセラレータは、推論や微調整などのAIワークロード向けに調整されています。このソリューションは、 5th インテル® Xeon® スケーラブル・プロセッサーと組み合わされています。

オペレーティング・システム

Linux

プロセッサー世代

インテル® 8570 - 5th 世代 Xeon® スケーラブル・プロセッサー

アクセラレーター

AMD Instinct MI300X アクセラレータ (192 GB OAM)

可用性

ステータス空席状況を選択

表 1. 対応地域と
リージョン	ユニバーサルゾーン
us-east	`us-east-wdc06-a`
us-east	`us-east-wdc07-a`
eu-de	`eu-de-fra02-a`
eu-de	`eu-de-fra05-a`

リージョンとユニバーサルゾーンの詳細については、リージョンを参照のこと。アカウントに割り当てられたゾーンマッピングは、 VPCインフラストラクチャの概要ページのエンドポイントセクションで確認できます。ゾーンマッピングは、ゾーンが物理的な場所を表すユニバーサルゾーン名にどのように対応しているかを示しています。

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンス・ストレージはい
内部AIファブリック：はい
- Infinity Fabric™ (XGMI) 128 GB/秒 GPU間接続
クラスタネットワーク対応：いいえ

VM 構成

ハードウェアの種類：q35
クラウド・ネットワーキング: virtio
ブロックブートボリューム：virtio
ブロック・データ・ボリューム: virtio
インスタンス・ストレージNVMe

インスタンス・プロファイル

アクセラレートAMDプロファイル・オプション
インスタンス・プロファイル	vCPU / コア	メモリー (GiB)	帯域幅上限値 (Gbps)	アクセラレーター	インスタンス・ストレージ (GB)
gx3d-208x1792x8mi300x	208 / 104	1792	200	8x AMD (192 GB) MI300X	8 x 3.2 TB

この大きなプロフィールでは、おそらくサポートチケットを開いてクォータの増加をリクエストする必要がありますクォータレベルを確認し、リソースをプロビジョニングするアカウントのクォータを変更する必要があるかどうかを判断してください。このサーバーは、 vCPU, RAM、インスタンスストレージ、GPUクォータを利用します

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。インスタンスにはこの制限はインスタンスのサイズに基づいている。

最大ボリュームと最大ネットワーク・インターフェースに関するAMDファミリーの制限を高速化
プロフィール	最大ボリューム	最大vNICs
gx3d-208x1792x8mi300x	15	15

インテル® Gaudi 3 インスタンスプロファイル

インテル® Gaudi 3 アクセラレーテッド・バーチャル・サーバー・プロファイルは、128 GB OAM ベースのインテル® Gaudi 3 AI アクセラレーターを基盤として構築されています。これらのアクセラレータは、推論や微調整などのAIワークロード向けに調整されています。このソリューションは、 5th インテル® Xeon® スケーラブル・プロセッサーと組み合わされています。

オペレーティング・システム

Linux

プロセッサー世代

インテル 8568Y+- 5th 世代 Xeon® Scalable プロセッサー

アクセラレーター

インテル® Gaudi 3 AI アクセラレーター（128 GB OAM）

可用性

ステータス空席状況を選択

表 1. 対応地域と
リージョン	ユニバーサルゾーン
us-south	`us-south-dal12-a`
us-east	`us-east-wdc06-a`, `us-east-wdc07-a`
eu-de	`eu-de-fra02-a`

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンス・ストレージはい
内部AIファブリック：はい
- 21 x 200 GbE OAM-to-OAM接続用
クラスタネットワーク対応：いいえ

VM 構成

ハードウェアの種類：q35
クラウド・ネットワーキング: virtio
ブロックブートボリューム：virtio
ブロック・データ・ボリューム: virtio
インスタンス・ストレージNVMe

インスタンス・プロファイル

インテル・アクセラレーテッド・プロファイル・オプション
インスタンス・プロファイル	vCPU / コア	メモリー (GiB)	帯域幅上限値 (Gbps)	アクセラレーター	インスタンス・ストレージ (GB)
gx3d-160x1792x8gaudi3	160 / 80	1792	200	8x インテル (128 GB) Gaudi-3	8 x 3.2 TB

制限

最大ボリュームおよび最大ネットワークインターフェースにおけるインテル・ファミリーの制限値の加速
プロフィール	最大ボリューム	最大vNICs
gx3d-160x1792x8gaudi3	15	15

NVIDIA Hopper HGXインスタンスプロファイル

Hopperベースの高速仮想サーバープロファイルは、 NVIDIA、 H100、 H200 のアクセラレータを基盤として構築されています。これらのこれらのアクセラレーターは、推論、ファインチューニング、大規模トレーニングなどのAIワークロード向けに調整されている。トレーニングなどです。このソリューションは、 4th Generation Intel® Xeon® Scalable プロセッサーと組み合わせて使用します。

このソリューションは IBM Cloud® クラスタネットワークでも動作する。クラスタ・ネットワークの実装 Hopper世代のアクセラレータのクラスタ・ネットワーク実装は、8つのアクセラレータNICの上で実行され、合計3.2Tbpsのクラスタ・スループットを提供します。 Tbpsのスループットを提供します。このソリューションはまた、RDMAベースのワークロードをサポートする RoCEv2 。詳細については、クラスタ・ネットワークについてを参照してください。

オペレーティング・システム

Linux

プロセッサー世代

インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

NVIDIA H100 SXM5 (80GB)
NVIDIA H200 SXM5 （141 GB）

可用性

NVIDIA H100 SXM5 (80GB)

ステータス空席状況を選択

表 1. 対応地域と
リージョン	ユニバーサルゾーン	クラスター・ネットワーク
ダラス（`us-south`）	`us-south-dal10-a`	いいえ
ワシントンDC（`us-east`）	`us-east-wdc07-a`	ある
トロント (`ca-tor`)	`ca-tor-tor05-a`	いいえ
サンパウロ (`br-sao`)	`br-sao-sao01-a`	いいえ
フランクフルト（`eu-de`）	`eu-de-fra04-a`	ある
ロンドン（`eu-gb`）	`eu-gb-lon05-a`	いいえ
マドリード `eu-es`	`eu-es-mad05-a`	いいえ
シドニー（`au-syd`）	`au-syd-syd04-a`	いいえ
東京（`jp-tok`）	`jp-tok-tok05-a`	いいえ
大阪 (`jp-osa`)	使用不可	いいえ

NVIDIA H200 SXM5 （141 GB）

ステータス空席状況を選択

表 1. 対応地域と
リージョン	ユニバーサルゾーン	クラスター・ネットワーク
ワシントンDC（`us-east`）	`us-east-wdc07-a`	ある
トロント (`ca-tor`)	`ca-tor-tor05-a`	いいえ
フランクフルト（`eu-de`）	`eu-de-fra04-a`	ある
ロンドン（`eu-gb`）	`eu-gb-lon05-a`	いいえ
シドニー（`au-syd`）	`au-syd-syd04-a`	いいえ

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンス・ストレージはい
NVLink：はい (900 GB/秒)
NVIDIA GPUDirect対応：はい
クラスターネットワークに対応あり（地域限定）
- 帯域幅：3.28x400 Gbps）
- タイプ専用

VM 構成

ハードウェアの種類：q35
クラウド・ネットワーキング: virtio
クラスターネットワーキングSR-IOV
- タイプ NVIDIA CX-7- バーチャルファンクション
- 数量8x専用400Gbps物理NIC
ブロックブートボリューム：virtio
ブロック・データ・ボリューム: virtio
インスタンス・ストレージNVMe

インスタンス・プロファイル

高速化された NVIDIA Hopper HGXプロファイルオプション
インスタンス・プロファイル	vCPU / コア	メモリー (GiB)	帯域幅上限値 (Gbps)	クラスタ・ネットワーク専用帯域幅	アクセラレーター	インスタンス・ストレージ (GB)
gx3d-160x1792x8h100	160 / 80	1792	200	3.2 Tbps 8x 400 Gbps専用 NVIDIA CX-7 )	8x NVIDIA H100 (80 GB)	8 x7.68TB
gx3d-160x1792x8h200	160 / 80	1792	200	該当なし	8x NVIDIA H200 （141 GB）	8 x7.68TB

大規模なプロファイルでは、おそらくサポートチケットを開いて、クォータの増加をリクエストする必要がクォータレベルを確認し、リソースをプロビジョニングするアカウントのクォータを変更する必要があるかどうかを判断してください。このサーバーは、 vCPU, RAM、インスタンスストレージ、GPUクォータを利用します

制限

アクセラレートされた NVIDIA Hopper HGXによる vCPU, 最大ボリューム、最大ネットワーク・インターフェイスの制限
vCPU の数	最大ボリューム	最大vNICs
2-16	15	5
17-48	15	10
49+	15	15

RDMA対応クラスタ・ネットワークを構成する場合は、8、16、または32のクラスタ・ネットワーク・インターフェイスを使用できるようにする必要があります。のいずれかのクラスタネットワークインタフェースが必要です。適切な数のクラスタ・ネットワーク・インタフェースを利用できるようにすることで、基礎となる物理インフラストラクチャ全体でネットワーク・インタフェースを適切に分配することができます。物理インフラストラクチャに適切に分配することができます。ほとんどのユーザーは通常8本しか使わない。クラスタ・ネットワーク・インターフェースは、インスタンスの電源がオフのときにのみ設定できます。

NVIDIA L4 インスタンスプロファイル

仮想サーバー・プロファイルは、 NVIDIA L4 アクセラレーターの上に構築されている。これらのアクセラレータは、グラフィックスワークロード用に調整されています。このソリューションは、 4th Generation Intel® Xeon® Scalable プロセッサーと組み合わせて使用します。

オペレーティング・システム

Windows
Linux

プロセッサー世代

インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

NVIDIA L4 GPU (24GB)

可用性

ステータス一般的に利用可能

リージョン:

アメリカ大陸
- サンパウロ (br-sao)
- トロント (ca-tor)
- ダラス（us-south）
- ワシントンDC（us-east）
ヨーロッパ
- フランクフルト（eu-de）
- ロンドン（eu-gb）
- マドリード eu-es
アジア太平洋
- シドニー（au-syd）
- 東京（jp-tok）

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンスストレージ：なし
NVLink：いいえ

VM 構成

ハードウェアの種類：i440fx
クラウド・ネットワーキング: virtio
ブロックブートボリューム：virtio
- 例外：Windowsベースのインスタンス用のvscsi
ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速l4プロファイル・オプション
	vCPUs/コア	メモリー (GiB)	帯域幅上限値 (Gbps)	アクセラレーター
gx3-16x80x1l4	16 / 8	80	32	1x NVIDIA L4 (24 GB)
gx3-32x160x2l4	32 / 16	160	64	2x NVIDIA L4 (24 GB)
gx3-64x320x4l4	64 / 32	320	128	4x NVIDIA L4 (24 GB)

制限

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの L4 制限を高速化。
vCPU の数	最大ボリューム	最大vNICs
2-16	15	5
17-48	15	10
49+	15	15

NVIDIA L40S インスタンスプロファイル

L40s プロファイルは、 NVIDIA L40s アクセラレータの上に構築されている。これらのアクセラレーターはグラフィックスおよび推論ワークロード向けに調整されています。このソリューションには、 4th 世代インテル® Xeon® が搭載されていますスケーラブルなプロセッサ。

オペレーティング・システム

Windows
Linux

プロセッサー世代

インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

NVIDIA L40s GPU（48ギガバイト）

可用性

ステータス一般的に利用可能

リージョン:

アメリカ大陸
- サンパウロ (br-sao)
- トロント (ca-tor)
- ダラス（us-south）
- ワシントンDC（us-east）
ヨーロッパ
- フランクフルト（eu-de）
- ロンドン（eu-gb）
- マドリード eu-es
アジア太平洋
- シドニー（au-syd）
- 東京（jp-tok）

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンスストレージ：なし
NVLink：いいえ

VM 構成

ハードウェアの種類：i440fx
クラウド・ネットワーキング: virtio
ブロックブートボリューム：virtio
- 例外：Windowsベースのインスタンス用のvscsi
ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速L40sプロファイル・オプション
インスタンス・プロファイル	vCPUs/コア	メモリー (GiB)	帯域幅上限値 (Gbps)	アクセラレーター
gx3-24x120x1l40s	24 / 12	120	48	1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s	48 / 24	240	96	2x NVIDIA L40s (48 GB)

制限

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの L40s 制限を高速化。
vCPU の数	最大ボリューム	最大vNICs
2-16	15	5
17-48	15	10
49+	15	15

NVIDIA A100 インスタンスプロファイル

A100 プロファイルは、 NVIDIA A100 80GBアクセラレーターの上に構築されている。これらのアクセラレーターは HPCおよび推論ワークロード向けに調整されています。このソリューションには、 4th 世代インテル® Xeon® が搭載されていますスケーラブルなプロセッサ。

オペレーティング・システム

Windows
Linux

プロセッサー世代

インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

NVIDIA A100 テンソルコアGPU（80GB）

可用性

ステータス空席状況を選択

リージョン:

アメリカ大陸
- ワシントンDC（us-east）
ヨーロッパ
- フランクフルト（eu-de）
- ロンドン（eu-gb）
アジア太平洋
- 東京（jp-tok）

機能

コアタイプ専用
専用ホスト：なし
ハイパースレッディングはいSMT-2
セキュアブートいいえ
コンフィデンシャル・コンピューティングいいえ
ライブ移住：なし
インスタンス・ストレージはい
NVLink：いいえ

VM 構成

ハードウェアの種類：i440fx
クラウド・ネットワーキング: virtio
ブロックブートボリューム：virtio
- 例外：Windowsベースのインスタンス用のvscsi
ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速 A100 プロファイルオプション
インスタンス・プロファイル	vCPUs/コア	メモリー (GiB)	帯域幅上限値 (Gbps)	アクセラレーター	インスタンス・ストレージ (GB)
gx3d-24x120x1a100p	24 / 12	120	48	1x NVIDIA A100 PCIe (80 GB)	780 GB
gx3d-48x240x2a100p	48 / 24	240	96	2x NVIDIA A100 PCIe (80 GB)	1560 GB

制限

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの A100 制限を高速化。
vCPU の数	最大ボリューム	最大vNICs
2-16	15	5
17-48	15	10
49+	15	15