IBM Cloud Docs
高速化インスタンス・プロファイル - Gen 3

高速化インスタンス・プロファイル - Gen 3

アクセラレータとGPUへのオンデマンドかつコスト効率の高いアクセスを提供する、プロファイルの高速化ファミリー。 GPUとアクセラレータは、AI、機械学習、推論などのような計算集約的なワークロードに必要な処理時間を加速するのに役立つ。

AMD MI300X インスタンス・プロファイル

AMD MI300X アクセラレーションによる仮想サーバー・プロファイルは、192 GB OAMベースのAMD Instinct™ MI300X アクセラレーター上に構築されています。 これらのアクセラレータは、推論や微調整などのAIワークロード向けに調整されています。 このソリューションは、 5th インテル® Xeon® スケーラブル・プロセッサーと組み合わされています。

オペレーティング・システム

  • Linux

プロセッサー世代

  • インテル® 8570 - 5th 世代 Xeon® スケーラブル・プロセッサー

アクセラレーター

  • AMD Instinct MI300X アクセラレータ (192 GB OAM)

可用性

ステータス空席状況を選択

表 1. 対応地域と
リージョン ユニバーサルゾーン
us-east us-east-wdc06-a
us-east us-east-wdc07-a
eu-de eu-de-fra02-a
eu-de eu-de-fra05-a

リージョンとユニバーサルゾーンの詳細については、リージョン を参照のこと。 アカウントに割り当てられたゾーンマッピングは、 VPCインフラストラクチャの概要ページのエンド ポイントセクションで確認できます。 ゾーンマッピングは、ゾーンが物理的な場所を表すユニバーサルゾーン名にどのように対応しているかを示しています。

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンス・ストレージはい
  • 内部AIファブリック:はい
    • Infinity Fabric™ (XGMI) 128 GB/秒 GPU間接続
  • クラスタネットワーク対応:いいえ

VM 構成

  • ハードウェアの種類:q35
  • クラウド・ネットワーキング: virtio
  • ブロックブートボリューム:virtio
  • ブロック・データ・ボリューム: virtio
  • インスタンス・ストレージNVMe

インスタンス・プロファイル

アクセラレートAMDプロファイル・オプション
インスタンス・プロファイル vCPU / コア メモリー (GiB) 帯域幅上限値 (Gbps) アクセラレーター インスタンス・ストレージ (GB)
gx3d-208x1792x8mi300x 208 / 104 1792 200 8x AMD (192 GB) MI300X 8 x 3.2 TB

この大きなプロフィールでは、おそらくサポートチケットを開 いてクォータの増加を リクエストする必要があります クォータレベルを確認し、 リソースをプロビジョニングするアカウントのクォータを変更する必要があるかどうかを判断してください。 このサーバーは、 vCPU, RAM、インスタンスストレージ、GPUクォータを利用します

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

最大ボリュームと最大ネットワーク・インターフェースに関するAMDファミリーの制限を高速化
プロフィール 最大ボリューム 最大vNICs
gx3d-208x1792x8mi300x 15 15

インテル® Gaudi 3 インスタンスプロファイル

インテル® Gaudi 3 アクセラレーテッド・バーチャル・サーバー・プロファイルは、128 GB OAM ベースのインテル® Gaudi 3 AI アクセラレーターを基盤として構築されています。 これらのアクセラレータは、推論や微調整などのAIワークロード向けに調整されています。 このソリューションは、 5th インテル® Xeon® スケーラブル・プロセッサーと組み合わされています。

オペレーティング・システム

  • Linux

プロセッサー世代

  • インテル 8568Y+- 5th 世代 Xeon® Scalable プロセッサー

アクセラレーター

  • インテル® Gaudi 3 AI アクセラレーター(128 GB OAM)

可用性

ステータス空席状況を選択

表 1. 対応地域と
リージョン ユニバーサルゾーン
us-south us-south-dal12-a
us-east us-east-wdc06-a, us-east-wdc07-a
eu-de eu-de-fra02-a

リージョンとユニバーサルゾーンの詳細については、リージョン を参照のこと。 アカウントに割り当てられたゾーンマッピングは、 VPCインフラストラクチャの概要ページのエンド ポイントセクションで確認できます。 ゾーンマッピングは、ゾーンが物理的な場所を表すユニバーサルゾーン名にどのように対応しているかを示しています。

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンス・ストレージはい
  • 内部AIファブリック:はい
    • 21 x 200 GbE OAM-to-OAM接続用
  • クラスタネットワーク対応:いいえ

VM 構成

  • ハードウェアの種類:q35
  • クラウド・ネットワーキング: virtio
  • ブロックブートボリューム:virtio
  • ブロック・データ・ボリューム: virtio
  • インスタンス・ストレージNVMe

インスタンス・プロファイル

インテル・アクセラレーテッド・プロファイル・オプション
インスタンス・プロファイル vCPU / コア メモリー (GiB) 帯域幅上限値 (Gbps) アクセラレーター インスタンス・ストレージ (GB)
gx3d-160x1792x8gaudi3 160 / 80 1792 200 8x インテル (128 GB) Gaudi-3 8 x 3.2 TB

この大きなプロフィールでは、おそらくサポートチケットを開 いてクォータの増加を リクエストする必要があります クォータレベルを確認し、 リソースをプロビジョニングするアカウントのクォータを変更する必要があるかどうかを判断してください。 このサーバーは、 vCPU, RAM、インスタンスストレージ、GPUクォータを利用します

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

最大ボリュームおよび最大ネットワークインターフェースにおけるインテル・ファミリーの制限値の加速
プロフィール 最大ボリューム 最大vNICs
gx3d-160x1792x8gaudi3 15 15

NVIDIA Hopper HGXインスタンスプロファイル

Hopperベースの高速仮想サーバープロファイルは、 NVIDIA、 H100、 H200 のアクセラレータを基盤として構築されています。 これらの これらのアクセラレーターは、推論、ファインチューニング、大規模トレーニングなどのAIワークロード向けに調整されている。 トレーニングなどです。 このソリューションは、 4th Generation Intel® Xeon® Scalable プロセッサーと組み合わせて使用します。

このソリューションは IBM Cloud® クラスタネットワークでも動作する。 クラスタ・ネットワークの実装 Hopper世代のアクセラレータのクラスタ・ネットワーク実装は、8つのアクセラレータNICの上で実行され、合計3.2Tbpsのクラスタ・スループットを提供します。 Tbpsのスループットを提供します。 このソリューションはまた、RDMAベースのワークロードをサポートする RoCEv2 。 詳細については、 クラスタ・ネットワーク についてを参照してください。

オペレーティング・システム

  • Linux

プロセッサー世代

  • インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

  • NVIDIA H100 SXM5 (80GB)
  • NVIDIA H200 SXM5 (141 GB)

可用性

NVIDIA H100 SXM5 (80GB)

ステータス空席状況を選択

表 1. 対応地域と
リージョン ユニバーサルゾーン クラスター・ネットワーク
ダラス(us-south us-south-dal10-a いいえ
ワシントンDC(us-east us-east-wdc07-a ある
トロント (ca-tor) ca-tor-tor05-a いいえ
サンパウロ (br-sao) br-sao-sao01-a いいえ
フランクフルト(eu-de eu-de-fra04-a ある
ロンドン(eu-gb eu-gb-lon05-a いいえ
マドリード eu-es eu-es-mad05-a いいえ
シドニー(au-syd au-syd-syd04-a いいえ
東京(jp-tok jp-tok-tok05-a いいえ
大阪 (jp-osa) 使用不可 いいえ

リージョンとユニバーサルゾーンの詳細については、リージョン を参照のこと。 アカウントに割り当てられたゾーンマッピングは、 VPCインフラストラクチャの概要ページのエンド ポイントセクションで確認できます。 ゾーンマッピングは、ゾーンが物理的な場所を表すユニバーサルゾーン名にどのように対応しているかを示しています。

NVIDIA H200 SXM5 (141 GB)

ステータス空席状況を選択

表 1. 対応地域と
リージョン ユニバーサルゾーン クラスター・ネットワーク
ワシントンDC(us-east us-east-wdc07-a ある
トロント (ca-tor) ca-tor-tor05-a いいえ
フランクフルト(eu-de eu-de-fra04-a ある
ロンドン(eu-gb eu-gb-lon05-a いいえ
シドニー(au-syd au-syd-syd04-a いいえ

リージョンとユニバーサルゾーンの詳細については、リージョン を参照のこと。 アカウントに割り当てられたゾーンマッピングは、 VPCインフラストラクチャの概要ページのエンド ポイントセクションで確認できます。 ゾーンマッピングは、ゾーンが物理的な場所を表すユニバーサルゾーン名にどのように対応しているかを示しています。

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンス・ストレージはい
  • NVLink:はい (900 GB/秒)
  • NVIDIA GPUDirect対応 :はい
  • クラスターネットワークに対応あり(地域限定)
    • 帯域幅:3.28x400 Gbps)
    • タイプ専用

VM 構成

  • ハードウェアの種類:q35
  • クラウド・ネットワーキング: virtio
  • クラスターネットワーキングSR-IOV
    • タイプ NVIDIA CX-7- バーチャルファンクション
    • 数量8x専用400Gbps物理NIC
  • ブロックブートボリューム:virtio
  • ブロック・データ・ボリューム: virtio
  • インスタンス・ストレージNVMe

インスタンス・プロファイル

高速化された NVIDIA Hopper HGXプロファイルオプション
インスタンス・プロファイル vCPU / コア メモリー (GiB) 帯域幅上限値 (Gbps) クラスタ・ネットワーク専用帯域幅 アクセラレーター インスタンス・ストレージ (GB)
gx3d-160x1792x8h100 160 / 80 1792 200
  1. 3.2 Tbps 8x 400 Gbps専用 NVIDIA CX-7 )
8x NVIDIA H100 (80 GB) 8 x7.68TB
gx3d-160x1792x8h200 160 / 80 1792 200 該当なし 8x NVIDIA H200 (141 GB) 8 x7.68TB

大規模なプロファイルでは、おそらくサポートチケットを開いて、 クォータの増加 をリクエストする必要が クォータレベルを確認し、 リソースをプロビジョニングするアカウントのクォータを変更する必要があるかどうかを判断してください。 このサーバーは、 vCPU, RAM、インスタンスストレージ、GPUクォータを利用します

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

アクセラレートされた NVIDIA Hopper HGXによる vCPU, 最大ボリューム、最大ネットワーク・インターフェイスの制限
vCPU の数 最大ボリューム 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

RDMA対応クラスタ・ネットワークを構成する場合は、8、16、または32のクラスタ・ネットワーク・インターフェイスを使用できるようにする必要があります。 のいずれかのクラスタネットワークインタフェースが必要です。 適切な数のクラスタ・ネットワーク・インタフェースを利用できるようにすることで、基礎となる物理インフラストラクチャ全体でネットワーク・インタフェースを適切に分配することができます。 物理インフラストラクチャに適切に分配することができます。 ほとんどのユーザーは通常8本しか使わない。 クラスタ・ネットワーク・インターフェースは、インスタンスの電源がオフのときにのみ設定できます。

NVIDIA L4 インスタンスプロファイル

仮想サーバー・プロファイルは、 NVIDIA L4 アクセラレーターの上に構築されている。 これらのアクセラレータは、グラフィックス ワークロード用に調整されています。 このソリューションは、 4th Generation Intel® Xeon® Scalable プロセッサーと組み合わせて使用します。

オペレーティング・システム

  • Windows
  • Linux

プロセッサー世代

  • インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

  • NVIDIA L4 GPU (24GB)

可用性

ステータス一般的に利用可能

リージョン:

  • アメリカ大陸
    • サンパウロ (br-sao)
    • トロント (ca-tor)
    • ダラス(us-south
    • ワシントンDC(us-east
  • ヨーロッパ
    • フランクフルト(eu-de
    • ロンドン(eu-gb
    • マドリード eu-es
  • アジア太平洋
    • シドニー(au-syd
    • 東京(jp-tok

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンスストレージ:なし
  • NVLink:いいえ

VM 構成

  • ハードウェアの種類:i440fx
  • クラウド・ネットワーキング: virtio
  • ブロックブートボリューム:virtio
    • 例外:Windowsベースのインスタンス用のvscsi
  • ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速l4プロファイル・オプション
vCPUs/コア メモリー (GiB) 帯域幅上限値 (Gbps) アクセラレーター
gx3-16x80x1l4 16 / 8 80 32 1x NVIDIA L4 (24 GB)
gx3-32x160x2l4 32 / 16 160 64 2x NVIDIA L4 (24 GB)
gx3-64x320x4l4 64 / 32 320 128 4x NVIDIA L4 (24 GB)

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの L4 制限を高速化。
vCPU の数 最大ボリューム 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA L40S インスタンスプロファイル

L40s プロファイルは、 NVIDIA L40s アクセラレータの上に構築されている。 これらのアクセラレーターは グラフィックスおよび推論ワークロード向けに調整されています。 このソリューションには、 4th 世代インテル® Xeon® が搭載されています スケーラブルなプロセッサ。

オペレーティング・システム

  • Windows
  • Linux

プロセッサー世代

  • インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

  • NVIDIA L40s GPU(48ギガバイト)

可用性

ステータス一般的に利用可能

リージョン:

  • アメリカ大陸
    • サンパウロ (br-sao)
    • トロント (ca-tor)
    • ダラス(us-south
    • ワシントンDC(us-east
  • ヨーロッパ
    • フランクフルト(eu-de
    • ロンドン(eu-gb
    • マドリード eu-es
  • アジア太平洋
    • シドニー(au-syd
    • 東京(jp-tok

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンスストレージ:なし
  • NVLink:いいえ

VM 構成

  • ハードウェアの種類:i440fx
  • クラウド・ネットワーキング: virtio
  • ブロックブートボリューム:virtio
    • 例外:Windowsベースのインスタンス用のvscsi
  • ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速L40sプロファイル・オプション
インスタンス・プロファイル vCPUs/コア メモリー (GiB) 帯域幅上限値 (Gbps) アクセラレーター
gx3-24x120x1l40s 24 / 12 120 48 1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s 48 / 24 240 96 2x NVIDIA L40s (48 GB)

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの L40s 制限を高速化。
vCPU の数 最大ボリューム 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA A100 インスタンスプロファイル

A100 プロファイルは、 NVIDIA A100 80GBアクセラレーターの上に構築されている。 これらのアクセラレーターは HPCおよび推論ワークロード向けに調整されています。 このソリューションには、 4th 世代インテル® Xeon® が搭載されています スケーラブルなプロセッサ。

オペレーティング・システム

  • Windows
  • Linux

プロセッサー世代

  • インテル8474C-4th世代Xeon®スケーラブル・プロセッサー

アクセラレーター

  • NVIDIA A100 テンソルコアGPU(80GB)

可用性

ステータス空席状況を選択

リージョン:

  • アメリカ大陸
    • ワシントンDC(us-east
  • ヨーロッパ
    • フランクフルト(eu-de
    • ロンドン(eu-gb
  • アジア太平洋
    • 東京(jp-tok

機能

  • コアタイプ専用
  • 専用ホスト:なし
  • ハイパースレッディングはいSMT-2
  • セキュアブートいいえ
  • コンフィデンシャル・コンピューティングいいえ
  • ライブ移住:なし
  • インスタンス・ストレージはい
  • NVLink:いいえ

VM 構成

  • ハードウェアの種類:i440fx
  • クラウド・ネットワーキング: virtio
  • ブロックブートボリューム:virtio
    • 例外:Windowsベースのインスタンス用のvscsi
  • ブロック・データ・ボリューム: virtio

インスタンス・プロファイル

加速 A100 プロファイルオプション
インスタンス・プロファイル vCPUs/コア メモリー (GiB) 帯域幅上限値 (Gbps) アクセラレーター インスタンス・ストレージ (GB)
gx3d-24x120x1a100p 24 / 12 120 48 1x NVIDIA A100 PCIe (80 GB) 780 GB
gx3d-48x240x2a100p 48 / 24 240 96 2x NVIDIA A100 PCIe (80 GB) 1560 GB

制限

インスタンスには、アタッチできるボリュームと仮想ネットワーク・インターフェイスの数に制限があります。 インスタンスには この制限はインスタンスのサイズに基づいている。

vCPU,、最大ボリュームおよび最大ネットワーク・インターフェイスの A100 制限を高速化。
vCPU の数 最大ボリューム 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15