IBM Cloud Docs
加速实例配置文件 - 第 3 代

加速实例配置文件 - 第 3 代

加速器家族可根据需求提供经济高效的加速器和GPU访问。 GPU和加速器有助于缩短AI、机器学习、推理等计算密集型工作负载的处理时间。

AMD MI300X 实例配置文件

AMD MI300X 加速虚拟服务器配置文件建立在基于 192 GB OAM 的 AMD Instinct™ MI300X 加速器之上。 这些加速器针对人工智能工作负载进行了优化,包括推理和微调。 该解决方案搭配 5th 代英特尔®至强®可扩展处理器。

操作系统

  • Linux

一代处理器

  • 英特尔® 8570 - 5th 代至强® 可扩展处理器

加速器

  • AMD Instinct MI300X 加速器(192 GB OAM)

可用性

状态:选择可用性

表 1. 支持的地区和区域
区域 通用区
us-east us-east-wdc06-a
us-east us-east-wdc07-a
eu-de eu-de-fra02-a
eu-de eu-de-fra05-a

有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:是
  • 内部人工智能面料:是
    • Infinity Fabric™ (XGMI) 128 GB/s GPU 对 GPU 连接
  • 集群网络功能:否

虚拟机配置

  • 硬件类型:q35
  • 云网络:Virtio
  • 块引导卷:Virtio
  • 块数据卷:Virtio
  • 实例存储:NVMe

实例概要文件

加速 AMD 配置文件选项
实例概要文件 vCPU / 内核 内存 (GiB) 带宽上限(吉比特/秒) 加速器 实例存储器 (GB)
gx3d-208x1792x8mi300x 208 / 104 1792 200 8x AMD (192 GB) MI300X 8 x 3.2 TB

鉴于您的配置较大,您可能需要提交支持请求,申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

最大容量和最大网络接口的 AMD 系列加速限制
Profile 最大卷数 最大vNICs
gx3d-208x1792x8mi300x 15 15

英特尔高迪3实例配置文件

英特尔高迪3加速虚拟服务器配置文件建立在基于OAM的128GB英特尔高迪3人工智能加速器之上。 这些加速器针对人工智能工作负载进行了优化,包括推理和微调。 该解决方案搭配 5th 代英特尔®至强®可扩展处理器。

操作系统

  • Linux

一代处理器

  • 英特尔 8568Y+- 5th 世代至强®可扩展处理器

加速器

  • 英特尔高迪3人工智能加速器(128 GB OAM)

可用性

状态:选择可用性

表 1. 支持的地区和区域
区域 通用区
us-south us-south-dal12-a
us-east us-east-wdc06-a, us-east-wdc07-a
eu-de eu-de-fra02-a

有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:是
  • 内部人工智能面料:是
    • 21 x 200 GbE,用于OAM到OAM连接
  • 集群网络功能:否

虚拟机配置

  • 硬件类型:q35
  • 云网络:Virtio
  • 块引导卷:Virtio
  • 块数据卷:Virtio
  • 实例存储:NVMe

实例概要文件

加速英特尔配置文件选项
实例概要文件 vCPU / 内核 内存 (GiB) 带宽上限(吉比特/秒) 加速器 实例存储器 (GB)
gx3d-160x1792x8gaudi3 160 / 80 1792 200 8x 英特尔 (128 GB) Gaudi-3 8 x 3.2 TB

鉴于您的配置较大,您可能需要提交支持请求,申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

英特尔加速系列的最大容量和最大网络接口限制
Profile 最大卷数 最大vNICs
gx3d-160x1792x8gaudi3 15 15

NVIDIA )Hopper HGX 实例配置文件

基于Hopper的加速虚拟服务器配置文件建立在 NVIDIA H100 和 H200 加速器之上。 这些 这些加速器针对人工智能工作负载进行了调整,包括推理、微调和大规模训练。 训练。 该解决方案与 4th Generation Intel® Xeon® Scalable处理器搭配使用。

该解决方案还可与 IBM Cloud® 集群网络一起运行。 用于 在八个加速网卡上运行,提供总计 3.2 Tbps 的集群吞吐量。 集群吞吐量为 3.2 Tbps。 该解决方案还提供 RoCEv2,以支持基于 RDMA 的工作负载。 更多信息,请参阅 关于群集网络

操作系统

  • Linux

一代处理器

  • 英特尔8474C-4th至强® 可扩展处理器

加速器

  • NVIDIA H100 SXM5 (80GB)
  • NVIDIA H200 SXM5 (141 GB)

可用性

NVIDIA H100 SXM5 (80GB)

状态:选择可用性

表 1. 支持的地区和区域
区域 通用区 集群网络
达拉斯 (us-south) us-south-dal10-a
华盛顿 (us-east) us-east-wdc07-a
多伦多 (ca-tor) ca-tor-tor05-a
圣保罗 (br-sao) br-sao-sao01-a
法兰克福 (eu-de) eu-de-fra04-a
伦敦 (eu-gb) eu-gb-lon05-a
马德里 eu-es) eu-es-mad05-a
悉尼 (au-syd) au-syd-syd04-a
东京 (jp-tok) jp-tok-tok05-a
大板 (jp-osa) 不可用

有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。

NVIDIA H200 SXM5 (141 GB)

状态:选择可用性

表 1. 支持的地区和区域
区域 通用区 集群网络
华盛顿 (us-east) us-east-wdc07-a
多伦多 (ca-tor) ca-tor-tor05-a
法兰克福 (eu-de) eu-de-fra04-a
伦敦 (eu-gb) eu-gb-lon05-a
悉尼 (au-syd) au-syd-syd04-a

有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:是
  • NVLink是(900 GB/秒)
  • 支持 NVIDIA GPUDirect:是
  • 集群网络功能:是(有限区域)
    • 带宽:3.2Tbps8x400 Gbps)
    • 类型专用

虚拟机配置

  • 硬件类型:q35
  • 云网络:Virtio
  • 集群联网:SR-IOV
    • 类型 NVIDIA CX-7- 虚拟功能
    • 数量8x专用 400 Gbps 物理网卡
  • 块引导卷:Virtio
  • 块数据卷:Virtio
  • 实例存储:NVMe

实例概要文件

加速 NVIDIA Hopper HGX 配置文件选项
实例概要文件 vCPU / 内核 内存 (GiB) 带宽上限(吉比特/秒) 专用集群网络带宽 加速器 实例存储器 (GB)
gx3d-160x1792x8h100 160 / 80 1792 200
  1. 3.2 Tbps 8x 400 Gbps 专用 NVIDIA CX-7
8x NVIDIA H100 (80 GB) 8 x7.68TB
gx3d-160x1792x8h200 160 / 80 1792 200 不适用 8x NVIDIA H200 (141 GB) 8 x7.68TB

由于您的个人资料信息较多,您可能需要提交支持请求,以申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

加速 NVIDIA Hopper HGX 对 vCPU, 最大卷和最大网络接口的限制
vCPU 数量 最大卷数 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

如果配置启用 RDMA 的群集网络,则必须有 8、16 或 32 个可用的群集网络接口。 网络接口。 拥有正确数量的可用群集网络接口有助于确保网络接口在底层物理基础架构中的正确分布。 物理基础设施之间的适当分布。 大多数用户通常只使用 8 个。 群集网络接口只能在实例电源关闭时配置。

NVIDIA L4 实例配置文件

虚拟服务器配置文件建立在NVIDIA ) L4 加速器之上。 这些加速器针对图形 工作负载。 该解决方案与 4th Generation Intel® Xeon® Scalable处理器搭配使用。

操作系统

  • Windows
  • Linux

一代处理器

  • 英特尔8474C-4th至强® 可扩展处理器

加速器

  • NVIDIA L4 Gpu (24GB)

可用性

状态普遍可用

区域:

  • 美洲
    • 圣保罗 (br-sao)
    • 多伦多 (ca-tor)
    • 达拉斯 (us-south)
    • 华盛顿 (us-east)
  • 欧洲
    • 法兰克福 (eu-de)
    • 伦敦 (eu-gb)
    • 马德里 eu-es)
  • 亚太地区
    • 悉尼 (au-syd)
    • 东京 (jp-tok)

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:无
  • NVLink:无

虚拟机配置

  • 硬件类型:i440fx
  • 云网络:Virtio
  • 块引导卷:Virtio
    • 例外:基于 Windows 实例的 vscsi
  • 块数据卷:Virtio

实例概要文件

加速l4配置文件选项
vCPUs/ 内核 内存 (GiB) 带宽上限(吉比特/秒) 加速器
gx3-16x80x1l4 16 / 8 80 32 1x NVIDIA L4 (24 GB)
gx3-32x160x2l4 32 / 16 160 64 2x NVIDIA L4 (24 GB)
gx3-64x320x4l4 64 / 32 320 128 4x NVIDIA L4 (24 GB)

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

针对vCPU,最大卷和最大网络接口的加速L4限制
vCPU 数量 最大卷数 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA L40S 实例配置文件

L40s 配置文件建立在NVIDIA ) L40s 加速器之上。 这些加速器针对 图形和推理工作负载。 该解决方案与4th英特尔® 至强® 处理器搭配使用 可扩展处理器

操作系统

  • Windows
  • Linux

一代处理器

  • 英特尔8474C-4th至强® 可扩展处理器

加速器

  • NVIDIA L40s GPU(48 GB)

可用性

状态普遍可用

区域:

  • 美洲
    • 圣保罗 (br-sao)
    • 多伦多 (ca-tor)
    • 达拉斯 (us-south)
    • 华盛顿 (us-east)
  • 欧洲
    • 法兰克福 (eu-de)
    • 伦敦 (eu-gb)
    • 马德里 eu-es)
  • 亚太地区
    • 悉尼 (au-syd)
    • 东京 (jp-tok)

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:无
  • NVLink:无

虚拟机配置

  • 硬件类型:i440fx
  • 云网络:Virtio
  • 块引导卷:Virtio
    • 例外:基于 Windows 实例的 vscsi
  • 块数据卷:Virtio

实例概要文件

加速L40s剖面选项
实例概要文件 vCPUs/ 内核 内存 (GiB) 带宽上限(吉比特/秒) 加速器
gx3-24x120x1l40s 24 / 12 120 48 1x NVIDIA L40s (48 GB)
gx3-48x240x-2l40s 48 / 24 240 96 2x NVIDIA L40s (48 GB)

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

加速L40s对vCPU,最大卷和最大网络接口的限制
vCPU 数量 最大卷数 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15

NVIDIA A100 实例简介

A100 配置文件建立在 NVIDIA A100 80 GB 加速器之上。 这些加速器针对 高性能计算和推理工作负载。 该解决方案与4th英特尔® 至强® 处理器搭配使用 可扩展处理器

操作系统

  • Windows
  • Linux

一代处理器

  • 英特尔8474C-4th至强® 可扩展处理器

加速器

  • NVIDIA A100 张量核心 GPU(80 GB)

可用性

状态:选择可用性

区域:

  • 美洲
    • 华盛顿 (us-east)
  • 欧洲
    • 法兰克福 (eu-de)
    • 伦敦 (eu-gb)
  • 亚太地区
    • 东京 (jp-tok)

功能

  • 核心类型专用
  • 专用主机:否
  • 超线程:是SMT-2
  • 安全启动:否
  • 机密计算:否
  • 实时迁移:否
  • 实例存储:是
  • NVLink:无

虚拟机配置

  • 硬件类型:i440fx
  • 云网络:Virtio
  • 块引导卷:Virtio
    • 例外:基于 Windows 实例的 vscsi
  • 块数据卷:Virtio

实例概要文件

加速 A100 配置文件选项
实例概要文件 vCPUs/ 内核 内存 (GiB) 带宽上限(吉比特/秒) 加速器 实例存储器 (GB)
gx3d-24x120x1a100p 24 / 12 120 48 1x NVIDIA A100 PCIe(80 GB) 780 GB
gx3d-48x240x2a100p 48 / 24 240 96 2x NVIDIA A100 PCIe(80 GB) 1560 GB

限制

一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。

加速 A100 对 vCPU, 最大卷和最大网络接口的限制
vCPU 数量 最大卷数 最大vNICs
2-16 15 5
17-48 15 10
49+ 15 15