加速实例配置文件 - 第 3 代
加速器家族可根据需求提供经济高效的加速器和GPU访问。 GPU和加速器有助于缩短AI、机器学习、推理等计算密集型工作负载的处理时间。
AMD MI300X 实例配置文件
AMD MI300X 加速虚拟服务器配置文件建立在基于 192 GB OAM 的 AMD Instinct™ MI300X 加速器之上。 这些加速器针对人工智能工作负载进行了优化,包括推理和微调。 该解决方案搭配 5th 代英特尔®至强®可扩展处理器。
操作系统
- Linux
一代处理器
- 英特尔® 8570 - 5th 代至强® 可扩展处理器
加速器
- AMD Instinct MI300X 加速器(192 GB OAM)
可用性
状态:选择可用性
区域 | 通用区 |
---|---|
us-east | us-east-wdc06-a |
us-east | us-east-wdc07-a |
eu-de | eu-de-fra02-a |
eu-de | eu-de-fra05-a |
有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:是
- 内部人工智能面料:是
- Infinity Fabric™ (XGMI) 128 GB/s GPU 对 GPU 连接
- 集群网络功能:否
虚拟机配置
- 硬件类型:q35
- 云网络:Virtio
- 块引导卷:Virtio
- 块数据卷:Virtio
- 实例存储:NVMe
实例概要文件
实例概要文件 | vCPU / 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 加速器 | 实例存储器 (GB) |
---|---|---|---|---|---|
gx3d-208x1792x8mi300x | 208 / 104 | 1792 | 200 | 8x AMD (192 GB) MI300X | 8 x 3.2 TB |
鉴于您的配置较大,您可能需要提交支持请求,申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
Profile | 最大卷数 | 最大vNICs |
---|---|---|
gx3d-208x1792x8mi300x | 15 | 15 |
英特尔高迪3实例配置文件
英特尔高迪3加速虚拟服务器配置文件建立在基于OAM的128GB英特尔高迪3人工智能加速器之上。 这些加速器针对人工智能工作负载进行了优化,包括推理和微调。 该解决方案搭配 5th 代英特尔®至强®可扩展处理器。
操作系统
- Linux
一代处理器
- 英特尔 8568Y+- 5th 世代至强®可扩展处理器
加速器
- 英特尔高迪3人工智能加速器(128 GB OAM)
可用性
状态:选择可用性
区域 | 通用区 |
---|---|
us-south | us-south-dal12-a |
us-east | us-east-wdc06-a , us-east-wdc07-a |
eu-de | eu-de-fra02-a |
有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:是
- 内部人工智能面料:是
- 21 x 200 GbE,用于OAM到OAM连接
- 集群网络功能:否
虚拟机配置
- 硬件类型:q35
- 云网络:Virtio
- 块引导卷:Virtio
- 块数据卷:Virtio
- 实例存储:NVMe
实例概要文件
实例概要文件 | vCPU / 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 加速器 | 实例存储器 (GB) |
---|---|---|---|---|---|
gx3d-160x1792x8gaudi3 | 160 / 80 | 1792 | 200 | 8x 英特尔 (128 GB) Gaudi-3 | 8 x 3.2 TB |
鉴于您的配置较大,您可能需要提交支持请求,申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
Profile | 最大卷数 | 最大vNICs |
---|---|---|
gx3d-160x1792x8gaudi3 | 15 | 15 |
NVIDIA )Hopper HGX 实例配置文件
基于Hopper的加速虚拟服务器配置文件建立在 NVIDIA H100 和 H200 加速器之上。 这些 这些加速器针对人工智能工作负载进行了调整,包括推理、微调和大规模训练。 训练。 该解决方案与 4th Generation Intel® Xeon® Scalable处理器搭配使用。
该解决方案还可与 IBM Cloud® 集群网络一起运行。 用于 在八个加速网卡上运行,提供总计 3.2 Tbps 的集群吞吐量。 集群吞吐量为 3.2 Tbps。 该解决方案还提供 RoCEv2,以支持基于 RDMA 的工作负载。 更多信息,请参阅 关于群集网络。
操作系统
- Linux
一代处理器
- 英特尔8474C-4th至强® 可扩展处理器
加速器
- NVIDIA H100 SXM5 (80GB)
- NVIDIA H200 SXM5 (141 GB)
可用性
NVIDIA H100 SXM5 (80GB)
状态:选择可用性
区域 | 通用区 | 集群网络 |
---|---|---|
达拉斯 (us-south ) |
us-south-dal10-a |
否 |
华盛顿 (us-east ) |
us-east-wdc07-a |
是 |
多伦多 (ca-tor ) |
ca-tor-tor05-a |
否 |
圣保罗 (br-sao ) |
br-sao-sao01-a |
否 |
法兰克福 (eu-de ) |
eu-de-fra04-a |
是 |
伦敦 (eu-gb ) |
eu-gb-lon05-a |
否 |
马德里 eu-es ) |
eu-es-mad05-a |
否 |
悉尼 (au-syd ) |
au-syd-syd04-a |
否 |
东京 (jp-tok ) |
jp-tok-tok05-a |
否 |
大板 (jp-osa ) |
不可用 | 否 |
有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。
NVIDIA H200 SXM5 (141 GB)
状态:选择可用性
区域 | 通用区 | 集群网络 |
---|---|---|
华盛顿 (us-east ) |
us-east-wdc07-a |
是 |
多伦多 (ca-tor ) |
ca-tor-tor05-a |
否 |
法兰克福 (eu-de ) |
eu-de-fra04-a |
是 |
伦敦 (eu-gb ) |
eu-gb-lon05-a |
否 |
悉尼 (au-syd ) |
au-syd-syd04-a |
否 |
有关区域和通用区域的更多信息,请参阅 区域。 您 可以在“VPC基础设施概览”页面的“ 终端”部分查看为账户分配的区域映射。 区域映射显示了区域与代表物理位置的通用区域名称的对应关系。
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:是
- NVLink是(900 GB/秒)
- 支持 NVIDIA GPUDirect:是
- 集群网络功能:是(有限区域)
- 带宽:3.2Tbps8x400 Gbps)
- 类型专用
虚拟机配置
- 硬件类型:q35
- 云网络:Virtio
- 集群联网:SR-IOV
- 类型 NVIDIA CX-7- 虚拟功能
- 数量8x专用 400 Gbps 物理网卡
- 块引导卷:Virtio
- 块数据卷:Virtio
- 实例存储:NVMe
实例概要文件
实例概要文件 | vCPU / 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 专用集群网络带宽 | 加速器 | 实例存储器 (GB) |
---|---|---|---|---|---|---|
gx3d-160x1792x8h100 | 160 / 80 | 1792 | 200 |
|
8x NVIDIA H100 (80 GB) | 8 x7.68TB |
gx3d-160x1792x8h200 | 160 / 80 | 1792 | 200 | 不适用 | 8x NVIDIA H200 (141 GB) | 8 x7.68TB |
由于您的个人资料信息较多,您可能需要提交支持请求,以申请 提高配额。 请检查您的配额水平, 并确定提供资源的帐户是否需要更改配额。 请注意 此服务器使用了 vCPU, RAM、实例存储和GPU配额。
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
vCPU 数量 | 最大卷数 | 最大vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
如果配置启用 RDMA 的群集网络,则必须有 8、16 或 32 个可用的群集网络接口。 网络接口。 拥有正确数量的可用群集网络接口有助于确保网络接口在底层物理基础架构中的正确分布。 物理基础设施之间的适当分布。 大多数用户通常只使用 8 个。 群集网络接口只能在实例电源关闭时配置。
NVIDIA L4 实例配置文件
虚拟服务器配置文件建立在NVIDIA ) L4 加速器之上。 这些加速器针对图形 工作负载。 该解决方案与 4th Generation Intel® Xeon® Scalable处理器搭配使用。
操作系统
- Windows
- Linux
一代处理器
- 英特尔8474C-4th至强® 可扩展处理器
加速器
- NVIDIA L4 Gpu (24GB)
可用性
状态普遍可用
区域:
- 美洲
- 圣保罗 (
br-sao
) - 多伦多 (
ca-tor
) - 达拉斯 (
us-south
) - 华盛顿 (
us-east
)
- 圣保罗 (
- 欧洲
- 法兰克福 (
eu-de
) - 伦敦 (
eu-gb
) - 马德里
eu-es
)
- 法兰克福 (
- 亚太地区
- 悉尼 (
au-syd
) - 东京 (
jp-tok
)
- 悉尼 (
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:无
- NVLink:无
虚拟机配置
- 硬件类型:i440fx
- 云网络:Virtio
- 块引导卷:Virtio
- 例外:基于 Windows 实例的 vscsi
- 块数据卷:Virtio
实例概要文件
vCPUs/ 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 加速器 | |
---|---|---|---|---|
gx3-16x80x1l4 | 16 / 8 | 80 | 32 | 1x NVIDIA L4 (24 GB) |
gx3-32x160x2l4 | 32 / 16 | 160 | 64 | 2x NVIDIA L4 (24 GB) |
gx3-64x320x4l4 | 64 / 32 | 320 | 128 | 4x NVIDIA L4 (24 GB) |
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
vCPU 数量 | 最大卷数 | 最大vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
NVIDIA L40S 实例配置文件
L40s 配置文件建立在NVIDIA ) L40s 加速器之上。 这些加速器针对 图形和推理工作负载。 该解决方案与4th英特尔® 至强® 处理器搭配使用 可扩展处理器
操作系统
- Windows
- Linux
一代处理器
- 英特尔8474C-4th至强® 可扩展处理器
加速器
- NVIDIA L40s GPU(48 GB)
可用性
状态普遍可用
区域:
- 美洲
- 圣保罗 (
br-sao
) - 多伦多 (
ca-tor
) - 达拉斯 (
us-south
) - 华盛顿 (
us-east
)
- 圣保罗 (
- 欧洲
- 法兰克福 (
eu-de
) - 伦敦 (
eu-gb
) - 马德里
eu-es
)
- 法兰克福 (
- 亚太地区
- 悉尼 (
au-syd
) - 东京 (
jp-tok
)
- 悉尼 (
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:无
- NVLink:无
虚拟机配置
- 硬件类型:i440fx
- 云网络:Virtio
- 块引导卷:Virtio
- 例外:基于 Windows 实例的 vscsi
- 块数据卷:Virtio
实例概要文件
实例概要文件 | vCPUs/ 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 加速器 |
---|---|---|---|---|
gx3-24x120x1l40s | 24 / 12 | 120 | 48 | 1x NVIDIA L40s (48 GB) |
gx3-48x240x-2l40s | 48 / 24 | 240 | 96 | 2x NVIDIA L40s (48 GB) |
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
vCPU 数量 | 最大卷数 | 最大vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |
NVIDIA A100 实例简介
A100 配置文件建立在 NVIDIA A100 80 GB 加速器之上。 这些加速器针对 高性能计算和推理工作负载。 该解决方案与4th英特尔® 至强® 处理器搭配使用 可扩展处理器
操作系统
- Windows
- Linux
一代处理器
- 英特尔8474C-4th至强® 可扩展处理器
加速器
- NVIDIA A100 张量核心 GPU(80 GB)
可用性
状态:选择可用性
区域:
- 美洲
- 华盛顿 (
us-east
)
- 华盛顿 (
- 欧洲
- 法兰克福 (
eu-de
) - 伦敦 (
eu-gb
)
- 法兰克福 (
- 亚太地区
- 东京 (
jp-tok
)
- 东京 (
功能
- 核心类型专用
- 专用主机:否
- 超线程:是SMT-2
- 安全启动:否
- 机密计算:否
- 实时迁移:否
- 实例存储:是
- NVLink:无
虚拟机配置
- 硬件类型:i440fx
- 云网络:Virtio
- 块引导卷:Virtio
- 例外:基于 Windows 实例的 vscsi
- 块数据卷:Virtio
实例概要文件
实例概要文件 | vCPUs/ 内核 | 内存 (GiB) | 带宽上限(吉比特/秒) | 加速器 | 实例存储器 (GB) |
---|---|---|---|---|---|
gx3d-24x120x1a100p | 24 / 12 | 120 | 48 | 1x NVIDIA A100 PCIe(80 GB) | 780 GB |
gx3d-48x240x2a100p | 48 / 24 | 240 | 96 | 2x NVIDIA A100 PCIe(80 GB) | 1560 GB |
限制
一个实例可连接的卷和虚拟网络接口的数量有限制。 的数量限制。 该限制基于实例的大小。
vCPU 数量 | 最大卷数 | 最大vNICs |
---|---|---|
2-16 | 15 | 5 |
17-48 | 15 | 10 |
49+ | 15 | 15 |