AMD为Microsoft Azure打造具有 HBM3 内存的定制 EPYC CPU

AMD为Microsoft Azure打造具有 HBM3 内存的定制 EPYC CPU
2024年11月21日 17:06 电子产品世界

Microsoft 宣布推出其最新的高性能计算 (HPC) Azure 虚拟机,该虚拟机由定制的 AMD CPU 提供支持,该 CPU 可能曾经被称为 MI300C。具有 88 个 Zen 4 内核和 450GB HBM3 的 CPU 可以重新用于 MI300C,四个芯片达到 7 TB/s,这款采用 HBM3AMD 芯片是 Azure 独有的。

本文引用地址:

HBv 系列 Azure VM 专注于提供大量内存带宽,这是 HPC 的重要规范;Microsoft 称其为“最大的 HPC 瓶颈”。以前,Microsoft 使用带有 AMD 3D V-Cache 的 Milan-X 和 Genoa-X 服务器 CPU 来提供额外的带宽,但对于最新的 HBv5 VM,Microsoft 显然需要性能更高的产品。

用于 HBv5 虚拟机的自定义 AMD CPU 利用 HBM3,HBM3 通常是最新数据中心级 GPU(如 AMD 的 MI300X)的首选内存。凭借单个 VM 中四个芯片的 6.9TB/s 带宽,这些 VM 的速度几乎是 Microsoft 在 HBv4 VM 中提供的 Genoa-X CPU 的 9 倍,是 HBv3 VM 中的 Milan-X 芯片的近 20 倍。

当与 CPU 配对时,HBM3 扮演着与 3D V-Cache 类似的角色。尽管如此,它并没有扩大 L3 缓存池,而是有效地增加了一个巨大的 L4 缓存,具有更大的带宽,并且可能更糟糕的延迟。但是,后者在某些类型的工作负载中并不那么重要。

每个 HBv5 VM 都配备四个这样的自定义 AMD CPU,并且具有所有附加功能,单个 HBv5 VM 提供 450GB 的 HBM3、352 个主频高达 4GHz 的 Zen 4 内核,以及常规 Epyc CPU 上可用普通 Infinity Fabric 带宽的两倍。但是,SMT (超线程) 已被禁用。这些虚拟机还具有 800Gb/s 的 Nvidia Quantum-2 InfiniBand 用于网络切换。

在 4 个 CPU 上有 352 个内核时,每个 CPU 有 88 个内核,尽管可能并非处理器上的每个内核都暴露在 VM 中。每个 Zen 4 CCD 有 8 个或 16 个内核,具体取决于它是 Zen 4 还是 Zen 4c;自定义 CPU 使用 11 个 Zen 4 CCD 或 6 个 Zen 4c CCD,其中一个 CCD 上的 8 个内核被禁用。CPU 更有可能的是具有 96 个功能齐全的内核,其中 8 个保留用于操作 VM,可能担任编排或虚拟机管理程序角色。

这个 “定制 ”的 AMD CPU 也可能不是那么定制,因为它听起来很像去年传闻中的 MI300C 芯片。预计该 CPU 本质上是 MI300A APU,但仅配备 Zen 4 CCD 而不是 CDNA 3 显卡,允许使用 HBM3 的 96 核 CPU。MI300A 的 CPU 核心频率高达 3.7GHz,与 HBv5 使用的 CPU 相差不远,说明定制的 Azure 处理器和 MI300C 可能是一体的。

然而,虽然 HBv5 CPU 在技术层面上可能不是定制的,但它仍然是 Microsoft 的独家 CPU。“它仅在 Azure 上可用,”Microsoft 工程师 Glenn Lockwood 在 Bluesky 上回应了一位想知道 AMD CPU 是否会作为常规 Epyc CPU 可用的用户。

如果 HBv5 处理器以前是 MI300C,AMD 最初可能想向公众销售它,但很难找到市场,AMD 内存工程师 Phil Park 表示。

“为什么我们没有早点看到 EPYC+HBM?EPYC 一直专注于大批量市场,这就是为什么你看不到超过 2 个插槽的 EPYC,“Park 在 Bluesky 上发帖。“你不能换掉 DDR5 控制器并添加 HBM 控制器/堆栈,然后就收工了。HBM 强制进行某些设计选择(例如,每个 HBM3 堆栈需要 16 个 64 位通道)。

“灵活性:使用 HBM,您无法升级容量或拥有填充较少通道的低成本版本,”他补充道。通常,CPU 不需要那么多带宽。

这个解释与迄今为止配备 HBM 的 CPU 的短暂历史相吻合。Intel 已经推出了基于 Sapphire Rapids 的 HBM 注入 CPU,称为 Xeon Max,用于 Aurora 超级计算机,并且已全面上市。

然而,英特尔去年证实不会有基于 Emerald Rapids 的 Xeon Max 版本,目前尚不清楚 Granite Rapids 是否也会获得 Xeon Max 变体,这可能表明他们没有取得巨大的商业成功。AMD 的务实决定可能是与 Microsoft 达成协议,并将 MI300C 的生产重点放在 Azure 上。

关键词: AMD Microsoft Azure HBM3 EPYC CPU
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片