借助电源完整性测试提高人工智能数据中心的能效

借助电源完整性测试提高人工智能数据中心的能效
2024年07月20日 16:51 电子产品世界

数据中心正在部署基于人工智能 (AI) 的技术,处理器密集型服务器正在推动能源需求的增长,下表说明了这种发展趋势所带来的巨大影响。国际能源署 (IEA) 预测,到 2030 年,数据中心的耗电量将占全球耗电量的 7%,相当于印度全国的耗电量。

本文引用地址:

图1 数据中心CPU和GPU技术的功耗图1 数据中心CPU和GPU技术的功耗

由于电力需求不断增长,关注能源效率至关重要。泰克与知名电源完整性专家 Steve Sandler 合作,开发了出色的测量技术,旨在改进下一代人工智能数据中心的运营效率/能效。随着对电力的需求不断增长,对能源效率的重视至关重要。与备受认可的电力完整性专家史蒂夫·桑德勒(Steve Sandler)合作;泰克开发了良好的测量技术,以提高下一代 AI 数据中心的运营/瓦特。

提高电源分配网络 (PDN) 的能效提高供电网络 (PDN) 的能源效率

PDN 必须为驱动服务器机架中的 GPU 敏感负载提供许多低噪声直流电源轨。追求更高速度和更高密度意味着,需要在更低电压水平和更大电流下实现更快边缘速率、更高频率和更多轨道。这突显了良好电源完整性的重要性。PDN 必须为驱动这些服务器机架中 GPU 的敏感负载提供许多低噪声直流电源轨。追求更高的速度和更高的密度意味着更快的边沿速率、更高的频率和更多的电源轨,但电压水平更低,电流更高,如上图所示。这强调了良好的电源完整性。

进行电源完整性测试的目的是,验证到达负载点 (POL) 的电压和电流在所有预期运行条件下是否满足负载的电源轨规格要求。要在千兆赫频率下准确测量毫伏级电源轨噪声,尤其需要注意。进行电源完整性测量的目的是验证在所有预期工作条件下到达负载点 (POL) 的电压和电流是否符合负载的电源轨规格。在GHz频率下,需要特别注意精确测量电源轨噪声的毫伏。

让我们通过基于的服务器系统的电源分配网络高能级结构图,了解如何评估 PDN 性能。让我们看一下如何通过基于服务器的系统上的配电网络的高级视图来评估 PDN 性能。

图2 数据中心的高能级配电网络图2 数据中心的高能级配电网络

如图所示,典型数据中心通过 12 V、24 V 或 48 V 直流电源为其基于 AI 的服务器供电,然后在主板上将电压转换为其他电源电压。工程师能够查看从电源输出到 FPGA、处理器和其他复杂 IC 的链路中的每个环节,因此可以将电源轨阻抗控制在非常低的水平,以便输送由 GPU 技术驱动的 AI 服务器所需的高电流。阻抗管理的棘手之处在于配电网络由许多阻抗组成,包括电压调节器、去耦电容器和 PCB 走线。高速交换和热插拔服务器卡会引入意外的阻抗变化,这可能导致过多的瞬变或噪声。如图所示,典型的数据中心通过 12、24 或 48 V DC 电源为其基于 AI 的服务器供电,然后将其转换为主板上的其他电源电压。工程师能够查看从电源输出到 FPGA、处理器和其他复杂 IC 的链条中的每个环节,因此必须将电源轨阻抗管理在非常低的水平,以便提供由 GPU 技术驱动的以 AI 为中心的服务器中的高电流。使阻抗管理复杂化的是,网络由许多阻抗组成,包括稳压器、去耦电容器和PCB走线。高速交换和热插拔服务器卡会带来意想不到的阻抗变化,从而导致过多的瞬变或噪声。

要确保稳定节能的设计,首先要最大限度地减少 PDN 中的噪声。电源轨噪声规格可以达到数百兆赫或数千兆赫的频率范围,其幅度达到毫伏级。要确保稳定、节能的设计,首先要将 PDN 中的噪声降至最低。电源轨上的噪声规格可以上升到MHz或GHz频率范围,幅度以毫伏为单位。

评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线电压和线电流符合要求。用于评估质量的测量值如下所示:评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线路电压和线路电流。评估质量的测量值如下所示:

●   频率频率

●   有效电压和电流

●   有效值 电压和电流

●   阻抗阻抗

●   波峰因数(电压和电流)波峰因数(电压和电流

●   有功功率、无功功率和视在功率真实功率、无功功率和视在功率

●   功率因数和相位功率因数和相位

为了确保准确进行这些测量,示波器探头的选择非常重要;使用差分探头测量系统的线电压,使用电流探头测量系统的线电流。确保这些测量准确无误;示波器探头的选择很重要;使用差分探头测量系统的线路电压,使用电流探头测量系统的线路电流。

另一个关键测量是对 PDN 控制环路响应进行频率响应分析。这将提供有关控制环路速度和电源稳定性的重要信息。借助波特图查看分析结果,图 3 中是示例设置。另一个关键测量是对PDN的控制环路响应进行频率响应分析。这将提供有关控制回路速度和电源稳定性的宝贵信息。波特图用于查看分析,图 3 中的设置示例如下。

图3 电源分配网络阻抗的测量设置图3 电源分配网络阻抗的测量设置

电源完整性探测系统应受重视电源完整性探测系统值得关注

当今示波器配备的高阻抗 10X 无源探头可能具有足够的带宽,但会使您想要测量的噪声信号发生衰减。1X 探头可无衰减地传递噪声信号,但其带宽仅为几百兆赫。具有 50Ω 输入阻抗的传输线探头或电缆具有出色的高频性能,但在直流情况下会产生显著负载,除非增加直流隔离器。  衰减传输线探头产生的负载较小,同时保持低噪声和高带宽。当今示波器附带的高阻抗 10X 无源探头可能具有足够的带宽,但它们会衰减您尝试测量的噪声信号。1X探头通过噪声信号而不衰减,但它们被限制在几个MHz带宽内。输入阻抗为 50 Ω的传输线探头或电缆具有出色的高频性能,但在直流时会造成很大的负载,除非添加直流模块。 衰减传输线探头提供更少的负载,同时保持低噪声和高带宽。

电源轨探头是另一类低噪声探头,偏移范围高达 4 GHz,直流偏移范围为 -60 至 +60 Vdc。在识别噪声源方面,电源轨探头是一种比传统无源探头更准确的替代工具,如下图 4 所示。根据电源轨的电压,可能需要直流阻断器。  如果需要,请确保直流阻断器为示波器提供浪涌保护,并且不受直流或交流偏置的影响。电源轨探头虽然能够测量很小的噪声,但也是单端测量。  因此,需要使用能够进一步减少测量接地环路误差的同轴隔离器。Picotest 提供多种直流阻断器和同轴隔离器来满足此类需求。  详细了解终极电源轨噪声测量。电源轨探头是另一类探头,可在高达 4 GHz 的频率下提供低噪声和高失调范围,直流失调范围为 -60 至 +60 Vdc。在识别噪声源方面,这被视为传统无源探头的更准确替代方案;如下图 4 所示。根据电源轨的电压,可能需要一个直流块。如果是这种情况,请确保它为示波器提供浪涌保护,并且对直流或交流偏置不敏感。电源轨探头虽然噪声非常低,但也是单端的。为此,请寻找能够进一步减小测量接地环路误差的同轴隔离器。Picotest提供一系列直流模块和同轴隔离器来满足这些需求。了解有关终极电源轨噪声测量的更多信息。

图4 使用无源探头(下方迹线)和电源轨探头(上方迹线)的电源线纹波测量比较图4 使用无源探头(下方迹线)和电源轨探头(上方迹线)的电源线纹波测量比较

快速低噪声采集与超快速边缘负载相结合,可模拟 AI 级处理器工作负载,从而可以准确评估 PDN 设计中的电源轨噪声电压以及电源轨与电源轨之间的串扰。在结合使用泰克 5 B 系列 MSO 或 6 B 系列 MSO 示波器的情况下,Picotest提供了完整的负载设备系列,最高为 2,000 安培、1 纳秒的边缘负载,并支持高达 65Ms/s 的采样率,以进行精确的模拟实验。(见图 5)快速、低噪声采集与超快边缘负载相结合,可模拟 AI 级处理器工作负载;允许准确评估 PDN 设计中的电源轨噪声电压和电源轨到电源轨串扰。与泰克 5 系列 B MSO 或 6 系列 B MSO 示波器结合使用;Picotest 提供高达 2,000 安培、1ns 边缘负载的完整负载系列,支持高达 65MS/s 的采样率,以实现精确的仿真工作。(见图5)

图5 显示了对AI级处理器进行伪随机高幅度负载的特性分析图5 显示了对AI级处理器进行伪随机高幅度负载的特性分析

使用 Picotest 负载设备进行特性分析,并通过泰克6系列B MSO示波器进行测量,可以确保特性分析的准确性。泰克 6 系列 B MSO 示波器是捕获低噪声、高分辨率信号的理想仪器。图5.显示AI级处理器高振幅负载的伪随机步长的表征。这种表征的准确性是通过使用 Picotest 负载实现的,并由泰克6系列B MSO示波器测量,非常适合低噪声和高分辨率信号捕获。

示波器测量分析有助于节省时间并减少错误

识别和分析 PDN 中的故障点可能耗费时间。在电源分配网络中寻找纹波、过冲、欠冲、开启、关闭、时间趋势、稳定时间和抖动信号是一项复杂的任务。值得庆幸的是,当今大多数现代示波器都提供了内置分析软件,用于设置仪器和自动执行信号采集和显示。下方为波纹自动测量示例。将这些特性内置到仪器中,再加上具备通过远程PC进行自动化的功能,可以简化大型团队的 AI 性能评估工作,同时,还可以评估 AI 支持性能随时间和温度的变化情况,以测试服务器的效率和耐久性。

图6 自动纹波测量,并在5系列B MSO示波器显示屏的右侧显示注释结果图6 自动纹波测量,并在5系列B MSO示波器显示屏的右侧显示注释结果

总结

由于人工智能 (AI) 推动下一代数据中心的能源需求增长,评估电源分配网络 (PDN) 的性能和效率变得比以往任何时候都更加重要。随着人工智能 (AI) 推高下一代数据中心的能源需求;评估供电网络的性能和效率变得比以往任何时候都更加重要。采用良好的 PDN 测试和测量策略,将会使 AI 就绪数据中心达到最佳运行性能、可靠性和能效。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片