升级电源和机架架构,满足AI服务器的需求

升级电源和机架架构,满足AI服务器的需求
2025年02月25日 09:07 电子产品世界

前言

本文引用地址:

人工智能(AI)的迅猛发展推动了数据中心处理能力的显著增长。如图1所示,英飞凌预测单台GPU的功耗将呈指数级上升,预计到2030年将达到约2000 W [1],而AI服务器机架的峰值功耗将突破惊人的300 kW。这一趋势促使数据中心机架的AC和DC配电系统进行架构升级,重在减少从电网到核心设备的电力转换和配送过程中的功率损耗。

图1 基于x86和Arm®架构的服务器CPU与GPU和TPU的电力需求对比图1 基于x86和Arm®架构的服务器CPU与GPU和TPU的电力需求对比

图2(右)展示了开放计算项目(OCP)机架供电架构的示例。每个电源架由三相输入供电,可容纳多台PSU;每台PSU由单相输入供电。机架将直流电压(例如,50 V)输出到母线,母线则连接到IT和电池架。

AI的发展趋势要求对PSU功率进行革新,如图2(左)所示。接下来,我们将通过各代PSU的拓扑结构和器件技术建议示例,来逐步介绍这些PSU的演变。

图2  AI服务器PSU的功率演变(上);服务器机架架构示例(下)
图2  AI服务器PSU的功率演变(上);服务器机架架构示例(下)图2  AI服务器PSU的功率演变(上);服务器机架架构示例(下)

AI服务器机架PSU的趋势和功率演进

第一代AI PSU:在相同的架构下提升功率,~5.5-8 kW、50 Vout、277 Vac、单相

当前的AI服务器PSU大多遵循ORv3-HPR标准[9]。相较于先前的ORv3 3 kW标准[9],该标准的大部分要求(包括输入和输出电压以及效率)保持不变,但增加了与AI服务器需求相关的更新,例如,更高的功率和峰值功率要求(稍后详述)。此外,由于与BBU架的通信方式有所调整,输出电压的调节范围变得更窄。

尽管每个电源架都通过三相输入(400-480 Vac L-L)供电(见图2),但每台PSU的输入仍为单相(230-277 Vac)。图3展示了符合ORv3-HPR标准的第一代PSU的部署示例:PFC级可以采用两个交错的图腾柱拓扑结构,其中,650 V CoolSiCTM MOSFET用于快臂开关,600 V CoolMOSTM SJ MOSFET用于慢臂开关。DC-DC级可以选用650 V CoolGaNTM晶体管的全桥LLC,次级全桥整流器和ORing则使用80 V OptiMOSTM Power MOSFET。此外,示例还展示了一个中间级,也称“延长保持时间”或“小型升压”,其作用是减小大容量电容器的尺寸。该中间级由一个升压转换器组成,在线路周期掉电事件期间,通过储能电容器放电,以调节LLC输入电压。在正常运行期间,升压转换器保持空闲状态,并通过低阻抗的600 V CoolMOSTM SJ MOSFET旁路。

图3 第一代AI PSU的拓扑结构及器件技术示例图3 第一代AI PSU的拓扑结构及器件技术示例

第二代AI PSU:增加线路电压,以实现更高的功率,~8-12 kW、50 Vout、277–347 Vac、单相

如上所述,随着机架功率增加到300 kW以上,电源架的功率密度变得至关重要。因此,下一代PSU的设计方向是,在单相架构中实现8 kW至12 kW的输出功率。随着每个机架的功率增加,数据中心中的机架数量在某些情况下,可能会受配电电流额定值和损耗的约束。因此,为了降低交流配电的电流和损耗,部分数据中心可能会将机架的交流配电电压从400/480 V提高到600 Vac L–L(三相),同时将PSU的输入电压从230/277 Vac提高到 347 Vac(单相)。

虽然这一变化有利于数据中心的运行效率和资源利用,但会影响PSU的额定电压和设计。在347 Vac的输入电压下,PFC的输出电压必须设定在575 Vdc左右,这意味着传统的650 V器件的额定电压已无法满足要求。图4展示了一个示例:第一代 PSU使用的两电平图腾柱PFC被替换为400 V CoolSiCTM MOSFET 的三电平飞电容图腾柱PFC(3-L FCTP PFC)级。多电平功率转换概念使得在使用较低额定电压的开关器件的同时,支持更高的输入电压。凭借多电平拓扑结构的频率倍增效应,3-L FCTP PFC能够带来更高的效率和功率密度。最重要的是,CoolSiCTM技术针对400 V的较低击穿电压进行了优化,与650 V 和 750 V CoolSiCTM参考器件相比,其FoM更为优异(见图5(左))。此外,图5(右)显示了导通电阻在整个温度范围内的曲线,其中,400 V CoolSiCTM MOSFET的RDS(on) 100°C仅比RDS(on) 25°C高11%。RDS(on)与Tj之间的这一平缓关系有助于CoolSiCTM MOSFET实现更高的RDS(on) typ,从而降低成本并提升开关性能。

图4 第二代AI PSU的拓扑结构和器件技术示例图4 第二代AI PSU的拓扑结构和器件技术示例

图5 400 V CoolSiCTM与650 V和750 V CoolSiCTM对比,具有更优的开关 FoM和稳定的RDS(on)与结温的关系:品质因数(上),RDS(on)与Tj(下)

对于DC-DC级来说,三相LLC拓扑结构是一种理想选择,其中,750 V CoolSiCTM MOSFET用于初级侧开关,80 V OptiMOSTM 5 Power MOSFET用于次级全桥整流器和ORing。由于增加了第三个半桥开关臂,该解决方案能够提供更高的功率,有效降低输出电流的纹波,并通过三个开关半桥之间的固有耦合实现自动电流分配。

第三代AI PSU:三相架构与400 V配电,最高功率约为22 kW,400 Vout,480-600 Vac,三相

为了进一步提高机架功率,第三代AI PSU将采用更具颠覆性的机架架构,具体如下:

●   PSU输入:从单相转为三相,以提高功率密度,并降低成本

●   电源架PSU输出电压:从50 V提升到400 V,以降低母线电流、损耗和成本

图6展示了一个三相输入、400 V输出的PSU部署示例,以及推荐的器件和技术。PFC级采用Vienna整流器,这是一种常用于三相PFC应用的拓扑结构。其主要优势在于采用分离式总线电压设计,因此可以使用650 V器件:通过使用双倍数量的背靠背650 V CoolSiCTM MOSFET和 1200 V CoolSiCTM二极管实现。PFC输出配置为分离式电容器,每个电容器电压为430 V,并为全桥LLC转换器供电,该转换器在初级和次级侧均使用650 V CoolGaNTM晶体管。两个LLC级在初级侧串联,次级侧并联,以向400 V母线供电。

此外,也可以将两个背靠背的650 V CoolSiCTM MOSFET替换为650 V CoolGaNTM 双向开关(BDS),后者是真正的常关型单片双向开关。这意味着一个CoolGaNTM BDS即可取代4个分立式电源开关,以实现相同的RDS(on),这是因为它在RDS(on)/mm2方面具备更高的芯片尺寸利用率。

图6 第三代AI PSU的拓扑结构和器件技术示例图6 第三代AI PSU的拓扑结构和器件技术示例

WBG为 AI PSU带来的优势

CoolGaNTM助力实现高峰值功率瞬变

宽禁带(WBG)半导体(例如,CoolGaNTM[2])能够在更高的开关频率下,实现最佳效率,使转换器在不影响转换效率的前提下,实现更高的功率密度,因此,成为AI PSU的理想选择。

除了AI PSU的额定功率显著增加外,GPU在运行时还会拉动更高的峰值功率,并产生高负载瞬变(见图7)。因此,DC-DC级的输出必须具有足够的动态响应能力,同时需确保电压的过冲和下冲保持在规定的范围内。通过提升开关频率,并增加控制环路带宽,可以提高DC-DC级的输出动态响应能力。

图7 AI GPU所需的AI PSU峰值功率图7 AI GPU所需的AI PSU峰值功率

400V CoolSiCTM MOSFET可在3-L飞电容图腾柱PFC中实现最高效率

使用 CoolSiCTM MOSFET 400 V的三电平级飞跨电容图腾柱PFC(3-L FCTP PFC)不仅能够实现更高的交流输入电压(见第2.2节),且相较CoolSiCTM 650 V和750 V参考器件,其品质因数(FoM)更佳,因此还能提供显著的功率密度和效率优势。经过优化的电感器设计(包括尺寸、材料和绕组)和3L拓扑结构中的RDS(on)选择,结合更低的开关损耗,能够实现平缓的效率曲线:峰值效率超过99.3%,满载效率超过99.15%(见图8)。

图8 效率对比:3-L FCTP PFC与2-L TP PFC图8 效率对比:3-L FCTP PFC与2-L TP PFC

结论

为了满足数据中心对AI应用的需求,新一轮技术角逐已经启动,推动了机架和PSU的电力需求大幅增长。其中,AI PSU的功率需求已经从3-5.5 kW,提升到8-12 kW(单相)和高达22 kW(三相)。这种需求给数据中心运营商带来了新的挑战,即如何优化数据中心的空间和电力的效率和利用率。应对这些挑战需要采用新的机架架构和AC-DC配电配置,使得基于CoolSiCTM和CoolGaNTM的设计处于PSU设计的前沿,致力于实现最佳效率和功率密度。

此外,新的宽禁带器件在新型拓扑结构中也展现了极佳的性价比,例如,在三电平飞跨电容图腾柱PFC中采用400 V CoolSiCTM MOSFET,或在三相Vienna PFC中使用650 V CoolGaNTM BDS(详见前文)。

总而言之,英飞凌的功率器件技术组合(硅、碳化硅和氮化镓)和经过优化的栅极驱动IC产品组合,通过混合应用,为当前和下一代平台及趋势的发展提供了支持。这些组合充分利用了三种技术的优势,使PSU设计实现了最佳灵活性,并在效率、功率密度和系统成本之间达成平衡。此外,英飞凌还率先推出了全球首项300毫米氮化镓功率半导体等先进技术,进一步推动了文章[10]中所述的未来设计发展。

参考文献 

[1]   Infineon Technologies AG: We power AI, Online Media Briefing

[2]   Infineon Technologies AG: Wide Bandgap Semiconductors (SiC/GaN)

[3]   Infineon Technologies AG: GaN transistors (GaN HEMTs)

[4]   Infineon Technologies AG: Silicon Carbide MOSFET Discretes

[5]   Infineon Technologies AG: Server and data center 3 kW 50 V PSU – Engineering report

[6]   Infineon Technologies AG: 3300 W CCM bidirectional totem pole with 650 V CoolSiC™ and XMC™– Infineon Technologies application note

[7]   Infineon Technologies AG: CoolSiC™ totem-pole PFC design guide and power loss modeling– Infineon Technologies application note

[8]   Infineon Technologies AG: CoolGaN™ totem-pole PFC design guide and power loss modeling – Infineon Technologies application note

[9]   Open Compute Project Foundation: ORv3-HPR standard

[10] Infineon Technologies AG: Infineon pioneers world's first 300 mm power gallium nitride (GaN) technology – an industry game-changer

[11] Infineon Technologies AG: Powering AI PSU solutions

机架AI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片