前言
本文引用地址:
人工智能的迅猛发展推动了数据中心处理能力的显著增长。如图1所示,英飞凌预测单台GPU的功耗将呈指数级上升,预计到2030年将达到约2000W [1] ,而AI服务器机架的峰值功耗将突破惊人的300kW。这一趋势促使数据中心机架的AC和DC配电系统进行架构升级,重在减少从电网到核心设备的电力转换和配送过程中的功率损耗。
图2(右)展示了开放计算项目(OCP)机架供电架构的示例。每个电源架由三相输入供电,可容纳多台PSU;每台PSU由单相输入供电。机架将直流电压(例如,50V)输出到母线,母线则连接到IT和电池架。
AI的发展趋势要求对PSU功率进行革新,如图2(左)所示。 接下来,我们将通过各代PSU的拓扑结构和器件技术建议示例,来逐步介绍这些PSU的演变。
与GPU和TPU的电力需求对比
AI服务器机架PSU的趋势和功率演进
▴ 第一代AI PSU:在相同的架构下提升功率,~5.5-8kW、50V out 、277V ac 、单相
当前的AI服务器PSU大多遵循ORv3-HPR标准 [9] 。相较于先前的ORv3 3 kW标准 [9] ,该标准的大部分要求(包括输入和输出电压以及效率)保持不变,但增加了与AI服务器需求相关的更新,例如,更高的功率和峰值功率要求(稍后详述)。此外,由于与BBU架的通信方式有所调整,输出电压的调节范围变得更窄。
尽管每个电源架都通过三相输入(400-480 V ac L-L)供电(见图2),但每台PSU的输入仍为单相(230-277 V ac )。图3展示了符合ORv3-HPR标准的第一代PSU的部署示例:PFC级可以采用两个交错的图腾柱拓扑结构,其中,650V CoolSiC™ MOSFET用于快臂开关,600V CoolMOS™ SJ MOSFET用于慢臂开关。DC-DC级可以选用650V CoolGaN™晶体管的全桥LLC,次级全桥整流器和ORing则使用80V OptiMOS™ Power MOSFET。此外,示例还展示了一个中间级,也称“延长保持时间”或“小型升压”,其作用是减小大容量电容器的尺寸。该中间级由一个升压转换器组成,在线路周期掉电事件期间,通过储能电容器放电,以调节LLC输入电压。在正常运行期间,升压转换器保持空闲状态,并通过低阻抗的600V CoolMOS™ SJ MOSFET旁路。
▴ 第二代AI PSU:增加线路电压,以实现更高的功率,~8-12kW、50Vout、277–347Vac、单相
如上所述,随着机架功率增加到300kW以上,电源架的功率密度变得至关重要。 因此,下一代PSU的设计方向是,在单相架构中实现8kW至12kW的输出功率。 随着每个机架的功率增加,数据中心中的机架数量在某些情况下,可能会受配电电流额定值和损耗的约束。因此,为了降低交流配电的电流和损耗,部分数据中心可能会将机架的交流配电电压从400/480V提高到600V ac L–L(三相),同时将PSU的输入电压从230/277V ac 提高到347V ac (单相)。
虽然这一变化有利于数据中心的运行效率和资源利用,但会影响PSU的额定电压和设计。在347V ac 的输入电压下,PFC的输出电压必须设定在575V dc 左右,这意味着传统的650V器件的额定电压已无法满足要求。图4展示了一个示例:第一代PSU使用的两电平图腾柱PFC被替换为400V CoolSiC™ MOSFET的三电平飞电容图腾柱PFC(3-L FCTP PFC)级。多电平功率转换概念使得在使用较低额定电压的开关器件的同时,支持更高的输入电压。凭借多电平拓扑结构的频率倍增效应,3-L FCTP PFC能够带来更高的效率和功率密度。最重要的是,CoolSiC™技术针对400V的较低击穿电压进行了优化,与650V 和750V CoolSiC™参考器件相比,其FoM更为优异(见图5(左))。此外,图5(右)显示了导通电阻在整个温度范围内的曲线,其中,400V CoolSiC™ MOSFET的R DS(on) 100°C 仅比R DS(on) 25°C 高11%。R DS(on) 与T j 之间的这一平缓关系有助于CoolSiC™ MOSFET实现更高的R DS(on) typ ,从而降低成本并提升开关性能。
对于DC-DC级来说,三相LLC拓扑结构是一种理想选择,其中,750V CoolSiC™ MOSFET用于初级侧开关,80V OptiMOS™ 5 Power MOSFET用于次级全桥整流器和ORing。由于增加了第三个半桥开关臂,该解决方案能够提供更高的功率,有效降低输出电流的纹波,并通过三个开关半桥之间的固有耦合实现自动电流分配。
图5 400V CoolSiC™与650V和750V CoolSiC™对比,具有更优的开关FoM和稳定的R DS(on) 与结温的关系:品质因数(左),R DS(on) 与T j (右)
▴ 第三代AI PSU:三相架构与400V配电,最高功率约为22kW,400Vout,480-600Vac,三相
为了进一步提高机架功率,第三代AI PSU将采用更具颠覆性的机架架构,具体如下:
PSU输入: 从单相转为三相,以提高功率密度,并降低成本
电源架PSU输出电压: 从50V提升到400V,以降低母线电流、损耗和成本
图6展示了一个三相输入、400V输出的PSU部署示例,以及推荐的器件和技术。PFC级采用Vienna整流器,这是一种常用于三相PFC应用的拓扑结构。其主要优势在于采用分离式总线电压设计,因此可以使用650 V器件:通过使用双倍数量的背靠背650V CoolSiC™ MOSFET和1200V CoolSiC™二极管实现。PFC输出配置为分离式电容器,每个电容器电压为430V,并为全桥LLC转换器供电,该转换器在初级和次级侧均使用650V CoolGaN™晶体管。两个LLC级在初级侧串联,次级侧并联,以向400V母线供电。
此外,也可以将两个背靠背的650V CoolSiC™ MOSFET替换为650V CoolGaN™ 双向开关(BDS),后者是真正的常关型单片双向开关。这意味着一个CoolGaN™ BDS即可取代4个分立式电源开关,以实现相同的RDS(on),这是因为它在R DS(on) /mm 2 方面具备更高的芯片尺寸利用率。
WBG为 AI PSU带来的优势
▴ CoolGaN™助力实现高峰值功率瞬变
宽禁带(WBG)半导体(例如,CoolGaN™ [2] )能够在更高的开关频率下,实现最佳效率,使转换器在不影响转换效率的前提下,实现更高的功率密度,因此,成为AI PSU的理想选择。
除了AI PSU的额定功率显著增加外,GPU在运行时还会拉动更高的峰值功率,并产生高负载瞬变(见图7)。因此,DC-DC级的输出必须具有足够的动态响应能力,同时需确保电压的过冲和下冲保持在规定的范围内。通过提升开关频率,并增加控制环路带宽,可以提高DC-DC级的输出动态响应能力。
▴ 400V CoolSiC™ MOSFET可在3-L飞电容图腾柱PFC中实现最高效率
使用 CoolSiC™ MOSFET 400V的三电平级飞跨电容图腾柱PFC(3-L FCTP PFC)不仅能够实现更高的交流输入电压(见第2.2节),且相较CoolSiC™ 650V和750V参考器件,其品质因数(FoM)更佳,因此还能提供显著的功率密度和效率优势。经过优化的电感器设计(包括尺寸、材料和绕组)和3L拓扑结构中的R DS(on) 选择,结合更低的开关损耗,能够实现平缓的效率曲线: 峰值效率超过99.3%,满载效率超过99.15% (见图8)。
结论
了满足数据中心对AI应用的需求,新一轮技术角逐已经启动,推动了机架和PSU的电力需求大幅增长。其中,AI PSU的功率需求已经从3-5.5kW,提升到8-12kW(单相)和高达22kW(三相)。这种需求给数据中心运营商带来了新的挑战,即如何优化数据中心的空间和电力的效率和利用率。 应对这些挑战需要采用新的机架架构和AC-DC配电配置,使得基于CoolSiC™和CoolGaN™的设计处于PSU设计的前沿,致力于实现最佳效率和功率密度。
此外,新的宽禁带器件在新型拓扑结构中也展现了极佳的性价比,例如,在三电平飞跨电容图腾柱PFC中采用400V CoolSiC™ MOSFET,或在三相Vienna PFC中使用650V CoolGaN™ BDS(详见前文)。
总而言之,英飞凌的功率器件技术组合(硅、碳化硅和氮化镓)和经过优化的栅极驱动IC产品组合,通过混合应用,为当前和下一代平台及趋势的发展提供了支持。这些组合充分利用了三种技术的优势,使PSU设计实现了最佳灵活性,并在效率、功率密度和系统成本之间达成平衡。此外,英飞凌还率先推出了全球首项300毫米氮化镓功率半导体等先进技术,进一步推动了文章 [10] 中所述的未来设计发展。
关于作者
Sam Abdel-Rahman拥有中佛罗里达大学电气工程博士学位,效力英飞凌已十三年有余,现任高级首席系统架构师,负责开发服务器/数据中心SMPS和可再生能源应用的应用路线图。Sam在功率半导体行业拥有丰富的经验,专注于系统架构、拓扑结构和控制技术。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)