UCIe 核心技术细节悉数落地

UCIe 核心技术细节悉数落地
2026年02月13日 11:23 电子产品世界

核心要点

  1. 自 2023 年起,UCIe 标准保持年度更新节奏,此次 3.0 版本实现带宽翻倍、可管理性提升,同时针对性解决了此前版本难以适配的三类全新应用场景。

  2. 受单片芯片技术瓶颈制约,人工智能数据中心对芯粒架构的需求持续攀升,芯粒间的通信与互连技术成为关键核心。

  3. UCIe 标准最初因功能体系庞大引发行业顾虑,但其多数管理功能为可选配置,这一特性降低了行业落地门槛,也让开发者拥有更高的设计灵活性。

随着芯粒在各领域的应用率不断提升,尤其在数据中心场景的规模化落地,UCIe 联盟发布了标准 3.0 版本,延续了 2023 年以来每年更新一次的节奏。该版本将数据传输速率提升一倍、优化了系统可管理性,还解决了此前版本中难以高效适配的三类应用场景问题。

了解这些技术升级对实际应用的影响,对于把握行业发展趋势至关重要。

阿尔法波半导体首席产品营销经理阿查娜切鲁利伊尔在与西门子 EDA 联合举办的网络研讨会上表示:“如今人工智能数据中心的工作负载,对计算能力和带宽的需求达到了传统单片裸片难以企及的规模。光刻版尺寸限制、良率约束以及供电难题,让打造这类超大规模单片芯片不仅不切实际,在多数情况下更是完全无法实现。”

这也意味着芯粒间的高效互连成为刚需。西门子 EDA 三维集成电路封装流程高级产品专家肯德尔海尔斯补充道:“异构集成领域的诸多棘手问题,核心都在于实现芯粒间的有效通信,以及应对布线和互连带来的复杂管理挑战。”

目前面向芯粒互连的主流裸片间互连标准主要有两个:UCIe 和 BoW(总线式互连)。UCIe 于 2022 年正式推出,对芯粒互连进行了全维度定义,既涵盖底层物理层信号传输规范,也支持上层协议的适配开发。UCIe 联盟着眼于未来可能形成的芯粒交易市场,而互操作性将成为该市场的核心关键。

2024 年发布的 2.0 版本新增了多项管理功能,却也因功能体系庞大让行业产生了 “过重” 的印象。彼时行业并未充分意识到,这些功能中多数为可选配置,开发者可根据实际需求自主选择是否部署。

楷登电子裸片间接口知识产权产品营销总监马扬克巴特纳格尔表示:“最初大家看到标准文档时,都会觉得‘这套标准太复杂,很多功能根本用不上’,但事实上其大部分功能都是可选的。”

如今这种顾虑已大幅缓解,行业对该标准的落地抵触情绪也有所降低,3.0 版本的发布几乎未引发争议。

平面封装的带宽升级

针对 UCIe-S(采用有机布线和 C4 凸点的标准封装)和 UCIe-A(先进封装),3.0 版本将最大允许数据传输速率从 32GT/s(T 为传输次数)提升至 64GT/s,其中二维和 2.5 维设计的带宽实现翻倍,同时还新增了 48GT/s 的速率规格。

新思科技高级产品经理曼努埃尔莫塔表示:“这是 UCIe 3.0 最核心的升级亮点,也是驱动市场落地的关键。并非旧版的速率上限无法满足所有应用需求,而是行业技术在持续发展,我们的标准也需同步跟进。”

三维封装未纳入此次速率翻倍的升级范围,核心原因与边缘布线资源相关。在平面设计中,信号需从裸片边缘引出以实现与相邻裸片的连接,因此边缘布线资源受裸片外围尺寸限制。

而在三维堆叠架构中,裸片并非与相邻裸片通信,而是通过硅通孔与上下层裸片互连。硅通孔的可用数量由裸片面积决定,而非外围尺寸,UCIe 联盟认为,现有硅通孔的资源储备已能满足信号传输需求,无需通过提升速率来扩容。

UCIe 联盟主席、英特尔资深院士德文德拉达斯夏尔马表示:“对于三维封装,我们无需将传输速率翻倍,目前的技术规格其实已经足够完善。”

单时钟,四沿采样

此次速率提升的核心技术支撑是四分之一速率信令(也可称为四数据速率信令 QDR)。该技术此前已应用于 32GT/s 速率,此次则拓展至 48GT/s 和 64GT/s。技术原理为:从基础时钟内部生成两个双倍数据速率(DDR)时钟信号,二者由同一信号源驱动,相位相差 90 度。

夏尔马解释道,在 64Gbps 的传输速率下,“基础时钟为 16Gbps,同时运行两个相位相差 90 度的时钟信号。发送端将信号相位偏移 90 度,接收端同样进行 90 度相位偏移后完成数据采集。”

这意味着两个内部时钟各有一个上升沿和下降沿,最终实现 0°、90°、180°、270° 四个相位的采样沿,大幅提升数据传输效率。

巴特纳格尔指出:“四分之一速率信令的价值重大,能显著降低开发者和厂商开发新一代知识产权产品的技术风险。”

可靠性与功耗优化

48GT/s 和 64GT/s 速率下的误码率规格存在差异:48GT/s 的误码率为 10¹,64GT/s 为 10¹²。尽管二者相差三个数量级,但 UCIe 联盟表示,结合循环冗余校验和重传机制,两种误码率均能满足行业应用需求。

在低速传输场景下,UCIe 3.0 的功耗仍可控制在 0.5 皮焦 / 比特以内;高速传输时,因需启用增强型均衡技术,功耗有所上升,目标值设定为 0.75 皮焦 / 比特,具体关键指标如下表所示。

UCIe 3.0 核心指标

特性 / 关键绩效指标

UCIe-S(二维)

UCIe-A(2.5 维)

UCIe 3D(三维)

备注

基础特性

传输速率(GT/s)

4、8、12、16、24、32、48、64

同左

最高 4

三维版注重能效;3.0 版本新增   48G 和 64G 规格

通道宽度(每集群)

16

64

80

三维版可选项:缩窄至 70、60 等

凸点间距(微米)

100-130

25-55

<10(优化版);10-25(实用版)

需按凸点面积做规格适配;三维版需支持混合键合

通道传输距离(毫米)

≤25

≤2

三维垂直互连

三维版支持裸片对裸片、裸片对基板、基板对基板及多堆叠

核心指标目标值

边缘带宽密度(吉字节 / 秒 / 毫米)

28-224;278、370

165-1317;1975、2634

不适用(垂直互连)

前一行为 4-32G 速率;后一行为 48G、64G 速率;S 版基于 110μm 凸点间距,A 版基于   45μm

面带宽密度(吉字节 / 秒 / 平方毫米)

22-192

188-1646

4000(9μm);300000(1μm)

S 版基于 110μm 凸点间距,A 版基于 45μm

功耗效率目标(皮焦 / 比特)

≤16G 为 0.5;≥24G 为 0.75

≤12G 为 0.25;16G-32G 为 0.3;≥48G   为 0.5

<0.05(9μm);0.01(1μm)

-

低功耗进入 / 退出延迟

≤16G 为 0.5 纳秒;≥24G 为 0.5-1 纳秒

同左

0 纳秒

无需前导码和后导码

可靠性(单位时间失效数)

0<FIT<<1

同左

0<FIT<<1

-

静电放电防护

30V 器件充电模型

同左

初始 5V 器件充电模型,后续降至<3V

三维版晶圆对晶圆混合键合暂不做静电放电防护要求

此次带宽升级未改变凸点位置,实现了与旧版本的完全向后兼容,但高速传输也对信号完整性的保障提出了更高挑战。

尽管 UCIe 在信号传输、可靠性和功耗效率上实现了多重升级,但其对系统设计与集成的深层影响也日益凸显。随着行业技术的推进,新的挑战不断出现,对应的解决方案也在持续迭代。

西门子 EDA 高级营销战略经理闫艾米丽表示:“人工智能推动带宽需求呈爆发式增长,裸片间互连的分析难度也呈指数级上升。”

异构集成带来了全新的复杂度,从持续攀升的功耗、散热需求,到堆叠架构下的全系统级验证,无一不是行业难题。海尔斯指出:“随着 UCIe 向 64Gbps 速率迈进,设计余量不断压缩、布线密度持续提升、信号完整性风险成倍增加,系统级时序收敛的难度较以往大幅提高。”

更优化的启动流程与优先级管理

UCIe 2.0 版本首次引入可管理性功能,3.0 版本则对其进行了多项升级,其中一项核心优化针对先进封装的启动流程。

传统芯粒封装的启动方式,要求每个需启动的芯粒配备独立的固件文件或加载程序;而 3.0 版本支持将所有芯粒的固件文件整合为单一源,也可根据需求进行组合配置。

莫塔解释道:“如果一个系统由多颗芯粒组成,若每颗芯粒都需要独立固件,就会陷入‘先有鸡还是先有蛋’的困境 —— 要么为每颗芯粒配置独立的固件加载路径,实现同步启动;要么逐一路径唤醒所有 UCIe 接口,为每颗芯粒搭建固件传输通道。而 UCIe 3.0 提供了一套标准化的路径和方法,可通过主信道或辅助信道在芯粒间分发固件,流程统一规范,无需为每颗芯粒配置闪存链路或独立的并行加载路径。”

在 3.0 版本之前,优先级通知事件通过主信道传输,这可能导致重要消息被低优先级数据阻塞;此外,所有经主信道传输的信息都需通过主芯粒的可信根验证,进一步增加了消息传输延迟。3.0 版本将优先级通知事件转移至辅助信道传输,尽管辅助信道速率更低,但可用性更高,且无需经过可信根验证,规避了延迟问题。

夏尔马介绍道:“将时钟拉低 8 个周期,即可向对端示意,在第 8 个单位间隔的边界处将传输高优先级消息,高优先级消息的传输时长为 64 个单位间隔,之后恢复常规大载荷数据的传输。”

目前,辅助信道的安全防护功能仍在研发中。

更远的辅助信道传输距离与新增开漏引脚

高速接口的信号传输距离存在天然限制,此前 UCIe 的主信道与辅助信道传输距离一致;但辅助信道的工作频率远低于主信道,原有的距离限制其实过于严苛,未充分发挥其性能。

巴特纳格尔表示:“此前辅助信道的最大传输距离仅 25 毫米,3.0 版本将其提升至 100 毫米。”

莫塔补充道:“延长传输距离的核心目的,是让多个芯粒共享同一条传输线,实现辅助信道的星型连接。主信道则保持原有传输距离不变,因其采用的是点对点连接模式。”

3.0 版本实现了单跳传输距离的提升,同时仍支持芯粒间的消息转发功能。

此外,3.0 版本新增了两个开漏引脚,实现快速节流和紧急关断功能:当任意芯粒检测到温度过高时,一级阈值触发降频运行,更高阈值则触发所有芯粒同步关断,避免过热损坏。

莫塔说:“当系统出现故障时,需要快速响应,而通过传统的辅助信道或主信道传输指令,速度过慢。开漏引脚为行业提供了一套标准化的快速响应方案,若某颗芯粒温度过高,可同步向所有芯粒发送状态切换指令,无需通过关断协议,所有芯粒均可即时接收。”

这一功能对提升系统整体可靠性意义重大。巴特纳格尔指出:“快速节流和紧急关断的支持能力尤为重要,从可靠性角度来看,在汽车电子应用场景中更是不可或缺。”

图2:利用开漏信号的一个示例。这旨在允许在温度升高时一次性节流或关闭所有芯片组。“Prochot”是表示处理器过热的信号。来源:UCIe联盟

更流畅的流传输与重校准功能

UCIe 3.0 版本还针对性解决了此前版本未覆盖的几类应用场景,其中最具代表性的是连续流传输。从技术层面来看,这并非全新功能,但此前的实现方式易出现传输中断,且需在主信道中占用带宽设置标记位,同时时钟频率的可选范围也十分有限。

连续流传输适用于数据恒定速率生成且需恒定速率传输的场景,天线就是典型案例:一颗芯粒上的天线生成数字数据后,需向片上系统等其他芯粒实现恒定速率传输。

这类系统的时钟频率设计要求极高,需规避与采样信号产生拍频的频率。此前的 UCIe 版本对时钟频率做了严格限定,可能与设计师的最优选择不符。3.0 版本开放了时钟频率的可选范围,莫塔表示:“设计师可选择不会与射频信道产生拍频的频率,适配 UCIe 标准。”

该版本不再通过锁相环从指定时钟衍生所需频率,而是直接由参考时钟决定数据传输速率,调整时钟频率即可实现传输速率的变更;同时复用有效信号的编码方式,将同步和奇偶校验信息移至带外传输,不占用主信道带宽。

另一项新功能是接收端请求重校准:链路接收端可向发送端发起重校准请求,缓解接收端处理随时间漂移数据的压力;同时,重校准可在无需重新初始化的前提下完成,简化了启动流程,也降低了功耗。

莫塔指出:“这一功能让物理层可在工作状态下完成重校准,从而适配更广泛的环境温度变化。”

深度休眠与 CHI 协议支持

3.0 版本新增的最后一个应用场景适配,是深度休眠模式(L2)。在 3.0 版本之前,即便主信道进入休眠,辅助信道仍需保持常亮;新版本则新增了辅助信道关断功能,仅保留一个小型电路处于唤醒状态,用于检测退出休眠的触发信号,进一步降低休眠状态下的功耗。

夏尔马解释道:“此前辅助信道必须保持激活,才能唤醒系统其他组件,而 3.0 版本允许对辅助信道的大部分电路进行电源门控。”

实现休眠唤醒无需大量常亮电路,夏尔马表示:“仅需 2-3 个逻辑门检测信号变化,甚至无需时钟;只需让这部分电路保持供电,其余电路全部断电,就能实现更高幅度的功耗节省。”

莫塔补充道:“如今开发者可在无需完整初始化流程的前提下,唤醒辅助信道。”

还有一项重要进展来自 UCIe 联盟外部:联盟此前已实现 PCIe 和 CXL 协议在 UCIe 上的部署,此次安谋控股则将其主流的 CHI 相干协议也适配至 UCIe 标准。

安谋控股基础设施业务线营销副总裁埃迪拉米雷斯表示:“大量开发者希望在 UCIe 上运行 AMBA 协议,该协议的优势在于支持内存和输入输出相干性。英伟达在其 Grace Blackwell 架构中,就通过 NVLink 运行 AMBA 协议。这一方案并非与 UCIe 本身对比,因为 UCIe 只是物理层接口,其最接近的对比对象是行业基于 CXL 2.0 的相关实现。”

此次适配的核心是将 CHI 数据映射至 UCIe 格式,莫塔解释道:“安谋控股定义了一套规范,将芯粒间的 CHI 协议数据转换为微片包,通过 UCIe 实现简易传输。”

这些技术升级,让 UCIe 在功耗效率和协议支持上实现了双重突破。随着技术的持续演进,这些更新将推动 UCIe 的更广泛落地,拓展其应用场景,为后续技术发展奠定基础。

核心组件悉数落地

UCIe 的发展路径始终是:先推出基础功能版本,再根据行业反馈通过迭代升级完善功能体系。前两个版本均对初代标准进行了重大升级,而 3.0 版本虽新增了多项重要功能,却未对接口做任何修改 —— 所有新功能均复用了有效引脚等现有信号,新增的开漏引脚也为接口拓展,而非对旧版接口的改动。

尽管 UCIe 联盟仍会根据行业需求进行必要的升级,但目前来看,该标准的核心缺失功能已基本补齐,行业对其 “实现成本过高” 的顾虑也已大幅缓解。如今行业对 UCIe 的反对声音越来越少,落地应用的进展却越来越多。

巴特纳格尔表示:“在 UCIe 出现之前,几乎所有企业都采用定制化互连方案,就连楷登电子也有自己的 40G 速率定制方案 Ultralink。此前行业对切换至 UCIe 持犹豫态度,核心顾虑是额外开销 —— 包括面积、性能或速率损失。但如今 UCIe 已升级至 64Gbps,我们看到行业的落地意愿显著提升。”

BoW 标准仍将在行业中占据一席之地,尤其适用于对接口要求极简、功耗要求极低的设计场景。莫塔表示:“显然 BoW 标准仍有其应用空间和支持者,不会轻易退出市场,但行业主流已向 UCIe 靠拢,或至少基于 UCIe 标准进行技术开发。”

带宽
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片