近日,中国移动在“2024中国算力大会”正式发布了广域高吞吐100Gbps网卡 — HP-WAN NIC,实现海量数据广域高效传输,这是中国移动打造算网一体原创技术策源地的又一重大突破。为此,C114采访了中国移动研究院段晓东副院长,详细介绍了中国移动广域高吞吐创新成果的设计理念和创新历程,并对未来算力网络产业发展提出建议。
Q1:您好,我们了解到当前国家正在大力推进“东数西算”等重大战略工程,请问广域高吞吐是服务于这些重大战略需求吗?这些技术在其中如何发挥作用?
段晓东:正如您所说,当前数据已成为国家的战略性资源,算力成为数字经济时代的核心生产力,国家相继出台了“数字中国”、“东数西算”等重大战略,大力发展新质生产力,促进我国经济社会高质量发展。
中国移动积极响应国家号召,提出“算力网络”全新发展理念,并围绕基础设施构建、算网应用赋能、技术创新引领三条主线开展攻关。今天发布的广域高吞吐100Gbps网卡(HP-WAN NIC)正是中国移动立足于国家重大战略,推进算力网络系统性建设过程中取得的重要成果,可以满足科学计算、东数西存、东数西训等算力网络典型应用场景的海量数据广域网高效传输需求。
Q2:本次发布的广域高吞吐创新成果有哪些亮点和“黑科技”?
段晓东:这次发布的广域高吞吐100Gbps高性能网卡可以在16000公里超长距、0.1%高丢包率的广域网环境下,达到90Gbps以上的数据传输性能,较当前业界最高水平提升了30%,创造了新的世界纪录,意味着中国任意两地只要部署了这款网卡并开通网络服务,就可以实现超高速、高品质的海量数据传输。
这项成果的创新源头来自于中国移动原创提出的广域高吞吐协议栈,通过四项核心技术实现“高通量”、“高可靠”、“低算耗”和“易部署”等特性,突破传统数据传输方案在广域网面临的性能瓶颈,实现“分钟级”部署开通和“分钟级”TB数据传输。
一是增强RDMA协议(URDMA),使得吞吐性能不受服务器性能影响,大幅降低算力消耗;二是基于参考速率的拥塞控制算法(RRCC),有效增强了抗丢包能力,使得弱网环境下仍能进行高速率传输;三是计时计数双维度选择性重传机制(TC-SACK),使得数据传输性能不受传输距离限制,超长距离下有效吞吐不衰减;四是快速丢包恢复机制(P-FEC),提升传输可靠性的同时降低了长距传输尾时延,显著扩展了网卡的环境适配性。此外,网卡可灵活部署,不需要现网升级,不需要新增网元,可以在包括国产服务器在内多种服务器、多种操作系统上便捷部署。
Q3:请问广域高吞吐这项创新成果将如何应用?会对产业产生怎样的影响?
段晓东:2020年起,中国移动就开展了广域高吞吐相关技术创新研究,并结合真实业务进行了场景验证。2023年10月,我们联合相关天文机构,在业界首次实现了贵州到北京2200公里大规模天文数据稳定传输,创新成果荣获2024年信息社会世界峰会 (WSIS) 最高项目奖。今年5月,中国移动正式成立“算网一体”中试战队,结合基因测序、云间数据同步、异地办公、影视制作等更加丰富的业务进行现网试点验证。其中,哈尔滨到贵州5000公里云间数据同步的测试案例可以在100Gbps物理带宽实现70Gbps有效吞吐,较传统方案提升5倍。
可以看到,广域高吞吐创新成果能够服务和支撑多元化的算力网络应用场景,当前已成为产业刚需。本次广域高吞吐创新成果的发布是中国移动推进广域高吞吐技术落地应用的又一个重要里程碑,将为产业界面向数据迁移备份、大数据协同计算、智算中心互联等场景广域网数据高效传输需求提供端到端高效解决方案,切实助力“东数西算”等战略工程实施。
Q4:面向未来,中国移动在算力网络工程和技术研究方面如何谋篇布局,还有哪些创新的思路?
段晓东:未来,算力需求指数级增长,对 AI基础设施带来极大挑战。一方面,受限于机房空间、电力、散热等问题,智算中心单点算力规模难以为继;另一方面,受限于网络通信性能,大规模分布式GPU集群的计算效率难以线性增长。为破解智算基础设施供给难题,中国移动将以网络为基础融合计算架构和范式,面向互联网协议栈在网络层引入计算因子,原创算力路由、在网计算技术;在传输层增强拥塞控制,策源广域高吞吐技术;在应用层构建一体化编排调度,提出算网数字孪生技术。我们将深入研究算网一体架构和关键技术,构建具备网内计算功能可重构、算网融合统一计算范式、网络模态自适应等多维属性的算网一体广域智算互联技术体系,赋能无处不在的网络资源,弥补小规模智能计算的差距,提升整网智算利用率。
Q5:中国移动在广域高吞吐等算力网络核心技术方向取得了引领性成果,请您基于现有经验以及创新实践,对于未来几年行业发展提出建议?
段晓东:算力网络既是一个宏大的基础设施,也是一个复杂的科学命题,更是信息通信领域全面融合创新的系统工程。中国移动愿意携手产学研各界伙伴合力推进包括广域高吞吐在内的算力网络技术创新和产业应用。在此提出三点建议:
一是加强原创技术攻关。积极融入国家科创大局,充分利用国家算力网络策源地、联合体、国家重点研发计划等资源,加强基础根技术创新和核心技术攻关,提升原创技术需求牵引、源头供给、资源配置、转化应用能力,实现算力网络技术自主可控的同时,努力在国际上输出中国技术方案。
二是合力构建统一标准体系。当前算力网络领域多个技术方向均存在多种技术路线共存的局面,需协同产学研各方,加强国际交流,共同探讨算力网络标准化方案,构建统一的国内外标准体系。中国移动在算力路由、全调度以太等方向正积极推动标准体系构建,同时,在IETF也启动了广域高吞吐(HP-WAN)技术的标准化探索,欢迎业界更多伙伴关注并合力贡献。
三是推进构建健康产业生态。发挥我国算网设施和市场需求优势,汇聚技术、产业、资源、用户四类要素,加速产业协同创新,构建全产业创新链,突破算力网络“卡脖子”技术,实现供应链安全可控。构建包括数据快递、任务式服务等新业态,为产业升级和融合发展提供新动能。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)