阿里云HPN7.0论文成果入选全球顶会SIGCOMM,争夺下一代AI网络架构标准

阿里云HPN7.0论文成果入选全球顶会SIGCOMM,争夺下一代AI网络架构标准
2024年05月14日 14:51 紫牛新闻

5月14日消息,阿里云AI高性能网络架构HPN 7.0成果论文被SIGCOMM2024收录,成为SIGCOMM历史上首篇关于AI智算集群网络架构的论文。SIGCOMM是全球最权威的计算机通信网络顶会,此前谷歌Jupiter网络入选SIGCOMM后发展成为经典架构,有专家指出,阿里云HPN7.0有望成为下一代AI高性能网络架构的新范式。据悉,今年阿里云共有6篇论文被SIGCOMM收录。

大模型对AI基础设施提出了更高要求,阿里云新一代HPN7.0架构,为AI时代超大规模、超高稳定性的网络需求而研发。HPN 7.0创新性地设计了“双上联+多轨+双平面”的网络架构,并自研Solar-RDMA和ACCL通信库,可实现网络的高性能和高稳定互联。

HPN7.0架构:为AI设计的高性能网络集群

从2023年9 月开始,HPN7.0在阿里云展开大规模部署,大模型训练性能较上一代架构在典型场景下提升14.9%,且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型,中文性能全面赶超GPT-4Turbo,就是基于HPN7.0高性能网络集群训练而成。

阿里云基础设施网络负责人蔡德忠介绍称:“阿里云从2017年开始探索端网融合的可预期网络,HPN7.0更进一步,把端网融合的体系结构从网络协议栈拓展到网络架构和通信库,实现了面向AI智算时代的全新网络集群架构创新。”

据悉,始于1977年的SIGCOMM是计算机网络领域最顶级的国际学术会议,每年录取率在10%~20%之间,入选成果极有可能成为主流技术范式标准。此前,谷歌传统数据中心网络Jupiter论文SIGCOMM收录,成为经典架构;此次阿里云HPN7.0架构斩获SIGCOMM首篇AI高性能网络论文,则是中国公司首次为全球AI网络基础设施的设计及实践提供了全新高性能标准。

阿里云在高性能网络领域已深耕多年,提出了端网融合的可预期网络技术体系,并在业界率先完成RDMA低延时网络、智算集群网络架构HPN 7.0等先进技术的大规模实践。阿里巴巴还曾获评AMiner全球十大网络研究机构,是榜单中唯一的中国科技企业。

通讯员 芮瑞

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部