共筑全国一体化算力网:多元视角下的探索与实践丨算力网风云⑮

共筑全国一体化算力网:多元视角下的探索与实践丨算力网风云⑮
2024年06月27日 14:19 21世纪经济报道

21世纪经济报道记者白杨 北京报道 

随着数字经济的蓬勃发展,算力已成为新时代的核心生产力。尤其是近两年AI大模型的崛起,更是激发了巨大的算力需求。如何满足这一日益增长的需求,已成为全社会共同关注的重要议题。

去年底,国家发展改革委、国家数据局等部门联合印发的《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》提出,到2025年底,要初步建成普惠易用、绿色安全的综合算力基础设施体系。

这一体系,即全国一体化算力网,旨在通过信息网络技术,实现全国范围内各类算力资源的高效、大规模一体化调度运营,这也将是未来支撑数字经济高质量发展的关键基础设施。

在此背景下,6月21日,由21世纪经济报道、21世纪新质生产力研究院举办的“高端智库看‘新质生产力’——一体化算力建设”闭门研讨会聚焦相关话题。会上,来自算力产业链各环节的企业代表围绕“如何有效构建全国一体化算力网”进行了深入讨论。

智算将引领未来算力趋势

根据《2023-2024年中国人工智能计算力发展评估报告》,中国智能算力规模正处于高速增长状态。预计到2027年,中国智能算力规模将达1117.4EFLOPS,2022-2027年期间的年复合增长率为33.9%。

由此可见,市场对智能算力的需求正急剧上升,这也带动了算力上下游市场的快速增长。摩尔线程产品事业部首席AI专家申骞表示,“作为国产芯片厂商,在大模型飞速发展的时代责任也十分重大。”

摩尔线程成立三年半来,量产了三颗全功能GPU芯片,迭代速度非常快。“借助我们很好的CUDA兼容能力,我们已经适配了市面上所有主流大模型,可以为中国大模型建设添砖加瓦”。申骞说道。

大模型发展至今,企业客户对芯片厂商的需求已不仅限于芯片本身,而是需要足够的算力支持。因此,摩尔线程的产品交付形态也已变为千卡甚至万卡智算集群。

申骞透露,摩尔线程建设的千卡智算集群,已被多个客户用于大模型训练,比如无问芯穹、智谱AI、滴普科技等,这些模型的训练过程全程稳定,且集群线性加速比可达到90%以上。

“这充分说明国产GPU的千卡集群已经具备完全的可用性,可以很好支撑国产大模型的发展。”申骞表示。但他同时指出,现阶段,大模型对算力的需求已提升到万卡,这相比千卡集群,难度又增加许多。

申骞称,为了保证大规模集群训练的稳定性,摩尔线程也在做很多优化工作,包括对芯片、网络、平台、AI框架、模型服务等层面的优化。“我们希望交付给客户的是一个包含算力基础设施、集群管理工具、模型服务平台在内的软硬一体、完整可用的系统级算力解决方案,而不仅仅是芯片”。

对于智能算力未来的发展,神州数码信创业务集团研发中心总经理向阳朝指出,智能算力的增长速度已远超通用算力,现在已占到整个算力市场的三分之一,而且这个占比会越来越高。

与此同时,在使用场景上,智算也在从过去的训练为主,逐渐向推理场景倾斜。“未来,每台计算机都可能是一台智算集成机,都有一个智算的GPU在里面,这样一来,智算的市场占比将会达到80%、90%,甚至100%”,向阳朝表示。

另外一位与会专家也表示,未来在算力资源利用上,训练和推理的比例将从1:6变成1:10,而且推理市场对于国产化来说也是一个更大的空间,有望成为数字经济下一个高增长点。

算力能耗问题不容忽视

在算力产业链当中,数据中心运营商扮演着举足轻重的角色。世纪互联作为老牌IDC运营商,在环京、环沪等经济发达的地区布局了50多座数据中心。

世纪互联AIDC产品解决方案总经理程汉生表示,“在‘东数西算’议题提出后,我们一直在思考如何有效利用西部算力资源。随着ChatGPT等大模型的出现,我们发现大模型的训练就可以放在西部地区进行,因为训练场景对网络传输的延迟要求并不高”。

据程汉生介绍,客户在选择数据中心时已展现一种明确趋势,他们倾向于将训练场景放置在自然资源丰富的数据中心,如乌兰察布等地,而将实际的应用场景部署在一线发达地区的数据中心,中间通过世纪互联DCI环网进行连接,这种布局策略实现了资源的最优配置和服务的高效提供。

 对于数据中心建设,程汉生特别强调了在西部地区建设数据中心的优势。他指出,随着大模型时代算力需求不断高涨,电力消耗已经成为一个不容忽视的问题。而数据中心作为高载能用户,对能源的需求尤为显著。而西部地区优势突出,一方面,西部地区常年气温较低,为数据中心的高效散热提供了得天独厚的条件;另一方面,西部地区丰富的风能和太阳能资源为数据中心提供了可靠的能源供应,可以有效降低运营成本,为数据中心的绿色运营提供有力保障。

不过,市场现状是在东部发达地区也存在很多数据中心。程汉生说,要想在东部地区降低数据中心的PUE,液冷解决方案会是现在比较好的办法。“过去数据中心在降低能耗方面进行了诸多创新,如风冷、液冷等技术。现在看来,液冷将成为未来的重要发展趋势。” 

近几年,数据中心领域也迎来很多新玩家,协鑫能科是其中之一。作为一家有着三十多年历史的新能源企业,协鑫能科目前已经在上海和苏州建设了两座智算中心。

协鑫能科智算运营负责人白学院表示,协鑫能科自建智算中心,数字经济时代,尤其是大模型技术的快速发展,让协鑫能科看到了人工智能技术蕴藏的巨大潜力,希望通过建设智算中心来推动协鑫能科的数字化转型。 

这也是绿色能源的需要。“算力的尽头是能源,作为新能源企业,我们也需要研究算力,并希望能够给智算中心提供更好的清洁能源,减少碳排放”,白学院称。

协鑫在中国西北部,包括内蒙古、新疆、宁夏等地,有不少产业布局。而建设智算中心,可以很好地承接新能源资源,进而促进协鑫能科在当地的发展,真正实现区域协同发展。

针对全国一体化算力网建设,向阳朝还提到了算力资源异构的问题。他认为,提高算力利用率的关键在于异构调度和软件优化。

向阳朝指出,如果一个算力网的利用率只有50%,那将是巨大的资源浪费。因此要做好异构资源的调度,最大化地利用算力资源。而神州数码目前正研发相关产品和技术,来帮助企业解决算力调度的问题。

可以清晰地看到,全国一体化算力网的构建是一个多方参与、协同推进的系统工程。它不仅需要政府在政策层面给予引导和支持,还需要基础设施提供商、芯片厂商、数据中心运营商等产业链各环节的共同努力。我们相信,在各方的共同努力下,全国一体化算力网的建设将不断提速,并在未来为中国数字经济的蓬勃发展提供有力支撑。

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-11 科力装备 301552 --
  • 07-01 乔锋智能 301603 --
  • 06-26 键邦股份 603285 18.65
  • 06-24 安乃达 603350 20.56
  • 06-17 永臻股份 603381 23.35
  • 新浪首页 语音播报 相关新闻 返回顶部