2024中国智算中心实现规模增长 万卡集群成为新赛道

2024中国智算中心实现规模增长 万卡集群成为新赛道
2024年12月16日 17:17 通信信息报

去年工信部等六部门印发《算力基础设施高质量发展行动计划》,提出到2024年末,我国将建成40个智算中心。今年以来,浙江杭州宣布每年“算力券”总额提升至2.5亿元;上海推出算力超市;内蒙古乌兰察布正打造“全国算力保障基地”绿色低碳先行示范区;江苏选择为数据立法,拟明确支持经营主体开放数据;湖南发布工作要点,拟释放数据要素价值……全国多地纷纷出台有关智能算力建设的相关内容,算力不仅以“肉眼可见”的速度更“大”更“快”,还在变得更加智能,截至2024年6月,中国已建和正在建设的智算中心超250个。

同时,《中国综合算力指数报告(2024)》显示,过去20年间,中国的智能算力需求增长了超过百亿倍,这一趋势使得算力中心正朝着万卡规模迈进。万卡集群,顾名思义,是指由一万张及以上的加速卡(如GPU、TPU等)组成的高性能计算系统。近年来,在全球范围内,各大运营商均在加速布局超大规模的智算中心,以适应这一迅猛增长的需求。

智能算力发展势头强劲

“我国算力规模已达246 EFLOPS”“智能算力同比增速超过65%”“算力存力方面,2023年总量达到1200 EB,年增长率达20%”“在算力中心建设上,我国58.3%的算力中心已连接到国家骨干网”……《中国综合算力指数报告(2024)》分析了中国算力行业的发展现状及未来趋势。

随着国家“东数西算”工程启动,我国算力地图正式开始形成八大枢纽、十大算力中心集群,涵盖了京津冀、内蒙古、甘肃、长三角、贵州、粤港澳、成渝等地区。这些地区成为我国算力网络的重要节点,通过高速网络连接,实现数据的高效传输和算力的协同调度。工信部发布的数据显示,我国算力总规模位于世界前列;互联互通纵深推进,城域算力节点间1ms(毫秒)时延保障能力逐渐形成,区域集群到周边主要城市间5ms时延保障能力广泛覆盖,国家枢纽节点间20ms时延保障能力全面实现;全国算力中心平均电能利用效率(PUE)降至1.47,创建国家绿色数据中心246个,超140个算力中心绿色低碳等级达到4A级以上标准。

“综合算力作为集算力、存力、运力于一体的新型生产力,是加速我国数字经济发展的核心动能。”中国信息通信研究院院长余晓晖说。目前,我国吸引了诸多外资企业、民营企业等积极参与“算力产业发展方阵”,形成资源共享、平台共建、价值共创的产业发展新生态。工业、教育、医疗、能源等多个领域算力应用项目超过1.3万个,有力支撑人工智能快速发展,为在更大范围、更高水平上共享数字化发展成果奠定坚实基础。

AI大模型推动智算中心

进入万卡时代

当前,火热的大模型技术和面向行业场景化的创新AI研发,都离不开算力资源的有力支撑。进入大模型时代,算力需求日益复杂,不仅要求算力资源更加充沛和灵活,还要求算力基础设施向智能化和一体化的方向发展,以更高效率和性能来支持更大规模计算。

如何解决智算资源供给矛盾?如何提高算力利用效率?万卡集群则成为了破题方法之一。中国工程院院士郑纬民指出,“构建国产AI卡的万卡大模型训练平台很难,但也很重要以及必要。”

当前,国际、国内科技巨头都在通过积极部署千卡乃至超万卡规模的计算集群,以确保大模型产品的竞争力。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,万卡甚至超万卡集群成为这一轮大模型竞赛的入场券。以运营商中国电信为例,紧随人工智能、大模型等产业发展方向,中国电信目前在上海、北京两个万卡集群已经投产,其中,中国电信临港智算谷终期规划30万卡高端智算集群。中国电信万卡资源池将为广大企业提供高效、稳定、安全的一站式智算服务,支持企业数字化转型和智能化升级。国产算力资源将赋能智慧城市建设、公共服务优化等应用场景,提高政府治理能力和公共服务水平。

以开放务实姿态

提高智算中心利用率

在“算力即国力、智能即未来”的时代背景下,智算已经成为全球高科技角逐的主要赛道。中国各地加快打造自己的人工智能基础设施,北京、广东等多地提出2025年智算规模目标。虽然我国的智算技术不断突破,但产业发展仍有一些问题待解。

业内人士指出,在行业热度高涨的背景下,需要给行业提一个醒,要保持“冷思考的定力”,客观测算算力需求,统筹安排智算中心布局,“小步快跑”,不断健全完善试错包容的机制,避免出现投资浪费。“算力中心,投资建设是容易的,但是算力运营模式探索和创新是更重要的话题,如何提高智算中心利用率,防止出现算力的空置、空转,保持投资的良性循环是必须解决的问题。”紫光股份董事长、新华三集团总裁兼CEO于英涛表示,开放、务实和应用导向是算力产业高质量发展的关键所在。

今年的《政府工作报告》提出“适度超前建设数字基础设施,加快形成全国一体化算力体系”。业内人士普遍认为,“适度超前建设”绝非盲目建设、重复投资,而是在做好规划的前提下,形成投、建、运、管、用协同发展的产业生态,持续提高智算资源的利用率。因此运营商也亟需深化行业合作,加强跨行业、跨领域的合作与交流,共同推动智能算力技术的研发和应用。此前,中国电信天翼云已携手产业伙伴共同构筑开源大模型社区,提供AI资源的可信托管、开源工具链的持续优化和一站式交互开发平台,推进产业链的聚合创新和商业变现,共同繁荣中国AI生态。

集群智能
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片