每经记者 赵雯琪 每经编辑 张海妮
12月6日,由每日经济新闻主办的“2024数智科技大会”在成都举行。会上,国家超级计算成都中心常务副主任王建波发表了题为“大模型算力基础设施——技术趋势与关键挑战”的主题演讲。
王建波在演讲中提到,大语言模型(Large Language Model)等快速发展,让人工智能进入了一个前所未有的新时代,模型能力的提升和架构的演进催生了新的算力应用范式,对所需的算力基础设施提出了全新的挑战。
不过他也表示,从中国市场看,生成式人工智能产业链在中国已经初具规模,尽管产业链条上各大厂商目前都处于前期投入阶段,但随着应用落地的提速,相比前几次的AI革新,这一次大家对盈利和商业化的焦虑明显下降。“这种来自技术和实体产业的双重合法性,很大程度上提振了互联网产业在平台经济整顿之后的发展信心。”王建波表示。
王建波表示,大语言模型等快速发展,人工智能进入了一个前所未有的新时代,模型能力的提升和架构的演进催生了新的算力应用范式,对所需的算力基础设施提出了全新的挑战。他举例称,ChatGPT-4有1.8万亿个参数,百度文心大模型4.0也突破了万亿规模,国内外都在大规模建设耗资巨大的新型算力中心,X AI计划使用10万块英伟达H100 GPU构建超级计算机,其规模至少是目前市场上最大的GPU集群的4倍。
因此,大模型、大算力、大数据——以“大”取胜,超算、人工智能、数据驱动多种应用的发展,以及问题求解方式的变化。加速硬件的涌现,超算、智算、云算的共存与协同,对计算机系统软件和平台提出了新的要求。
不过,王建波坦言,中国人工智能的发展依然面临着不小的困境和挑战。首先是核心能力不足。王建波认为,中国在AI核心能力上处于“跟踪”模式,这些核心能力包括AI高端人才数量、AI基础算法创新、AI底座大模型能力、底座大模型训练数据、底座大模型训练算力等。
此外,王建波提及,当前我国AI应用主要集中在互联网行业和一些国防领域。从互联网行业迁移到非互联网行业,需要进行大量的定制工作,迁移难度大,单次使用成本高,我国在AI领域的人才数量与实际需求相比明显不足。
他还表示,中国大模型技术发展也有自己的独特优势,从技术端看,中国拥有全球最大的互联网用户基数,为训练深度学习模型提供了丰富的素材,使得中国的AI技术能够更快地迭代和优化;从应用端看,以AI电商为代表的产业逻辑革新带来新机会,通过用户行为数据分析,电商平台能够提供更加精准的商品推荐,提高用户的购物体验和转化率。此外,以无人驾驶为代表的新产业的出现,也给科技互联网公司带来新机会。
在王建波看来,美国大模型是走的通用技术路线,即用超过人类智能的机器,再发起一次工业革命,在这种路线下,美国大模型技术主要着眼于服务业,目前在内容生成、人机交互、逻辑推理三大能力方面都有突破的迹象。
中国的大模型是一种全社会生产方式的变革,王建波解释,这不是单一的革命性的技术,这是一种以成本、效率优化为目标的复合技术应用,这种发展方向有助于全要素生产率的提升,它对传统产业、新兴产业、未来产业都大有裨益。
在王建波看来,人工智能技术成功的关键在于能否让一个行业或者一个产品的成本大幅下降,从而将用户数与产业规模扩大10倍。
“基于生成式人工智能的产业链在中国已初具规模,在中国,具身智能、无人驾驶都是极具未来的新产业。”王建波表示。
王建波同时表示,大模型技术归根结底拼的是新型基础设施,数据、算力、算法的全面基础设施化数据已成为国家战略信息资源,AI大模型就是数据空间的一类算法基础设施,因此要全国一体化算力网络,推动算力基础设施化发挥先导作用,率先实现智能要素。
他特别强调,大模型技术和算力等基础设施关系到发展的可持续性与最终的国际竞争格局,让用得起、安全可信的算力技术低门槛赋能各行各业,让我国的优势产业保持竞争力,让落后产业能够大幅缩小差距,才是最重要的发展路径。
封面图片来源:主办方提供
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)