华为李义:鲲鹏打造坚实AI算力底座 与开发者共成长

华为李义:鲲鹏打造坚实AI算力底座 与开发者共成长
2025年05月26日 17:33 C114通信网

C114讯 5月26日消息(苡臻)近日,鲲鹏昇腾开发者大会2025(KADC2025)在北京中关村国际创新中心成功举办。期间,华为鲲鹏计算业务总裁李义发表“鲲鹏打造AI时代先进算力底座”的主题演讲。

他表示,迈向AI时代,智算、通算走向异构融合,CPU算力无处不在。大模型深入千行万业,激发全产业创新。需求驱动下,行业场景倍增,企业业务流采用AI功能比例达70%;商业应用加速催熟,国内生成式AI日均Token消耗量从千亿级跃升至十万亿级。“从模型训练到推理,从推理到AI应用,通用算力成为刚需。CPU与xPU进行协同,算力得到充分释放。”

华为始终坚持“硬件开放、软件开源、使能伙伴、发展人才”的生态策略,打造开放繁荣的计算产业生态。鲲鹏计算产业历经六年发展,通过硬件开放与软件开源战略构建了覆盖数据中心到边缘场景的完整生态,并正式发布面向AI时代的"鲲鹏AI+解决方案"。

AI Core方面,提供鲲鹏+xPU推理方案,能够兼容昇腾以及其他国产GPU,覆盖数据中心到边缘场景。“目前,数据中心场景已推出十多款推理服务器,边缘场景基于鲲鹏的模组搭建二十多套推理工作站,覆盖1.5B至671B参数规模的模型训练与推理需求;同时还实现内存融合与算力融合,推理吞吐量提升10~30%。”

会上,趋境科技依托鲲鹏基础软硬件平台,在Ktransformer架构优化中取得的突破性进展,正式发布鲲鹏+xPU解决方案。

AI Infra方面,提供鲲鹏AI数据工程组件和鲲鹏AI安全组件,提供性能更优、更安全的数据处理、数据检索等能力。鲲鹏提供AI+数据工程组件,围绕大模型全生命周期,全面提升数据处理效率和性能,“金融证券报告分析,可以将时延下降超过25%,推理处理性能提升20~30%。”同时,鲲鹏AI+安全使能套件:3道安全防线实现纵深防御,端到端保护AI模型和私域数据安全,实现系统可信任、攻击可检测、数据防窃取。

AI应用方面,提供业务编排、部署、调度等能力,基于开源生态,构建企业端到端AI解决方案,做到开箱即优。发布鲲鹏搜广推解决方案,围绕召回和排序极致优化,助力企业打造新一代智能推荐引擎;同时,正式发布鲲鹏RAG 解决方案1.0,基于鲲鹏CPU和昇腾NPU、第三方GPU卡,打造包含RAG业务编排、AI+微服务、部署调度、安全和存储的开源开放体系,定义企业级RAG的技术标杆。

此外,为了解决大规模集群的管理,openFuyao社区开源发布,助力集群算力充分释放。openFuyao聚焦“云原生+AI”,打造多样化算力互联的集群管理与调度能力,提供算力亲和组件及面向生产的社区发行版,实现集群算力的弹性调度和高效释放。“openFuyao能以组件化形式支持异构算力的精细化调度,可在在线和离线的场景下将资源利用率提升30%,业务性能提升20%,较业界方案规模提升3.2倍,实现超大规模集群1.6万节点调度管理;同时,架构可插拔,开发效率显著提升。”

演讲最后,李义强调,“回首过去,鲲鹏以算力为舟,与百万开发者携手前进。展望未来,鲲鹏的初心不变,与开发者共成长。”

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片