百度沈抖：企业级AI应用正在爆发大模型进入深度应用期|百度_新浪财经

转自：新华财经

新华财经北京11月14日电（记者闫鹏）百度集团执行副总裁、百度智能云事业群总裁沈抖近日在百度世界2024大会上表示，AI应用正率先在B端爆发，由企业级大模型工程平台、异构算力平台组成的新型AI基础设施，将替代传统云计算，为大模型应用在企业生产力场景中的规模落地提供关键支撑。

图为百度集团执行副总裁、百度智能云事业群总裁沈抖

AI应用率先在B端爆发

2024年，大模型产业落地显著提速，在行业场景覆盖广度、落地深度等方面都有显著提升。目前，百度智能云已帮助客户精调3.3万个模型，开发77万个企业应用，文心大模型日均调用量超过15亿次，在能源、电力、制造、金融、交通等数十个行业、上百场景中落地应用。

沈抖表示，企业级AI应用大量涌现的背后，是产品服务形态的突破性变革与能力的大幅拉升。以百度智能云“曦灵”数字人平台为例，全新升级的“文生3D数字人视频”功能，能够大幅提升电商、教育、文旅等行业的内容创作、营销推广效率，大幅降低成本支出。

比如，在电商领域，过去拍摄制作真人产品推广短视频需要专业团队花费几天时间才能完成。而“文生3D数字人视频”只需一句话，就能生成符合不同行业场景特色的3D数字人形象和专业灵动的视频，成本仅有传统方式的1%，工作效率提升超过1倍。

“无数的AI应用，正在重新定义人与数字世界、物理世界之间的交互方式。现在，这些应用已经深入到企业‘研产供销服’的各个环节，并成为企业提升竞争力的关键要素。”沈抖说。

模型精调需求大增

传统的企业业务中，复杂的工作和任务往往过度依赖专家经验和固有流程，即便在数字化系统中，传统工作流配置依旧是没有“大脑”的机械执行，难有实质性的突破。大模型具备强大的意图理解和泛化能力，通过与企业工作流相结合，构成智能时代企业真正需要的“数字员工”。

本次大会上，百度智能云千帆大模型平台正式发布“工作流Agent”功能，旨在帮助企业快速开发出面向复杂对话场景的AI应用，快速拥有专业水平的“数字员工”。通过学习各种企业流程与规范，工作流Agent能够适应不同岗位职责，快速规模化复制，大幅提升企业运转效率。

“我们在实践中发现，行业应用要达到更专业的效果，需要深入模型层面进行定制开发或精调。精调模型的数量一定程度上反映了大模型与产业结合的深度。这个数量今年增长地特别快，在千帆大模型平台上，每天有超过一半的调用量是来自精调后的模型。”沈抖说。

针对数据积累不足，难以承担人工精标数据成本的企业，千帆平台全新推出模型蒸馏解决方案，帮助企业利用文心旗舰级大模型生成专业数据，完成全流程的数据准备工作，加速启动模型精调工作。

以百度电商数字人直播平台“慧播星”为例，通过使用文心旗舰模型ERNIE 4.0 Turbo萃取训练数据，生成模型精调数据集，对轻量级大模型ERNIE Lite进行精调，精调后的模型在特定场景中的效果与旗舰模型基本持平，并拥有更快的推理速度，成本大幅下降90%。模型上线以后，数字人直播间的互动率大幅提升11%，带货转化率也实现提升。

大算力管理依然是最大难题

大算力是大模型落地的基础条件。为了满足企业落地大模型从集群创建、开发实验，到模型训练、模型推理的全旅程算力需求，百度智能云推出百舸AI异构计算平台4.0，服务中国石化、中海石油、长安汽车等行业龙头企业和机构，目前已具备成熟的10万卡集群部署和管理能力。

沈抖表示，为了支撑大模型的进一步高速发展，百度智能云提前布局，是行业内最早打磨10万卡集群能力的厂商之一，并通过技术创新解决了集群算力供给、跨地域部署两大核心难题。

一方面，在算力供给方面，百舸平台兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片，支持同一智算集群中混合使用同一厂商不同代际芯片、不同厂商芯片，最大程度上屏蔽硬件之间差异，帮助中国企业摆脱单一芯片带来的高溢价和供应链风险。

目前，在万卡规模集群上，百舸能够将两种芯片混合训练大模型的效率折损控制在5%以内，达到业界最领先的水平。未来，“一云多芯”将成为中国企业的必然选择。

另一方面，10万卡规模超大集群需要占据大概10万平方米空间，相当于13个标准足球场；每天则要消耗大约300万千瓦时的电力，相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大需求，远超传统机房部署的承载能力，而跨地域机房部署又会给网络通信带来巨大挑战。

沈抖表示，通过设计高效的网络拓扑结构，结合模型切分优化和跨地域无拥塞高性能网络方案，百舸能够在横跨几十公里的多机房组成的万卡规模的集群上，将单一模型训练任务的性能折损控制在4%以内，达到业界最领先水平。

编辑：罗浩