百度王海峰谈通用人工智能:技术通用、能力全面

百度王海峰谈通用人工智能:技术通用、能力全面
2024年07月01日 06:25 中国科学报
百度供图

王海峰发布“农民院士智能体”。

■本报记者 赵广立

“旱稻什么时候种最好?”“种植旱稻有哪些注意事项?”“我的旱稻遭遇病虫害怎么办?”

以前,在云南省普洱市澜沧拉祜族自治县竹塘乡云山村,种植旱地优质稻的村民们遇到这些问题,只能在中国工程院院士朱有勇每天跑步的必经之路上“堵”他。但现在,他们可以使用“农民院士智能体”快速得到答案。

“农民院士智能体”是朱有勇及团队与百度共同打造的首个农业智能体,它基于文心智能体平台创建,学习了朱有勇的研究成果以及相关的农业知识,可以为农民解答生产生活中的问题。云山村村民张文清说:“朱院士就在我的手机里!同他本人一模一样。”

“智能体是在基础大模型的基础上,进一步做思考增强训练的结果。”6月28日,在深度学习技术及应用国家工程研究中心主办的WAVE SUMMIT深度学习开发者大会2024上,百度CTO王海峰正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新技术以及“农民院士智能体”。

模型迭代:速度更快、效果更好

大模型技术和产品的迭代仍在加速。大会现场,王海峰发布了文心大模型4.0 Turbo,网页版、APP、API陆续面向用户开放。企业用户即刻起登录百度智能云千帆大模型平台可使用API服务。以用户使用文心大模型设计调查问卷的演示为例,文心大模型 4.0 Turbo的速度更快、效果更好。

百度自2010年起开始布局人工智能,2019年3月推出文心大模型1.0并持续迭代升级, 2023年10月发布文心大模型4.0,今年4月发布文心大模型4.0工具版。文心大模型,基于飞桨平台从万亿级数据和千亿级知识中融合学习,具备知识增强、检索增强和对话增强等核心技术。

王海峰介绍,基于强大的基础大模型,百度进一步创新了智能体技术,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并在一定程度上将思考过程白盒化,让机器像人一样思考和行动,能够调用工具自主完成复杂任务,在环境中持续学习实现自主进化。

“农民院士智能体”就是基于文心智能体平台创建的。王海峰介绍说,“农民院士智能体”不仅学习了相关的农业知识,还使用朱有勇团队的研究成果,从而可以为农民解答生产生活中的问题,促进科技助农惠农。目前,文心一言累计用户规模已达3亿,日调用次数5亿,澜沧拉祜族自治县竹塘乡云山村村民们也成了文心一言的新用户。

飞桨升级,文心进化

王海峰表示,文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。

文心大模型的基础模型训练离不开飞桨深度学习平台,即运行在万卡算力上的飞桨平台,通过集群基础设施和调度系统及软硬件协同优化,支持文心大模型的稳定高效训练。会上,王海峰发布了飞桨新一代框架——飞桨框架3.0。

他介绍,飞桨框架3.0具备动静统一自动并行、编译器自动优化、大模型多硬件适配、大模型训推一体等核心技术,能够使大模型效果更好、性能更优。

“‘飞桨文心’生态规模持续扩大,和每一位开发者的贡献都密不可分。”王海峰披露,飞桨-文心生态至今已凝聚1465万名开发者,服务37万家企事业单位,创建95万个模型。

通用人工智能:技术通用、能力全面

人工智能的目标是模拟、延伸和扩展人的智能。随着大模型的“规模效应”(scaling law)越来越显著,人们逐渐看到了通用人工智能(AGI)的曙光。对此,王海峰认为,可以从两个角度解读,一是人工智能技术的通用性,二是能力的全面性。

他提到,人工智能技术历经几十年发展,经历了从专用到通用的蝶变:从早期的人工撰写规则到后来统计机器学习,能自动从数据中学习;从早期解决不同场景的问题需要不同的算法,演进到深度学习时代算法的通用性大大加强,深度神经网络这套架构和技术可以解决各类问题,再到大模型时代,不仅算法,模型也变得更加通用和统一。

在技术的通用性方面,王海峰表示,大模型在面向不同任务、语言、模态、场景时,通用性越来越强。以自然语言处理为例,之前有分词、句法分析、语义匹配、机器翻译、问答、对话等很多子方向,现在一个大语言模型就可以完成绝大多数任务;语言方面,大模型既可以解决单语言问题,也可以跨语言——不仅能学习人类的自然语言,也能学习人工定义的形式语言(如编程语言等),架起了从思考到执行的桥梁;同时,大模型可以实现多模态的统一建模,广泛赋能各行各业应用等。总体上,人工智能技术的通用性越来越强。

在能力的全面性方面,王海峰认为,理解、生成、逻辑、记忆是人工智能的4项基础能力。人工智能所表现出的其他能力,无论是创作、解题还是编写代码,抑或是规划、决策等,基本上都是这4项基础能力的综合运用。以基于文心大模型实现的运营活动系统为例,模型首先了解用户需求进行系统设计,然后规划相关的任务用于执行,接下来根据规划生成代码,逐步实现系统搭建(包括数据库、后端功能、前端页面等),再进行服务部署;如果部署失败,模型还能够根据报错信息自动“反思”迭代,直到部署成功,服务顺畅运行。

“大模型完成系统开发到服务运行的过程,充分体现了大模型的理解、生成、逻辑、记忆4项基础能力,以及对这4项能力的综合运用。”王海峰说,“这4项能力越强,越接近通用人工智能。”

王海峰最后表示,纵观人类经历的前3次工业革命,当时的核心驱动力量如机械技术、电气技术和信息技术都有很强的通用性,能应用于各行各业,当它们呈现出标准化、自动化和模块化的特征时,核心技术就进入了工业大生产阶段。如今,基于深度学习及大模型工程平台的人工智能技术,包括算法、数据、模型、工具等,也已经具备了非常强的通用性,并具备了标准化、模块化和自动化的特征,正在推动人工智能进入工业大生产阶段,通用人工智能时代将加速到来。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片