百度大模型上新 智能体仍有差距

百度大模型上新 智能体仍有差距
2024年11月12日 23:46 北京商报

“应用来了”,百度世界大会2024年的主题简单明了,11月12日,百度CEO李彦宏一上场也紧扣主题,“这代表了百度对当前大模型和生成式人工智能时代的认知和判断”,并从智能体和产业应用两个方向“上新”:可以直播的角色类智能体、可以将照片变成动画的工具类智能体等。

大模型是新的革命还是新的泡沫?李彦宏认为百度有资格回答这个问题,截至11月12日文心大模型日均调用量超15亿,他也承认众所期待的AI超级应用还没有出现。“PC时代的应用是软件和网站,移动时代是App,大模型时代是智能体。”李彦宏强调,“智能体是AI应用的最主流形态,即将迎来它的爆发点。”

基本解决幻觉问题

“要想基于大模型开发应用,消除幻觉是必须的。”李彦宏一针见血,“如果这个模型总是一本正经地胡说八道,就不会有人信你,就不会有应用。”

其实,在大模型爆发的两年里,幻觉现象在不同使用场景下的改善程度也不一样。

在李彦宏看来,“大模型是一个概率模型,生成的内容具有不确定性。采用RAG(检索增强生成)技术后,大模型会利用检索到的信息来指导文本或答案的生成,提高内容的质量和准确性。文字层面的RAG已经做得很好了,但图像等多模态内容和RAG的结合还不够”。

他拿两张天坛的图片举例,大模型生成的天坛是四层的,真正的天坛其实只有三层,这就是典型的文生图幻觉现象。回到应用层面,这种幻觉现象目前仍然很普遍,“所以今天的多模态大模型,没有什么成规模的应用出来。就是幻觉没有解决,至少没有像文生文RAG解决得那么好”,李彦宏说。

基于此,百度开发了iRAG技术,即检索增强的文生图技术。该技术将百度搜索的图片资源跟基础模型能力相结合,可以生成各种超真实的图片。

百度CTO王海峰详细介绍称,“百度基于大模型对用户的需求进行分析理解,自动规划精准或泛化方案;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图;最后在生成阶段,自研了多模可控生图大模型。在实际应用中,这个方法也支持用户上传参考图,应用户期望进行生成”。

一些立等可取的现货

不论是热门新能源汽车还是大模型,技术、应用、商业模式都是渐进的过程。就像中欧AI与管理创新研究中心秘书长钱文颖说的,“人工智能目前处于早期阶段,更多是以实验室创新为主。随着技术成熟,企业需要将这些创新应用到实际场景中,满足实际需求,逐步实现商业化”。

当天,李彦宏就展示了iRAG的应用场景:品牌宣传。“试想一下,如果给大众汽车生成的海报,车型长得像丰田”,他开了个玩笑,“之前一组汽车海报拍摄需要一二十万,甚至大几十万元,现在创作成本接近于0,iRAG的商业价值在于:无幻觉、超真实、没成本、立等可取”。

55分钟的演讲中,他提到两次“立等可取”这个词,第二次是谈到“自由画布”时,一个由百度文库和百度网盘联合开发的工具类智能体,核心功能体现在输入、编辑、创作、分享环节。

以创作为例,在划好重点后,用户框选全部需要的素材就能一键生成,根据现场分享的视频,输入一张儿童的照片,加上故事的背景等,自由画布就可以生成一个漫画。

“自由画布可以帮你完成从找资料到编辑,再到生成和分享的全部任务。每个人都可以成为漫画家、短视频导演。”说到这儿,李彦宏的声音明显提高,“这不是期货,是立即可用的现货”。

和自由画布一样零门槛的还有无代码工具“秒哒”,一个多智能体协作工具。以设计一个萝卜快跑新技术发布会的邀请函为例,包括海报生成、文案生成、嘉宾报名、地图信息展示等,工作人员不需要懂代码就可以完成,用李彦宏的话说,“你不需要去招募项目经理、设计人员、开发人员、测试人员等,自己就可以指挥多个智能体来协同完成任务”。

应用的样貌不一样

一个是智能体,一个是智能体协作工具,李彦宏看好的智能体在百度世界大会2024官宣前、预热时、主论坛演讲和展区都出现在C位。

北京商报记者体验了展区的农民院士智能体。“你好,我是农民院士朱有勇的智能体,你可以通过向我提问,了解旱地优质稻的具体问题解答。”“院士”有问必答。截至记者发稿,这款智能体在文心智能体平台上的浏览次数11.3万次,帮助2.9万人。整个文心智能体平台上,已吸引15万家企业和80万名开发者参与。

11月12日当天,李彦宏大部分时间也在给智能体打call,他将百度的智能体分为四类:公司类智能体、角色类智能体、工具类智能体、行业类智能体。

“智能体是AI应用的最主流形态,即将迎来它的爆发点”,他再一次强调,“未来公司官方智能体很可能替代官网”,并从PC时代追溯至今,“在人类信息技术变革的不同历史时期,应用出现的样貌也不一样:在PC时期,它是一个个的软件和网站;在移动时期,它是一个个的App和可被关注的账号;在AI时代,应用主要的形态就是智能体”。

应用、智能体为什么屡次被提及?换一个角度或许更容易理解,“正常健康的生态应用是:应用创造的价值)云厂商)芯片GPU(图形处理器)”,零一万物创始人及CEO李开复说。

北京商报记者 魏蔚

图片来源:企业供图

海量资讯、精准解读,尽在新浪财经APP
智能体 百度 李彦宏

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 11-18 联芸科技 688449 --
  • 11-15 红四方 603395 --
  • 11-08 金天钛业 688750 7.16
  • 11-08 万源通 920060 11.16
  • 11-08 壹连科技 301631 72.99
  • 新浪首页 语音播报 相关新闻 返回顶部