阿玛拉定律说,人们总是高估技术短期变化,却低估长期的变革。
显然,这一观点放置于眼下如日中天的人工智能(AI)浪潮背景中也是恰如其分的。百度创始人、董事长兼首席执行官李彦宏作为AI的坚定支持者之一,显然并不迷信于由这一波生成式AI推动的“超级应用”会如众人期待那般短期内就从天而降,而是更愿意将这一由智能化开启的新时代比作“新工业革命”的到来。
但同时,这也意味着更长远的发展周期与更深刻的颠覆性。
为什么是“应用来了”
本周,百度世界2024于上海世博中心举办,今年的大会主题是“应用来了”。
过去一两年,大模型成为全球各行业谈及AI行业的核心聚焦点,同时也成为一部分加入这一赛道的创业企业的焦虑点。利用不断迭代的大模型,究竟可以做些什么?机会在哪里?
“模型本身不产生直接价值,只有在模型之上开发各种应用,在各种场景找到所谓的PMF,才能真正产生价值。如果说2023年大家还在卷模型,让模型能力逐步达到可用的话,那未来所谓的‘可用’,就是真的有东西用,应用的‘用’。”李彦宏在期间接受媒体采访时强调,只有把大模型真正化作能够产生价值的实用应用,才能让更多从业者找到发展的路径和方向。
因此,无代码秒哒和文生图检索增强(iRAG)的发布,成为了此次百度世界的重点。
需要了解的一个背景是,去年10月,百度发布了智能体机制,并研制了系统2。其核心是思考模型,包括理解、规划、反思和进化,能够做到可靠执行,自我进化,并在一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,同时在环境中持续学习、自主进化。
无代码秒哒和文生图检索增强(iRAG)则是激发智能体爆发的关键。
百度表示,无代码秒哒能够让任何人,用自然语言开发应用,实现想法。其中,零代码工具就是多智能体协作的应用,采用了智能体的中心化模式,其中的代码智能体通过场景知识的增强,显著提升复杂代码生成的质量与稳定性,高效实现用户需要的功能,让人人都可以成为程序员。
关于文生图检索增强(iRAG),百度研发了「理解-检索-生成」协同优化的检索增强技术,提升了大模型技术及应用效果;面向不同应用场景的生图需求,进一步研发了检索增强的文生图技术,既可以生成精确的图片,也可以进行泛化生图。
所有这些都建立在百度文心一言快速成长的基础之上。自去年3月16日发布文心一言以来,“文心一言用户规模达到4.3亿,”百度首席技术官王海峰在会上宣布了这一数据。同时,文心大模型日均调用量已超过15亿。
超级应用一定会有,只是时机未到
正如从4G跨越到5G时代,移动通信行业在苦等一个颠覆性Killer APP一样,AI行业经过过去两年生成式AI浪潮的轰炸式席卷,也在翘首期盼一个让大家为之兴奋的“超级应用”。
对此,李彦宏表示,百度的愿景并不是要推出一个“超级应用”,而是希望不断地帮助更多人、更多企业打造出数以百万“超级有用”的应用。
从商业逻辑上讲,这对于百度这样一家拥有如此体量和历史积累的企业来说是合理的。做平台型的企业,赋能更多开发者基于其平台底座打造更多的应用,而不是成为一家实力雄厚的应用开发商,这意味着更广阔的生态和更响亮的话语权以及更多元的收入机会。
但也如开篇所说,从李彦宏所述的产业发展逻辑来讲,这样的做法是将眼光放置到了更长远的发展周期。
“大家很容易把这波生成式AI和上一波移动互联网或者上上一波PC互联网相比,那之后的确出现了超级应用。但人工智能很像是一次新的工业革命,这意味着它不是三五年就结束,不是一两年就出现超级应用的过程,它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。“李彦宏说,AI的超级应用会有,只是现在时机未到。
另外,他在本次峰会上提出的另一个观点亦引发了极大关注与反响——过去24个月,这个行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升。
实际上,正是得益于文生图检索增强(iRAG)这类技术的逐渐成熟,才使得AI工具在落地使用时能够减少幻觉,提升准确性与可控性。
务实的AI理想主义者
这里面还绕不开的一部分则包括百度自身在大模型等底层技术与框架的不断增强升级。
C114了解到,在文生图检索增强(iRAG)的实现中,首先,基于大模型对用户的需求进行分析理解,自动规划精确或泛化方案,比如对哪些实体进行增强;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图。最后在生成阶段,百度自研了多模可控生图大模型,一方面,通过局部注意力计算,在保持实体特征不变的情况下,实现了图像的高泛化生成,比如根据牛顿的肖像,生成绘本风格的牛顿;另一方面,通过整体注意力计算,进行高精确的图像生成,比如生成图中的汽车跟原图片保持完全一致。
不过,这并非李彦宏在大会上的演讲重点。比起追逐大模型不断迭代衍生的超级能力,他更愿意讨论应用的场景和真正的市场需求,而且这些应用是被千千万万普罗大众用户所使用。
说回上面提到的“无代码秒哒”。利用AI来进行辅助代码生成已非什么新鲜事,而百度这一有望于明年第一季度上线试用的新产品,则是希望将这样的先进生产力能力下沉到规模更大的、可能毫不具备相关基础知识的用户群。简单来说,通过无代码编程,由大模型直接生成代码,不需要人写一行代码,这意味着门槛低,人人可上手。按李彦宏的话来说,这将开启一个“只靠想法就能赚钱的时代”。
身处AI这样一个瞬息万变的前沿行业,他认为面向未来做出判断时并不是在做猜谜游戏。而是先拥有一个愿景,然后再去实现这个愿景。在C114看来,李彦宏所描述的愿景中,既有手可摘星辰的浪漫主义,也有坚持普惠大众的务实精神。
李彦宏表示,“今天,随着基础模型和智能体的能力逐步提升,我们把这些能力综合在一起,就可以让普通人,一行代码都看不懂的人,具备程序员的能力。当几亿、十几亿人都具备这种能力的时候,它对于创造力的爆发,是辅助代码生成工具没法比的。辅助代码工具还是让金字塔塔尖的人更加powerful。而我们希望金字塔中间层和底层的人,拥有金字塔塔尖这些人的能力,这个意义更大”。李彦宏在采访中说到。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)