面壁智能开源新模型“剑指”具身智能,对话创始团队

面壁智能开源新模型“剑指”具身智能,对话创始团队
2026年02月06日 21:47 新京报网

2月4日,来自北京的端侧AI模型公司面壁智能开源了仅有9B,但高密度、全模态且拥有“全双工交互”的新模型 MiniCPM-o 4.5。在毗邻清华大学南校门的面壁智能公司总部,围绕模型研发、端侧模型未来的可能性以及面壁智能作为AI初创公司的发展战略,新京报贝壳财经记者采访了面壁智能CEO李大海、面壁智能首席科学家刘知远、面壁智能联合创始人兼COO雷升涛,以及该模型的主要研发者,面壁智能多模态首席科学家姚远。

李大海告诉贝壳财经记者,一直秉承“密度法则”(Densing Law,由刘知远提出,其认为模型的能力密度每100天就可倍增一次),不断将大模型的能力压缩至极致的面壁智能要做“大模型的光刻机”。而经历范式提升后,拥有新能力的MiniCPM模型也有望在具身智能领域“大放异彩”。

而刘知远则把目光看向了未来,在他看来,随着模型能力的提升,端侧模型有望陪伴人类成长,最终每个人都会有专属于自己的模型,让电影中的“贾维斯”成为现实。

清华大学计算机系长聘教授、面壁智能联合创始人兼首席科学家刘知远。新京报贝壳财经记者罗亦丹/摄清华大学计算机系长聘教授、面壁智能联合创始人兼首席科学家刘知远。新京报贝壳财经记者罗亦丹/摄

首创原生全双工技术,仅有9B有望成为“具身大脑”

相比其他的大模型公司,面壁智能团队在创业初期就选择了一条非比寻常的道路:做“小而精悍”,可在本地运行的端侧模型。这次发布的MiniCPM-o 4.5,其参数量为9B(记者注:1B代表10亿参数),对比DeepSeek-R1的671B,以及通义千问Qwen3的235B,可以发现面壁智能的这款新模型仅分别为前两者的1.34%和3.83%。

麻雀虽小,五脏俱全。姚远介绍,该模型的能力覆盖全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方方面面,还拥有“边看、边听、主动说”的全双工与主动交互能力,这意味着其自身可以根据环境的动态变化实时反应,以最合适的时机、最恰当的内容回复,让大模型对于信息的感知与传递不会慢半拍。

姚远对贝壳财经记者解释道,传统的单工模型犹如对讲机,当模型回答时,无法接收外部信息,“你很难想象一个人在说话的时候耳朵是堵住的,听的时候又不能说话,而全双工模型在语音方面就解决了这一问题。”谈到具体表现,姚远称,考虑到模型主动“打断”用户有可能会影响交互体验,面壁实际上并没有展示语音维度的能力,但在视觉上,全双工模型可以根据看到的景色变化主动判断交互的时机,输入输出的多模态信息流互不阻塞,对话的延迟更低。

“我们在做这个模型时将其视为全模态基础模型看待,我们相信,全模态在未来赋能终端上有非常大的潜力,无论是汽车、手机还是机器人。有了这样一个能够全双工感知环境并回应用户的模型,将可以把我们现在的设备从被动响应变为主动式智能,所以这是一个范式提升,未来一定能衍生出很多场景。”李大海表示。

对于MiniCPM-o 4.5的应用前景,面壁智能在官方公众号中这样写道:具备类人感知与交互能力、再加上只有 9B 的“小身材”,意味着像具身机器人、汽车、PC 等不同终端交互模式都将进化。以具身机器人为例,目前具身厂商是以研发运控、VLA 模型为主,但行业一直缺乏“理解、沟通、交互”的能力,而像 MiniCPM-o 4.5 则有望补齐具身机器人大脑能力,变得更加智能。

李大海在接受贝壳财经记者采访时表示,在具身智能领域,目前本体的发展比大脑更快,相信具身智能大脑的突破能够为行业带来突飞猛进的进展。姚远也表示,多模态大模型“一定是具身智能实现通用性的最大机会”。

坚持密度法则,面壁智能要做“大模型的光刻机”

此外,对于面壁智能作为初创公司,如何与国内外大厂“差异化竞争”的问题,李大海与雷升涛也回应了贝壳财经记者。

李大海首先提到了面壁智能一直秉承的“密度法则”。他表示,这一定律引发的推论是每一个领先大模型的“保鲜期”都非常短,所以任何大模型公司都需要持续不断进行研发,否则就会被淘汰。

“面壁智能要做‘大模型的光刻机’,在技术层面,我们会不断训练出更高知识密度的大模型。同时,我们也会同步构建其他优势,积极商业化,目前我们的端侧模型在汽车、手机等很多终端设备上运转,交出了还算不错的答卷。”李大海说。

雷升涛则补充道,当前让底层的infra(注:基础设施)模型在端侧跑到极致,是一件非常难的事情。他举例称,“比如车载AI的遗留物品提醒功能,我们最开始做出来时是4秒,客户认为4秒钟‘人就已经走出十来步了’,希望我们做到2秒以内,而最终我们把这个功能做到了1秒之内,这一体验就非常极致。端侧模型意味着算力小、内存小,有着极致的约束,我们把infra这一块做到极致,就能拉长模型领先的时间。”

而对于未来,AI的发展将走向何方,刘知远认为有两大“主旋律”。

在他看来,其一是智能能力越来越强,智能使用越来越高效,“在过去五六年的时间里,我们见证了模型从海量数据中学习知识、理解用户意图、深度思考,接下来这一两年,我们将快速见证模型的专业能力越来越强,跟世界的交互越来越强。当智能体具备了在相关领域进行自主探索、学习成长的能力后,下一步的大突破将是多智能体的协同,完成任何一个个体都无法完成的工作,这也是面壁智能团队将持续发展的方向。”

另一个方面则是“密度法则”,刘知远表示,未来大模型将像芯片一样,不断提高密度,极致地降低模型使用成本与模型尺寸,这样就可以将模型放入终端,更好地服务用户。

“我们可以预见,在未来三到五年的时间里,会有越来越多的终端具备更强智能,当个人的模型也具备了自主学习能力和协同能力时,就会形成一个重要的奇点:这个世界上每个人都会有专属于自己的,持续成长的模型,成为每个人越来越贴心的、懂你的助手。”刘知远说。

记者联系邮箱:luoyidan@xjbnews.com

新京报首席记者 罗亦丹

编辑 岳彩周

校对 付春愔

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片