面壁智能开源新模型“剑指”具身智能，对话创始团队|智能|贝壳财经|李大海_新浪科技

2月4日，来自北京的端侧AI模型公司面壁智能开源了仅有9B，但高密度、全模态且拥有“全双工交互”的新模型 MiniCPM-o 4.5。在毗邻清华大学南校门的面壁智能公司总部，围绕模型研发、端侧模型未来的可能性以及面壁智能作为AI初创公司的发展战略，新京报贝壳财经记者采访了面壁智能CEO李大海、面壁智能首席科学家刘知远、面壁智能联合创始人兼COO雷升涛，以及该模型的主要研发者，面壁智能多模态首席科学家姚远。

李大海告诉贝壳财经记者，一直秉承“密度法则”（Densing Law，由刘知远提出，其认为模型的能力密度每100天就可倍增一次），不断将大模型的能力压缩至极致的面壁智能要做“大模型的光刻机”。而经历范式提升后，拥有新能力的MiniCPM模型也有望在具身智能领域“大放异彩”。

而刘知远则把目光看向了未来，在他看来，随着模型能力的提升，端侧模型有望陪伴人类成长，最终每个人都会有专属于自己的模型，让电影中的“贾维斯”成为现实。

清华大学计算机系长聘教授、面壁智能联合创始人兼首席科学家刘知远。新京报贝壳财经记者罗亦丹/摄

首创原生全双工技术，仅有9B却有望成为“具身大脑”

相比其他的大模型公司，面壁智能团队在创业初期就选择了一条非比寻常的道路：做“小而精悍”，可在本地运行的端侧模型。这次发布的MiniCPM-o 4.5，其参数量为9B（记者注：1B代表10亿参数），对比DeepSeek-R1的671B，以及通义千问Qwen3的235B，可以发现面壁智能的这款新模型仅分别为前两者的1.34%和3.83%。

麻雀虽小，五脏俱全。姚远介绍，该模型的能力覆盖全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方方面面，还拥有“边看、边听、主动说”的全双工与主动交互能力，这意味着其自身可以根据环境的动态变化实时反应，以最合适的时机、最恰当的内容回复，让大模型对于信息的感知与传递不会慢半拍。

姚远对贝壳财经记者解释道，传统的单工模型犹如对讲机，当模型回答时，无法接收外部信息，“你很难想象一个人在说话的时候耳朵是堵住的，听的时候又不能说话，而全双工模型在语音方面就解决了这一问题。”谈到具体表现，姚远称，考虑到模型主动“打断”用户有可能会影响交互体验，面壁实际上并没有展示语音维度的能力，但在视觉上，全双工模型可以根据看到的景色变化主动判断交互的时机，输入输出的多模态信息流互不阻塞，对话的延迟更低。

“我们在做这个模型时将其视为全模态基础模型看待，我们相信，全模态在未来赋能终端上有非常大的潜力，无论是汽车、手机还是机器人。有了这样一个能够全双工感知环境并回应用户的模型，将可以把我们现在的设备从被动响应变为主动式智能，所以这是一个范式提升，未来一定能衍生出很多场景。”李大海表示。

对于MiniCPM-o 4.5的应用前景，面壁智能在官方公众号中这样写道：具备类人感知与交互能力、再加上只有 9B 的“小身材”，意味着像具身机器人、汽车、PC 等不同终端交互模式都将进化。以具身机器人为例，目前具身厂商是以研发运控、VLA 模型为主，但行业一直缺乏“理解、沟通、交互”的能力，而像 MiniCPM-o 4.5 则有望补齐具身机器人大脑能力，变得更加智能。

李大海在接受贝壳财经记者采访时表示，在具身智能领域，目前本体的发展比大脑更快，相信具身智能大脑的突破能够为行业带来突飞猛进的进展。姚远也表示，多模态大模型“一定是具身智能实现通用性的最大机会”。

坚持密度法则，面壁智能要做“大模型的光刻机”

此外，对于面壁智能作为初创公司，如何与国内外大厂“差异化竞争”的问题，李大海与雷升涛也回应了贝壳财经记者。

李大海首先提到了面壁智能一直秉承的“密度法则”。他表示，这一定律引发的推论是每一个领先大模型的“保鲜期”都非常短，所以任何大模型公司都需要持续不断进行研发，否则就会被淘汰。

“面壁智能要做‘大模型的光刻机’，在技术层面，我们会不断训练出更高知识密度的大模型。同时，我们也会同步构建其他优势，积极商业化，目前我们的端侧模型在汽车、手机等很多终端设备上运转，交出了还算不错的答卷。”李大海说。

雷升涛则补充道，当前让底层的infra（注：基础设施）模型在端侧跑到极致，是一件非常难的事情。他举例称，“比如车载AI的遗留物品提醒功能，我们最开始做出来时是4秒，客户认为4秒钟‘人就已经走出十来步了’，希望我们做到2秒以内，而最终我们把这个功能做到了1秒之内，这一体验就非常极致。端侧模型意味着算力小、内存小，有着极致的约束，我们把infra这一块做到极致，就能拉长模型领先的时间。”

而对于未来，AI的发展将走向何方，刘知远认为有两大“主旋律”。

在他看来，其一是智能能力越来越强，智能使用越来越高效，“在过去五六年的时间里，我们见证了模型从海量数据中学习知识、理解用户意图、深度思考，接下来这一两年，我们将快速见证模型的专业能力越来越强，跟世界的交互越来越强。当智能体具备了在相关领域进行自主探索、学习成长的能力后，下一步的大突破将是多智能体的协同，完成任何一个个体都无法完成的工作，这也是面壁智能团队将持续发展的方向。”

另一个方面则是“密度法则”，刘知远表示，未来大模型将像芯片一样，不断提高密度，极致地降低模型使用成本与模型尺寸，这样就可以将模型放入终端，更好地服务用户。

“我们可以预见，在未来三到五年的时间里，会有越来越多的终端具备更强智能，当个人的模型也具备了自主学习能力和协同能力时，就会形成一个重要的奇点：这个世界上每个人都会有专属于自己的，持续成长的模型，成为每个人越来越贴心的、懂你的助手。”刘知远说。

记者联系邮箱：luoyidan@xjbnews.com

新京报首席记者罗亦丹

编辑岳彩周

校对付春愔