回望2025|大厂入场斗法,“AI六小龙”变“四小强”

回望2025|大厂入场斗法,“AI六小龙”变“四小强”
2025年12月31日 16:44 新京报网

开栏语

2025年,是全球经济在复苏与重构中寻找新平衡的一年,也是中国产业在经历了数年技术积淀、市场激荡与模式探索后,进入深度分化与价值重塑的关键节点。我们不再仅仅追逐风口,而是更冷静地审视风口之下正在发生的改变:存储芯片“超级周期”搅动市场,国产正凭借成熟的性能、稳定的供应突围;新能源汽车穿越价格战,驶向全球化的深海;金价暴涨,点燃一场现代淘金热;AI大模型卸下炫技光环,沉入产业毛细血管;短剧现象则掀开了内容消费的底层革命。

这一年的核心叙事是分化与沉淀,当所有行业都在接受价值的重新丈量,真正的机遇只属于那些穿透周期噪音、构筑内生力量的建设者。我们在此记录这场静默而深刻的重塑——潮水退去时,留在岸上的才是这个时代真正的重量。

新京报贝壳财经记者罗亦丹使用AI制图新京报贝壳财经记者罗亦丹使用AI制图

“最累的一天,早上睁眼手机消息就‘爆了’,一路处理到下午2点才想起还没吃饭。”某“AI六小龙”公司的一线技术岗员工讲述,自己习惯了匆匆扒两口饭,便又埋头工作,常常一晃就到夜里10点。“打车回家半小时,北京的夜间环线交通倒很畅快。”

她并不觉得这是消耗。“这是AI行业特有的‘正面压力’。每天都有新的突破和可能,你会觉得自己站在浪潮前沿,被推着,也主动想去看更多、做更多。”

2025年,中国AI大模型的叙事图谱被彻底重画。曾以“AI六小龙”(智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物,也被称作“AI六小虎”)之名集结的创业军团,在聚光灯下渐渐退至舞台侧翼。

这一年,它们目睹了DeepSeek的横空出世,将公众目光与行业期待尽数吸引;见证了字节跳动的豆包在C端成长为“用户之王”,在月活数据上建立起几乎断层领先的优势;到了年末,又亲见阿里携“千问”“灵光”“蚂蚁阿福”强势入场,与字节跳动“大象打架”,而自己只能在激荡的浪涛边缘谨慎观望,避免被误伤。

“小龙”的光环正在褪色,取而代之的是“基模五强”“AI四小强”。名号流转的背后,是生存逻辑的深刻变迁。曾经并肩的六家,如今已走上殊途:智谱与MiniMax在12月双双递交港交所招股书,“上岸”在即;月之暗面和阶跃星辰基础模型的发布停留在今年9月和7月,却在年底分别押注于深度思考与端侧模型;而零一万物与百川智能已悄然转身,放弃预训练通用模型,埋头扎进AI应用与垂直领域。

“这并非坏事而是务实之举。”一位关注该赛道的投资人表示,在市场与资本双重理性之下,收缩战线、回笼资金,反而是更健康的生存姿态。

“卷”与“变”的深处,有一股更沉稳的力量在生长。2025年,被许多人视为国产大模型真正崛起、快速追赶全球前沿的关键年份。在DeepSeek这条“鲶鱼”的刺激下,整个行业进入了一种高强度、高浓度的迭代节奏。

“AI六小龙”名号不再“性感”

“今年投资人已经不再关注所谓的‘小龙’‘小虎’公司了。”

一位对AI行业观察多年的天使投资人告诉贝壳财经记者,“它们当年能撑起三四十亿美元的估值,是因为市场对基础模型还有幻想——总觉得会有创业公司跑出来。但现在,大部分人都看懂了,基础模型终归是巨头的战场。而这些AI独角兽如果成为应用公司,想象力就完全不一样了。估值逻辑变了,故事也就变了。”

自今年年中以来,一个明显的趋势渐显:几家“AI六小龙”企业在宣传上已经不再将自己与这一名号绑定。

“AI六小龙”曾在2023年至2024年颇为流行,彼时,“百模大战”的硝烟初起。在无数入局者中,这六家之所以被称为“小龙”,除了均获得了大量投资,拥有专业背景过硬的创始团队以外,也都以实现AGI为愿景,研发基础模型。

“基础模型在定义行业的格局,可以说最终谁的基础模型胜出,谁就拥有定价权。”12月中旬,一家“AI六小龙”公司的高管告诉贝壳财经记者。

理想很丰满,但现实很骨感,研发基础模型的代价是高昂的:首先预训练必备的GUP芯片就造价不菲,训练千亿级参数的基础模型,需要动辄数千甚至上万张顶级GPU集群,单张英伟达H100 GPU的采购价就超过20万元。而要想对标ChatGPT,则至少需要万亿级别大模型,这意味着,做基础模型,某种程度上就是一场“烧钱竞赛”。

零一万物创始人李开复就曾透露,做预训练的Production Run(投产运行)的训练成本达到一次三四百万美元。

如果说财务层面的问题还可以依靠继续“讲故事”和“拉投资”解决,那么导致“AI六小龙”这一称谓不再“性感”,当属2025年春节期间DeepSeek的爆火。

对“AI六小龙”来说,同为初创公司,DeepSeek在未获得如同“AI六小龙”一般曝光的同时,却取得了它们梦寐以求的成绩和关注度。此外,DeepSeek免费且开源,既然有一款现象级的模型可以“拿来即用”,为何还要苦苦“烧钱”继续做基础模型?

事实上,早在DeepSeek发布之前,一些“小龙”就传出过终止预训练的消息。贝壳财经记者统计“AI六小龙”最近一次更新各家旗下通用基座模型的时间发现,百川智能和零一万物的更新时间已经停留在了2024年。

开源的DeepSeek出现,成为许多AI初创公司放弃预训练的最好理由,AI大模型行业的第一次大规模“收敛”降临了。

2024年10月,李开复表示,“中国的六家大模型公司只要有够好的人才,如果有想做预训练的决心,资金和芯片算力都不是问题。”而2025年3月,他则在演讲中公开表示,零一万物要做“行业第一个全面拥抱DeepSeek模型的‘六小虎(龙)’”。2025年7月,李开复在线下媒体发布会上告诉贝壳财经记者,AI科技公司的“通病”之一是拿着AI这把“锤子”到处找“钉子”,业务核心是AI。但如果要为传统公司创造价值,业务核心应是“行业+AI”,而非“AI+行业”。

同样放弃“大而全”基础模型路线的还有百川智能。2023年4月创业时,百川智能创始人兼CEO王小川曾放话“年底做出国内最好的大模型”。两年后,王小川在全员信中坦承,过去两年战线拉得过长,不够聚焦,“接下来将围绕百小应、AI儿科、AI全科、精准医疗四个方向专注聚焦,减少多余的动作。”

狂奔的大模型“收缩”

DeepSeek的登场,像一枚投入湖心的石子——涟漪不再只是扩散,而是搅动了整个水域的流向。

“这就像中国AI真正站上了国际牌桌,让我们看到和全球顶尖模型公司的距离在缩小,大家的干劲一下子更足了,工作节奏从年后就开始直线递增,全年基本处于连轴转的状态。到现在不管是工作体量还是思考量,都比年初翻了两倍多。”上述一线技术岗员工口中,“卷”不再是一个形容,而成了一种贯穿行业的生存状态。

Kimi或许是剧烈变动格局下感受最深的那一个。2025年初,月之暗面K1.5和DeepSeek-R1两个模型的发布时间几乎“撞车”,结果前者沦为了后者的背景板。不仅如此,此前通过大规模投流和豆包竞争,准备打造C端产品的Kimi还受到了豆包和DeepSeek的“两面夹击”。

月之暗面转变了发展战略。早在今年3月,面对DeepSeek的冲击,Kimi员工告诉贝壳财经记者,“之前许多技术人员的脑子会被产品带着走,需要分出部分精力给用户反馈的问题‘打补丁’、关注DAU(日活跃用户数量),这在让产品变好的同时,或多或少影响了底层技术的开发。DeepSeek的出现让我们回归到了本来就擅长的技术领域,现在我们集中资源研发下一代模型,就像蒸汽机发明初期,重点在于核心技术创新而非局部优化。”

转变风格后,Kimi收缩重心在基础研发之上,今年7月推出的K2模型受到了市场好评。“我其实非常感谢DeepSeek,它的出现对我们是一件好事,让我们更能够以长期主义视角看待实现AGI的梦想。反思之后,我们并没有‘一拍脑袋’把强化学习干到底,反而更加注重第一性原理,即先把基座模型做好,所以我们在3到4个月的时间里没有发布任何模型,也拒绝了抢发模型的诱惑,而是做了一件更长期的事。”Kimi研究人员杜羽伦说。

多家“小龙”企业的战略布局正呈现出趋同性:不放弃研发基础模型的同时,将模型的工具调用能力与场景落地价值置于核心位置,例如智谱、MiniMax、Kimi等均强调了其编程模型的差异化竞争力。

“国内AI行业收敛至少数家拥有自研能力的厂商,专注基础模型研发,其他公司专注于分发和行业应用。这种收敛并非退步,而是意味着客户和市场如今更加看重大模型能否在真实业务场景中解决实际问题,行业需求也越来越旺盛。基础模型的竞争也日趋激烈。例如,在模型参数规模方面,正迈向万亿级别,当前四五千亿参数已成为一个基准量级,模型训练成本越来越高,行业门槛提升导致自然收敛。”智谱董事长刘德兵告诉贝壳财经记者。

在他看来,智谱的核心是坚持并深化原有战略路径:坚持做好基础模型,对齐世界领先水平。

MiniMax相关人士向贝壳财经记者透露,“对于大多数相对通用的需求来说,最终应用层的机会还是属于模型公司的,关键在于周期有多长,以及在这个周期内,是否有少数几家应用公司能够‘跑出来’。”

该人士判断,新的一年,模型体验方面最大的亮点将是模态融合,“我们是目前全球极少数拥有全模态技术的公司,并且在不久的将来,我们有能力做出Gemini 3级别的产品。”

接近月之暗面的人士表示,Kimi接下来的主要任务还是提升模型能力,在此基础上,重点做好Agent和API产品,这也是继续加强产品Agentic的重要方向。

如今,智谱和MiniMax将成为率先“上岸”的“小龙”,分别预计于2026年1月8日和1月9日上市。两家公司虽然营收逐年稳步增长,但亏损同样逐年增大。不过,上市也增添了新的光环:智谱将成“全球大模型第一股”,而MiniMax则获得了包括Aspex、Eastspring在内的14家基石投资者的约27.23亿港元认购,获得了长线资本的“价值背书”。

对于这些留下来、坚持训练基础模型的“小龙”们,或许因其坚持不易,市场给了他们一个新的称号:“AI四小强”。

巨头下场后的巨震

2025年是国产大模型崛起,快速拉近和美国距离的关键一年。也许人们会感叹昔日“AI六小龙”们手中的“旧船票”,还能否如他们当初创立时所说的那样,登上AGI(通用人工智能)的“客船”。但在国内大模型企业激烈竞争的背后,技术迭代速度加快,人才留了下来,这构成了中国大模型行业最坚实的基础。

谈及Kimi的处境,另一家“AI六小龙”公司高管对记者表达得更为直白:“在还没真正杀出一条血路之前,就与巨头正面‘硬刚’,并非明智。字节、阿里、腾讯,它们今天未必最在意‘智能’本身,但一定在意日活跃用户,在意是否错过任何一个新的流量入口。”

这一判断,早已被数据验证。新京报AI研究院与数据公司Xsignal自今年7月开始联合编制全媒介之星AI应用榜,豆包的月活数据(APP+网页)一直“断崖式”领先其他App。其中,今年11月,豆包App的月活用户数量达到3.09亿,排名第二的DeepSeek为1.66亿,排名第三的夸克9462万。月之暗面的月活用户数则为3062.2万,排名第6。

11月,月活用户数跻身前20名的App所在公司,字节跳动、百度、阿里巴巴均有4款上榜。Kimi成为唯一一个上榜的“六小龙”公司。

国内TOP20AI应用所属企业一览。新京报贝壳财经记者 任婉晴 制图国内TOP20AI应用所属企业一览。新京报贝壳财经记者 任婉晴 制图

可以说,在AI产业的C端战场,字节系旗下的AI产品依托庞大用户基数与场景渗透力,已经构建起了难以撼动的流量壁垒。而进入 2025年11月,阿里系突然吹响了向C端全面进攻的号角,“千问”App公测一周下载量破千万,“灵光”上线4天破百万下载刷新纪录,“蚂蚁阿福”也一度冲入苹果应用商店前三。

同时,刚刚引入OpenAI前研究员姚顺雨作为首席AI科学家的腾讯更是“虎视眈眈”,更让赛道张力拉满。

在字节、阿里、腾讯构成的 “三巨头” 斗法格局下,即便“小龙”手握百亿级融资、估值逼近千亿,也难以在这场资源密集型竞赛中找到有效插手空间。

“投资人不会为持续没有营收的基模型买单,除非是第一。”快思慢想研究院院长田丰告诉贝壳财经记者,在中国市场,若一个基础模型无法稳居前三,便意味着它失去了持续投入海量算力与数据的战略意义。

他分析,这一现实倒逼大多数AI研发企业转向to C应用或to B垂类服务。如今,仍坚守在通用基模型赛道的,仅剩四家头部玩家:DeepSeek、通义千问、豆包、元宝。“它们正从各自优势领域出发提升基座能力,同时通过云服务反哺研发投入——这本质上已成为‘巨头的开源游戏’。”

“唯一例外或许是DeepSeek,”田丰话锋微转,“它背后有‘母体’幻方的持续输血,不走寻常路。按照当前迭代速度,它甚至有可能在2026年,在基模型性能上反超美国谷歌Gemini和OpenAI GPT系列基模型性能。”

这句话很轻,却像一颗石子,投进了看似平静的湖面。

一名“AI六小龙”企业的高管告诉贝壳财经记者,“所谓‘小龙’和大厂只是上一个时代的标签,未来行业内可能只剩下一个梯队,我们要做的就是成为其中的一员。”

“说实话,能走到今天这一步的公司都不容易。我真心觉得大家都是勇士。只是各家选择的路径和方式不同,我觉得今天能站在这里的公司,都非常优秀。”这名高管说。

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹 张晓慧

编辑 王进雨

校对 杨利

AI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片