这两天,中美AI领域发生了两件大事:
在美国发布AI禁令后,特朗普随即宣布了一项预算高达5000亿美元的AGI计划——星际之门,以保证其在AI领域的领先地位。
而在大洋彼岸的中国,一家名为Deepseek的中国创业公司,只用了2048块显卡,就训练出了一个能与顶级模型相媲美的Deepseek-V3模型。
Deepseek最引人注目的并不只是它的技术指标,而是其所代表的效率革命,仅依靠少量的硬件配置和几十名年轻的博士生,就打破了美国的AI资源限制,完成了跨越式的技术突破。
更重要的是,Deepseek选择了完全开源的路线,将代码、模型权重和训练日志全部公开。没有人会忘记开源的力量,虽然定义智能手机的是iOS,但安卓才是那个让手机行业真正繁荣,普惠深入世界各个角落的人。
正如Perplexity CEO Aravind Srinivas所说:历史告诉我们,一旦开源追上甚至超越闭源软件,所有开发者都会转向开源。
以此为转折点,DeepSeek不仅改变了AI原有的竞争规则,也让美国和中国的AI路线走向了不同的两个方向:巨额投入与追求效率、封闭与开源。
/ 01 /
DeepSeek突破的三层意义
之所以DeepSeek能够引起如此广泛的讨论,不仅在于其技术指标,更在于其对于AI行业的重要意义。
首先,DeepSeek重新定义了大模型的竞争壁垒。过去两年里,OpenAI每年要花费上百亿美金,来维持自己在AI领域的优势地位。
而现在游戏规则变了。“DeepSeek”证明,数千万美元的投资也能取得显著成果。
不久前,UC伯克利博士生潘家怡和另两位研究人员,在CountDown游戏中复现了DeepSeek R1-Zero。实验中,团队验证了通过强化学习RL,3B的基础语言模型也能够自我验证和搜索。
更夸张的是,整个实现成本仅不到30美金(约217元)。这意味着,低成本构建具备推理能力的模型已成为可能,预训练模型的巨额投入不再是必需。
这背后也引出了一个深层次的问题:
当一家公司能在缺乏顶级芯片的情况下,以极低成本建立突破性的 AI 模型时,我们不得不重新思考:那些投入的数千亿美元资本支出,真的物有所值吗?
这是OpenAI需要回答的问题。
其次,与OpenAI的闭源路线不同,DeepSeek选择完全开源的路线,将代码、模型权重和训练日志全部公开。
当开源模型性能媲美市场上最强大的模型,甚至在部分领域有所超越时,会吸引越来越多的开发者参与。
原因很简单,开源软件成本低廉,成本越低,开发者的吸引力就越大。因为这将大大降低构建应用程序的成本。
这有点像苹果和安卓的故事。回顾移动互联网时代,定义智能机0到1的是iOS,但让手机行业真正繁荣普惠深入世界各个角落的是安卓。
在Meta 副总裁兼首席人工智能科学家杨立昆看来,DeepSeek的成功,与其说是”中国超越美国”,倒不如说是开源模型正在超越专有模型。
第三,Deepseek的技术突破,背后是AI研发开放性的胜利,这与美国的AI封锁形成了鲜明对比。
具体来说,在一个被GPU短缺和芯片禁运困扰的环境中,一家从未被计入中国“AI 六小龙”的量化基金公司,用少量的硬件配置和几十名年轻的博士生,就完成了跨越式的技术突破。
作为一个后来者,Deepseek的突破虽然离不开自身的努力,但更重要的是,开放的技术交流环境,包括论文、开源代码和各种正式或非正式的人才交流,为创新突破创造了条件。
这揭示了AI行业的另一个关键特性:模型研发具有很强的外部性。特别是在蒸馏与合成数据等技术存在的情况下,后来者的追赶和学习效应异常强劲。这种内卷加外卷的结果,也是模型能力变好,而成本快速下降的原因。
英伟达科学家Jim Fan也提到了开放性对于AI发展的影响:
不管你喜欢与否,AI的未来不会是被“安全委员会”控制的瓶中精灵。每个互联网用户都将能在他们的“烤面包机笔记本”上运行高阶模型。这是历史潮流,我们应该顺势而为,而不是逆流而上。
当美国不断强化AI技术封锁的当下,Deepseek的突破又何尝不是对于美国AI制裁的一种“反噬”。
/ 02 /
找到中国大模型的商业化答案
之前,李开复一直在表达一个观点:
中国做AI的优势从来不是在不设预算上限的情况下去做突破性研究,而是在好、快、便宜和可靠性之间找出最优解。
在相当长时间里,国内大模型一直处于很尴尬的处境,训练阶段不仅被技术封锁,还容易被海外开源降维打击。
如今,Deepseek的突破代表了一种新的可能性——即通过算力效率的提升,实现更繁荣的LLM应用生态。
长期来看,AI应用生态能否跑通,取决于每个国家的成本结构、商业模式、经济模型、产品供给能力,大家各有不同,是个复杂的商业问题。
固然,中国买不到最新的芯片,单位Flops的推理成本永远比海外高,但这也倒逼中国infra出现了各种“工程式创新”,去探索更高效的算力优化方式。
至少从目前看,国内推理优化进展比大家想象要快。一旦算力优化这事跑通,国内大模型在商业层面建立良性循环也不是没有可能。
也就是说,中美未来AI将是两个完全不同的故事:美国押注模型能力提升,中国追求模型效率的极限。
一旦算力优化这事跑通,国内大模型在商业层面建立良性循环也不是没有可能。
也就是说,中美未来AI将是两个完全不同的故事:美国押注模型能力提升,中国追求模型效率的极限。
这就很像当年互联网所发生的故事。过去十年,中国和美国在互联网领域讲了两个完全不同的故事:硅谷加倍投入企业软件,而中国则将赌注押在消费者应用上。
自谷歌和Meta后,美国科技业几乎放弃了在消费互联网上再造流量入口的尝试,转而选择全面拥抱SaaS。软件也完美接力上一个十年中的消费移动应用,成为新十年的主流投资趋势,也跑出了很多优秀公司。
而中国在消费互联网展现了非凡的生命力,字节跳动把短视频生意做到了全世界,美团把本地生活做成了一个千亿美元的生意,而拼多多也成长为阿里、亚马逊一外的电商新一极。
在GPT横空出世之后,美国SaaS公司率先受益,纷纷开始向客户提供AI功能,通过之前建立的客户基础和产品场景直接产生商业回报,大大提升了在AI上创新投入的回报确定性。而中国的AI应用却因为缺乏场景和商业模式而进展缓慢。
随着AI应用的逐渐落地,模型效率将会成为打通中国大模型商业化循环的一把“钥匙”。
文/林白


APP专享直播
热门推荐
2000年以前建成的老旧小区,全部纳入城市更新改造范围 收起2000年以前建成的老旧小区,全部纳入城市更新改造范围
- 2025年03月09日
- 08:08
- APP专享
- 扒圈小记
2,843
不得询问女性求职者婚育情况,多地工会发布法律监督提示函
- 2025年03月10日
- 03:39
- APP专享
- 扒圈小记
2,192
00后主播用DeepSeek直播1天卖出3.3亿元
- 2025年03月10日
- 07:25
- APP专享
- 北京时间
1,574

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 12:00:14
两会期间,全国人大代表、深交所理事长沙雁日前接受记者采访时表示,深交所将以深化创业板改革为牵引,优化发行上市、并购重组和市场定价机制,落实科技型优质创新企业“绿色通道”机制,用好创业板第二套、第三套标准,促进市场资源向新产业(sz300832)新业态新技术领域集聚;发挥好全周期、接力式市场服务体系作用,股、债协同发力,扎实做好金融“五篇大文章”,全方位服务新质生产力。 -
趋势领涨今天 11:04:46
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 10:11:24
【石英股份(sh603688)澄清:购买甘肃新石英矿的传言不属实】石英股份(sh603688)(603688.SH)发布澄清公告,公司关注到网络平台关于购买甘肃新石英矿的传言,现予以澄清说明。2025年3月6日,公司与甘肃省天水市麦积区签订投资意向协议,非传言所说的购买石英矿。该协议的内容为投资建设石英材料产业园项目,总投资不超过6亿元,主要生产高纯石英制品等产品。 -
趋势领涨今天 09:42:18
【南向资金大幅今日净买入296.26亿港元 盈富基金获净买入104亿港元】南向资金大幅净买入296.26亿港元,单日净买入额创历史新高。盈富基金、恒生中国企业、阿里巴巴-W分别获净买入104亿港元、55.34亿港元、29.18亿港元;中芯国际(sh688981)净卖出额居首,金额为4.64亿港元。 -
数字江恩今天 09:30:16
明日来说,看3378点位是否突破。若这里突破,那么今日最低点3347可以是3390回踩最低点。否则,明日都还要继续回踩,回补上周四日线缺口,并且确认3330支撑后,才会再次掉头向上攻击3400整数位。这里的操作,以3330跌破作为休止,只要不触及这个条件,就只有姿势的问题,都会去到3400以上。 -
数字江恩今天 09:30:10
看5分钟图,今天虽然午后开始反弹,但是否达到3390应有的回踩级别还有待观望。这里3390的回踩,只要在3330以上获得支撑,都是正常回踩,说明3297的反弹还会继续向上冲高3400整数位。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:29:55
板块上,今日新能源、新能源车、医药医疗、农林牧渔和军工涨幅靠前,前期的科技和机器人(sz300024)分化严重。部分消费类起来,科技类分化,显示市场风险偏好降低,等待重要事件完成后的走向。 -
数字江恩今天 09:29:49
A股两市今日成交5950 + 9106 = 15056 亿人民币,明显缩量。大盘今日上午回踩、下午反弹,收跌6个跌,略微回补了一点上周四的缺口,但未能完全回补。个股方面,超过60%的个股收红。 -
数字江恩今天 09:29:44
底线思维看待震荡 -
宋谈股经今天 08:33:35
今日共80股涨停,连板股总数10只,17股封板未遂,封板率为82%(不含ST股、退市股)。焦点股方面,虽然华丰股份(sh605100)、大位科技(sh600589)都走出反包行情,但高位股整体依旧偏弱,云鼎科技(sz000409)、海南华铁(sh603300)等人气股跌停,浙江黎明(sh603048)盘中一度上演天地板。