现在的主流宏大叙事是:1、强化学习目前仍然在Scaling Law的早期,这会完全替代Pretrain的算力用量。2、Deepseek等带来的模型降本,最终会大量刺激Token用量,带来应用生态的加速催化,并且总量比训练更大。3、我们会在未来三年内看到AGI,AGI已经不是能不能,已经是什么时候的问题。
这几天看各路Sellside点评和国内自媒体学到了很多宏大叙事专用名词,例如Jevons paradox、Sputnik moment、全球技术扩散、降本带来加速AGI。
太多的宏大叙事对弈难免逃不开空对空的交流。我们是个严肃的研究团队,不想从宏大叙事角度过度讨论。
这篇文章无意去证实或者证伪,只是感觉到在宏大叙事之外,我们也需要尝试用数学/会计方法和调研Data Point验证,作为我们Track进展的锚。
至少从我的感受是经历过去几天的Debate,整个行业变得越来越容易受到刺激,易惊体质,投资的难度也越来越大。
现在的主流宏大叙事是:
强化学习目前仍然在Scaling Law的早期,这会完全替代Pretrain的算力用量。
Deepseek等带来的模型降本,最终会大量刺激Token用量,带来应用生态的加速催化,并且总量比训练更大。
我们会在未来三年内看到AGI,Agent产品替代人类价值,并且贡献大量的消耗。AGI已经不是能不能,已经是什么时候的问题。
这与我们一年前听到的宏大叙事已经有了观感的变化,在一年前的宏大叙事是:
Agent和应用进展是更加渐进的,在推理大规模起量,到训练预算增长变慢之间,可能会有Air Pocket。
Air Pocket的时间点,可能是发现AI刚好能处理例如Coding、Math、客服等相对简单场景,但延伸到更加复杂场景需要更长的时间。
前途非常光明,但过程可能仍然像Gartner曲线表述的,会有一个过热→冷静→成熟的阶段。
宏大叙事的转变是因为:
最主要供应链出货很好,看不出Airpocket。
尽管我们还没有看到应用的爆发,但强化学习基于边际数据改善的逻辑,更容易做垂直场景。
训练的生命周期也因为强化学习进一步延长了。
1 强化学习的进展与天花板
我们在之前的一篇文章详细的讲过强化学习的关键要素:合成数据的数量与质量。
在我们跟踪Scaling Law的过程中,也出现过几次明显的心态变化。
在2024年上半年和之前,Scaling Law没有争议,Pretrain的逻辑比Posttrain更加清晰简单,每一代模型可能需要2-3年,但10x参数量增长带来相应效果提升。
在2024年年中,我们开始在个别案例中,发现强化学习的用量已经超过Pretrain,同时这是一条非常好的生成合成数据的路径,并最终会反哺Pretrain。所以在当时,我们非常乐观,Scaling Law同时有两条驱动曲线。
在2024年四季度我们看到了一些变化:
强化学习反哺Pretrain的路径好像没有之前那么清晰,很难泛化。
尽管进行了无数次尝试,但将额外计算能力投入到Pretrain中的回报已大大减少。这主要是由于高质量原始数据集的枯竭,而合成数据(一种潜在的解决方案)尚未提供令人满意的结果。
但虽然Pretrain撞墙了,Scaling Law仍然有一条处于早期的曲线for强化学习,我们讲到强化学习甚至还没有到GPT3的阶段。
在这一阶段,我们的想法与目前的主流叙事逻辑非常一致。
到了最近一个月,我们又看到了一些变化:
强化学习也存在数据制约,现在的数据生成方法仍然偏向手工化,依赖人工标注。同时,做题的方法也基本只适用于coding和math,很难进一步泛化。
如果继续沿用目前的的合成数据生产方案,往后的边际成本也会越来越高,这会同时出现Data Effiency和Data Quality的问题。
但我们仍然不确定在GB卡带来训练算力指数级提升后,是否能解决Data Effiency问题,同时也通过大量实验解决Data Quality问题,最终通向可泛化的Self-play,突破数据瓶颈,超越人类智能。
另外也强调下,最近讨论热烈的Deepseek R1-zero,和我们所说的self-play 仍有所区别,实际上还是大量依靠了人类生成的数据,本质上还是和人类做了对齐,需要在宏大叙事下正视技术的发展。
所以这里最关键的验证点是在GB到量后,是否大量实验真的能够通向真正的Self-play。这个时间点很近了,可能在Q2-Q3会有清晰地结论(除非大集群GB完全上线会进一步delay)。
在这个验证点前,我们相信所有的大模型公司都要为了验证这一逻辑做大量的算力储备,换言之在这个时间段是对CAPEX相对安全的时间段。
但越临近验证点,不确定性的风险也就越大。
2 降本带来的推理用量刺激-Jevons paradox
燃油、煤炭、电都是典型的Jevons paradox商品,并在不断降价后催生了更大的需求。
IaaS产品也是,头部CSP每年降价5-8%,通过性能相对OnPrem的不断提升,最终带来的稳定的增速。
大模型API仍然非常接近于过去软件行业的PaaS产品。而降本带来用量刺激的逻辑,在PaaS产品的每一个阶段都相伴相生。
我们在CDN、短信、RTC、数据库等不同壁垒的PaaS产品中都听到过类似的故事,“降价会促生更大的用量,带来收入的加速增长。”
最近的一次故事在所有Consumption SaaS中,从2022年开始,所有的客户都开始认为Consumption SaaS的定价太贵了。Consumption SaaS也开始回应客户的需求,并开始为我们所有投资人画下了一个新的大饼,“降价刺激更多的用量,百利而无一害,我们很快会再次加速增长。”
这个再次加速增长短的用了一年时间,长的用了三年时间。
就LLM API,我也觉得最后一定会符合Jevons paradox的终局,但中间的路径可能仍然很曲折。
这需要非常好的节奏把控。目前每个季度平均API的降本大概维持20-30%的水平。这意味着每年API价格会降低70%,换言之需要倍的Token增长维持API收入的稳定。需要6倍的Token增长,维持API收入的翻倍。
造成过去每个季度降本的模型包括GPT4 Turbo、GPT4o、GPT4o mini。
一次过快的价格调整,很可能也会带来1-2个月的Dip(没错,AGI时代已经比之前的PaaS友好多了,毕竟是大时代),然后花更多的时间走出来直至加速。
所以在这轮里可能要去想,如果降本不一定能带来推理算力总盘子立刻加速增长(可能还是渐进的增长),那在叙事变化的时候,什么产品的份额会提升?
同时在目前的场景中也需要区分是更好的模型,还是更便宜的模型在驱动用量。
在多数2C场景,更便宜的价格,意味着更低的试错成本,可以覆盖更多的客户,这一点问题都没有。
但在2B场景,客户付费能力本身就更强,更好的模型才会带来更多的用量,价格带来的弹性可能有限。例如Salesforce Agentforce产品,目前普遍的客户折扣在2-3折,模型的降本很难推动客户去打1折刺激更多量。但模型的能力提升,不光可以带来用量提升,还可以带来更高的ASP。
所以更强的O4、O5模型,或者Orion模型,可能对用量的帮助更大。
回到我们的观测时间点,观测API增长比观测Agent公司的进展更加直接。
这个时间点可能在2-3月。O1正式版在相比O1 Preview降本60%,以及O3出现后,是不是能带来用量的增长。这对推理的弹性非常大。
目前在观察了2个月O1 Preview的使用情况后,还没有看到用量的激增。
3 IT Spending与CAPEX的数学逻辑
主流叙事很容易将两者画等号,但在数学与会计逻辑却有很大的区别。
我们曾经对OpenAI的训练成本进行过估算,这包括24-26年的训练折旧成本分别为3.6B、8.6B与15B。25年的折旧成本可能比OpenAI原本的计划要低,在考虑到如果Stargate项目能顺利融资,25年-26年的折旧成本也会继续上移。
在上述的假设中,尽管训练开支仍然在2026年有70%的增长,但到CAPEX层面已经不再增长了。训练开支更符合收入增长的趋势,我们假设OpenAI在26年仍然有翻倍的收入增长。但毫无疑问在这个算术里,2025年是CAPEX的超级大年,但也留下了更多的问号给2026年。
我们尝试将Startgate的影响加入其中。尚且不了解Stargate与OpenAI原本的CAPEX有多少重合。
第一批1000亿美金StargateTCO中,有15%是资金和运维成本,扣掉后25-27年的CAPEX投资(和上面apple2apple包括场地等)分别是100亿,250亿,500亿。如果25-26年的CAPEX中都各有一半是来自OpenAI过去的CAPEX计划,那意味着去重后的25-26年CAPEX是300亿和375亿,27年会增长更快。
在这个算术场景中,Stargate非常重要,能不能顺利融资和启动决定了2026年的CAPEX叙事。
同样的数学计算也可以出现在Anthropic CEO最近的描述中。
所以这里最大的验证节点是Stargate的融资进展,以及其ROI的合理性。
按照目前的ROI估算,最大的算力供应方Oracle的IRR仅有5-8%。
4 Sputnik moment
这个话题非常Debate,不想过度阐述。
但看起来更像闭源AI的Sputnik moment,而不像美国AI行业的Sputnik moment。
Deepseek与北美大模型的Effiency比较,虽然无法Apple2Apple的给出答案,但观察北美公司的做法,这也确实改变了长期想法。
关于优化数据,OpenAI几乎不做任何披露,Deepseek也很多没写,两边就像开了战争迷雾,只能靠猜进行比对。
但即使OpenAI的Effiency比Deepseek高,OpenAI能够挖掘的算力利用空间也是很大的。
OpenAI有最高效的networking,NV保姆级支持,最好的卡,最好的配置,阶段性在优化少的情况下Effiency比Deepseek高也是可能的,但Deepseek的工程做法还是给了北美大模型公司很多优化上的启示。
更不用提,之前本来在算力应用上就非常粗放的META等大模型公司。
5 最重要的
整个故事中最重要的验证点是什么?
应该是大规模可泛化的Self-play能否跑通。
本文作者:波太金,来源:共识粉碎机,原文标题:《AI宏大叙事的验证逻辑》
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。


APP专享直播
热门推荐
理想汽车高管疑似暗讽华为:起个山海经名字就算技术突破,是不是自己研发的每个人都有一杆秤 收起理想汽车高管疑似暗讽华为:起个山海经名字就算技术突破,是不是自己研发的每个人都有一杆秤
- 2025年02月25日
- 03:46
- APP专享
- 扒圈小记
8,666
重大宣布!俄罗斯开出停战条件
- 2025年02月25日
- 01:44
- APP专享
- 扒圈小记
2,945
特朗普政府正施压主要盟友,寻求加大对华芯片产业限制,外交部回应
- 2025年02月25日
- 07:27
- APP专享
- 北京时间
2,248

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 12:24:48
亚太药业(sz002370)公告称,公司注射用更昔洛韦通过仿制药质量和疗效一致性评价。该药品适用于治疗危及生命或视觉的免疫缺陷患者的巨细胞病毒感染,以及预防器官移植病人的巨细胞病毒感染。通过一致性评价将进一步丰富公司的产品管线,提升市场竞争力,并为后续其他产品开展仿制药一致性评价工作积累经验。 -
趋势领涨今天 10:20:00
【3连板大位科技(sh600589):公司是一家主要从事IDC业务的互联网综合服务提供商 为客户提供机柜租赁等服务】大位科技(sh600589)发布风险提示公告称,公司是一家主要从事IDC业务的互联网综合服务提供商,为客户提供机柜租赁服务、网络传输及增值服务以及相关运维服务。经自查,公司目前经营情况正常,主营业务未发生重大变化,外部市场环境、行业政策亦未发生重大变化。 -
数字江恩今天 09:31:29
只是明天来说,图上3384的回踩并没有5分钟级别的底背离,正常情况下就图上蓝色轮峰线就压制了,哪怕反弹略微扩展也是3376重压,继续向下震荡。至少明天还处于宽幅震荡的向下震荡之中。 -
数字江恩今天 09:31:25
直接看5分钟图,本人昨天告诉短线选择在即,今天就直接下跳空了。这个选择说明了目前大盘依旧处于宽幅震荡阶段,而不是开始了新的主升浪结构,后面的任务就集中在寻找宽幅震荡的低点了。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:31:09
板块来看,工业母机、飞行汽车、光刻机等行业都稍微反弹,但是就活跃个股家数来看,依旧是机器人(sz300024)、人工智能、新能源类领先。 -
数字江恩今天 09:30:56
A股两市今日成交7275 + 11693 = 18968 亿人民币,虽然相对昨日略微缩量,但依然维持在高水平运行。大盘今天大幅向下跳空,然后运行了一个倒V型,上午抵抗、下午回落新低的结构,收跌27个点。个股方面,70%的个股收绿下跌,但大幅下跌个股家数只有昨天的不到一半。 -
数字江恩今天 09:30:51
轮峰线压制震荡 -
趋势领涨今天 09:25:36
【7天5板威尔泰(sz002058):公司股票可能被实施退市风险警示】威尔泰(sz002058)公告称,预计公司2024年度利润总额、净利润、扣除非经常性损益后的净利润三者孰低为负值,且扣除后的营业收入低于3亿元。若2024年度经审计的财务数据触及《深圳证券交易所股票上市规则》第9.3.1条的规定,公司股票交易将在2024年年度报告披露后被实施退市风险警示。 -
北京红竹今天 07:59:28
3、1.9万亿成交额一直保持1.5万亿以上,有卖也有买,成交额很讲课。上涨1537家,下跌3735家,涨停65家,跌停7家。涨跌数据属于调整的一天,这两天我给大家的策略也是周一二注意洗盘,把仓位控制一下。这里给个标准吧,即便出现调整开始信号,也没必要空仓。半仓以下比较舒服,品种首先滞涨品种,高位品种一律出掉,这两天没有降低仓位的,也可以逐步降低一下,没必要等客观跌破防守线。等日线一笔下跌出现在帮仓位提高到7成以上。 -
北京红竹今天 07:59:24
2、主线也有标准了DS和人形机器人(sz300024)同时都有标准了。早盘低开人形机器人(sz300024)也构造了五分钟级别三买,也就是说今天早上的低点就是人形机器人(sz300024)波段反弹的防守线。看明天或者后天了,跌破反弹结束,迎接洗盘,不跌破还能继续上。同样DS,大方向依然没问题,也不谈大风险,只是跟大家说一下节奏的问题。图片这是DS三十分钟级别走势图,横线这里不跌破反弹还可以继续,跌破反弹结束。交易上,目前高位品种要规避,那些滞涨的品种还无所谓,继续持有问题不大。如果板块指数出现调整,首先洗盘的就是这些高位品种,滞涨品种还不一定。