DeepSeek这条“鲶鱼”,让全球大模型竞赛进一步提速。
北京时间2月1日凌晨,OpenAI发布全新推理模型o3-mini。据介绍,o3-mini是其推理模型系列中最新、最具成本效益的模型,包含low、medium和high三个版本,已经上线了ChatGPT和API。值得注意的是,ChatGPT免费用户可以通过在消息编辑器中选择“推理(Reason)”或重新生成响应来试用o3-mini模型,这也是OpenAI首次向免费用户提供推理模型。
此前,DeepSeek因推出了性能良好、开源且免费的V3和R1模型而受到广泛关注,也由于低廉的模型训练成本而走出了一条独特的道路,通过开源重构了全球的AI竞争格局,使低成本创新成为颠覆行业的创新路径。过去一周多的时间里,国内外大模型厂商从“紧急上线”新模型,到降价、免费,种种措施表明,在DeepSeek的刺激下,AI大模型行业的竞争正变得越来越激烈。
OpenAI紧急上线新模型
据介绍,o3-mini是其最新、最具成本效益的模型,复杂推理和对话能力显著提升,在科学、数学、编程等领域的性能超越了o1模型,并保持了低成本及低延迟的特点。
具体来看,o3-mini在GPQADiamond(理化生)、AIME2022-2024(数学)、CodeforcesELO(编程)基准测试中,得分分别为0.77、0.80、2036,比肩或是超过了o1推理模型。在中等(medium)推理能力下,o3-mini在额外的数学和事实性评估中表现更为出色。同时,o3-mini的平均响应速度为7.7秒,比o1-mini的10.16秒平均响应速度快24%。

值得注意的是,DeepSeek的网页及移动应用端均实现了模型与网络的连接,支持联网搜索功能,而o1模型则尚未实现联网搜索功能。另外,与其他模型直接提供问题答案不同,DeepSeek的R1推理模型可以向用户展示出具体的思考过程。不少用户表示,在与DeepSeek互动的过程中,欣赏其思考的过程甚至比最终得到的答案更具有启发性。
或是受DeepSeek的影响,o3-mini可与联网搜索功能搭配使用,并展示完整的思考过程。奥特曼在其社交平台上介绍o3-mini时候不仅表示这是一款“聪明、反应快速的模型”,还专门强调,“它能够搜索网页,还可以展示搜索过程”。

使用权限方面,ChatGPT首次向所有用户免费提供推理模型,用户可以通过在消息编辑器中选择“推理(Reason)”或重新生成响应来试用o3-mini模型。ChatGPTPro用户可以无限访问,Plus和Team用户的速率限制从原来o1-mini的每天50条消息增加3倍到o3-mini的每天150条消息。
在定价方面,o3-mini每百万token的输入(缓存未命中)/输出价格为1.10美元/4.40美元,比完整版o1便宜93%。不过,o3-mini的性价比或依然比不上DeepSeek。作为对比,DeepSeek的API提供的R1模型,每百万token的输入(缓存未命中)/输出价格仅为0.55美元/2.19美元。
美国知名播客主持人LexFridman在其个人社交平台上表示,虽然OpenAI的o3-mini表现不错,但是DeepSeek的R1以更低成本实现了同等的性能,并开创了开放模型透明度的先河。
DeepSeek让大模型“卷”起来了
记者注意到,早在几天以前,奥特曼在回应DeepSeek的爆火时就指出,DeepSeekR1让人印象深刻,尤其考虑到成本方面,“但我们无疑将带来更好的模型,我们很快会发布新的模型”。业内人士分析称,o3-mini模型的紧急上线,或表明OpenAI已感受到了来自竞争对手的压力,需要加快发布性能更强的模型证明自身的领先优势。
值得注意的是,在o3-mini推出后,OpenAI首席执行官山姆·奥特曼与一众高管在reddit上回答网友的问题。奥特曼承认,中国竞争对手DeepSeek的崛起削弱了OpenAI的技术领先优势。“DeepSeek是个非常优秀的模型。我们将继续推出更优质的模型,但将无法维持往年的领先优势”。
对于“更优质的模型”,奥特曼透露,下一代推理模型o3将在“数周至月内”发布。但被业界期待了许久的旗舰模型GPT-5,则尚无发布的时间表。
除此以外,奥特曼罕见地对开源与闭源的问题进行了回应。他指出,OpenAI过去在开源方面站在“历史错误的一边”,公司曾经开源部分模型,但主要采用闭源的开发模式,未来将重新制定开源战略。
OpenAI首席产品官KevinWell还表示,公司正考虑将非前沿的旧模型如GPT-2、GPT-3等开源。
在OpenAI发布新模型的同时,国产大模型的降价浪潮仍在持续。1月30日,阿里云发布百炼qwen-max系列模型调整通知,qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型输入输出价格调整,qwen-maxbatch和cache同步降价。
而就在1月29日凌晨,阿里云才正式发布升级了通义千问旗舰版模型Qwen2.5-Max,据介绍,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了包括DeepSeek-V3在内在目前全球领先的开源MoE模型以及最大的开源稠密模型。
天风国际分析师郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。不过,使用量的提升程度能否抵消价格降低带来的影响仍然有待观察。同时,郭明錤表示,只有大量部署者才会遇到Scalinglaw边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。
责任编辑:赵思远








APP专享直播
热门推荐
男子往火锅里小便?海底捞:已报案,无论是否摆拍都将追究法律责任 收起男子往火锅里小便?海底捞:已报案,无论是否摆拍都将追究法律责任
- 2025年03月06日
- 09:33
- APP专享
- 扒圈小记
5,221
中乌签署乌克兰豌豆、野生水产品输华议定书
- 2025年03月06日
- 23:31
- APP专享
- 扒圈小记
3,120
普京:在乌克兰问题上 俄罗斯不会向任何人屈服
- 2025年03月06日
- 18:47
- APP专享
- 北京时间
1,341

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
东方红陈晨今天 05:19:58
这还是拉了白酒拉动指数了,不停的折腾没涨的板块,稳定大盘,千万别是因为开会的原因,那会后就麻烦 -
趋势起航今天 05:19:50
港股持续走高,恒生指数涨幅扩大至1%,消费股、科技股领涨,恒生科技指数涨近2% -
北京红竹今天 05:19:38
沪指新高,但五分钟级别顶着背离呢 -
徐善武今天 05:19:35
指数创了3140点反弹以来的新高 -
趋势起航今天 05:18:48
海南椰岛(sh600238)涨停! -
徐小明今天 05:18:43
【盘中直播】120分钟有了新的顶部钝化 -
宋谈股经今天 05:16:58
【白酒板块震荡反弹 迎驾贡酒(sh603198)涨超5%】3月7日,午后迎驾贡酒(sh603198)、岩石股份(sh600696)涨超5%,今世缘(sh603369)、泸州老窖(sz000568)、水井坊(sh600779)、五粮液(sz000858)、古井贡酒(sz000596)、山西汾酒(sh600809)等纷纷跟涨。消息面上,中信建投(sh601066)表示,当前烟酒终端已经处于库存低位,需求修复将能快速传导至酒企,龙头白酒仍有较好的成长空间,全年预期或逐步提升。 -
数字江恩今天 05:16:18
目前市场都在犹豫、等待,这里到底是和上周的3388一样,还是真要拉上去3400上震荡,等待3390突破确认。3388前高,都到边上了,突破一下才有诚意 -
冯矿伟今天 05:15:43
从能量守恒到偏离 -
徐善武今天 05:15:19
总体来说,今天的大盘是比较平稳的,虽然主力净流出增大,但多数个股表现还是非常不错,特别是机器人(sz300024)、AI相关的板块,这几天都在资金流入做多。所以还是那句话,如果达到预期了,看情况选择进退,这个市场就分几类人,有贪心的,有胆小的,有冲动的,有谨慎的,有知足的等等,所以就按照自己的来就好了。下午的行情我还是保持早上的观点,今天只会是一个冲高回落的走势,但回落的空间不会太大,因为现在大趋势依然是向上的,所以尾盘还是有希望收一根小小十字星阳线。