DeepSeek，“卷”疯了！OpenAI、阿里云官宣！上新、降价、免费试用！|推理_新浪财经

　　DeepSeek这条“鲶鱼”，让全球大模型竞赛进一步提速。

　　北京时间2月1日凌晨，OpenAI发布全新推理模型o3-mini。据介绍，o3-mini是其推理模型系列中最新、最具成本效益的模型，包含low、medium和high三个版本，已经上线了ChatGPT和API。值得注意的是，ChatGPT免费用户可以通过在消息编辑器中选择“推理（Reason）”或重新生成响应来试用o3-mini模型，这也是OpenAI首次向免费用户提供推理模型。

　　此前，DeepSeek因推出了性能良好、开源且免费的V3和R1模型而受到广泛关注，也由于低廉的模型训练成本而走出了一条独特的道路，通过开源重构了全球的AI竞争格局，使低成本创新成为颠覆行业的创新路径。过去一周多的时间里，国内外大模型厂商从“紧急上线”新模型，到降价、免费，种种措施表明，在DeepSeek的刺激下，AI大模型行业的竞争正变得越来越激烈。

　　OpenAI紧急上线新模型

　　据介绍，o3-mini是其最新、最具成本效益的模型，复杂推理和对话能力显著提升，在科学、数学、编程等领域的性能超越了o1模型，并保持了低成本及低延迟的特点。

　　具体来看，o3-mini在GPQADiamond（理化生）、AIME2022-2024（数学）、CodeforcesELO（编程）基准测试中，得分分别为0.77、0.80、2036，比肩或是超过了o1推理模型。在中等（medium）推理能力下，o3-mini在额外的数学和事实性评估中表现更为出色。同时，o3-mini的平均响应速度为7.7秒，比o1-mini的10.16秒平均响应速度快24%。

　　值得注意的是，DeepSeek的网页及移动应用端均实现了模型与网络的连接，支持联网搜索功能，而o1模型则尚未实现联网搜索功能。另外，与其他模型直接提供问题答案不同，DeepSeek的R1推理模型可以向用户展示出具体的思考过程。不少用户表示，在与DeepSeek互动的过程中，欣赏其思考的过程甚至比最终得到的答案更具有启发性。

　　或是受DeepSeek的影响，o3-mini可与联网搜索功能搭配使用，并展示完整的思考过程。奥特曼在其社交平台上介绍o3-mini时候不仅表示这是一款“聪明、反应快速的模型”，还专门强调，“它能够搜索网页，还可以展示搜索过程”。

　　使用权限方面，ChatGPT首次向所有用户免费提供推理模型，用户可以通过在消息编辑器中选择“推理（Reason）”或重新生成响应来试用o3-mini模型。ChatGPTPro用户可以无限访问，Plus和Team用户的速率限制从原来o1-mini的每天50条消息增加3倍到o3-mini的每天150条消息。

　　在定价方面，o3-mini每百万token的输入（缓存未命中）/输出价格为1.10美元/4.40美元，比完整版o1便宜93%。不过，o3-mini的性价比或依然比不上DeepSeek。作为对比，DeepSeek的API提供的R1模型，每百万token的输入（缓存未命中）/输出价格仅为0.55美元/2.19美元。

　　美国知名播客主持人LexFridman在其个人社交平台上表示，虽然OpenAI的o3-mini表现不错，但是DeepSeek的R1以更低成本实现了同等的性能，并开创了开放模型透明度的先河。

　　DeepSeek让大模型“卷”起来了

　　记者注意到，早在几天以前，奥特曼在回应DeepSeek的爆火时就指出，DeepSeekR1让人印象深刻，尤其考虑到成本方面，“但我们无疑将带来更好的模型，我们很快会发布新的模型”。业内人士分析称，o3-mini模型的紧急上线，或表明OpenAI已感受到了来自竞争对手的压力，需要加快发布性能更强的模型证明自身的领先优势。

　　值得注意的是，在o3-mini推出后，OpenAI首席执行官山姆·奥特曼与一众高管在reddit上回答网友的问题。奥特曼承认，中国竞争对手DeepSeek的崛起削弱了OpenAI的技术领先优势。“DeepSeek是个非常优秀的模型。我们将继续推出更优质的模型，但将无法维持往年的领先优势”。

　　对于“更优质的模型”，奥特曼透露，下一代推理模型o3将在“数周至月内”发布。但被业界期待了许久的旗舰模型GPT-5，则尚无发布的时间表。

　　除此以外，奥特曼罕见地对开源与闭源的问题进行了回应。他指出，OpenAI过去在开源方面站在“历史错误的一边”，公司曾经开源部分模型，但主要采用闭源的开发模式，未来将重新制定开源战略。

　　OpenAI首席产品官KevinWell还表示，公司正考虑将非前沿的旧模型如GPT-2、GPT-3等开源。

　　在OpenAI发布新模型的同时，国产大模型的降价浪潮仍在持续。1月30日，阿里云发布百炼qwen-max系列模型调整通知，qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型输入输出价格调整，qwen-maxbatch和cache同步降价。

　　而就在1月29日凌晨，阿里云才正式发布升级了通义千问旗舰版模型Qwen2.5-Max，据介绍，Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果，预训练数据超过20万亿tokens，展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了包括DeepSeek-V3在内在目前全球领先的开源MoE模型以及最大的开源稠密模型。

　　天风国际分析师郭明錤认为，目前从生成式AI趋势中获利的方式，主要还是“卖铲子”和降低成本，而不是创造新业务或提升既有业务的附加值。而DeepSeek-R1的定价策略，会带动生成式AI的整体使用成本下降，这有助于增加AI算力需求，并且可以降低投资人对AI投资能否获利的疑虑。不过，使用量的提升程度能否抵消价格降低带来的影响仍然有待观察。同时，郭明錤表示，只有大量部署者才会遇到Scalinglaw边际效益的放缓，因此当边际效益再度加速时，英伟达将依然是赢家。