低成本优势,国产大模型震撼华尔街和资本市场,OpenAI有了更强的紧迫感,随即推出更小、性价比更高的新推理模o3-mini。
Sam Altman还在问答中“认错”开源策略,并称公司的领先优势不如以前。
更灵活
1月31日,OpenAI正式发布了新的推理模型o3-mini,该模型更加灵活,用户可根据自己的需求选择不同的模式。

OpenAI介绍称,o3-mini是公司的第一个小型推理模型,它支持开发人员一些高要求的功能,使其可以立即投入生产。
在使用时,开发人员可以根据推理工作量选择低、中和高的模式,以针对其特定用例进行优化。
这种灵活性使o3-mini在应对复杂挑战时能够“更加认真地思考”,或在有延迟问题时优先考虑速度。
定位上,前一版本的o1仍然是OpenAI更广泛的常识推理模型,o3-mini为需要精度和速度的技术领域提供了一种专门的替代方案。
能力上,o3-mini的中等推理选项与o1在数学、编码和科学方面的表现相当,同时提供更快的响应。
专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到其主要错误减少了39%。
在2024年美国数学邀请赛(AIME 2024)的测试中,低等模式的o3-mini准确率与o1-mini差不多,中等模式的准确率能提升到79.6%,与o1模型相当,高等模式o3-mini的准确率能进一步提升至87.3%。

在博士级科学问题(GPQA Diamond)方面,三种不同程度o3-mini的准确率分别为70.6%、76.8%和79.7%。

首次向免费用户开放推理模型
据悉,这是OpenAI推理系列中最新、最具成本效益的模型,现已在ChatGPT和API中提供。
ChatGPT Plus、Team和 Pro的订阅用户可以开始访问OpenAI o3-mini,企业订阅用户将于2月推出。
速率限制上,ChatGPT Plus和Team用户从o1-mini的每天50条提升到o3-mini的150条,Pro用户能无限制地访问o3-mini。
值得注意的是,从今天开始,未订阅的用户还可以尝试使用OpenAI o3-mini,只需要点击reason按钮即可。这意味着,ChatGPT中首次向免费用户提供推理模型。
OpenAI创始人Sam Altman也发文高调官宣o3-mini的推出,并称它可以联网,并显示其思考过程,Plus用户可以使用o3-mini的高端模式。

领先优势不如以前
o3-mini发布后,Sam Altman还带领首席研究员Mark Chen、首席产品官Kevin Weil、工程副总裁Srinivas Narayanan、API 研究主管Michelle Pokrass,和o3-mini团队研究主管Hongyu Ren,在Reddit和网友们来了场互动问答。
在问答中,奥特曼坦诚地表示:“在开源上我们站在了历史的错误一方。”
他透露,内部正在考虑开源策略,继续研发模型,但OpenAI领先优势不会像以前那么大了。
对于特朗普推动的星际之门计划,OpenAI表示,这非常重要。事实表明,计算能力越多,就能建立更好的模型,并制造更有价值的产品。
OpenAI现在同时在两个维度上扩展模型——更大的预训练和更多的强化学习/strawberry训练,这两者都需要计算资源。
此外,为数亿用户提供服务,且随着OpenAI转向更多为您持续工作的智能产品,这些也都需要计算资源。因此可以将Stargate视为工厂,将算力/GPU转化为令人惊叹的产品。
就OpenAI的表态来看,DeepSeek引发的算力需求可能会过剩的争议被证伪了。
OpenAI还透露,预计完整版o3将在超过几周,少于几个月的未来推出。语音模式更新即将到来,会直接叫它GPT-5而不是GPT-5o,目前还没有时间表。


APP专享直播
热门推荐
吕国泉委员:建议每周上班不超44小时 收起吕国泉委员:建议每周上班不超44小时
- 2025年03月04日
- 11:32
- APP专享
- 扒圈小记
31,490
鸿蒙智行称遭某公司操纵上万账号诋毁 该公司多人已被公安机关缉拿归案并被检察院依法批准逮捕
- 2025年03月04日
- 09:55
- APP专享
- 扒圈小记
8,733
建议推迟中考分流时间
- 2025年03月03日
- 05:32
- APP专享
- 北京时间
7,040

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
宋谈股经今天 03:58:38
3月5日午间收评:沪指半日涨0.32%,工程机械板块集体走强1、市场早间窄幅震荡,三大指数涨跌互现。工程机械板块集体走强,山推股份(sz000680)、柳工(sz000528)、厦工股份(sh600815)涨停。商业航天板块走高,合众思壮(sz002383)、本川智能(sz300964)、东方通信(sh600776)、三维通信(sz002115)等涨停。机器人(sz300024)概念股再度活跃,山东矿机(sz002526)、龙溪股份(sh600592)、捷昌驱动(sh603583)、秦川机床(sz000837)等涨停。下跌方面,房地产板块走低,中洲控股(sz000042)接近跌停。个股跌多涨少,沪深京三市超3800股飘绿,上午半天成交9745亿。午间收盘沪指涨0.32%,深成指跌0.13%,创业板跌0.33%。2、板块概念方面,工程机械、通信服务、芯片、算力等板块领涨;光伏设备、固态电池、房地产、AI医疗等板块领跌; 3、两市共1295只个股上涨,45只个股涨停;3738只个股下跌,4只个股跌停;18只股票炸板,炸板率32%。 -
宋谈股经今天 03:57:40
上午A股数据统计!【更多独家重磅股市观点请点击】 -
北京红竹今天 03:39:20
收摊,下午见 -
北京红竹今天 03:39:03
3、缠论打板也是可以的昨天在【每周内参】的文字中,还有过实战教学呢。南方精工(sz002553)昨天涨停,在五分钟级别属于回落段确立调整结束,可涨停一笔都没用,那么很明显向上一笔需要至少五根K线,今天早上是可以博个溢价的,今天早上冲高5个点左右。不管是长线、波段还是短线,缠论都可以灵活应用,只是千万别一根筋,任何交易都没有一定怎么样,都是成功率。 -
北京红竹今天 03:38:58
2、以沪指为例为什么说沪指新高,就要谈大卖点了呢,咱们以沪指为例,新高之后就会构造五分钟级别2个中枢,就像科创50和人形机器人(sz300024)一样,2个中枢之后就不能谈买入了,可以持有也可以逐步减持。2个中枢上涨在缠论中,我们称之为上涨趋势,上涨趋势怎么谈买点呢?如果市场不新高,进行标准调整,在缠论中上涨找卖点,下跌找买点。日线级别向上没走完,三十分钟级别回落段一旦形成,就是波段的买点,后期还是可以期待一波再次上涨。同理,人形机器人(sz300024)也是如此,如果调整几天那么它还能继续玩,如果持续上涨那就没法玩了。 -
北京红竹今天 03:38:54
1、静等市场变化任何交易都需要有根,市场怎么走都是对的,但你的交易要有原则,买是因为什么买的,可以是根据缠论,也可以根据均线,或者资金情绪以及价值投资,都可以的,这些就是你交易的依据。现在对于市场怎么走都可以,比如说继续大涨新高可以的,继续回落完成日线一笔调整也是可以的。就像早评中所说的一样,如果市场出现阳线反包就找大风险的位置,如果继续调整,完成日线回落段,那我们就寻找机会继续干活。而不是去猜测市场今天要怎么走,猜测市场怎么裤子都穿不上。按照缠论标准的结构,跌破昨天低点之后预备干活,不跌破先不干活。休息也是一种交易。 -
冯矿伟今天 03:37:48
冯矿伟:保持耐心昨天动能背离向上,今天动能背离向下,完全相反,最近一段时间基本都是分化比较严重的,波动也是非常频繁的,所以操作上唯一要做的就是坚持规则,否则很容易在波动和分化中受到情绪的影响,情绪化驱使往往节奏就会乱,所以,保持耐心。 -
数字江恩今天 03:34:20
早盘高点之后,双创表现会1F回踩+横盘;大盘在金融电力等权重支持下,回踩+反弹再创新高。大盘依旧在预期的范围内,即昨日高点以上10个点左右。看个股涨跌比更为明显 -
徐小明今天 03:32:32
【盘中直播】下午见 -
趋势起航今天 03:32:28
市场早间窄幅震荡,三大指数涨跌互现。工程机械板块集体走强,山推股份(sz000680)、柳工(sz000528)、厦工股份(sh600815)涨停。商业航天板块走高,合众思壮(sz002383)、本川智能(sz300964)、东方通信(sh600776)、三维通信(sz002115)等涨停。机器人(sz300024)概念股再度活跃,山东矿机(sz002526)、龙溪股份(sh600592)、捷昌驱动(sh603583)、秦川机床(sz000837)等涨停。下跌方面,房地产板块走低,中洲控股(sz000042)盘中跌停。个股跌多涨少,沪深京三市超3800股飘绿,上午半天成交9745亿。午间收盘沪指涨0.32%,深成指跌0.13%,创业板跌0.33%。