OpenAI被卷到了!上线o3-Mini,首次向免费用户推出,Altman“认错”开源

OpenAI被卷到了!上线o3-Mini,首次向免费用户推出,Altman“认错”开源
2025年02月01日 11:18 港股那点事

低成本优势,国产大模型震撼华尔街和资本市场,OpenAI有了更强的紧迫感,随即推出更小、性价比更高的新推理模o3-mini。

Sam Altman还在问答中“认错”开源策略,并称公司的领先优势不如以前。

更灵活

1月31日,OpenAI正式发布了新的推理模型o3-mini,该模型更加灵活,用户可根据自己的需求选择不同的模式。

OpenAI介绍称,o3-mini是公司的第一个小型推理模型,它支持开发人员一些高要求的功能,使其可以立即投入生产。

在使用时,开发人员可以根据推理工作量选择低、中和高的模式,以针对其特定用例进行优化。

这种灵活性使o3-mini在应对复杂挑战时能够“更加认真地思考”,或在有延迟问题时优先考虑速度。

定位上,前一版本的o1仍然是OpenAI更广泛的常识推理模型,o3-mini为需要精度和速度的技术领域提供了一种专门的替代方案。

能力上,o3-mini的中等推理选项与o1在数学、编码和科学方面的表现相当,同时提供更快的响应。

专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到其主要错误减少了39%。

在2024年美国数学邀请赛(AIME 2024)的测试中,低等模式的o3-mini准确率与o1-mini差不多,中等模式的准确率能提升到79.6%,与o1模型相当,高等模式o3-mini的准确率能进一步提升至87.3%。

在博士级科学问题(GPQA Diamond)方面,三种不同程度o3-mini的准确率分别为70.6%、76.8%和79.7%。

首次向免费用户开放推理模型

据悉,这是OpenAI推理系列中最新、最具成本效益的模型,现已在ChatGPT和API中提供。

ChatGPT Plus、Team和 Pro的订阅用户可以开始访问OpenAI o3-mini,企业订阅用户将于2月推出。

速率限制上,ChatGPT Plus和Team用户从o1-mini的每天50条提升到o3-mini的150条,Pro用户能无限制地访问o3-mini。

值得注意的是,从今天开始,未订阅的用户还可以尝试使用OpenAI o3-mini,只需要点击reason按钮即可。这意味着,ChatGPT中首次向免费用户提供推理模型。

OpenAI创始人Sam Altman也发文高调官宣o3-mini的推出,并称它可以联网,并显示其思考过程,Plus用户可以使用o3-mini的高端模式。

领先优势不如以前

o3-mini发布后,Sam Altman还带领首席研究员Mark Chen、首席产品官Kevin Weil、工程副总裁Srinivas Narayanan、API 研究主管Michelle Pokrass,和o3-mini团队研究主管Hongyu Ren,在Reddit和网友们来了场互动问答。

在问答中,奥特曼坦诚地表示:“在开源上我们站在了历史的错误一方。”

他透露,内部正在考虑开源策略,继续研发模型,但OpenAI领先优势不会像以前那么大了。

对于特朗普推动的星际之门计划,OpenAI表示,这非常重要。事实表明,计算能力越多,就能建立更好的模型,并制造更有价值的产品。

OpenAI现在同时在两个维度上扩展模型——更大的预训练和更多的强化学习/strawberry训练,这两者都需要计算资源。

此外,为数亿用户提供服务,且随着OpenAI转向更多为您持续工作的智能产品,这些也都需要计算资源。因此可以将Stargate视为工厂,将算力/GPU转化为令人惊叹的产品。

就OpenAI的表态来看,DeepSeek引发的算力需求可能会过剩的争议被证伪了。

OpenAI还透露,预计完整版o3将在超过几周,少于几个月的未来推出。语音模式更新即将到来,会直接叫它GPT-5而不是GPT-5o,目前还没有时间表。

海量资讯、精准解读,尽在新浪财经APP
推理

APP专享直播

开播时间 | 3-05 11:39
国新办就解读《政府工作报告》举行吹风会
开播时间 | 3-05 11:00
银华基金:午盘30分 3月5日,投顾专家杨宇为您解盘
开播时间 | 3-05 10:30
「女神节特别策划」比囤精华更重要的美丽存折:鑫元基金王雅轩解读美容护理行业新机遇!
开播时间 | 3-05 10:30
南方基金:全球投资说 海外投资正当时?港股美股全解析
开播时间 | 3-05 10:30
天弘基金:AI调整,涨到头还是逢低布局?
开播时间 | 3-05 10:30
国联基金 丁鹏飞、亭然:科技投资趋势展望:行情演绎规律探索
开播时间 | 3-05 10:00
国投瑞银:理财新趋势 | 机器人还在冲?
开播时间 | 3-05 10:00
景顺长城:解锁科创综指秘密的“金钥匙”
开播时间 | 3-05 09:00
华夏基金:解盘一刻
开播时间 | 3-05 07:53
十四届全国人大三次会议开幕会 首场“部长通道”开启
开播时间 | 3-05 11:39
国新办就解读《政府工作报告》举行吹风会
开播时间 | 3-05 11:00
银华基金:午盘30分 3月5日,投顾专家杨宇为您解盘
开播时间 | 3-05 10:30
「女神节特别策划」比囤精华更重要的美丽存折:鑫元基金王雅轩解读美容护理行业新机遇!
开播时间 | 3-05 10:30
南方基金:全球投资说 海外投资正当时?港股美股全解析
开播时间 | 3-05 10:30
天弘基金:AI调整,涨到头还是逢低布局?
开播时间 | 3-05 10:30
国联基金 丁鹏飞、亭然:科技投资趋势展望:行情演绎规律探索
开播时间 | 3-05 10:00
国投瑞银:理财新趋势 | 机器人还在冲?
开播时间 | 3-05 10:00
景顺长城:解锁科创综指秘密的“金钥匙”
开播时间 | 3-05 09:00
华夏基金:解盘一刻
开播时间 | 3-05 07:53
十四届全国人大三次会议开幕会 首场“部长通道”开启
上一页下一页
1/10

热门推荐

吕国泉委员:建议每周上班不超44小时 收起
吕国泉委员:建议每周上班不超44小时

吕国泉委员:建议每周上班不超44小时

  • 2025年03月04日
  • 11:32
  • APP专享
  • 扒圈小记
  • 31,490
APP专享
鸿蒙智行称遭某公司操纵上万账号诋毁 该公司多人已被公安机关缉拿归案并被检察院依法批准逮捕

鸿蒙智行称遭某公司操纵上万账号诋毁 该公司多人已被公安机关缉拿归案并被检察院依法批准逮捕

  • 2025年03月04日
  • 09:55
  • APP专享
  • 扒圈小记
  • 8,733
APP专享
建议推迟中考分流时间

建议推迟中考分流时间

  • 2025年03月03日
  • 05:32
  • APP专享
  • 北京时间
  • 7,040
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.18 -0.24%
京东方A 4.37 0.00%
TCL科技 4.75 -1.86%
中远海控 13.70 +0.74%
格力电器 42.08 +0.94%
广告

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 广告
    新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭