DeepSeek“轰炸”数日,OpenAI出手了

DeepSeek“轰炸”数日,OpenAI出手了
2025年02月01日 22:05 上观新闻

DeepSeek“轰炸”数日,OpenAI终于出手。

当地时间1月31日,人工智能(AI)巨头OpenAI正式发布推理模型o3-mini,支持low、medium和high低中高三种推理难度。

目前ChatGPT Plus、团队和Pro用户可以直接使用o3-mini,企业用户将于2月推出。所有付费用户可以在模型中选择o3-mini-high,以获得生成回复时间稍长的高智能版本。专业用户可以无限制使用o3-mini和o3-mini-high。

同时,免费用户也可以通过勾选 “推理”来使用o3-mini,这也是ChatGPT首次向免费用户提供推理模型。

ChatGPT免费用户也支持推理模型的使用。

作为此次升级的一部分,OpenAI把Plus和团队用户的速率限制,从o1-mini的每天50条信息提高到o3-mini的每天150 条信息。此外,o3-mini还能通过搜索功能查找最新答案,并提供相关的网络链接。OpenAI表示,这是公司在推理模型中整合搜索功能的早期原型。

OpenAI表示o3-mini是公司推理系列中最新、最具成本效益的模型,旨在推动高性价比推理的发展。

与o1类似,o3-mini针对STEM(科学、技术、工程、数学)推理进行了优化。o3-mini-medium的能力在数学、编码和科学方面与o1表现相当,响应速度更快。专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到在困难的现实问题上重大错误减少了39%。o3-mini-medium在一些最具挑战性的推理和智力评估(包括AIME竞赛数学和GPQA博士水平的专家推理)上的表现与o1相当。同时,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。

不过o3-mini暂不支持视觉功能,开发者需要继续使用 o1进行视觉推理任务。

o3-mini与o1在AIME竞赛数学的得分对比。

模型发布后,OpenAI的核心团队也密集回答了网友的问题。

对于DeepSeek,OpenAI CEO山姆·奥特曼(Sam Altman)称:“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将不会像前几年那么大了。

在另一个问答中,奥特曼表示,在开源权重模型和研究成果这个问题上,“我个人认为,我们已经站在了历史的错误一边,需要制定不同的开源策略。OpenAI并非所有人都认同这一观点,这也不是我们当前最首要的事项。

山姆·奥特曼回答网友提问。

当被问及递归自我改进是一个渐进的过程还是一个艰难的起飞过程时,奥特曼表示个人认为快速起飞比几年前想的更有可能。

值得注意的是,此次新发布的o3-mini也展示了回答提问是的思考逻辑。对于思维链展示,有网友询问是否后续是否能看到模型思考的所有token,奥特曼表示很快就会展示一个更有用、更详细的版本,并感谢R1提供的最新信息。

有网友问及o3 mini价格与DeepSeek和Gemini相比仍然没有竞争力时,OpenAI API研究主管米歇尔·波克拉斯(Michelle Pokrass)的回答是:“o3-mini与美国托管的 DeepSeek版本相比具有竞争力。我们认为对于这种级别的智能来说,这是一个真正实惠的选择。”

此外,奥特曼还表示将会在推理模型中增加文件附件功能,同时,随着时间的推移,会考虑减少Plus会员价格的提高。

根据此前发布会上的表述,o3将会在mini正式发布后上线。那么究竟满血版o3何时上线?奥特曼依旧没有给出具体时间,只是称“我猜会是几周以上,几个月以下”。

此前,据外媒报道,OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。本轮融资由软银领投,软银计划最多向OpenAI投资250亿美元。这一融资规模将打破OpenAI上一轮创下的硅谷单轮融资纪录,而公司的估值相较于上一轮的1500亿美元足足翻了一倍。

当地时间2月1日,奥特曼在o3-mini正式发布的消息下面跟帖表示:“很多人更喜欢这个而不是o1,而且它只是mini版本的模型。”

海量资讯、精准解读,尽在新浪财经APP
推理 奥特曼
0条评论|0人参与网友评论
最热评论

APP专享直播

开播时间 | 3-08 20:21
「金融街话两会」对话全国政协委员、申万宏源证券杨成长:视角与对策 三类形态看经济
开播时间 | 3-08 18:00
“我们WOMEN走在前线”暨2025复旦科创先锋论坛
开播时间 | 3-08 15:03
长城基金:当科技遇见闪闪发光的“她”
开播时间 | 3-08 15:00
「女神节特别策划」当科技遇见闪闪发光的“她”——她视角 她力量 她未来
开播时间 | 3-08 14:00
「财经V时刻」从“她经济”到“她力量”,女性消费的下一个黄金赛道在哪里?
开播时间 | 3-08 11:00
「女神节特别策划」博时基金于玥:蛇年投资机遇解析
开播时间 | 3-08 09:00
中国财政政策论坛:从预算报告看2025年财政政策
开播时间 | 3-08 07:53
第二场“部长通道”集中采访活动
开播时间 | 3-07 19:30
Manus一码难求!真需求 or 假狂欢?
开播时间 | 3-07 19:00
前海开源杨德龙:市场反复中的谜团何解
开播时间 | 3-08 20:21
「金融街话两会」对话全国政协委员、申万宏源证券杨成长:视角与对策 三类形态看经济
开播时间 | 3-08 18:00
“我们WOMEN走在前线”暨2025复旦科创先锋论坛
开播时间 | 3-08 15:03
长城基金:当科技遇见闪闪发光的“她”
开播时间 | 3-08 15:00
「女神节特别策划」当科技遇见闪闪发光的“她”——她视角 她力量 她未来
开播时间 | 3-08 14:00
「财经V时刻」从“她经济”到“她力量”,女性消费的下一个黄金赛道在哪里?
开播时间 | 3-08 11:00
「女神节特别策划」博时基金于玥:蛇年投资机遇解析
开播时间 | 3-08 09:00
中国财政政策论坛:从预算报告看2025年财政政策
开播时间 | 3-08 07:53
第二场“部长通道”集中采访活动
开播时间 | 3-07 19:30
Manus一码难求!真需求 or 假狂欢?
开播时间 | 3-07 19:00
前海开源杨德龙:市场反复中的谜团何解
上一页下一页
1/10

热门推荐

视频|网友调侃:海尔老总还没大葱高!海尔老总回应:他说的对!我很高兴为山东大葱代言 收起
视频|网友调侃:海尔老总还没大葱高!海尔老总回应:他说的对!我很高兴为山东大葱代言

视频|网友调侃:海尔老总还没大葱高!海尔老总回应:他说的对!我很高兴为山东大葱代言

  • 2025年03月08日
  • 00:50
  • APP专享
  • 扒圈小记
  • 6,487
APP专享
冲击全球第六!《哪吒2》票房破147亿,将在日本上映!背后A股公司宣布:拟12.2亿买楼

冲击全球第六!《哪吒2》票房破147亿,将在日本上映!背后A股公司宣布:拟12.2亿买楼

  • 2025年03月08日
  • 08:59
  • APP专享
  • 扒圈小记
  • 2,208
APP专享
媒体:美国确认切断乌克兰对卫星图像的访问权限

媒体:美国确认切断乌克兰对卫星图像的访问权限

  • 2025年03月08日
  • 04:35
  • APP专享
  • 北京时间
  • 1,813
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.18 -0.48%
京东方A 4.42 -0.67%
TCL科技 4.77 -0.83%
中远海控 13.74 -0.22%
格力电器 41.86 -0.59%

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 海博思创 688411 19.38
  • 01-16 亚联机械 001395 19.08
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 新浪首页 语音播报 相关新闻 返回顶部