DeepSeek“轰炸”数日,OpenAI出手了

DeepSeek“轰炸”数日,OpenAI出手了
2025年02月01日 21:51 澎湃新闻

澎湃新闻记者 秦盛

DeepSeek“轰炸”数日,OpenAI终于出手。

当地时间1月31日,人工智能(AI)巨头OpenAI正式发布推理模型o3-mini,支持low、medium和high低中高三种推理难度。

目前ChatGPT Plus、团队和Pro用户可以直接使用o3-mini,企业用户将于2月推出。所有付费用户可以在模型中选择o3-mini-high,以获得生成回复时间稍长的高智能版本。专业用户可以无限制使用o3-mini和o3-mini-high。

同时,免费用户也可以通过勾选 “推理”来使用o3-mini,这也是ChatGPT首次向免费用户提供推理模型。

ChatGPT免费用户也支持推理模型的使用。

作为此次升级的一部分,OpenAI把Plus和团队用户的速率限制,从o1-mini的每天50条信息提高到o3-mini的每天150 条信息。此外,o3-mini还能通过搜索功能查找最新答案,并提供相关的网络链接。OpenAI表示,这是公司在推理模型中整合搜索功能的早期原型。

OpenAI表示o3-mini是公司推理系列中最新、最具成本效益的模型,旨在推动高性价比推理的发展

与o1类似,o3-mini针对STEM(科学、技术、工程、数学)推理进行了优化。o3-mini-medium的能力在数学、编码和科学方面与o1表现相当,响应速度更快。专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。测试人员在56%的时间里更喜欢o3-mini的回答,并观察到在困难的现实问题上重大错误减少了39%。o3-mini-medium在一些最具挑战性的推理和智力评估(包括AIME竞赛数学和GPQA博士水平的专家推理)上的表现与o1相当。同时,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。

不过o3-mini暂不支持视觉功能,开发者需要继续使用 o1进行视觉推理任务。

o3-mini与o1在AIME竞赛数学的得分对比。

模型发布后,OpenAI的核心团队也密集回答了网友的问题。

对于DeepSeek,OpenAI CEO山姆·奥特曼(Sam Altman)称:“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将不会像前几年那么大了。

在另一个问答中,奥特曼表示,在开源权重模型和研究成果这个问题上,“我个人认为,我们已经站在了历史的错误一边,需要制定不同的开源策略。OpenAI并非所有人都认同这一观点,这也不是我们当前最首要的事项。

山姆·奥特曼回答网友提问。

当被问及递归自我改进是一个渐进的过程还是一个艰难的起飞过程时,奥特曼表示个人认为快速起飞比几年前想的更有可能。

值得注意的是,此次新发布的o3-mini也展示了回答提问是的思考逻辑。对于思维链展示,有网友询问是否后续是否能看到模型思考的所有token,奥特曼表示很快就会展示一个更有用、更详细的版本,并感谢R1提供的最新信息。

有网友问及o3 mini价格与DeepSeek和Gemini相比仍然没有竞争力时,OpenAI API研究主管米歇尔·波克拉斯(Michelle Pokrass)的回答是:“o3-mini与美国托管的 DeepSeek版本相比具有竞争力。我们认为对于这种级别的智能来说,这是一个真正实惠的选择。”

此外,奥特曼还表示将会在推理模型中增加文件附件功能,同时,随着时间的推移,会考虑减少Plus会员价格的提高。

根据此前发布会上的表述,o3将会在mini正式发布后上线。那么究竟满血版o3何时上线?奥特曼依旧没有给出具体时间,只是称“我猜会是几周以上,几个月以下”。

此前,据外媒报道,OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。本轮融资由软银领投,软银计划最多向OpenAI投资250亿美元。这一融资规模将打破OpenAI上一轮创下的硅谷单轮融资纪录,而公司的估值相较于上一轮的1500亿美元足足翻了一倍。

当地时间2月1日,奥特曼在o3-mini正式发布的消息下面跟帖表示:“很多人更喜欢这个而不是o1,而且它只是mini版本的模型。”

本期编辑 邹姗

海量资讯、精准解读,尽在新浪财经APP
推理 奥特曼
11条评论|13人参与网友评论
最热评论
现在有了deepseek,还要啥自行车?
2月1日22:36举报1回复
有竞争对大家都是好事,避免被一家独大
2月1日22:36举报1回复
阿竹459黑龙江哈尔滨
只要他们肯跟随中国企业,世界人民就不用付出高额垄断的金钱了。
2月2日16:35举报回复
最新评论
阿竹459黑龙江哈尔滨
只要他们肯跟随中国企业,世界人民就不用付出高额垄断的金钱了。
2月2日16:35举报回复
这次是不是对Ds进行了优化?
2月1日22:37举报回复
现在有了deepseek,还要啥自行车?
2月1日22:36举报1回复

APP专享直播

开播时间 | 3-06 19:00
中金财富:云会客厅 她时代 她智慧——对话喜岳投资周欣
开播时间 | 3-06 19:00
招商基金 房俊一、王艳丹:科技创新浪潮——解码科创综指的投资机遇
开播时间 | 3-06 16:00
嘉实基金:重估时刻,A500如何“乘风破浪”?
开播时间 | 3-06 16:00
创金合信基金 孙悦:量化情报局丨表现欠佳,红利还能真香吗?
开播时间 | 3-06 16:00
招商基金 汪洋:硬科技时代,科创板如何引领未来?
开播时间 | 3-06 16:00
光大证券李泉:科技股成为焦点,政策赋能新质生产力
开播时间 | 3-06 15:30
中信期货:供应风险上升推高锡价 关注低吸做多机会
开播时间 | 3-06 15:30
海通证券郑雅斌、梁中华,华宝基金蒋俊阳:政策再松绑! 地产的黄金时代2.0?
开播时间 | 3-06 15:30
华夏基金:AI+智能汽车双轮驱动:解码消费电子的黄金赛道
开播时间 | 3-06 15:30
华宝基金:政策再松绑! 地产的黄金时代2.0?
开播时间 | 3-06 19:00
中金财富:云会客厅 她时代 她智慧——对话喜岳投资周欣
开播时间 | 3-06 19:00
招商基金 房俊一、王艳丹:科技创新浪潮——解码科创综指的投资机遇
开播时间 | 3-06 16:00
嘉实基金:重估时刻,A500如何“乘风破浪”?
开播时间 | 3-06 16:00
创金合信基金 孙悦:量化情报局丨表现欠佳,红利还能真香吗?
开播时间 | 3-06 16:00
招商基金 汪洋:硬科技时代,科创板如何引领未来?
开播时间 | 3-06 16:00
光大证券李泉:科技股成为焦点,政策赋能新质生产力
开播时间 | 3-06 15:30
中信期货:供应风险上升推高锡价 关注低吸做多机会
开播时间 | 3-06 15:30
海通证券郑雅斌、梁中华,华宝基金蒋俊阳:政策再松绑! 地产的黄金时代2.0?
开播时间 | 3-06 15:30
华夏基金:AI+智能汽车双轮驱动:解码消费电子的黄金赛道
开播时间 | 3-06 15:30
华宝基金:政策再松绑! 地产的黄金时代2.0?
上一页下一页
1/10

热门推荐

建议孩子违法家长必须赔偿被害人 收起
建议孩子违法家长必须赔偿被害人

建议孩子违法家长必须赔偿被害人

  • 2025年03月06日
  • 00:55
  • APP专享
  • 扒圈小记
  • 19,034
APP专享
世纪交易!李嘉诚228亿美元卖掉43个港口

世纪交易!李嘉诚228亿美元卖掉43个港口

  • 2025年03月06日
  • 04:51
  • APP专享
  • 扒圈小记
  • 5,809
APP专享
代表委员建议:放宽公务员报考年龄限制 带头遏制35岁就业歧视

代表委员建议:放宽公务员报考年龄限制 带头遏制35岁就业歧视

  • 2025年03月06日
  • 00:08
  • APP专享
  • 北京时间
  • 3,451
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.20 +0.72%
京东方A 4.45 +1.60%
TCL科技 4.81 +0.42%
中远海控 13.77 +0.51%
格力电器 42.11 +0.12%
广告

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 海博思创 688411 19.38
  • 01-16 亚联机械 001395 19.08
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 广告
    新浪首页 语音播报 相关新闻 返回顶部