移动客户端

滚动新闻 > 正文

OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

2024年12月21日 14:27 网易新闻

新浪财经APP 缩小字体放大字体收藏微博微信

快科技12月21日消息，OpenAI"连续12日圣诞发布"终于迎来激动人心的大结局，OpenAI推出重磅收官新品，其迄今最强前沿推理模型的升级版——o3。

OpenAI号称o3在一些条件下接近通用人工智能（AGI），共有o3和精简版o3-mini两个版本。

评估显示，o3在软件工程测试中准确率比o1高近47%，竞赛数学测评的准确率比o1高15%，人类博士专家级生化物测试中准确率比o1高近13%。

AGI相关测试中，o3最佳成绩87.5，超过人类水平门槛85，显示迈向类人智能取得突破。

对比之下，GPT-3的评测结果为0%，GPT-4o为5%，而o3一举将成绩提升到87.5%。

OpenAI计划明年初发布o3系列模型，CEO Altman暗示可能一段时间内都不会面向大众上线这类模型，称希望正式发布前，先有一个联邦政府的测试框架，指导监控并减少这类模型的风险。

从本周五开始，OpenAI允许安全研究人员可以注册访问o3 和 o3-mini的预览。

OpenAI12天技术直播要点汇总：

1、推出"满血版"推理模型o1和ChatGPT Pro（每月订阅费200美元）。

2、推出强化微调研究项目，能够使用数十到数千个高质量任务定制模型。

3、正式推出AI视频生成模型Sora Turbo，最高支持1080p 20s视频。

4、发布升级版Canvas创作助手，主打高效编程与写作，向全量用户开放。

5、与苹果合作发布iOS 18.2，Siri、写作工具和Visual Intelligence与ChatGPT深度集成

6、全量上线4o视频通话，能实时对话并理解用户的连续性动作，也有记忆。

7、推出Projects In ChatGPT，可整合ChatGPT的各种功能，便于创建及管理项目。

8、ChatGPT搜索功能全面升级，新增地图集成、实时搜索等功能，向所有用户开放。

9、OpenAI开放满血o1模型API，实时API直接支持WebRTC，且定价猛砍60%。

10、ChatGPT入驻手机，拨打免费号码连接聊天机器人，每月可免费通话15分钟。

11、支持原生应用程序自动化协作功能，与AI Agent玩法相似，能够主动理解用户需求。

12、o1下一代模型o3亮相，推出两个版本，正式版o3以及精简版o3-mini。

海量资讯、精准解读，尽在新浪财经APP

文章关键词：推理人类水平

VIP课程推荐

加载中...

APP专享直播

上一页下一页

1/10

新浪财经公众号

新浪财经公众号

24小时滚动播报最新的财经资讯和视频，更多粉丝福利扫描二维码关注（sinafinance）

股市直播

7X24小时

新浪首页语音播报返回顶部