移动客户端

新浪科技> 滚动新闻 > 正文

游戏结束了？OpenAI可能已经突破，跨过起飞的最后临界阈值

游戏结束了？OpenAI可能已经突破，跨过起飞的最后临界阈值

2025年01月17日 12:23 机器之心Pro

新浪财经APP 缩小字体放大字体收藏微博微信

OpenAI 的研究达到了可以自我递归改进的程度？

刚刚，X 上的一则帖子爆火，浏览量达到 30 多万。

该推文涉及引领 AI 潮流的 OpenAI。内容显示「OpenAI 递归式自我改进目前在一个盒子里，准确的说是在一个无法破解的盒子！」

我们不难看出，帖子内容突出了 OpenAI 的发展态势，AI可以自我改进，并且很难有人短期内破解。还有一则帖子表示：

「OpenAI 可能已经获得了突破，并最终跨越了临界点，达到一个起飞状态 —— 即智能达到了可以自我递归改进的程度，o4 或 o5 将能够自动化 AI 研发并完成其余工作。

像 o1 这样的模型的大部分意义不在于部署它，而在于为下一个模型生成训练数据。o1 解决的每一个问题现在都是 o3 的训练数据点。

实际上我们有点惊讶于 OpenAI 竟然费心的部署了 o1-pro，而不是将其保持私密并投资计算资源进行更多的 o3 训练等。这显然与 Anthropic 和 Claude-3.6-opus 的开发不同，这个模型没有研发失败，只是 Anthropic 选择将其保持私密，并将其蒸馏成一个小而便宜但很智能的 Claude-3.6-sonnet。

如果你想知道为什么 OpenAI 的人突然在 X 上变得几乎是狂喜地乐观，认真观察从原始 4o 模型到 o3 的改进可能就是原因。

这就像观看 AlphaGo 的 Elo 曲线：它只是不断 up……up……up……

这给我们一种感觉，他们已经获得突破，终于跨越了临界点，即从仅仅是尖端 AI 工作（其他机构将在几年内才能复制），到起飞（破解智能），以至于 o4 或 o5 将能够自动化 AI 研发并完成其余工作。」

在这条推文下，大家的讨论格外热烈。

有人表示「如果这是真的，如果模型不需要人类进行训练，那么《黑客帝国》的结果就不再有效了。」

「我一直是这么想的，OpenAI 没有向公众发布他们最新的优秀模型，他们总是在内部领先 1 或 2 代，因为这为他们提供了开发优势。」

「也许最可怕的不是上述观点是否正确，而是我们无法判断他是否错误。」

就连 OpenAI 研究员 Jason Wei 也跑到评论区发言：魔法，就是当一个不可阻挡的强化学习（RL）优化算法，在充足的计算资源驱动下，遇到一个无法被攻破的强化学习环境时，奇迹就发生了。

Andrej Karpathy 也发表了自己的观点：魔法就是当优化技巧破解了那个环境时，就会出现。

关键词 : 改进 AI

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技

新浪数码

新浪手机

科学探索

苹果汇

新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

新浪首页新浪众测

语音播报返回顶部