全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug

全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug
2025年05月27日 17:54 机器之心Pro

AI 就像一头野驴,跑起来就不停。人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。奥!最新进展是已经能自己生成音画同步的超真实脱口秀了。

不过等人类回过味来,发现海的那边好像是敌人,AI 导致的失业潮仿佛近在咫尺。还记得七年前(那时候 ChatGPT 都还没发布)本科第一次班会上,老师问为什么要选这个专业,有同学回答因为这是最不容易被 AI 替代的职业之一(PS. 我学的是建筑,大家别笑得太大声)。

不知是不是预料之内,AI 最先波及的,竟然是写程序这件事本身。Anthropic 的创始人、CEO Dario Amodei 就曾预测,很快 90% 的代码可能都会由 AI 来编写。

先不说这个预言什么时候会实现,至少他家的产品确实在往这个方向发展。请问编程最厉害的大模型是哪个?虽然没有定论,但 Claude 肯定榜上有名。

BigCodeBench 榜单BigCodeBench 榜单

上个星期刚发布的 Claude 4,让人们的「刻板印象」又加深了一层。

5 月 22 日,Anthropic 推出了全新一代 Claude 4 系列大模型,为代码生成、高级推理和 AI 智能体树立了全新标准。其中,Claude Opus 4 是一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能。

Anthropic 展示了 Claude 4 如何无缝融入人们整个工作日。它拥有三大高级功能:通过 Claude 应用中自定义集成进行深入研究,管理项目,并能在 Claude Code 中独立解决代码任务。

新版本的大模型已经上线,立即吸引了大量程序员前去使用,很多人表示效果出奇的好。

昨天,Reddit 上一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。而 Claude Opus 4 竟然成功地解决了这个问题,并且是唯一能做到的 AI 智能体。

这篇帖子在 X 和 Reddit 引起了热烈的讨论,Anthropic 工程师 Alex Albert 表示,这样的故事可能会越来越多。

有人展开了技术讨论。

也有人认为,这根本就是个 Claude 推广软文。

假如这个故事是真的,我们该如何来看待这件事呢?

大家先别激动,等一等外行的朋友们,我们先来梳理一下要点,这里邀请 Gemini 老师场外援助(因为我也是外行)。

Bug 的来源和难度

这个 Bug 是在四年前一次大规模的代码重构(Re-architecting refactor)中产生的。

  • 代码重构:你可以把它想象成对一栋老房子进行彻底的重新设计和装修。原来的房子可能有很多问题(比如布局不合理、管道老化),装修后解决了这些问题,但可能因为改变了结构,导致某个角落里以前能用的某个特殊电器(比如某个特定型号的灯,只有在特定开关下才用)现在用不了了。

  • 6 万行代码:这说明这次「装修」的规模非常大,非常复杂。

  • 边缘案例(Edge case):这指的是一个非常特殊、不常出现的情况。就像上面说的那个特殊电器,平时很少用,只有在特定条件下才会用到。

  • 着色器(Shader):这是一种专门处理图形和视觉效果的代码。你可以理解为那个「特定型号的灯」。

  • 问题所在:在这次大规模「装修」后,那个「特定型号的灯」在「特定开关下」就不亮了。

Bug 的真正原因

AI 发现,这个问题不是因为「装修」时工人犯了个简单的错误(比如接错了一根线,这叫逻辑 Bug)。而是因为:

  • 那个「特定型号的灯」以前之所以能亮,仅仅是因为老房子旧结构下的一个「巧合」。可能有一根电线无意中搭在了某个地方,正好给它供电了。

  • 在重新设计和装修(改变了架构)时,大家并没有意识到这个「巧合」的存在,也就没有在新的设计里考虑进去。所以,当旧结构消失后,那个「巧合」也消失了,灯自然就不亮了。

  • AI 的厉害之处在于,它不仅看懂了新旧两套复杂的「图纸」,还理解了那个「巧合」是怎么回事,并指出了新设计没有考虑到这个隐藏的依赖关系。

很好!那我们现在来分析一下,AI 在这个过程中起到了什么作用呢?

首先,AI 可以轻松地加载、分析和比较新旧两个版本共计数万甚至数十万行的代码。它不会像人类那样感到疲劳或遗忘细节,可以同时「看到」整个 picture。

像 Claude Opus 4 这样的先进模型拥有巨大的「上下文窗口」,这意味着它可以一次性考虑非常多的信息,并追踪它们之间的复杂关系。

同时,AI 不会带有「它应该如何工作」的偏见。它只是客观地分析旧代码如何运行并产生结果,以及新代码如何运行并产生不同结果,它能发现两者之间最细微的差异。

别忘了,这个过程还需要人类的指导。程序员通过超过 30 个 prompt 来引导 AI。这说明人类的经验和直觉与 AI 强大的分析能力相结合,才能发挥最大效果。人类设定目标、提供背景,AI 则执行繁重的分析工作。

AIFAANG工程师
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片