OpenAI六年元老再发文：全球AI狂飙，我们应该拉手刹还是踩油门？_新浪财经

新智元报道

编辑：乔杨

【新智元导读】前段时间离职后留下公开辞职博客的OpenAI六年元老Miles Brundage最近再发一文，讨论了一个相当热门但棘手的问题：当今的AI发展速度，应该加速、减速还是维持现状？

10月末，OpenAI在政策研究领域方面的6年元老Miles Brundage离职，

10天后，似乎是觉得这篇文章意犹未尽，Brundage再次发文，题为「AI发展是应该加速、放缓，还是保持不变？」

虽然标题是问句，导读的一句话也充满了不可知论色彩，但文章的结论非常明确——谨慎起见，我们应该为全社会的AI发展安装一个「刹车」。

负责托管维基百科的Chris Albon转发了这篇博客并大力赞赏，将Miles Brundage的内容产出与致力于教育领域创业的Andrej Karpathy相提并论。

现在再加上刚离职的Lilian Weng，不得不说，OpenAI的「离职潮」大大丰富了高质量AI博客的创作和产出。

Miles Brundage本科毕业于乔治华盛顿大学，本科期间担任过美国能源部的特别助理，之后前往亚利桑那州立大学攻读博士，研究方向为科技的人类和社会维度，博士后期间曾在牛津大学担任AI政策研究员。

2018年，Miles Brundage加入了刚刚成立3年的OpenAI担任政策方面的研究科学家，之后又在2021年升任研究主管，目前是AGI准备工作的高级顾问。

当今的AI发展

人工智能应该更快、更慢还是保持不变？在回答这个问题之前，我们先简要回顾一下目前的人工智能进步有多快。

2021年出版的一本书——《人工智能简史》（A Brief History of Artificial Intelligence），其中的观点在短短3年后的今天就已经过时了。

比如书中提到，「理解一个故事并回答有关问题」以及「解释照片中发生的事情」，这些任务并没有完全被AI解决；但从GPT、Claude、o1等模型中可以看到，这些方面已经有了很大的进步，甚至很可能超过了人类表现。

举出这些例子并不是为了特意挑刺或抬杠，而是我们要明白一点——严肃的专家经常在人工智能领域犯下严重错误。

虽然某些情况下，人们确实对人工智能的进展过于乐观，但总体而言，近十年来，坚持唱深度学习的反调确实不是一个成功的策略。

计算机已解决和待解决的问题总览，按任务难度排序

另外还有下面这张著名的图表，告诉我们AI的发展如何让各种评估基准越来越快地饱和。

在物理、化学和编码等领域的测试问题上，AI开始超越专家表现，例如基本全新的GPQA问答基准（Google-Proof Question Answering），去年11月刚刚发布，现在却正在被碾压。

在解决谷歌搜索都无法完成的，孤立的、研究生级别的任务上，AI可以比大多数专家做得更好，即使专家有半个小时的时间来解决问题。

在有挑战性的推理基准上，o1大大超过GPT-4o

这种最新的进展的驱动力是AI系统向新范式的过渡，即所谓的「思维链」（chain of thought，CoT），在给出答案之前先思考问题。

GPQA基准仅仅是一个孤立的短期任务，AI系统在需要花费数小时/数天/数周/数年的「长期」任务上还无法超越专家，但科技公司正在积极推动这一点，并极有可能在10年内实现。

这些进步开始与机器人技术相结合，真正智能的AI系统无疑将大大加速机器人技术的发展。

棘手的问题——AI发展的理想配速

尽管在我看来，对AI进步速度的争议会随着时间的推移而减少，但这个问题目前仍然非常模糊，因为能在不同的规模和层面上控制它，比如单个公司、一个国家或一组国家，或全球范围，也区分不同类型。

例如去年发表的一篇文章中，就做出了如下区分：

本文下面的内容主要关注全球范围内AI在纵轴上的扩展/进步，也就是大多数人所理解的AI进步的意思；而且最终我们关心的是全球成果，因此无论人工智能发生在哪里，都应该考虑它的进展。

有些人可能认为这是一个棘手的问题，原因之一是他们认为这是对技术看法的「试金石」，而技术本身就已经是一个很大的争议了。

但事实并非如此。实际上，有很多人总体上支持技术发展，但对人工智能感到担忧。

比如，在这份旨在重视AI风险的倡议书上，不乏各种大力推动技术发展的大佬，比如比尔·盖茨、前OpenAI首席科学家Ilya Sutskever、DeepMind联创兼CEO Demis Hassabis、Anthropic联创兼CEO Dario Amodei、OpenAI CEO Sam Altman等人。