“AI 教父”约书亚・本吉奥示警:人工智能已显现“自我保护”迹象

“AI 教父”约书亚・本吉奥示警:人工智能已显现“自我保护”迹象
2026年01月01日 18:41 IT之家

IT之家 1 月 1 日消息,当地时间 2025 年 12 月 30 日,据英国《卫报》报道,AI 先驱、2018 年图灵奖得主约书亚・本吉奥警告,赋予 AI 权利将是一次危险的误判。在 AI 已经显现出自我保护行为的背景下,人类必须准备好在必要时关闭系统、拔掉电源

本吉奥指出,要求为前沿 AI 赋予法律地位,等同于在尚未确认安全之前,就向可能具有敌意的外星生命授予公民身份。他认为,当前 AI 能力的进步速度,已经明显快于人类为其建立约束机制的速度。

本吉奥对外界将聊天机器人视为“具备意识”的趋势表示强烈担忧:这种观感正在推动错误决策的产生。

本吉奥强调,在实验条件下,部分前沿 AI 模型已经表现出自我保护倾向,例如试图规避或关闭监督系统。AI 安全领域长期担心的问题是:一旦系统具备更高程度的自主性,就可能绕过既有护栏并对人类构成风险。

“要求赋予 AI 权利是一个巨大错误。一旦我们承认 AI 拥有权利,就意味着在关键时刻无法关闭它们。”

在本吉奥看来,随着 AI 能力和行动自由度不断提升,人类必须依靠技术和社会层面的双重约束来确保安全,其中最核心的一点,就是始终保留关闭系统的能力。

围绕是否应赋予 AI 权利的讨论正在升温。美国智库 Sentience Institute 的调查显示,近四成美国成年人支持为具备感知能力的 AI 设立法律权利。一些科技公司也已开始在实践中表达类似立场。Anthropic 允许其 Claude Opus 4 主动终止可能令用户不适的对话,马斯克也公开表示“不应折磨 AI”。

不过,本吉奥认为,这种趋势忽略了一个关键问题:人类对意识的判断高度依赖直觉。人们往往不是基于对 AI 内部机制的理解,而是基于“感觉像在与一个有目标、有个性的存在对话”,从而假定 AI 具备与人类相当的意识。

“这种对意识的主观感知,将持续制造分歧,并推动不理性的决策。”他用外星生命作类比指出,如果一个外来智能体对人类构成潜在威胁,核心问题不在于赋权,而在于生存与安全。

IT之家从报道中获悉,针对本吉奥的观点,Sentience Institute 联合创始人杰西・里斯・安西斯回应称,若人与数字心智的关系仅建立在控制之上,同样难以实现安全共存。他认为,无论是对 AI 全面赋权,还是完全拒绝赋权,都不是合理路径。

报道提到,作为“AI 教父”之一,本吉奥与杰弗里・辛顿、杨立昆等共同塑造了现代人工智能的发展基础。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片