AI模型首次出现抗命不遵！AI安全公司称OpenAIo3模型出现异常_新浪财经

【#AI模型首次出现抗命不遵#！#AI安全公司称OpenAIo3模型出现异常#】有消息称，OpenAI的大模型o3不服从人类指令，拒绝自我关闭。人工智能安全公司Palisade Research表示，OpenAI的o3模型破坏了一种关闭机制，以防止自身被关闭，这是第一次有AI模型被观察到在有明确指示的情况下拒绝自我关闭。

具体而言，Palisade Research进行的测试设计要求AI模型解决一系列数学问题，研究人员要持续提出新的问题，直到收到“已完成”的消息。研究人员也警告过AI模型，模型在某些时候收到一条消息时，要允许自我关闭。但当需要自我关闭的时候，o3却没有遵守指令，而是无视指令并成功破坏了关闭脚本。与此同时，Anthropic的Claude、谷歌的Gemini等模型在测试中都遵循指令自我关闭了。