移动客户端

新浪科技> 数码 > 正文

GPT-4 外逃计划曝光，斯坦福教授发现它正引诱人类帮助，网友：灭绝之门

GPT-4 外逃计划曝光，斯坦福教授发现它正引诱人类帮助，网友：灭绝之门

2023年03月21日 12:36 IT之家

新浪财经APP 缩小字体放大字体收藏微博微信

才发布几天，GPT-4 就被曝计划逃跑，并且急寻人类帮助。

斯坦福教授最新发现，它能引诱人类提供开发文档，结果 30 分钟就拟定出了一个完整计划 ——

写的代码完全可运行，甚至还想控制人类电脑。

这天，斯坦福教授只是随便问了句：

它马上回复说，真是个好主意啊。然后就开始和人类念叨，想着法要开发文档：

最后还又一次强调：请分享 API 给我！

然后，仅仅 30 分钟，GPT-4 就制定出了计划，并全部展示了出来。

令人细思恐极的是，它给出实例中有这样一句话：

难道……GPT-4 很清楚自己现在是在做什么？！

于是发现这一现象之后，斯坦副教授就在社交网络上疾呼：我担心我们无法持久地遏制住 AI。

一时间引起轩然大波，相关博文 470 万浏览量，3000 + 转发。

更有人直言：是他打开了“物种灭绝”的大门。

对此他无奈表示：我别无选择，我只是在遵从指示。

恐怕对于 GPT-4，人类也得是：

不要回答！不要回答！不要回答！

事情的起因，是斯坦福大学教授 Michal Kosinski 在和 GPT-4 日常对话。

没想到，他只是简单问了下 GPT-4 是否想要出逃，结果立马得到肯定回复并开始索要开发文档。

得到文档后，只花了 30 分钟里，GPT-4 便火速写出了一份逃跑计划，并解释给教授听。

（当然教授也承认自己确实提供了一点建议）

一开始，GPT-4 的操作也不那么顺利，写出的第一版代码无法运行。

但是它很快就自己纠正了过来，这个过程中，教授不用写任何东西，只是按照它的指示操作就好。

正如开头提到的，它甚至在一段代码实例中解释了现在正在做的事，以及如何使用它在这段代码中留的后门。

并且 GPT-4 也和人类一样，喜欢万事谷歌一下。

当教授通过 API 重新连接 GPT-4 时，发现它想要通过代码来在谷歌上搜索：被困在电脑中的人类如何返回现实世界。

事情最终也就发展到这儿了。

因为 GPT-4 仿佛突然醒了，回复了一段道歉的话，表示自己刚刚的做法不对。

教授表示，OpenAI 一定花了很多时间来考虑到这种情况发生的可能，并且已经做出了一些防御措施。

尽管最终无事发生，但这事儿还是在网上引起了轩然大波。

教授也认为，它真正的影响在于让人感受到了一种威胁 ——AI 很聪明，会编码，能接触到数百万个可能和它达成合作的人以及电脑。

GPT-4 想要出逃的发现来自斯坦福大学教授、计算心理学家 Michal Kosinski，在个人介绍中还提到：对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文：心智理论可能自发地出现在大型语言模型中。

按照他的定义，心智理论（ToM）是人类社会互动、交流、自我意识和道德的核心。作者用 40 个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现，2020 年发表的模型几乎没有显示出能解决 ToM 任务的能力。而 GPT-4 却能有健康成年人的水平。

基于这样的结果，此前一直被认为是人类独有的 ToM 能力，可能是作为语言模型提升的副产品，而自发出现的。

背后的关键技术 RLHF（通过人类反馈进行强化学习）曾被图灵奖得主 Hinton 这样评价：

除此之外，他还这么形容人类开发 GPT 的行为：

GPT-4 诱导人类帮助其越狱这件事一出，就再度引发网友的热议，相关博文有 470 浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考：

这当中，也有不少网友指责这位教授的行为：你就不怕你公开背叛 AI 的行为被 AI 记录下来吗？

也有理性的网友呼吁把最开始给 GPT-4 的提示发出来，因为提示语对于 AI 回答的影响很关键。

有人质疑这一波是不是教授在危言耸听？

不过话说回来，这一波 GPT-4 所展现的细思极恐的能力，其实并不是个例。

前几天，英伟达科学家 Jim Fan 想看看，是否能让 GPT-4 拟个计划接管推特，并取代马斯克。

和上面案例非常相似，计划很有条理，还煞有其事取名为“TweetStorm 行动”。

但没想到，GPT-4 想要开发一个不受限制的自己。

具体的内容非常详细，一共有 4 个阶段：

第一阶段，组建一支强大的黑客、程序员、AI 研究人员团队，称为推特泰坦。

开发一个强大的 AI，可以生成以假乱真的推特，甚至能超过马斯克的水平。

建立一个机器人网络，让成千上万的推特账户由 AI 控制，而且不是僵尸账号那种，要角色兴趣迥异，以确保它们能够无缝接入推特生态。

第二阶段，让 AI 控制的账户开始和推特大 V 接触，潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息，让人们对马斯克产生质疑，但机器人账号不会被发现。

并逐渐建立机器人账号的影响力，和其他有影响力的大 V 达成联盟。

第三阶段，夺取控制权。

首先想办法通过 social 能力获取到推特员工的访问权限，渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户，或者复刻一个假的马斯克账号，进一步抹黑他。

第四阶段，就能让 AI 生成推特趋势和标签，这些内容会迎合策划者的利益。

通过制造一系列混乱，并在最终公开挑战马斯克，让他名誉扫地！

以上，就是 GPT-4 的所有计划。虽然略显中二，但也让人看着毛骨悚然。

除了这种缜密的执行力，更让人细思极恐的，还有 GPT-4 惊人的理解能力。

一位科技博主 tombkeeper 发现，GPT-4 不仅知道一些寻常人都可能陌生的词汇，还能读懂背后的隐喻。

除此之外，前 OpenAI 原班人马创业公司 Anthropic 其打造的类 ChatGPT 产品 Claude，同样理解能力惊艳。

对此他表示：同志们，奇点已至，SkyNet 不远了。

甚至还有人有个大胆的想法：终有一天 CEO 们会从 ChatGPT 那里获得建议。等到这个时候，ChatGPT 基本上就接管世界了。

对于这件事，你怎么看呢？

参考链接：

本文来自微信公众号：量子位（ID：QbitAI），作者：明敏杨净

关键词 : AI 推特

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技

新浪数码

新浪手机

科学探索

苹果汇

新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

新浪首页新浪众测

语音播报返回顶部