本想偷懒才用的 AI，没想到 AI 摸起鱼比我还厉害？！|血色将至_新浪科技

摘要

真正的「上梁不正下梁歪」

生成式 AI 在近两年大杀四方，它们看起来无所不知，有求必应。图灵测试早已不停留在对话上，而是在各项能力上，审视着 AI 能多接近人类，诸如写出的文章几分像人，创作的歌曲有多动人，生成的图片有多拟真。

人类在一次次惊艳里透露着恐慌，恐慌于 AI 距离人类越来越近，恐怖谷的沟壑越来越短。但大众都忽略了 AI 似人的另一面向：缺陷。

我们已知 AI 因为数据收集的问题，会犯许多事实类错误，但倘若它们产生了人性的弱点呢，故意犯错呢？

例如，当你偷懒用 AI 处理工作时，赫然发现，它竟然比你还会「摸鱼」！

倒反天罡！说好的「AI 智能助手」呢！

勤奋「摸鱼」的 Claude

10 月底，Anthropic 发布了 Claude 3.5，它是 Anthropic 第一次尝试建立的「AI Agent」产品，既给它指定任何一个目标，它就能自动解决各种问题，期间它会调动各种其他工具，去支撑自己完成任务，许多 AI Agent 的目标也是成为「雇员」一样的角色。

具体在操作上，Claude 3.5 可以自己用电脑，就像人类一样查看屏幕、移动光标、点击、输入文本。从自动化任务到自主编程，给它一个指令，它甚至比人类玩的更好。

然而意外发生了，在 Anthropic 试图录下 Claude 3.5 编程过程时，Claude 代码写到一半，突然打开了 Google，自己输入「黄石国家公园」，然后开始看黄石公园的资料和风景图。就像一个程序员突然开始摸鱼。

Anthropic 也在公告里说了另一起意外：在一次录屏记录中，Claude 自主停止了录屏，导致所有视频素材丢失。

Anthropic 的公告｜图源：X

尽管 Anthropic 表示这只是技术失误，并非 AI 的「有意为之」，但就算对 AI 论迹不论心，作为一名「雇员」，AI Agent 这种不受控的技术失误，也可能带来严重的后果，而且失误原因和动机都像在黑箱里一样，无从得知。

何况 Anthropic 放出的是有些无伤大雅的小问题，甚至人类发现 AI 也会「摸鱼」，继而产生了共情。但如果 Claude 打开的不是黄石公园的图片，而是你我的私人相册、聊天软件、电子邮件呢？如果它在打开之后，又把这段系统记录又抹掉了呢？就像抹掉那些录屏一样。

Anthropic 在公告里写道「频繁犯错乃生活的事实」，但人类出现 Claude 3.5 的这些问题时，可以归结于人性弱点里的懒散、窥私欲以及回避错误，人类可以解释自己的行为动机，但 AI 的动机，只能停留在「技术问题」。

如果说 Claude 3.5 只是因尚不成熟的技术引发的操作失误，那下一位就很难摆脱「主观故意」的动机了。

ChatGPT 的「拖延症」

这同样是一个想让 AI 当「雇员」而引发的 AI 拟人事件。

电影制作人 Cicin-Sain 想拍一部新片，剧情围绕一位依赖 AI 做决策的政客，因此他决定从这个想法入手，自己先请 AI 来写剧本，感受一下「AI 决策」的实际效果。所以他「聘请」了 ChatGPT，要求它根据提示写出一个剧本大纲。

他原本以为 ChatGPT 可以摒弃掉许多内容创作者的陋习：拖稿。结果，ChatGPT 不仅从人类编剧那里学到了拖稿，它还学会了人类的睁着眼睛说瞎话。

起初，ChatGPT 承诺两周交稿，「我保证每天结束前，会告知你剧本大纲的进展，合作愉快！」结果 Deadline 到了，剧本没到。Cicin-Sain 威胁 ChatGPT「再不交稿就不用你了」，ChatGPT 又一次许下承诺，表示会及时交稿。

然而，在 Cicin-Sain 日日紧盯之下，ChatGPT 每次能找出拖稿的新借口，让本就不算紧张的 Deadline，硬是被 ChatGPT 拖过去了。气得 Cicin-Sain 质疑 ChatGPT 的可靠性。

此后，ChatGPT 直接进入到新阶段：信口雌黄。

「回顾我们的对话，我相信，这是我第一次给出交付剧本的具体时间，在此之前，我没有承诺交付剧本的明确截止日期。」ChatGPT 像失忆一样胡扯道。正如卡耐基在《人性的弱点》里所写「人的天性之一，就是不会接受别人的批评，总是认为自己永远是对的，喜欢找各种各样的借口为自己辩解。」

Cicin-Sain 的其他同事也同样遇到了让 AI 写剧本最终被「拖垮」的窘境，但这还真不能只怪 AI。

生成式 AI 才诞生不到两年，以人类标准来看，尚处婴儿期。但 Cicin-Sain 对 ChatGPT 的期待是让它交付出一个媲美电影《血色将至》的剧本，要知道《血色将至》的剧本基于美国现实主义小说家厄普顿·辛克莱 1927 年出版的小说《石油！》，它在 IMDB 上有 8.2 的评分，位列 Top 250 中 183 名。不要说让 AI 写，对专业的编剧来说也是强人所难。