意见领袖丨Project Syndicate
本文作者:布雷特·费希曼是维拉诺瓦大学法律教授。伊凡·塞林格是罗切斯特理工学院哲学教授。他们著有《逆向工程破解人性》。
几年前,我(布雷特)的收件箱被Facebook通知挤爆——有很多朋友祝我生日快乐。我很生气,登录将生日改成了仲夏时节的某个随机日期。六个月后,我的收件箱再次挤爆。一开始,我不太当回事。我的大部分Facebook好友不知道我的真实生日,只是自动响应提示而已。但有两个邮件来自知道我真实生日的关系密切的亲人。他们的反应和其他人一样,这引出了一个问题,即自动化偏误是否干扰了他们的人类判断。这只是个别的错误,还是说明了更大更危险的缺陷?
考虑另一个例子。某人遇到某在线用户协议,看到有一个“我同意”的小按钮,不假思索就按了下去。这是一种寻常的经验。人们不会去阅读服务条款、隐私政策或其他电子格式文本,也很少会停下来想一想自己正在与谁缔结有法律约束力的在线关系。但这一点击确认合同界面(以及允许公司使用它的基础法律规则)应该实事求是地加以认识:这是一个促使人做出机器人行为的系统,大体上脱离了常识。
这两个例子都属于科技-社会工程例子。随着这种行为的规模和范围通过公共和私人空间密布的联网传感器(包括我们的设备、穿着乃至我们自己)变得越来越广泛和接近我们,带来了紧迫的伦理和政治问题。我们的科技是否引导人类行为机器化,从根本上导致非人化?
这个问题和科技本身一样古老。在古希腊,苏格拉底担心写作会毁掉人类记忆,从根本上改变人类。工业革命期间,批评者担心流水线工人遭到和机器部件一样的对待。后来,媒体学者警告电视将人们变成不会思考的蔬菜。和十九世纪的马克思一样,二十一世纪的批评者担心科技非人化,包括亚马逊的仓库、优步司机的汽车,哈佛商学院的肖珊娜·祖波夫(Shoshana Zuboff)所谓的一切生命的商品化。
测试
改变范式的创新引起对技术非人化的担忧,这样的例子不胜枚举,但我们并没有概念上或实证上可靠的框架在产生这些担忧的多样化环境中检验这类说法。要解释这一重要的知识缺口,我们需要逆转计算机先驱艾伦·图灵的经典人工智能测试,以辨别潜在的非人化,实现伦理评估。
除了评估对话智能,这类测试还要评估对人类有意义或只有人类才行的不同的功能。但要这样做,我们必须知道是什么造就了人类。这是一个令人难以置信的难题,几千年来都没有争论出个结果。事实上,之所以不存在可靠的科学方法辨别和评估科技对于人性的影响,正是因为我们不知道到底应该测量什么,也不知道如何去评估我们看到的结果。
尽管如此,当图灵发问 “机器能思考吗?”时,他面临一个类似的概念困境。图灵认识到定义“机器”和“思考”的内在困难,他用一个实证测试来代替难以回答的原始问题。他转向一个观察“游戏”,聚焦于人和机器在具体的功能方面是否不可区分:用文本信息进行的对话表现。
在最初的图灵测试中,观察者通过文本信息与一系列被试对话,然后根据对话判别每个被试是人类还是机器。如果观察者将机器误判为人类,那么他就识别出一部卓越的机器。
因此,人类为如何评估机器提供了一个基准。当一位观察者错误地将某一台机器认定为人类时,测试就产生了需要解读和评估的证据。这并不是一台机器摇身一变成为人类的魔法时刻。机器仍然是机器,但测试产生的证据可能告诉,也可能没有告诉我们某些关于机器、观察者、被问及的问题以及环境的东西。
常规上,图灵测试的主体是机器,图灵观察可以界定为一组三个问题:我们能设计思考的机器吗?我们如何知道?存在与人类不可区分的机器吗?对于我们的目的,我们可以不问某项科技正在非人化,转而问:我们能设计不思考的人类吗?我们如何知道?存在与机器不可区分的人类吗?
一台简单机器可以作为基准以评估作为科技社会工程对象的人类。基本直觉是,行为与简单机器相似的人值得注意。和常规图灵测试一样,以人为焦点的测试是一种产生证据的手段。但是,因为人性不止于我们的对话智能,因此我们还要测试对人类有意义或只有人类才行的不同的功能。这一方法为其他人留下了空间,以改近测试,并开发其他测试考察他们认为作为人类或作为有用的机器必须具备的功能。
图灵问“机器能思考吗?”我们则问“人类可以不思考吗?”我们想要识别的不是设计为智能的机器,而是设计为不智能的人类。在这里,智能可以用计算能力、常识、理性或简单的随机数字生成行为(人类在做该测试时倾向于遵循可预测模式)来衡量。
人类还是机器?
设想我们制定了一个逆图灵测试,观察者是一台机器,它被设定向被试提供一系列数学计算问题。收到答案几分钟后,它会给出被试是人还是机器的结论。问题可以从简单计算开始,逐渐复杂化(比如一开始是一两位数字的加减,然后是乘法,开方,等等)。
在这个例子中,分类可以轻易与机器区分开来。人类会逐渐疲劳,容易出错。取决于测试的持续时间和提问的速度,哪怕是简单计算人类也会出错。大部分人通常都通不过这一测试。但少数人可能可以,从而触发第二阶段:评估。
通过测试的人类拥有卓越的——甚至可以说是非人或超人的——数学计算能力。但是,以这种方式、在这种环境中像机器一样并不影响这个人在规范上属于人类的地位。我们获得了一些反常的证据,但未必是科技非人化证据。
现在,设想一个常规图灵测试,观察者问哲学家杰拉尔德·埃利昂(Gerald J. Erion)界定的的“需要熟练使用常识”的问题。通过观察被试“在各种环境中相当常得一段时间”的表现,埃利昂认为我们可以自信地基于语言能力和常识表现区分人类和机器。他的焦点在于机器,对机器来说,通过常识测试门槛非常高。但要是基于常识测试中自身的表现,人类无法与机器区分考来会怎样?
很难想象人类缺少常识的环境,常识是一种适应性品质,可以在代际和不同的环境中体现。尽管如此,常识要依靠共同的知识基础、语言和社交互动,它们要足以形成共同理解和信念。获得这些基本输入量不是给定条件。
无法通过逆图灵常识证明,相关人类和科技社会环境存在某些值得关注的特点。这些人无法胜任对大部分人来说稀松平常的常识任务,这就值得关注。但是,这一结果并不构成某个魔力转变时刻。这些人仍然是人类,但结果将促使我们对他们和科技社会环境进行评估。
我们通过两个推定人无常识行动的例子开始这一讨论。我们在我们2018年的著作《逆向工程破解人性》(Re-Engineering Humanity)中指出,还有许多例子。因此,评估今天的科技社会工程与人的常识思考能力退化或丧失的因果关系至关重要。
大部分人会同意,常识是一种有意义的人类能力,也许对于人类繁荣是必不可少的。如果我们的科技正在侵蚀这种能力,那么我们必须考虑这对人类的未来意味着什么。
(本文作者介绍:报业辛迪加(Project Syndicate)被称为“世界上最具智慧的专栏”,作者来自全球顶级经济学者、诺奖得主、政界领袖,主题包括全球政治、经济、科学与文化塑造者的观点,为全球读者提供来自全球最高端的原创文章、最具深度的评论,为解读“变动中的世界”提供帮助。)
责任编辑:张文
新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。
欢迎关注官方微信“意见领袖”,阅读更多精彩文章。点击微信界面右上角的+号,选择“添加朋友”,输入意见领袖的微信号“kopleader”即可,也可以扫描下方二维码添加关注。意见领袖将为您提供财经专业领域的专业分析。