财经纵横新浪首页 > 财经纵横 > 经济学人 > 正文
 

平新乔:共赢的智慧


http://finance.sina.com.cn 2005年10月15日 18:16 和讯网-《财经》杂志

  在非合作的前提下能使参与博弈各方实现共赢,这实在是对人类智慧的考验。在这方面取得非凡成就的奥曼与谢林获得诺贝尔经济学奖,正是对人类自身智慧进步的肯定

  □平新乔/文

  博弈论试图在人类各种利害冲突中通过某种机制而实现共赢。这种共赢机制可以是合
作博弈,也可以是非合作的博弈。在非合作的前提下,参与博弈的双方乃至多方实现共赢,这实在是对人类智慧的考验。这种智慧实在太过稀缺。因此,诺贝尔经济学今年垂青于在这一领域贡献非凡的两位学者——罗伯特奥曼(Robert Aumann)与托马斯谢林(Thomas Schelling),实在是对人类自身智慧进步的肯定。

  谢林:真实世界的博弈

  奥曼与谢林分别是在两条截然不同的道路上寻找化解冲突、实现和谐的机制的:数学家奥曼一生处于象牙塔里,而谢林则是在参与战后马歇尔重建欧洲计划、白宫事务、兰德公司军备竞赛研究课题等一系列实践中,通过对真实世界的观察,而形成其睿智思想与敏锐目光的。

  谢林在美国经济学界属于元老级的经济学家,尽管他一直声称自己是一个“不安分的经济学家”。与他同代的托宾、索罗早就获得了诺贝尔奖,他的学生斯宾塞(Spence)也于2001年获得诺奖。事实上,无论是托宾、索罗,还是萨缪尔逊,都对谢林表示心悦诚服。

  托宾曾经写过,在哈佛与谢林同学的岁月里,“谢林总是比其他同学和教授在知识的广度上要胜出几个档次,在见地上深出若干层次。”2001年诺奖得主斯宾塞更是表示,自己于上个世纪70年代初从事信号博弈与细分(Sorting)策略研究,是在午餐桌上通过与谢林的对话得到灵感的。谢林问过他,世界上何以“物以类聚、人与群分”?为什么在加州的海滩,喜欢冲浪的人与喜欢游泳的人是不同的人群?这一连串问题,实质上点出了这个真实世界里人群细分背后的机制。因为,事实上,没有细分,企业就无从进行市场定价。

  谢林从事经济学研究要早于奥曼。值得注意的是,尽管谢林是在1951年才获哈佛大学经济学博士,却早在1946年起就在《Econometrica》(经济计量)等顶尖杂志上发表论文了,这是当时有二战背景的研究生的特点之一——独立研究能力超强。1956年以前,他的研究方法基本上是遵从主流的传统道路的,研究重点在收入分配与国际经济学。但在这两个领域,谢林也显现出以后研究化解冲突机制的端倪。

  比如他主张,为了化解冲突,就有必要使冲突中的获胜方受点损失,有时甚至可以“把面包扔到河里去”,看似浪费,其实会最终大赢:给工人加工资,最后会提高企业利润,增加一国国民收入水平。在国际经济学的研究中,谢林十分关心对外援助谈判中的成本分担问题。

  谢林正式转向现代博弈中的冲突化解机制的研究是在1956年。这一年,他在《美国经济评论》上发表《论谈判》,开始把50年代刚刚发展起来的博弈论运用到研究人类各类冲突及其化解的过程中去。之后,于1960年出版《冲突的策略》、1966年出版《军备及其影响》,1978年出版《微观动机与宏观行为》等书,奠定了自己在经济学、政治学、社会学、心理学中运用与推广博弈论的学术地位。

  形成于上个世纪40-50年代的博弈论的重要成果是纳什均衡(纳什本人已于1994年获诺贝尔奖)。但是,纳什均衡可能是好的,也可能是两败俱伤的。理论经济学对如何实现好的纳什均衡机制的探讨,主要是由奥曼推进的,但谢林在实践上却早于经济学理论界,独立开始对化解冲突的机制的追寻。

  谢林的这种研究有两个背景:一是美苏的冷战背景。谢林于1957-1958年进入兰德公司,专门从事美苏的军备竞赛与冷战策略。二是在60至80年代任哈佛大学肯尼迪政府学院院长期间,他与未来的白宫官员之间非纯粹思辨式的教学实践。他的这些学生要求教学必须是实战式的,且证据确凿。正是在这样鲜明的实践背景下,谢林独到地提出了一系列在冲突中实现协调、寻求冲突双方或各方利益极大化的理论见解与政策主张:

  ——谈判本质上是非零和的。任何基于冲突的谈判,若谈判失败,则双方都会受损;任何通过谈判达到的协议对双方来说都会比未达成协议要好一些。

  ——让步是谈判达成共赢必不可少的,任何一方的过于强势都不是最优策略。谢林讨论过两国军事对抗的例子。若一国先动员军队进入战备,另一国不动员战备,则先动员一方得益为a,不动员的国家得益为c;若两国都动员军队,双方剑拔弩张,则每国得益都为0;若两国都休战,则双方各得b。这里,a>b>c>0。显然,如写成“2×2” 矩阵,这里有三个纳什均衡:(c,a),(a,c)与混合策略均衡。而在混合策略均衡中动员军备的均衡概率P= 。谢林敏锐地指出,“c”是对方在我方先发制人时的得益,但这里,为了让先发制人方降低动武的概率P,也需要提高对方的得益“c”。而“提高c”就是先发制人一方对对方的让步!

  ——“二次打击力”的保存才是化干戈为玉帛的机制。在军备竞争时,只要每一方都可以生存得足够的长,即每一方只要在遭受敌方第一次袭击后有“还手”的能力,而且这种“二次打击”能力足够以致先进攻方于死地,则这个仗就不会打起来。因此,一国的生存战略的要义是隐蔽自己的武库,而不是隐蔽自己的人口。

  ——有条件承诺强势战略要优于无条件采取强势战略。在前述例子中,若一国宣称自己在任何情况下都采取先发制人的策略,这样战争、冲突就无法避免。相反,若一方只是承诺,当对方采取“战备”时我才战备,则双方就不至于无条件选择战备,这样,就有可能实现双方都克制的(b,b)状态。谢林以此论证道,有时,温和优于强势。

  ——实施报复的成本越低,则冲突越是不易形成。谢林主张渐进式地,一步步走向与对方的公开冲突。这就是说,即使真的要进行战争,也应该让战争逐次升级,因这样每一步投入的成本都比较小。而且,由于冲突是逐渐升级的,所以国内反对冲突升级的力量也较易于制止冲突的升级,这就会降低公开冲突发生的概率。

  ——人与人的隔阂、分离与孤立起源于人类偏好的二重性。人与人的冲突往往起源于个人与他人之间的缺乏沟通。但每个人的偏好都有两面性,如同一枚硬币有正面与背面,一个人选择居住地、进入公司,与邻居与同事的偏好完全一致的概率是极低的,有时会突然发现自己被掷于一个与自己格格不入的环境里。这种个人偏好二重性显现出来的文化隔离,在宏观上会严重妨碍和谐实现。但是,谢林强调,“如果我们真的追求和谐,则就可能实现和谐”。和谐不是自发形成的,而需要一种共识,成为个体行为的焦点,才可能真的达到和谐。

  如是者还可以列出许多,谢林的上述理论无疑提出了实现冲突化解的机制。其在商业上与政治上有广泛的应用。

  奥曼:从重复博弈到相关均衡

  与谢林不同,奥曼是一位纯粹理论经济学家。奥曼于1955年获美国麻省理工学院数学博士,现任教于以色列希伯莱大学理性研究中心。奥曼获数学博士时,正是博弈论方兴未艾之际,他将这以后50年的时间都贡献于寻找避免“囚徒困境”式的坏的纳什均衡的机制,实际上是从理论上探索协调人类利益冲突,增进社会福利的道路。由于奥曼的探索,现代博弈论才形成了下述进展:

  ——重复博弈。奥曼在1959年的论文中指出,人与人的长期交往是避免短期冲突、走向协作的重要机制。他严密地证明了,在较长的视野内,人与人交往关系的重复再现本身,就可能走出两败俱伤的“囚徒困境”。其充分条件是设置严格的惩罚背信弃义行为的机制。重复博弈强调契约的长期性对于纠正人们短期行为的意义,这在日常生活里是具普遍性的。中国农民对土地的经营权一定15年不变,后又延长至30年,其意义就在于加强了长远利益对于眼前行为的约束与激励。

  ——β-核概念。纳什均衡只讨论博弈中一个人偏离的可能以及防止这种个别人背离行为的条件。在重复博弈的框架下,就可以讨论群体行为中防止一部分人偏离均衡的条件。当社会中不存在任何一部分人获得更高得益的可能时,这就形成了“β-核”。

  ——重复博弈中的信息披露策略选择。博弈的参与人对信息的掌握通常是不对称的,如博弈只发生一次,则无疑具有信息优势的人会获得信息租;但如果博弈是重复进行的,则今天利用信息寻租者必定会在寻租过程中泄露其所拥有的信息。时间久了,信息不对称程度就会减轻,这又是重复博弈之所以会改进资源配置状态,使人与人的关系走向和谐的原因。

  ——无穷次重复博弈框架下谈判解的立即达成性质。奥曼与夏普利在1976年证明了,两人为分一块饼而讨价还价,这个过程初一看是可以无限期地谈下去的,但是,只要没有一个人有动机偏离对偏离者实施惩罚的机制,没有一个人去偏离对偏离了“对偏离者实施打击”的轨道的人实施惩罚的机制,并且这种惩罚链不中断,则无限期讨价还价的谈判在今天就会达成均衡解而结束谈判。因此,任何马拉松式的谈判一轮轮拖而未果的原因只在于,参与谈判的双方还未就惩罚背离行为的机制与每方对未来利益的折现因子达到共识。

  ——“共识”。人与人冲突的原因之一是相互猜疑。但是,一旦我知道你如何算计我,你知道“我知道你如何算计我”,我知道“你知道‘我知道…’”,这种“知道”的链延伸至参与博弈的全体成员,并且又延伸至博弈的无数个回合,则人们在一念之间就可能会停止相互猜疑与算计,立即达成和谐解。奥曼于1976年在其论文《对异议的同意》中正式提出了“共识”这一范畴,并证明,若博弈双方对于某一事件的发生概率的评估存在共识,则该评估一定是相同的,而且这时主观评估便在瞬间转变为客观概率。在金融市场上,这个洞见有着深刻的含义。其他经济学家们以此为基础讨论过金融危机与金融恐慌的传导机制。

  ——“相关均衡”。人们之间争斗以及由此造成的两败俱伤的根由之一是各人的行动策略都是相互独立的。由于缺乏协调,而失去了很多共赢机会。奥曼于1987年提出了“相关均衡”机制。所谓相关均衡是指,通过某种客观的信号装置以及当事人对信号的反应,有可能使本来各自为政的个体行为之间相互发生关系,形成一种共赢的结果。交通口为什么要设置红绿灯?为什么要下发中央文件?为什么要建设金融中介组织?为什么要有各种社会媒体与中介组织?这都可以从“相关均衡”的背景下得到解释。

  从重复博弈到相关均衡,这些抽象的概念无不对应着如何从冲突中实现和谐的追求。这说明,最抽象的有时是最具体的,最模糊的有时是最清晰的,最简单的有时是最丰富的,最抽象的有时是逼近现实的。这个世界充满着冲突,人与人之间的关系,人与自然的关系都存在着这样那样的紧张感。但奥曼的理论告诉我们,“风物长宜放眼量”,在较长期中,通过相互交往,人与人的和谐关系可能在渐进、缓慢的过程中建立起来,从而改善我们身处的状态。

  作者为北京大学中国经济研究中心教授

  (本文刊于10月17日出版的《财经》2005年第21期)


发表评论

爱问(iAsk.com) 相关网页共约153,000篇。


评论】【谈股论金】【收藏此页】【股票时时看】【 】【多种方式看新闻】【打印】【关闭


新浪网财经纵横网友意见留言板 电话:010-82628888-5174   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网

北京市通信公司提供网络带宽