“合作”博弈理论缘何能获诺贝尔奖

http://finance.sina.com.cn 2005年10月26日 08:38 中国证券报

　　诺贝尔经济学奖既授予了非合作博弈，又垂青了合作博弈，完整体现出博弈论在经济领域中的重要意义。也纠正了某些人在博弈论方面的若干误解

　　施锡铨

　　平心而论，从完整的博弈理论来看，诺贝尔奖再度光临博弈论学者，有着充分的理由

<SCRIPT LANGUAGE="JavaScript1.1" SRC="http://205.adsina.allyes.com/main/adfshow?user=AFP6_for_SINA|finance|financePIP&db=sina&local=yes&js=on"></SCRIPT> <NOSCRIPT><A HREF="http://205.adsina.allyes.com/main/adfclick?user=AFP6_for_SINA|finance|financePIP&db=sina"><IMG SRC="http://205.adsina.allyes.com/main/adfshow?user=AFP6_for_SINA|finance|financePIP&db=sina" WIDTH=360 HEIGHT=300 BORDER=0></a></NOSCRIPT>

，对于社会科学与经济科学的研究，也有着重大的意义。

　　博弈论可以分为两大部分:合作博弈和非合作博弈。

　　Nash提出“Nash均衡”，Selton　发明了“子博弈”概念和称之为“子博弈完美”的概念以及Harsan　y　i　考虑到不完全信息情况而提出“转化”的新建模手法，开创并奠定了非合作博弈的理论基础，正是基于这些贡献，1994年他们共同享有该年度诺贝尔经济学奖。一时间，非合作博弈似乎在博弈论中有独占鳌头之趋势。正确的授奖在某种场合却造成了一定的“误解”，这一点在我国的经济研究领域可以看到几丝迹象。其实，非合作博弈的研究不能取代合作博弈的研究。在人类社会实践中，正因为人们的理性，为了极大化自身的利益，会去寻求长期合作的可能性，奥曼和谢林通过重复博弈与聚焦效应、传递信号装置等分析指出了冲突的各方基于必须在未来与对手不断地打交道，认识到“合作是有利于自身的好策略”，从而增加了合作的机会。尽管存在冲突，长期共存是可能的，和谐社会的建立非但有其必要性，而且完全是现实的。这种理论对今日世界解决冲突、建立长期合作有着极其重要的指导意义。因此，诺贝尔奖落到他们头上是当之无愧的事情。两次博弈论获奖者之间除了在“合作”与“非合作”范畴方面的差异之外，另一个显著的差异在于:1994年的三位是博弈论的生产商，而2005年的奥曼也是博弈论生产商，谢林则可认为是博弈论的“优质客户”。

　　奥曼获奖的重要贡献之一在于他利用了数学分析这一工具，发展了博弈论并得到了精确的结论。最能佐证这一点的是他建立了局中人集合具有连续统势的模型。

　　在市场竞争中，可能存在着许许多多局中人，比如一个人决定购买某公司的一些

股票，作为一个理性与智性的人，他会想到他的购买对于大量的该公司股票持有者完全不构成影响，这种场合被有些博弈论专家认为是“非博弈的一个例子”。然而，在现实的完全竞争经济状态下，虽然每个局中人的影响都是微不足道的，但是，只要局中人是有限多个，个别局中人对经济的影响就不应该被忽视，因此，奥曼认为适合完全竞争的数学模型应当包含无限多个局中人，这样就包括了任意有限多个局中人，奥曼将“许多但数量有限”的元素近似地看作其势为连续统的集合，简单地说，将其全体近似地视作对应于直线或线段上的点。这样在数学上就容易处理得多。这样的一个模型中考虑各种各样的结局，尽管很多很多，必定是有限多个，几乎多得数不清楚的“有限”个结局，孰优孰劣，本身就很难区别，其变化更难以处理。如果我们将它们近似地处理为连续统势的集合，极限、求导、微分等数学分析工具就可以显示出强有力的作用，得到的结论也更趋精确化。奥曼利用商人集合具有连续统势构造的市场模型证明了瓦尔拉竞争均衡的存在性。

　　合作博弈必然涉及到联盟。n个人的博弈就有可能存在2n－1个不同的联盟，倘若n较大的话，不同联盟之间的相互作用过于复杂，所以在合作博弈理论中常有一个简化假设，即所谓的可转让效用。全体局中人各人得到的盈利构成盈利配置。我们称某配置对联盟S是可行的，是指在S中局中人可以通过他们之间对共同合作所得到的价值进行分配，从而实现各人在这个配置中的相应分量。此类合作博弈研究中有一个“解概念”——核。一个配置在核中，当且仅当这个配置对大联盟是可行的，并且不存在联盟可以改进这个配置。对于大的完全市场竞争，埃奇沃思曾经有个猜想:其核实质上等价竞争均衡集。奥曼的贡献在于通过精确地表达完全竞争的连续统模型证明了这个猜想。

　　也许我们需要强调奥曼关于重复博弈的贡献。这是博弈论中一个重要研究课题，它的实际应用也非常广泛，譬如，我们常关心的“诚信”问题就与重复博弈有关，为了在无限重复博弈中取得长期的效益，局中人在每个阶段博弈中应当表现出诚信。奥曼对重复博弈理论的系统性起到重要作用。

　　重复博弈可以分为完全信息与不完全信息两种类型。

　　重复博弈中最重要也是最有名的结果无非是“无名氏定理”，该定理认为，只要局中人有足够的耐心，那么任何理性的可行盈利都可以在均衡中得以实施。换句话说，只要局中人的耐心足够地大，一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。对这个结论的进一步探索为，无名氏定理的理论是否适用于子博弈完美均衡？奥曼与夏普利指出，如果用时间平均准则来评估阶段博弈的效用序列，那么对任何可行的，个人理性的盈利向量，总是存在一个子博弈完美均衡达到该盈利向量。这个结论的奥妙之处在于使用时间平均准则计算得失，因为从总体来看，这种计算方法使每一个局中人不在乎有限个周期内因为惩罚他人而蒙受的损失。于是对任何违反“合作协议”的行为必定会给予惩罚，这种现象增加了合作的机会。该结论与重复博弈的其他结论一起在社会经济领域内有重要的应用价值。举个通俗一些的例子:地球上公海中的鱼类资源是世界各国的“公共财产”，大家可以打捞，捕得越多则收益越大，长此下去会使资源枯竭。这就是非合作博弈中著名的“公地悲剧”现象。奥曼的理论指出，年年捕鱼，相当于重复博弈，捕鱼的国家与船队越多，矛盾与冲突自然也越多，但是为了长期的甚至永久的利益，大家合作达成协议的可能性就越大，协议规定保护了资源，谁违反了协议就受到集体的惩罚，于是保证了协议的执行。这种理论显然构成了人类社会长期合作的基础。一个国家的出口也存在这类问题，各家公司或集团在出口某产品方面互相剧烈竞争，其结局很可能压低了产品的价格，甚至由于出口太多引起别国的抗争。出口年年要搞，形成了重复博弈，竞争冲突的各方完全应该也有可能达成协议长期合作，以求得长期的稳定的收益。

　　1966年，奥曼与马希勒提出了关于不完全信息的重复博弈，将重复博弈研究推向更切合社会实践。在长期相互影响作用的过程中，信息并不是完全的，人们不难设想，局中人一般会力图让他的对手知道他的强项，而对于自己的短处或弱点，则尽量保持其不确定性，以迷惑对手，这样才有可能使自己在博弈中处于有利地位，从而极大化自己的收益和盈利，这种假设构成了研究不完全信息重复博弈的框架。奥曼与马希勒是在为美国的军备控制与裁军机构做有关研究时建立此类模型的，最原始的模型中，阶段博弈是简单的二人零和博弈，只不过一个局中人知道自己的类型，另一方则不知道这些信息。知情的局中人应该泄露信息，还是应当隐匿信息？奥曼他们指出，这与博弈的均衡盈利函数有着密切的关系。比如说，函数的凹凸性可以提示这个问题，他们的研究成果对于重复博弈的进一步研究有着启发性作用，而此类不完全信息的重复博弈在市场经济领域内的应用比比皆是，例如委托－代理模型，保险问题，银行贷款问题等等。在

证券市场上，上市公司每年的财务报表也体现了信息披露问题。对于这个问题的研究并由此制定科学合理的机制将使证券市场越来越成熟。如果讲得更大一些，中央与地方之间年复一年的情况处理也可看作是不完全信息的无限重复博弈。

　　奥曼在博弈论方面的贡献与理论是一系列的，有许多概念由他而出，诸如“强均衡”，“非转移盈利函数”，等等。他对构成博弈论基础的“共同知识”也有独到的见解，奥曼的一系列思想直接或间接地影响着博弈论有关学者的研究与应用，不少成果正在或即将在经济管理领域内获得应用。

　　另一位获奖的学者是托马斯·谢林，正如我们在前面所指出的，他是一位出色的博弈理论客户，成功地运用博弈论的知识对全球安全问题与冲突问题进行分析。1960年他出版的《冲突战略》，可以说是处理冲突的博弈论经典著作。有时候，我们真有些怀疑此君曾经读过一点毛泽东选集，因为他提出的方法与想法有不少与《论持久战》《矛盾论》等著作中的内容有暗合之处。

　　博弈论中有一个令人头痛的问题是纳什均衡的多重性，本来纳什均衡是我们预测博弈的一个科学且合理的结局，至少是我们用于预测的根据之一。但是纳什均衡常常不一定是唯一的，这就给预测结局带来了很大的麻烦甚至痛苦。

　　在一个具有多重均衡的博弈中，是否存在一个特定的均衡可以引起局中人的共同关注呢？谢林在1960年详尽地讨论过这个问题。他证明，在这样的博弈中，趋向于使局中人的注意力集中到某一个均衡的任何事情，都可以使所有局中人预期到并实现这个均衡结局。谢林称这个现象为焦点效应，这就是博弈论中常说的“聚焦”。聚焦对于冲突双方寻求解决途径提供了一个有效的方法。实现聚焦存在一个有效途径就是博弈前的“通信”，或者就是发出信号。通信的效果使局中人注意到聚焦均衡，倘若存在这种局前通信的可能时，如果某人能够通过向局中人公开建议去实施某个均衡，从而使该均衡车成为博弈的聚焦均衡，我们称此人为焦点仲裁人。这套理论在解决国际争端，贸易纠纷等冲突问题不失是一个有效手段。谢林提出，在冲突双方起争端时，“强硬”与“让步”是两种可能的选择，双方均取“强硬”，则可能发生“战争”，两败俱伤。如果势均力敌的两方都坚信自己的实力，用“持久战”的办法尽可能拖垮对方，那么这种想法的结局导致“和平”与“合作”。当然在对峙的时候，必须防范对手搞突然袭击，要想做到这一点的先决条件是“拥有足以令对手担忧的报复性手段”。在这里，谢林提出了“可信威胁”的概念，意即使对方深信“己方拥有致命的报复性手段”，迫使对手不敢贸贸然动手。谢林提出另一个概念是“限制己方的行为”。通过限制己方的行为向对手传递信号，让对手明白本来自己是准备如何对付他的。这两个概念及其行动，使“持久战”可以坚持下去，各方都有可能预测对方的实力与行动，反而使双方更有合作意愿，更容易达成合作。这些分析足以解释了冷战时期美苏都拥有大规模杀伤武器，但都不会发动战争的现象。这种策略完全符合毛主席一再提出的“以斗争求团结则团结存”的英明决断，谢林的思路验证了我国在拥有了自己的核武器之后再考虑签署禁核协议这一决策的正确性。谢林让世界明白，“反制的能力比对抗攻击的能力有用，不确定的反制比确定的反制更有效”，其实这些策略与奥曼他们研究的“在信息不完全情况，知情人公开自己强项信息(可信威胁)而隐匿自己弱项使之成为不确定信息”有异曲同工之妙！谢林的思路不仅适宜于国家与国家，地区与地区之间的冲突处理，也适宜于经济交易中的各种冲突，适宜于各种谈判中的讨价还价。中欧之间纺织问题的谈判处理结果应该可以称是《冲突战略》的一个范本，中美之间的谈判照例也可寻求双赢的结局，只是我们需要自身的实力与正确的决策。

诺贝尔经济学奖既授予了非合作博弈，又垂青了合作博弈，完整体现出博弈论在经济领域中重要意义。也纠正了某些人在博弈论方面的若干误解。以前在报纸上常可看到这样的论调，似乎寻求纳什均衡就是寻求双赢，殊不知，非合作博弈中，纳什均衡未必是双赢，有时候说不定对双方都显得有点尴尬。合作博弈论指出了冲突的各方为了极大化长久的收益，存在长期共存长期合作的可能性，它寻求的双赢或多赢，其味更浓！笔者认为，2005年，诺贝尔经济学奖评奖委员会作出了一个正确的决策。“非合作博弈”与“合作博弈”实现了“双赢”。

新浪声明：本版文章内容纯属作者个人观点，仅供投资者参考，并不构成投资建议。投资者据此操作，风险自担。

爱问(iAsk.com)

【谈股论金】【收藏此页】【股票时时看】【大中小】【多种方式看新闻】【打印】【关闭】