演化博弈理论

概述

在传统博弈理论中，常常假定参与人是完全理性的，且参与人在完全信息条件下进行的，但在现实的经济生活中的参与人来讲，参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中，参与人之间是有差别的，经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

传统博弈理论区别

与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的，它是指人的行为只能是“意欲合理，但只能有限达到”。威廉姆森在研究影响交易费用的因素时，对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的：一方面是由于人的感知认识能力限制，它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误；人的有限理性的另一方面则是来自语言上的限制，因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇，或许是因为这些词汇还不存在)，不管多么努力，人们都将发现，语言上的限制会使他们在行动中感到挫折。从这两个方面而言，完全理性的人根本就不可能存在。

演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论源于生物进化论，它曾相当成功地解释了生物进化过程中的某些现象。如今，经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程，也取得了令人瞩目的成绩。演化博弈论目前成为演化经济学的一个重要分析手段，并逐渐发展成一个经济学的新领域。

根源

经济演化思想很早就存在于经济理论中，即使是在以静态分析为主的新古典经济学盛行的年代，演化思想也仍然在经济学中占有一席之地。马歇尔(Marshall，1948)就曾指出，演化的概念比静态的概念更复杂，因此大量的经济基础理论研究还是以机械类比、均衡、稳定、决定性为主；阿尔钦(Alchian，1950)建议在经济分析中用自然选择的概念代替利润最大化的概念，认为适度的竞争可以作为决定各种制度形式存在的动态选择机制。在这种选择机制下，即使不把行为主体看作是理性的，但来自社会的演化压力(优胜劣汰)也将促使每个行为主体采取最适合自身生存的行动，从而使得达到的演化均衡为纳什均衡。阿尔钦的这种演化观不仅为新制度经济学研究制度的选择提供了一个思路，而且也为演化博弈论的发展提供了思路；纳什(Nash，1950)的“群体行为解释”，则认为是包含较完整的演化博弈思想的最早理论成果。纳什认为，不需要假设参加者有关于总体博弈结构的充分知识，也不要求参加者有进行任何复杂推理的愿望和能力，只需假定参加者能够积累关于各种纯策略被采用时的相对优势的实证信息，纳什均衡仍可达到。

发展

演化博弈理论能够在各个不同的领域得到极大的发展应归功于斯密斯(Smith，1973)与普瑞斯(Price，1974)，他们提出了演化博弈理论中的基本概念——演化稳定策略(Evolutionary Stable Strategy)。斯密斯和普瑞斯的工作把人们的注意力从博弈论的理性陷阱中解脱出来，从另一个角度为博弈理论的研究寻找到可能的突破口。自此以后，演化博弈论迅速发展起来。20世纪80年代，随着对演化博弈论研究的深入，许多经济学家把演化博弈理论引入到经济学领域，用于分析社会制度变迁、产业演化以及股票市场等等，同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入，并取得了一定的成果。20世纪90年代以来，演化博弈理论的发展进入了一个新的阶段。威布尔(W.Weibull，1995)比较系统、完整地总结了演化博弈理论，其中包含了一些最新的理论研究成果。其他的一些理论成果包括克瑞斯曼(Cressman，1992)以及萨缪尔森(Samuelson，1997)的著作。

应用研究

与此同时，演化博弈论在经济学中的应用研究也飞速发展。弗里德曼(Friedman，1991)认为演化博弈在经济领域有着极大的应用前景，并对一些具体应用前景的动态系统进行了探讨；巴苏(Basu，1995)研究了公民规范和演化之间的关系，认为规范的长期存活依赖于演化过程和自然选择；弗里德曼和方(Friedman＆ Fung，1996)以日本和美国的企业组织模式为背景，用演化博弈分析了在无贸易和有贸易情形下企业组织模式的演化；拜斯特和古斯(Bester＆Guth，1998)用演化博弈理论研究人类在经济活动中利他行为的存在性及其演化稳定性。登弗伯格和古斯(Dufwenberg＆Guth，1999)在双寡头垄断竞争的情形下比较了两种解释经济制度的方法：间接演化方法和策略代理方法，研究了在怎样的市场环境中这两种方法会导致相似的市场结果；戈特曼(Guttman，2000)用演化博弈理论研究了互惠主义在有机会主义存在的群体中是否能够存活的问题；青木昌彦(2001)从认知的角度提出了一个关于进化博弈的主观博弈模型；哈如威和普拉赛德(Haruvy＆ Prasad，2001)运用演化博弈的方法研究在具有网络外部性的条件下免费软件的最优价格和质量；科斯菲尔德(Kosfeld，2002)建立了德国超市购物时间反常的演化博弈模型；奈宝格和瑞戈(Nyborg＆Rege，2003)用演化博弈理论研究了顾及别人感受的吸烟行为的社会规范的形成；加斯米那和约翰(Jasmina＆John，2004)研究了三种不同的学习规则在公共物品博弈中仿制人类行为时谁表现得更好的问题；丹尼尔、阿瑟和托德(Daniel，Arce＆ Todd，2005)研究了四种不同类型的囚徒困境博弈，指出这四种囚徒困境要达成合作所需的演化和信息要求。

发展方向

进入2l世纪以来，国内的学者也开始关注演化博弈论。谢识予(2001)、张良桥(2001)、盛昭瀚和蒋德鹏(2002)介绍了演化博弈理论的一些基本概念和相关内容；崔浩、陈晓剑和张道武(2004 )用演化博弈论的方法分析了有限理性的利益相关者在共同治理结构下参与企业所有权配置并达到纳什均衡的演化博弈过程；胡支军和黄登仕(2004 )给出证券组合选择的一个演化博弈方法；高洁和盛昭瀚(2004)研究了发电侧电力市场竞价的演化稳定策略；周峰和徐翔(2005)运用演化博弈论探讨了农村税费改革问题；刘振彪和陈晓红(2005)创建了从单阶段创新投资决策到多阶段创新投资决策的演化博弈均衡模型研究企业家创新投资决策问题；石岿然和肖条军(2004)在一个三阶段Hotelling 博弈模型的基础上研究双寡头零售市场价格策略的演化稳定性问题；易余胤等(2003；2004；2005)运用演化博弈方法研究了信贷市场、双寡头市场、自主创新行为、合作研发中的机会主义行为等一系列问题。从以上的研究成果来看，近一两年来有越来越多国内学者关注该领域，并且应用演化博弈论探讨了经济学领域中的很多问题。但国内的研究成果仍然存在着不少问题，主要体现在：(1)对演化博弈论的特征以及基本概念不够清晰，演化博弈并不是演化的观点和博弈的思想简单相加，动态演化的博弈模型也不一定就是演化博弈模型；(2)运用演化博弈论解释某些问题显得“牵强附会”，让人感觉只是单纯套用演化博弈论，或是不清楚演化博弈论的理论框架；(3)只能运用一些非常简单的演化博弈模型，研究不够深入。事实上，问题(2)、(3)的产生至少部分是由于(1)引起的，因此，有必要把演化博弈论(模型)的特征以及基本概念界定清楚。

特征

一般的演化博弈理论具有如下特征：它的研究对象是随着时间变化的某一群体，理论探索的目的是为了理解群体演化的动态过程，并解释说明为何群体将达到目前的这一状态以及如何达到。影响群体变化的因素既具有一定的随机性和扰动现象(突变)，又有通过演化过程中的选择机制而呈现出来的规律性。大部分演化博弈理论的预测或解释能力在于群体的选择过程，通常群体的选择过程具有一定的惯性，同时这个过程也潜伏着突变的动力，从而不断地产生新变种或新特征。

几乎所有的演化博弈理论都具有上述特征。然而，演化博弈论在经济学领域的应用与运用演化博弈理论解释生物进化现象有所不同，演化博弈论中的一些生物进化的概念在经济学领域中无法应用。比如，性别和交配，染色体和代际等等，这些概念很难被引入到经济学领域中来。演化博弈论在经济学领域的应用主要是考虑微观个体在演化的过程中可以学习和模仿其他个体的行为，即沿用拉马克的遗传基因理论。

一般的演化博弈模型的建立主要基于两个方面：选择(Selection)和突变(Mutation)。选择是指能够获得较高支付的策略在以后将被更多的参与者采用；突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略，也可能是获得较低支付的策略)。突变其实也是一种选择，但只有好的策略才能生存下来。突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。不具备这两个方面的模型不能称为演化博弈模型。比如，艾格则等(Agiza，Hegazi&Elsadany，2001)提出了一个动态演化的博弈模型，它在有限理性的企业都采取一定的行为规则(产量调整机制)下研究企业重复博弈是否可以达到纳什均衡。这个模型虽然研究的是有限理性个体和动态演化过程，但不属于演化博弈模型，因为没有包含选择和突变的过程。如果把这个模型作如下修改，便可以看作演化博弈模型：假设企业有许多不同的行为规则，而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大；随着时间的推移，采用这些行为规则的企业生存下来，而不采用这些行为规则的企业被淘汰。这样修改后的模型既有选择过程又有突变过程，便成为一个演化博弈模型。

总之，演化博弈模型有如下几个特征：第一，以参与人群体为研究对象，分析动态的演化过程，解释群体为何达到以及如何达到目前的这一状态；第二，群体的演化既有选择过程也有突变过程；第三，经群体选择下来的行为具有一定的惯性。

应用优势

(一)方法论

新古典经济学以原子论和机械力学为理论基础，它假定参与人是完全理性和一致偏好的。参与人在既定的条件下可以得到一个最优方案，比如生产商在技术和资源一定的情况下可以找到一个获得最大收益的生产方案，消费者在既定的预算条件下可以获得一个最大效用的消费方案等等。博弈论在新古典经济学的基础上增加了行为主体之间的互动，使得理论更贴近现实，但总的来说，博弈论仍然没有跳出新古典经济学的框架。因此，在运用博弈论建立模型时，对各种关系做出的假设往往不切合实际，因此，根据此类模型做出的决策往往和现实相差较远，容易导致失误。

演化博弈论摒弃了完全理性的假设，以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体行为的调整过程看作为一个动态系统，在其中每个个体的行为及其与群体之间的关系得到了单独的刻画，可以把从个人行为到群体行为的形成机制以及其中涉及到的各种因素都纳入到演化博弈模型中去，构成一个具微观基础的宏观模型，因此能够更真实地反映行为主体的多样性和复杂性，并且可以为宏观调控群体行为提供理论依据。因此，演化博弈论提供的经济现象的解释比博弈论更深刻、更贴近实际、更有说服力。

(二)认识论

博弈论假设行为主体具有完美的理性思维，即行为主体始终以自身最大利益为目标，具有各种环境中追求自身利益最大化的判断和决策能力，具有在存在交互作用的博弈环境中完美的判断和预测能力，不会犯错、不会冲动、没有不理智。另外，博弈论中的一个最重要的假设就是博弈双方行为人的“共同知识”假设，即所有参与人都是理性的，所有参与人知道所有参与人都是理性的，如此类推，以至无限。这是一个令人难以想象的无限推理过程，就行为人对现实世界的认识能力而言，是一条非常严格的假设。很显然，现实世界这种假设通常是得不到保证的。

演化博弈论对于行为主体采取的是有限理性假设，因此，这些个体不具备博弈论中行为主体的“全知全能”，无法在经济活动中瞬间能够获得最优的结果。在演化博弈论中，行为主体被假设为程序化地采用某一既定行为，它对于经济规律或某种成功的行为规则、行为策略的认识是在演化的过程中得到不断的修正和改进的，成功的策略被模仿，进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下，行为主体获得“满意”的收益。这与现实情况更相符合。

(三)时间的不可逆性

博弈论注重均衡状态的研究，忽视达到均衡的过程。在博弈论中，行为主体能够立即对外部环境作出完美判断，达到均衡状态。博弈论忽视时问问题，强调行为主体瞬问的均衡，即使考虑时间问题，也把时间看作对称或可逆的。

在演化博弈论中，时间占有非常重要的地位。行为主体在演化过程中不断修正和改进自己的行为，模仿成功的策略等等，都需要一个相对较长的时间。演化博弈论认为，时间是不可逆的，过去时间内的状态与未来时间的状态是不对称的，因而，行为主体状态的演化跟初始的时间状态息息相关。

(四)随机(突变)因素

在博弈论模型中，不确定因素以随机变量的形式出现，通过给定随机变量的分布，模型的研究将最终集中于一些重要变量的平均值上，而不确定因素往往被忽略。因此，在博弈论中，即使存在不确定性因素，理性的行为人仍可实现最优化的结果。在演化博弈模型中，随机(突变)因素起着关键的作用，演化过程常被看成是一种试错的过程。行为人会尝试各种不同的行为策略，并且每一次都将发生部分替代。在多数情况下，用概率分布来描述这种不确定性是不可能的，这种不确定使长期最优化决策难以实现，演化过程的长期趋势很难预测，但如果选择过程的适应性标准确定，演化过程呈现一定的规律性，此时，演化过程的长期趋势又是可预测的。

(五)选择机制及均衡

传统的博弈理论中的行为主体是完全理性的，通常，在完全理性的假设下，如果纳什均衡存在，那么博弈双方博弈一次就可直接达到纳什均衡。这个结果不依赖于市场的初始状态，所以不需要任何的动态调整过程。而演化博弈论认为，纳什均衡的达到应当是在多次博弈后才能达到的，需要有一个动态的调整过程，均衡的达到依赖于初始状态，是路径依赖的。

另外，在有多个纳什均衡的情况下，若某个纳什均衡一定会被采用时，必须存在有某种能够导致每个博弈方都预期到的某个均衡出现的机制。然而，博弈论中的纳什均衡概念本身却不具有这种机制。因此，当博弈存在多个纳什均衡时，即使假设博弈方都是完全理性的，也无法预测博弈的结果是什么，如果博弈方只有有限理性，就更难预测博弈的结果了。当然，在博弈论中，当存在多个纳什均衡时，可以利用后向归纳法来实现对纳什均衡的精炼，但这种方法的前提条件是参与人需要满足一个比完全理性更强的理性假定——序贯理性。这在现实中是无法达到的。而在演化博弈理论中，均衡的精炼通过前向归纳法来实现，即参与人根据博弈的历史来选择其未来的行为策略，是一个动态的选择及调整过程。因此，尽管参与人都是有限理性的，但动态的选择机制将使得在有多个纳什均衡存在的情形下达到其中的某一个纳什均衡，实现纳什均衡的精练。

最常见的选择机制动态方程有三类：第一类为正支付动态方程，在这类动态方程中，所有获得的支付大于群体的平均支付的纯策略都有正增长率，所有获得的支付小于群体的平均支付的纯策略都有负增长率；第二类为单调动态方程，在这类动态方程中，若一个纯策略或混合策略获得的支付大于另一个纯策略所获得的支付，则前者的增长率大于后者；第三类为弱正支付动态方程，在这类动态方程中，至少有某些获得支付比群体的平均支付高的纯策略(若存在)有正的增长率。显然，弱正支付动态方程包含了正支付动态方程和单调动态方程。

在演化博弈理论中运用最为广泛的选择机制动态方程是泰勒和朱克(Taylor&Jonker，1978)提出的复制者动态方程，当时他们仅仅研究了对称两人博弈。随后，泰勒(Taylor，1979)把对称情形推广到不对称情形。在复制者动态方程中，纯策略的增长率与相对支付或适应度(纯策略所获得的支付与群体的平均支付之差)成正比。显然，复制者动态方程包括在前三类选择机制动态方程中。复制者动态方程在经济领域的应用最为广泛，学者们运用复制者动态方程对社会习俗、制度、行为规范等一系列社会经济问题进行了成功的研究。

那么，怎样把演化博弈论的基本概念——演化稳定策略与选择机制动态方程联系起来呢?是否通过选择机制所获得的均衡的精练就是演化稳定策略?从直观看来，演化稳定策略似乎可以保证均衡是稳定的。但正式的稳定性的定义针对的是动态系统，而不是博弈的支付或适应度函数，并且演化稳定策略只能描述系统的局部动态性质，它不能够表现均衡与动态的选择过程之间的关系。因此，演化稳定策略与选择机制动态方程所达到的动态均衡并不一定是同一个概念。因此，为了更好地描述动态的演化过程，把演化博弈理论中的静态概念与动态过程统一起来，荷什勒佛(Hirshleifer，1982)提出了演化均衡的概念。按照荷什勒佛的概念，若从使得动态系统的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点，则称该平衡点是局部渐近稳定的，这样的动态稳定平衡点就是演化均衡(Evolutionary Equilibrium)。

众所周知，演化稳定策略是纳什均衡的精炼。那么，演化均衡与演化稳定策略、纳什均衡之间的关系是怎样的呢?弗里德曼(Friedman，1998)指出：

(1)每一个纳什均衡都是动态系统的平衡点；(2)演化均衡一定是纳什均衡；(3)演化稳定策略不一定是演化均衡。

复制者动态方程可以保证演化稳定策略为演化均衡，但在一般的动态方程中演化稳定策略却既不是演化均衡的充分条件也不是演化均衡的必要条件。弗里德曼还认为，演化博弈论中最为有用、运用最为广泛的均衡概念并不是演化稳定策略，而是演化均衡。因为行为按照某种动态随时间变化的假设是合乎情理的。 ^[1]

评述

演化博弈论摒弃了完全理性的假设以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体行为的调整过程看作为一个动态系统，在其中每个个体的行为及其与群体之间的关系得到了单独的刻画，可以把从个人行为到群体行为的形成机制以及其中涉及到的各种因素都纳入到演化博弈模型中去，构成一个具微观基础的宏观模型，因此能够更真实地反映行为主体的多样性和复杂性，并且可以为宏观调控群体行为提供理论依据。

在演化博弈论中，行为主体被假设为程序化地采用某一既定行为，它对于经济规律或某种成功的行为规则、行为策略的认识是在演化的过程中得到不断的修正和改进的，成功的策略被模仿，进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下，行为主体获得“满意”的收益。

行为主体在演化过程中不断修正和改进自己的行为，模成功的策略等等，都需要一个相对较长的时间。演化博弈论认为，时间是不可逆的，过去时间内的状态与未来时间的状态是不对称的，因而，行为主体状态的演化跟初始的时间状态息息相关。在演化博弈模型中，随机(突变)因素起着关键的作用，演化过程常被看成是一种试错的过程。行为人会尝试各种不同的行为策略，并且每一次都将发生部分替代。

近年来，演化博弈论的理论研究以及演化博弈论在经济学的应用研究，成为国外学术界最热门的研究领域之一。演化博牟论还是经济学尤其是博弈论中的一个新领域，可以预见，在未来相长的时期内，演化博弃沧仍将是经济研究中最具发展潜力的前沿领域之一。

演化博弈理论

热门专栏

财联社

财华社

格隆汇

国际金融报

英为财情

嘉盛集团

香港智远

智通财经

热门词条