蜈蚣博弈

概述

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:1

合作 合作 合作 合作...合作 合作

A   B   A   B …… A  B (100,100)

合作 合作 合作 合作...合作 背叛

A   B   A   B …… A  B (98,101)

现在的问题是:A、B是如何进行策略选择的?

这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。

举例

这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“ 不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛” ——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。1

悖论
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?

这就是蜈蚣博弈的悖论。

什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验,目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者,实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。

这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。

倒推法是分析完全且完美信息下的动态博弈的有用工具,在第四章我们分析言语博弈中“威胁”或“承诺”是否可信时,已给出了一个倒推法例子。我们看到,倒推法符合我们的直觉。然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定[1]

参考文献

  • 1.01.11.2 潘天群.《博弈生存》M.中央编译出版社,2004-6-1