最大最小策略

定义

最大最小策略是指局中人使得能够获得的最小收益最大化的策略。

实验者自己可以为竞争者指定决定策略,为竞争者制定了4种不同的策略,即最大化、折扣(非线性策略,短期利益不成比例的被估价)、最大最小捕获量(最大化最小收获,始终是一个可以支撑的策略)以及针锋相对策略(做其他参与者先前所做的)。 

需要强调说明的是,优势策略均衡与纳什均衡的概念是建立在博弈者理性行为的基础上的。每一个博弈者的策略选择不仅依赖于自己的理性行为,也依赖于对手的理性行为。即,不仅每个博弈者自己是理性的,而且每个博弈者知道对手是理性的,每个博弈者知道对手知道自己是理性的,每个博弈者知道对手知道自己知道对手是理性的,……等等。 

正是因为要达到优势策略均衡或纳什均衡是需要绝对理性的。任何出现了一点错误将可能使博弈者蒙受巨大的损失,因而可能有player会采取比较保守的策略。 
其中一种保守的策略是最大最小策略(Maximin strategy)。 
最大最小策略是什么呢?它是指博弈者所采取的策略是使自己能够获得的最小收入最大化。所谓最小收入是指采取某种策略所能获得的最小收入。 
最大最小策略是一种保守的策略而不是利润最大化的策略。 
很显然,博弈者往往是在信息不完全的情况下才采取最大最小策略。在信息完全的情形下,他肯定是会采取促使他利润最大化的策略。 
在某些情况下,最大最小策略所达到的均衡也是一种纳什均衡[1]

思想来源

最大最小决策规则的一个重要思想来源是20世纪著名数学家冯诺伊曼关于二人零和博弈的定理,其中每个人都选择能够最大化自己的最小的可能支付(相应于对手的各个策略)的策略。

应用

在实际生活中,往往还会遇到非常糟糕的情况,如何选择,做到最大化可能遭遇到的最小的利益,也是伤透脑筋的事情。有时个体的理智不一定会带来理想的结局,甚至可能是最坏的结果。 
例如,其中的囚徒困境(Prisoners Dilemma)值得我们深思。用表1来解释。从表中可知,对两囚徒而言最好的结果应该是都不坦白,入狱年数是最短的,可这里双方都存在一个非常稳定的占优策略――坦白,因为坦白可以避免自己陷入最糟糕境地,不论对方采取何态度自己坦白都是最好的,但结果却对于双方来说都及其糟糕。其实,这就是一种最大最小策略。这种情况下,个人理性与团队理性显然存在激烈的冲突。 
表1:囚徒困境   囚徒乙  
坦白 不坦白  
囚徒甲 坦白 -6,-6 0,-10  
不坦白 -10,0 -1,-1  
表2:寡头合作的不稳定性   厂商乙  
合作 不合作  
厂商甲 合作 200,200 120,240  
不合作 240,120 160,160  
囚徒困境同样适于分析寡头垄断厂商合作的不稳定性。见表2。分析表中数据,整体而言最理性的做法是(合作,合作)。于是,诸如OPEC组织会联手以期达到利润最大化。但同时,另外有种激励,若自己悄悄毁约、不遵守协议自己的获利会高于合作下的获利。于是(不合作,不合作)的策略组合排挤掉了(合作,合作)的策略组合,并且由于(不合作,不合作)组合还是一个占优策略均衡,所以,卡特尔经常以失败告终也就属情理之中了。

支配性策略

在有些情况下,为了避免陷入被动,采取最大最小策略十分必要。在下图的博弈中,乙方采取“右”是一个支配性策略。因为不管甲方选什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情况下,甲方应该采取“下”,并得到2的收益。这样,支配性策略均衡为(下,右)。如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能故意捉弄甲方,则应该采取最大最小策略,