严格劣势策略
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:
甲沉默(合作) | 甲认罪(背叛) | |
乙沉默(合作) | 二人同服刑半年 | 甲即时获释;乙服刑10年 |
乙认罪(背叛) | 甲服刑10年;乙即时获释 | 二人同服刑2年 |
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
二、智猪博弈理论
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
人们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这人们称之为“双赢对局”。
可以有下列两种方式:
1、将缺点自我暴露,在指出缺点的同时大力宣传产品的优点,争取消费者。美国有一个农场主,他的苹果被冰雹打了很多伤疤,不好看,他宣称凡是在高原上生产的好苹果都被打伤了,被打伤的才是正宗的高原苹果,没有被打伤的就不是。这样就在指出缺点的同时大力宣传它的优点,在高原上生长的苹果,生长周期长,日照时间长,更有营养,冰雹打伤的疤痕反而成了它的一个支持。有一家企业开发出一款汽车,外观像乌龟,不好看,他们给这种车起名叫金龟博士,同时宣传它的优点,比如说非常省油、功能齐全等等,到后来这款外观非常有特点的车就专门卖它的外观,一直卖到美国,这就是有名的大众甲壳虫。
2、将“缺点”作为“特点”,将“特点”作为“优点”来宣传。因为产品的很多特点无所谓是“缺点”还是“优点”。关键是你能把这个特点找到,能给消费者带来利益。
有一个生产冰柜的企业,它的冰柜和别人的是不一样的,主要竞争对手的产品是四面制冷,而它的是“五面制冷”。这到底是优点还是缺点呢?技术人员分析,冷气是往下走的,所以冰柜底部是最冷的,就算把冰柜底部的制冷去掉,它的底下也是最冷的。四面制冷的产品,当时是主要流行的。
而“五面制冷”是老技术,而且不容易改,那么到底四面制冷好还是五面制冷好呢?有很多专家分析的结果是四面制冷技术更先进,因为底部是不必要的,但是通过调查显示,很多消费者根本不知道哪一种更好。当时,美菱冰箱倡导一个概念:“新鲜的,美菱的”。既然冰箱能保鲜,那么冰柜也能保鲜,于是给它设计的广告语是“五面制冷新科技”。宣传由于五面制冷、制冷快保鲜效果好,这就把缺点转化成了优点。这家企业宣传五面制冷比四面制冷好,多一个面帛冷更快,对手拿他没办法,因为消费者也是这样思考的,多一面制冷当然更好,结果市场很成功。[1]