海萨尼转换
把不确定性条件下的选择转换为风险条件下的选择。在风险条件下,B虽然不知道A的类型,但可以知道不同类型
的分布概率。将不确定性条件下的选择转换为风险条件下的选择,称为海萨尼转换(the Harsanyi transformation)。1967年,海萨尼(John Harsanyi),指出所有老定义下具有不完全信息的博弈都可以在不改变其精髓的情况下被重新模型化为一个完全但不完美的信息博弈,这一切只需要添加一个由自然在不同规则集合中进行选择的初始行动即可。在老的定义中,博弈论学家常指出不完全信息博弈是不可分析的,而海萨尼的创见使得这一切有所改变。老的定义是这样描述的:在完全信息博弈中,全体参与人都知道博弈的规则,否则这一博弈就是一个不完全信息博弈。
尽管海萨尼未指出老的定义是有问题的,但事实上人们的观点已经发生了变化,现在认为在原有定义中,被转换后的博弈才是不完全信息博弈。在博弈中,其中有参与人也许对博弈的支付并不十分清楚,但对支付还是有一定的了解的。一般情况下,采用主观概分布来表示信息。也就是基于概率对进行分组构建各种博弈支付,可以形成一个特定的支付集合。比如甲与乙选择策略时,可以这样考虑,甲选择某一种策略时,乙选择策略有几种,乙的这些策略按发生的概率进行分组。通常构建一个博弈树就可以较好地表达这一切。海萨尼教义的观点关键在于假定所有的参与人都是有共同的认识,对于策略采取发生的概率是一个共同知识。隐含的意思也就是:参与人对于自己的猜测至少是少许公开了的。在对一个博弈的信息结构进行划分的时候,并不试图决定参与人能从其它参与人的行动中推断出些什么东西。先验概率是作为博弈规则的一部分存在,因此,一个参与人必须是持有关于其它参与人类型的先验信念,同时,在观察到他们的行动后,就要假定他们遵循着均衡的行为,然后更新自己的信念。
在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型是不清楚的。如果一些局中人不知道另一些局中人的支付函数,或支付函数不是共同知识,局中人就不知道他在与谁博弈,博弈的规则是没有定义的。因而在1967年以前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。海萨尼提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然”。自然首先行动,它决定每个局中人的特征。每个局中人知道自己的特征,但不知道别的局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N的行动选择,第二阶段是除N外的局中人的静态博弈。这种转换被称为“海萨尼转换”,这个转换把“不完全信息”转变成为完全但不完美信息,从而可以用分析完全信息博弈的方法进行分析。
“不完美信息”指的是,“自然”作出了它的选择,但其他参与人并不知道它的具体选择是什么,仅知道各种选择的概率分布。
按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识。用上例来说,公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率。通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈(games of complete but imperfect information)。这里的不完美信息,就是指其他参与人只知道某一参与人某些方面类型的分布概率,而不知道该参与人在这些方面的真实类型。
在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡(Bayesian Nash equilibrium)。对此,可以作如下解释:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。在给定自己的类型和其他参与人类型的分布概率的条件下,这种战略组合使得每个参与人的期望效用达到了最大化。
回到上面提到的市场进入的例子。在这个例子里,对于挑战者B来说,原垄断者A在阻挠成本方面,存在着两种可能性:高成本或低成本。B不知道A的阻挠成本究竟是高是低,但他知道A在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率。假定高成本的概率为x,则低成本的概率为(1-x)。如果A的阻挠成本高,A将默许B进入市场;如果A的阻挠成本低,A将阻挠B进入市场。在这两种情况下,如表7-10所示,B进入的支付函数分别是得到40和失去10。因此,B选择进入所得到的期望利润为40x+(-10)(1-x),选择不进入的期望利润为0。简单的计算表明,当A阻挠成本高的概率大于20%时,挑战者B选择进入得到的期望利润大于选择不进入的期望利润。此时,选择进入是B的最优选择。此时的贝叶斯纳什均衡为,挑战者B选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠。
在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。
如上所述,在不完全信息条件下,博弈的参与人知道其他参与人可能有哪几种类型,也知道不同的类型与相应战略选择之间的关系。但他们并不知道其他参与人的真实类型。在不完全信息静态博弈中,我们是通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的分布概率,来得出博弈的贝叶斯纳什均衡结果的。而在不完全信息动态博弈中,问题变得更加简单。博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他 。
(1)一个虚拟的参与人“自然”,自然首先决定参与人的类型,赋予各参与人的类型向量 , 其中 t=(t1....tn),
(2)自然告知参与者i自己的类型,却不告诉其他参与者的类型;
(3)参与者同时选择行动,每一参与者i从可行集Ai中选择行动方案 ;
(4)各方得到收益Ai(a1......ai,ti) 。
借助于第一步和第二步中虚构的参与者“自然”的行动,我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。海萨尼转换是处理不完全信息博弈的标准方法。
海萨尼转换是处理不完全信息博弈的标准方法。一般地,“自然”在博弈开始的时候选择参与人的类型,参与人的某个类型包括表征类型的各个特征如策略空间、信息集、得益函数等,这些又称为该类型参与人所拥有的个人信息。
通过海萨尼转换,博弈开始时,所有参与人有关“自然”的行动有一致的信念,即都知道所有参与人类型的概率分布函数P(t1,t2,…,tn),此即“海萨尼公理”。
举例来说,某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那么,正如下表后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡——A阻挠,B不进入。如果阻挠的成本高,那么,正如表7-10前两列所表示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡——A默许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。
B 进入 40,50 -10,0 30,100 -10,140
不进入 0,300 0,300 0,400 0,400
显然,在这里,B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型(是高还是低),而且不知道不同类型的分布概率。
按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识。用上例来说,公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率。
[2] 有效营销 http://www.em-cn.com/article/2007/147843_7.shtml