几个博弈案例
1.囚徒困境
警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境与面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(坦白还是抵赖)?
2.智猪博弈(占优战略均衡)
猪圈里有一头大猪,一头小猪。猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩 踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板与食槽之间 。
办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是 有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东与大股东的行为。)
3.性别之争(多重纳什均衡)
“有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。这个博弈的策略式表达如下:
丈夫\妻子 足球赛 肥皂剧
足球赛 (2,1 ) (0,0)
肥皂剧 (0,0) (1,2)
可以用画线法求解该博弈的纳什均衡,均衡结果是(足球赛,足球赛)与(肥皂剧,肥皂剧)。这个博弈的一个典型特征是,如果对方一意坚持,则顺从对方比与对方抗争要好。一方坚决选择自己喜欢的节目时,顺从至少可以得到1单位效用,而抗争则只能得到0单位效用。这与现实中的故事是一致的,夫妻双方一方坚持己见的时候,另一方常常会迁就一些,做出让步。
性别战博弈结构的显著特点是,博弈有两个均衡,博弈双方各自会偏爱一个均衡,比如丈夫偏爱(足球赛,足球赛)均衡,而妻子偏爱(肥皂剧,肥皂剧)均衡;不过他们还是有一些共同利益的,因为任何一个均衡中,他们都可以得到比非均衡状态更多的赢利。
4.斗鸡博弈;
斗鸡博弈(Chicken Game)其实是一种误译。Chicken在美国口语中是“懦夫”之意,Chicken Game本应译成懦夫博弈。不过这个错误并不算太严重,非要把chicken game叫作斗鸡博弈,也不是不可以。
试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退。赢利矩阵(payoff matrix)如下:
甲/乙 前进 后退
前进 (-2,-2) (1,-1)
后退 (-1,1) (-1,-1)
上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进者获得1的支付,赢得了面子,而后退者获得-1的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得-1的支付。当然表中的数字只是相对的值。
5.市场阻挠博弈
“市场进入阻挠”案例的四种博弈分析,“市场进入阻挠”是产业经济学中的一个典型例子。设想有一个垄断企业已在市场上(称为“在位者”)处于优势地位,另一个企业虎视眈眈谋求进入(称为“进入者”)。在位者若要保持自己的垄断优势,就会想方设法阻挠进入者进入。本文采用非合作博弈理论的四种类型分析“市场进入阻挠”案例。以非合作博弈理论的四种类型分析同一案例具有一定的创新性。
2.1 完全信息静态博弈:纳什均衡
纳什均衡是非合作博弈理论的基础。假设有n个人参与博弈,给定其他人战略的情况下,每个人选择自己的最优战略。所有参与人选择的战略一起构成一个战略组合。纳什均衡指的是一种战略组合,这种战略组合由所有参与人的最优战略组成。
在“市场进入阻挠”博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略可以选择:默许还是斗争。假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10。各种战略组合下的支付矩阵如表1所示: 在位者
默许 斗争
进入 (40,50) (-10,0)
进入者
不进入 (0,300) (0,300)
这个博弈中有两个纳什均衡,即(进入,默许),(不进入,斗争)。给定进入者进入,在位者选择默许时得50单位利润,斗争则为零,所以,最优战略是默许。类似的,给定在位者选择默许,进入者的最优战略是进入。尽管在进入者选择不进入时,默许与斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以(进入,默许),(不进入,斗争)都是纳什均衡。
2.2 完全信息动态博弈:子博弈精炼纳什均衡
泽尔腾(1965)通过对动态博弈的分析完善了纳什均衡的概念。纳什均衡中存在三个问题。首先,一个博弈可能不止有一个纳什均衡;其次,在纳什均衡中,参与人在选择自己的战略时,把其他参与人的战略当作给定的,不考虑自己的选择如何影响对手的战略,这个假设在研究静态博弈中是成立的,而对动态博弈而言,当一个人行动在先时,后者会根据前
者的选择而调整自己的选择,前者能过理性地预期到这一点,所以不可能不考虑自己的选择对其对手的影响。再次,由于不考虑自己的选择对别人选择的影响,纳什均衡允许了不可置信威胁的存在。泽尔腾定义的“子博弈精炼纳什均衡”就是将纳什均衡中包含的不可置信的威胁剔除出去。
动态博弈通常用博弈树表示,如下。
图1中,进入者先选择行动(进入或不进),在位者然后默许或斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为40与50。
在市场进入博弈中,如果在位者通过某种承诺行动使自己的“斗争”威胁变得可置信,进入者就不敢进入,在位者就可以获得300的垄断利润,而不是50的寡头利润。承诺行动可能有多种形式。一种简单的办法是,在位者与某个第三者打赌:如果进入者进入后他不斗争,他就付给后者100。这时,斗争就变成了一种可置信的威胁。因为,如果进入后不斗争而是选择默许,在位者得到50的寡头利润,去掉100的赌注,净得-50,而若选择“斗争”,净得为0,所以斗争比合作好。因此通过打赌设置可置信的威胁来组织进入者进入。在位者实际上无需支付100的赌注,却得到300的垄断利润。一般来说,承诺行动的成本越
高,威胁就越变得可置信。
2.3 不完全信息静态博弈:贝叶斯纳什均衡
在完全信息博弈中,不管是静态的还是动态的,都包含一个假设前提,即所有参与人都知道博弈的结构、规则及支付函数。满足这个假设的称为完全信息博弈。反之,为不完全信息博弈。贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择。给定别人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人的类型的概率分布而不知道其真实类型,他不可能准确的知道其他参与人实际上会选择什么战略;但是,他能准确的预测到其他参与人的选择是如何依赖于其各自的类型的。这样,他就是在给定自己的类型与别人的类型依从战略的情况下,最大化自己的期望效用。贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化。在市场进入例子中,进入者只有一种类型,在位者有两种类型(高成本或低成本)。即进入者具有不完全信息,而在位者具有完全信息。给定进入者选择进入的情况下,在位者选择默许还是斗争依赖于他的类型;如果是高成本,就默许;低成本,就斗
争。进入者不知道在位者的真实类型,但是,若知道高成本的可能性为x,低成本的可能性为(1-x)。那么,进入者选择进入得到的期望利润为40x+(-10)(1-x),选择不进入的期望利润为零。简单的计算表明,当x>0.20时,进入得到的期望利润才大于不进入时的期望利润,从而,进入才是最优的。假定x>0.20,那么,贝叶斯(纳什)均衡是:进入者选择进入,高成本在位者选择默许,低成本在位者选择斗争。如表2与表3。