首页 > 试题

博弈论案例分析

更新时间:2022-12-08 08:56:52 阅读：评论：0

2019南宁中考语文试卷及答案-这的读音

2022年12月8日发(作者：拉丁舞教程下载)

博弈论案例：博弈论经典例子博弈论案

例

话题：博弈论案例传统文化报复心理囚徒收益

[笔记]——博弈论经典例子的思考摘要：博弈论就是关于在

包含相互依存情况中的理性行为的研究，是研究对策现象中

各方是否存在最合理的行动方案，以及如何找到合理的行动

方案的理论和方法。本文分析思考了博弈论的两个典型例

子，也对博弈价格战提出了自己的看法，希望能带给大家一

些启发。关键词：纳什均衡非合作博弈无限博弈田忌赛马

战国时期，齐王和大将田忌赛马，双方各出三匹马各赛一

局。各方的马根据好坏分别称为上马、中马、下马。田忌的

马比齐王同一级的马差但比齐王低一级的马好一些。若用同

一级马比赛，田忌必然连输三局。每局的赌注为1千金，田

忌要输3千金。田忌的谋士建议田忌在赛前先探听齐王赛马

的出场次序，然后用自己的下马对齐王的上马，用中马对齐

王的下马，用上马对齐王的中马。结果负一局胜两局赢得1

千金。但若事先并不知道对方马的出场次序，双方应取何种

策略？双方采用的赛马出场次序安排及相应的结果（齐王赢

的由图可知，田忌赢的概率只有六分之一，孙膑只是掌握了

齐王的思维定势侥幸赢了一把，在一把定胜负的时候管用，

当试验的机会增多，田忌就输了。如果赛马的规则发生变化，

每个人要将自己的马严格的划分等级，上等马速度必须比中

等马快，中等马必须比下等马快，且比赛时同等级的马才可

以比赛的话，那么田忌就只有输的份了。孙膑只是一时抓住

了规则的某些漏洞耍了些小聪明才取得一盘的胜利，我们只

对他的小聪明淡然一笑罢了。博弈根据不同的游戏规则会产

生与之相适应的策略。囚徒的困境有一天,一位富翁在家中被

杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌

疑人，斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家

中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发

现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将

两人隔离，分别关在不同的房间进行审讯。由地方检察官分

别和每个人单独谈话：检察官说，“由于你们的偷盗罪已有确

凿的证据，所以可以判你们1年刑期。但是，我可以和你做

个交易。如果你单独坦白杀人的罪行，你将无罪释放，但你

的同伙要被判10年刑。如果你拒不坦白，而被同伙检举，

那么你就将被判10年刑，他无罪释放。但是，如果你们两

人都坦白交代，那么,你们都要被判8年刑。”斯卡尔菲丝和

那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵

赖。显然最好的策略是双方都抵赖，结果是大家都只被判1

年。但是由于两人处于隔离的情况下无法串供，所以，按照

亚当·斯密的理论，每一个人都是从利己的目的出发，他们选

择坦白交代是最佳策略。因为坦白交代可以期望得到无罪释

放，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。

这种策略是损人利己的策略。不仅如此，坦白还有更多的好

处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。

太不划算了!因此，在这种情况下还是应该选择坦白交代，即

使两人同时坦白，至多也只判8年，总比被判10年好。所

以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)

和结局(被判1年刑)就不会出现。这样两人都选择坦白的策

略以及因此被判8年的结局被称为“纳什均衡”，也叫非合作

均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他

们只是选择对自己最有利的策略，而不考虑社会福利或任何

其他对手的利益。也就是说，这种策略组合由所有局中人(也

称当事人、参与者)的最佳策略组合构成。没有人会主动改变

自己的策略以便使自己获得更大利益。“囚徒的两难选择”有

着广泛而深刻的意义。个人理性与集体理性的冲突，各人追

求利己行为而导致的最终结局是一个“纳什均衡”，也是对所

有人都不利的结局。他们两人都是在坦白与抵赖策略上首先

想到自己，这样他们必然要延长的刑期。只有当他们都首先

替对方着想时，或者相互合谋(串供)时，才可以得到最短时

问的监禁的结果。有理由相信现实生活当中不是冤家不聚

头。结果第二次，第三次这两个囚徒又被抓到一起。有了第

一次教训之后他们会在接下来的审讯里做何选择呢？这就

是有限次重复的”囚徒的困境”。博弈论里有一种倒推法来解

决这个问题。假设这个例子只重复5次，因为在狱中渡过太

多的岁月之后他们都老到做不动坏事了。我们先看第5次他

们会怎么选。显然第5次的面临的选择和第1次是一模一样

的，因此没有理由相信这两个囚徒会在第5次审讯里合作。

如果第5次不合作，为什么他们会在第4次合作呢？如此倒

推，有限次重复的”囚徒的困境”和一次的结果没有任何不同，

即双双坦白，入狱8年。如果把这种体验无限延长，或至少

是他们俩知道肯定还有这种事，只是不知道什么时候才能停

止这种把戏，这就是无限次重复的”囚徒的困境”，让我们再

来看看这会不会有不同。因为无限博弈不存在最后一次，倒

推法不再适用。假设一个人在监狱里呆久了会适应这种环境

变得油滑。因此第一个8年最长，后来再进去的8年变得只

有象6年一样长，再后来是4年...。因此这里引入一个表示

监狱生活适应性指数的符号——”&”，0<&<1。

这个&值越大表明对监狱生活越难适应，前一个8年和

后一个8年差不多一样漫长。如果&越小则表示这个囚

犯对环境适应很快，后来呆上8年都没什么感觉了。对于一

个经常被判8年的人来说，他的受惩罚实际感受的总量是：

(-8)+&(-8)+&[&(-8)]+...。易知，如果

0<&<1，则

1+&+&&+&&&+...的极限值是

1/(1-&)。假设这两个囚徒选择这样一种战略：最开始选

择抵赖，然后一直选择抵赖直到另一方选择了坦白，然后就

永远选择坦白。这样的话其中任一个囚徒选择永远抵赖的总

收益是：(-1)+&(-1)+&[&(-1)]+...=(-1)/1-&。

如果其中某一次他选择了坦白，则那一次他将获无罪释放，

之后对方将用永远坦白来惩罚他，他们俩都一直被判8年。

因此总收益是：0+&(-8)+&

[&(-8)]+...=(-8&)/(1-&)。如果要使某次坦白对

其中一个囚犯有利，显然需要其中坦白一次这种选择所带来

的收益(-8&)/(1-&)大于等于一直互相合作抵赖所带

来的总收益(-1)/1-&，也就是&<=1/8的情况下(即

某人实在认为狱中岁月妙不可言，判得久对他来说无所谓，

&值极低)才会有人选择中途坦白，否则在无限次重复

的”囚徒的困境”当中他们都会选择一直抵赖以使自己能尽量

减少在监狱中渡过时光。因此在无限次重复的”囚徒的困境”

中最后的结果和一次或是有限次完全不同。在很大概率上囚

徒会选择合作而不是各自为战。也就是说，在长期的双方关

系中任何短视的行为都是得不偿失的。这个结果可以用来说

明为什么我们的传统文化里强调人与人的关系”以和为贵”。

数千年来中国一直是农业国家，农业人口缚系于土地，乡间

邻里相对固定。因此人们彼此之间的很多利益冲突可以用无

限次重复的囚徒困境来描述。也就是说如果某次利益是通过

冲突而不是合作解决，那么失利的一方必然会设法报复，而

且这种对立的情绪很有可能在后辈中延续，也就是无限次被

重复，结果必然是双方都得不偿失。此所谓”冤冤相报何时了”!

我的看法是：现实中囚徒要考虑更多的因素，即使他们合谋

决定合作，他们商量好都抵赖，但是真正面对警察的审讯时，

他们又会考虑对放是否会出卖自己，他们有可能会继续出卖

对方。但是人都有报复心理的，如果一方违背了约定，虽然

能很快出狱，但是若干年后呢，那位囚徒刑满释放后会放过

他吗？考虑到若干年后的情况，两个囚徒也许会都选择抵

赖。如果惩罚和奖赏的度发生改变：两人都坦白的话，则均

判刑1年；A坦白B抵赖，则A无罪释放，B判刑5年；两

人都抵赖的话，则均判刑3个月，这样的情况下，两个囚徒

会做怎样的选择呢？这样两个囚徒都选择坦白的可能性比

较大，毕竟一年的时间比较短，不必为了3个月的刑而冒坐

牢5年的风险。这里涉及到了风险收益不对称问题，湖北省

的一些官员，明明知道某些问题存在，却坐视不理，很大的

原因就是风险收益不对称，不治理问题不会太大，治理好了

奖励表彰也不怎么样，治理差了要受到责怪，于是湖北就有

些落后，原因就是湖北的官太聪明了。总之，囚徒的困境涉

及到的问题众多，不仅仅是心理与智力的较量，游戏规则的

指定对结果产生的影响是比较明显的。而现实中我们要考虑

的相关因素会更多，博弈论只有与我们已经掌握的情况充分

的结合才能得出比较满意的策略。博弈价格战现在我们经常

会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空

调大战、微波炉大战??这些大战的受益者首先是消费者。每

当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。

在这里，我们可以解释厂家价格大战的结局也是一个“纳什均

衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润

正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这

个结果可能对消费者是有利的，但对厂商而言是灾难性的。

所以，价格战对厂商而言意味着自杀。从这个案例中我们可

以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能

导致一个有效率的零利润结局。二是如果不采取价格战，作

为一种敌对博弈论其结果会如何呢?每一个企业，都会考虑采

取正常价格策略，还是采取高价格策略形成垄断价格，并尽

力获取垄断利润、如果垄断可以形成，则博弈双方的共同利

润最大。这种情况就是垄断经营所做的，通常会抬高价格。

另一个极端的情况是厂商用正常的价格，双方都可以获得利

润：从这一点，我们又引出一条基本准则：“把你自己的战略

建立在假定对手会按其最佳利益行动的基础上”。事实上，完

全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种

状态下，每一个厂商或消费者都是按照所有的别人已定的价

格来进行决策。在这种均衡中,每一企业要使利润最大化，消

费者要使效用最大化，结果导致了零利润，也就是说价格等

于边际成本。在完全竞争的情况下，非合作行为导致了社会

所期望的经济效率状态。如果厂商采取合作行动并决定转向

垄断价格，那么社会的经济效率就会遭到破坏。这就是为什

么WTO和各国政府要加强反垄断的意义所在。我对博弈价

格战的看法是：各个公司的实力是不一样的，一些国际上知

名的家电厂商，和国内厂商一样采取低价战略，同样低价的

情况下，老百姓当然愿意选择国际知名的大公司的产品，因

为国际知名大公司的产品有档次，质量也不会比国内的差。

虽然说厂家都会亏本，但是国际大公司资金雄厚，他亏本几

年甚至十几年都亏得起，国内一些脆弱的公司亏本几个月或

者一年就倒下了，一家家国内家电厂商退出后，国际大公司

形成垄断，适当提高价格，不久就会把以前亏损的钱弥补回

来，也许还会赚得更多。但是当一些普通品牌家电厂商采取

低价策略的时候，一些名牌家电厂商会采取提价的策略，也

许一些经济能力差点的消费者会买相对便宜的普通品牌家

电，但是有能力买名牌家电的人会觉得名牌家电不降价是因

为质量好，所以尽管名牌家电提价后仍然获得了丰厚的利

润，同时在中国这个社会，攀比非常严重，人们的思维定势

是便宜没好货，在中国，少数消费者目前处于盲目消费阶段，

不管多贵的东西都有人买，商家不愁卖不出去，。所以说，

商家不管是采取提价还是降价都是可取的，但是要结合当时

的情况，还有就是厂家的目的到底是为了立竿见影还是在几

年后的翻盘。结语博弈渗透到生活的各个方面，实际情况往

往比理论复杂得多，不按常理出牌也许会收到意想不到的效

果，只有知己知彼才能做出最正确的决策。参考文献[1]、施

锡铨著．博弈论．上海：上海财经大学出版社，2000[2]刘

加福．新管理博弈学．中国纺织出版社，2005[3]张维迎．博

弈论与信息经济学．上海人民出版社，1996[4]谢识予．经

济博弈论．石家庄：复旦大学出版社，

2002?tid=105717博弈

论是指某个个人或是组织，面对一定的环境条件，在一定的

规则约束下，依靠所掌握的信息，从各自选择的行为或是策

略进行选择并加以实施，并从各自取得相应结果或收益的过

程，在经济学上博奕论是个非常重要的理论概念。下面介绍

几个关于博弈论的例子：1。智猪博弈这个例子讲的是：猪

圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，

每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落

下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会

抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在

小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏

板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃

到另一半残羹。那么，两只猪各会采取什么策略？答案是：

小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；

而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原

因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃

上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总

是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，

自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。“小

猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规

则的核心指标是：每次落下的事物数量和踏板与投食口之间

的距离。如果改变一下核心指标，猪圈里还会出现同样的“小

猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。

投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。

小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把

食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁

也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏

板，这个游戏规则的设计显然是失败的。改变方案二：增量

方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩

踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物

吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”

社会，所以竞争意识却不会很强。对于游戏规则的设计者来

说，这个规则的成本相当高（每次提供双份的食物）；而且

因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变

方案三：减量加移位方案。投食仅原来的一半分量，但同时

将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢

着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好

消费完。对于游戏设计者，这是一个最好的方案。成本不高，

但收获最大。原版的“智猪博弈”故事给了竞争中的弱者（小

猪）以等待为最佳策略的启发。但是对于社会而言，因为小

猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最

佳状态。为使资源最有效配置，规则的设计者是不愿看见有

人搭便车的，政府如此，公司的老板也是如此。而能否完全

杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合

适了。比如，公司的激励制度设计，奖励力度太大，又是持

股，又是期权，公司职员个个都成了百万富翁，成本高不说，

员工的积极性并不一定很高。这相当于“智猪博弈”增量方案

所描述的情形。但是如果奖励力度不大，而且见者有份（不

劳动的“小猪”也有），一度十分努力的大猪也不会有动力了

----就象“智猪博弈”减量方案一所描述的情形。最好的激励机

制设计就象改变方案三----减量加移位的办法，奖励并非人人

有份，而是直接针对个人（如业务按比例提成），既节约了

成本（对公司而言），又消除了“搭便车”现象，能实现有效的

激励。许多人并未读过“智猪博弈”的故事，但是却在自觉地

使用小猪的策略。股市上等待庄家抬轿的散户；等待产业市

场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游

资；公司里不创造效益但分享成果的人，等等。因此，对于

制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指

标改变的个中道理。2．囚徒困境在博弈论中，含有占优战

略均衡的一个著名例子是由塔克给出的“囚徒困境”

（prisoners’dilemma）博弈模型。该模型用一种特别的方

式为我们讲述了一个警察与小偷的故事。假设有两个小偷A

和B联合犯事、私入民宅被警察抓住。警方将两人分别置于

不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给

出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，

于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也

作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有

坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）

再加刑2年，而坦白者有功被减刑8年，立即释放。如果两

人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以

私入民宅的罪名将两人各判入狱1年。我们来看看这个博弈

可预测的均衡是什么。对A来说，尽管他不知道B作何选择，

但他知道无论B选择什么，他选择“坦白”总是最优的。显然，

根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。

但是，倘若他们都选择“抵赖”，每人只被判刑1年。（抵赖、

抵赖）是最优的，因为偏离这个行动选择组合的任何其他行

动选择组合都至少会使一个人的境况变差。不难看出，“坦白”

是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占

优战略均衡。3．笨蜗居Ross和Rachel是一对情侣，暗地里

都有过不忠的行为。但他们并不想分开，而是希望能继续生

活在一起，于是不得不面对一个问题：是否应该向对方坦白

自己的不忠行为？对于Ross来说，他有两个战略，“坦白”

或者“隐瞒”。如果他向Rachel坦白自己的过错，Rachel作为

“清白”的一方(Ross并不知道Rachel的不忠行为，当Rachel

选择“隐瞒”)将在二人关系中占据心理优势，从而使得Ross

处于弱势状态。如果他决定隐瞒，则将背负良心上的谴责。

这个博弈是对称的，因此对于Rachel来说同样存在这样的两

难抉择。我们引入经济学的收益概念来衡量博弈中战略的优

劣，设收益上限为10分。如果Rachel选择“隐瞒”而Ross选

择“坦白”的话，Rachel将占据“我是清白的”的心理优势，从

而获得9的收益，而劣势一方的Ross的收益只有5。反过来

对Ross来说也是一样。如果两人都不约而同地选择“坦白”，

虽然彼此都会感到被背叛的痛苦，但是能够将心比己地互相

原谅，二人的收益都是8。如果两人都选择“隐瞒”，他们之

间感情得以维系的信任基础已经在事实上消失了，对双方来

说都是非常大的损失，收益都只有6。下表列出了四种情况

下双方的收益，Rachel在前。直观地说，肥皂剧观众和经济

学家们最愿意看到的结果自然是双方都坦承错误并互相原

谅，这样可以使这部肥皂剧更加吸引人并且使双方收益之和

最大。但博弈论给出的结论却正好相反。从表中可以看出，

在Rachel选择“坦白”的情况下，Ross选择“隐瞒”的收益大于

选择“坦白”的收益；在Rachel选择“隐瞒”的情况下，Ross选

择“隐瞒”的收益也大于选择“坦白”的收益。因此，“隐瞒”对

于Ross来说是一个占优战略，无论对方做出什么选择，这个

战略都可以保证他的收益最大。作为一个理性的人(这是博弈

论的基本假设)，Ross必然会选择“隐瞒”。同样，Rachel也会

选择“隐瞒”。于是，博弈的结果就是双方都选择“隐瞒”，各

得到6收益。这是个稳定的纳什均衡，虽然结果出乎意料：

博弈双方都选择了使自己利益最大化的战略，却得到了最差

的收益(总收益是四种方案中最低的)。而观众所期待的“彼此

坦白”的情况下，任何一方都可以通过改变策略而获得更大的

收益，比如Ross由“坦白”转向“隐瞒”可以使自己的收益由8

上升到9。因此它是一个不稳定解，必须依靠某种外界约束

才能存在。我们设想Ross和Rachel之间达成某种形式的协

议，承诺对对方的不忠行为既往不咎。在这个约束条件下“彼

此坦白”的解能够稳定存在，这就是合作解。这是个典型的社

会两难问题。各自从自身利益出发的博弈双方会自然而然地

达到稳定的纳什均衡，但这往往导致最坏的收益。如果双方

能建立有约束力的协议，则可以形成合作解，从而获得最好

的收益。最近三四十年，经济学经历了一场”博弈论革命”，

就是引入博弈论的概念和方法改造经济学的思维，推进经济

学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳

什博士在内的3位博弈论专家，可以看作是一个标志，这自

然也激发了人们了解博弈论的热情。博弈论作为现代经济学

的前沿领域，已成为占据主流的基本分析工具。博弈论是研

究决策主体的行为发生直接相互作用时的决策以及这种决

策的均衡，也就是说，当一个主体的选择受到其他主体选择

的影响，而且反过来影响到其他主体选择时的决策问题和均

衡问题。一个完整的博弈应当包括五个方面的内容：第一，

博弈的参加者，即博弈过程中独立决策、独立承担后果的个

人和组织；第二，博弈信息，即博弈者所掌握的对选择策略

有帮助的情报资料；第三，博弈方可选择的全部行为或策略

的集合；第四，博弈的次序，即博弈参加者做出策略选择的

先后；第五，博弈方的收益，即各博弈方做出决策选择后的

所得和所失。”囚徒困境”“囚徒困境”是博弈论里最经典的例

子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，

隔离审讯；警方的政策是”坦白从宽，抗拒从严”，如果两人

都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放

出去，不坦白的判１０年；如果都不坦白则因证据不足各判

１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，

他们每个人都有两个策略即坦白和不坦白，判刑的年数就是

他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦

白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。

Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选

择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖

却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，

因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不

管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，

不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两

个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组

合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收

益，于是谁也没有动力游离这个组合，因此这个组合是纳什

均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ

和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８

年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个”

攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，

没有人有积极性遵守这个协定。实证分析：”囚犯困境”在经

济学上有很多应用，也有力地解释了一些经济现象。一．电

信价格竞争根据我国电信业的实际情况，我们来构造电信业

价格战的博弈模型。假设此博弈的参加者为电信运营商A与

B,他们在电信某一领域展开竞争，一开始的价格都是P0。A

（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市

场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，

是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政

府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其

中就有B的价格可以比P0低10％。这一举动，还不会对A

产生多大的影响，因为A的根基实在是太牢固了。在这样的

市场分配下，A、B可以达到平衡，但由于B在价格方面的

优势，市场份额逐步壮大，到了一定程度，对A造成了影响。

这时候，A该怎么做？不妨假定：A降价而B维持，则A

获利15，B损失5，整体获利10；A维持且B也维持，则A

获利5，B获利10，整体获利15；A维持而B降价，则A

损失10，B获利15，整体获利5；A降价且B也降价，则A

损失5，B损失5，整体损失10。从A角度看，显然降价要

比维持好，降价至少可以保证比B好，在概率均等的情况下，

A降价的收益为15×50％－5×50％＝5，维持的收益为5×50％

－10×50％＝－2．5，为了自身利益的最大化，A就不可避

免地选择了降价。从B角度看，效果也一样，降价同样比维

持好，其降价收益为5，维持收益为2．5，它也同样会选择

降价。在这轮博弈中，A、B都将降价作为策略，因此各损

失5，整体损失10，整体收益是最差的。这就是此博弈最终

所出现的纳什均衡。我们构造的这一电信业价格战博弈模型

是典型的囚徒困境现象，各个局部都寻求利益的最大化，而

整体利益却不是最优，甚至是最差。许多其他行业的价格竞

争都是典型的囚徒困境现象，如可口可乐公司和百事可乐公

司之间的竞争、各大航空公司之间的价格竞争等等。

二．OPEC组织成员国之间的合作与背叛”囚徒困境”告诉我

们，个人理性和集体理性之间存在矛盾，基于个人理性的正

确选择会降低大家的福利，也就是说，基于个人利益最大化

的前提下，帕累托改进得不到进行，帕累托最优得不到实现。

上述我们在对电信价格竞争的博弈分析中，只是一次性的”

囚徒困境”博弈，因此得到了互相降价的纳什均衡。而在现实

生活当中，信任与合作很少达到如此两难的境地，无论在自

然界还是在人类社会，”合作”都是一种随处可见的现象。比

如中东石油输出国组织（Ｏｒｇａｎｉｚａｔｉｏｎｏｆ

ＰｅｔｒｏｌｅｕｍＥｘｐｏｒｔｉｎｇＣｏｕｎｔｒ

ｉｅｓ简称ＯＰＥＣ）的成立，本身就是要限制各石油生

产国的产量，以保持石油价格，以便获取利润，是合作的产

物。OPEC之所以能够成立，各组织成员国之间之所以能够

合作，是因为囚徒困境如果是一次性博弈(Oneshotgame)的

话，基于个人利益最大化，得到纳什均衡解，但如果是多次

博弈，人们就有了合作的可能性，囚徒困境就有可能破解，

合作就有可能达成。连续的合作有可能成为重复的囚徒困境

的均衡解，这也是博弈论上著名的”大众定理”(FolkTheorem)

的含义。但合作的可能性不是必然性。博弈论的研究表明，

要想使合作成为多次博弈的均衡解，博弈的一方（最好是实

力更强的一方）必须主动通过可信的承诺(Credible

commitment)，向另一方表示合作的善意，努力把这个善意

表达清楚，并传达出去。如果该困境同时涉及多个对手，则

要在博弈对手中形成声誉，并用心地维护这个声誉。这里”

可信的承诺”是一个很牵强的翻译，”Crediblecommitment”并

不是什么空口诺言，而是实实在在的付出。所以合作是非常

困难的。所以OPEC组织经常会有成员国不遵守组织的协

定，私自增加石油产量。每个成员国都这样想，只要他们不

增加产量，我增加一点点产量对价格没什么影响，结果每个

国家都增加产量，造成石油价格下跌，大家的利润都受到损

失。当然，一些产量增加较少的国家损失更多，于是也更加

大量生产，造成价格进一步下降--结果，陷入一个困境：大

家都增加产量，价格下跌，大家再增加产量，价格再下跌......。

理论上，几乎所有的卡特尔都会遭到失败，原因就在于卡特

尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有

成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了？

理论上，如果是无限期的合作，双方考虑长远利益，他们的

合作是会成功的。但只要是有限次的合作，合作就不会成功。

比如合作１０次，那么在第九次博弈参与人就会采取不合作

态度，因为大家都想趁最后一次机会捞一把，反正以后我也

不会跟你合作了。但是大家料到第九次会出现不合作，那么

就很可能在第八次就采取不合作的态度。第八次不合作会使

大家在第七次就不合作......一直到，从第一次开始大家都不

会采取合作态度。以上是运用博弈论中的经典案例”囚徒困

境”对现实经济生活的一些简单的理论上的分析，虽然在现实

生活当中影响人们决策和态度的因素很多，但是，博弈论作

为现代经济学的前沿领域，始终是一个强有力的分析工具。

/一个著名的博弈寓

言：村庄里的大屠杀在一个偏僻的山里，有一个村庄。这里

是女人掌权，女人对一切事务说了算。村里有100对夫妇。

在这个村里已经形成了约定俗成的规定。如果女人发现自己

的丈夫对自己不忠的话，就会毫不犹豫地将他杀死，而且就

在当天执行。当然，她必须有确切的证据来证明她丈夫不忠。

由于这个因素，某个女人发现某个男人不忠，她不会将之告

诉那个不忠男人的妻子。但是，她会告诉其他人的妻子，并

且女人们会相互传递这一信息，因此最后，一个男人不忠，

除了其妻子不知道外，其他女人都知道。而事实上是，村子

里的这100对夫妇的男人都不忠，但由于女人不会将她知道

的事实告诉不忠男人的妻子，每个女人都不知道自己的男人

不忠。因此，该村子一直很稳定，而没有发生妻子杀死丈夫

的行为。村子里有一个辈份很高的老太太，她德高望重，诚

实可敬。每个人都向她汇报村里的情况，因此她对村里的情

况了如指掌，她知道每个男人都不忠，当然，其他女人不知

道她所知道的。一天，这位老人对这100个女人说了一句很

平常的话：“你们的男人当中至少有一个是不忠的。”于是，

村里发生了这样一个事情：前99天，村里风平浪静，但到

了第100天，村里发生了一场大屠杀，所有的女人都杀死了

她们的丈夫。故事就是这样的。为什么会这样？公共知识与

行动均衡的打破这是一个推理和行动的过程。如果她的丈夫

不忠的话，她就杀死他；如果没有证据证明她的丈夫不忠的

话，她便相信他，不杀死他。这是女人的策略。在老太太

作了宣布之后的第一天，如果村里只有一个男人是不忠的

话，这个男人的妻子在老太太宣布之后就能知道。因为，她

会作这样一个推理：如果其他男人不忠的话，她应当事先知

道，既然不知道并且至少有一个男人不忠，那么这个不忠的

男人肯定就是她的丈夫。因此，村里如果只有一个男人不忠

的话，老太太宣布之后，当天这个男人就会被杀死。如果

村里有两个男人不忠，那么，这两个男人的妻子第一天都不

会怀疑到自己的丈夫，因为她知道另外一个女人的丈夫不

忠。但是当第一天过后她没有发现那个不忠诚的男人被杀

死，那么她会想，肯定有两个男人是不忠的，否则她知道的

那个不忠的男人会被他的妻子当天杀死的。既然有两个男人

不忠，但这两个不忠的男人的妻子想，她只知道一个，那么

另一个不忠的男人肯定是她的丈夫！……事实上这个村子里

的100个男人不忠，那么，这样推理会继续到99天，就是

说，前99天每个女人都没怀疑到自己的丈夫，而当第100

天的时候，每个女人都确定地推理出她的丈夫不忠，于是村

子里便发生了一场大屠杀，所有的男人都被他们的妻子杀

死。这里，在老太太宣布“至少一个男人是不忠的”这样一个

事实时，每个女人其实都知道这个事实（村子里的规则她们

也知道），老太太对这个事实的宣布似乎并没有增加这些女

人的知识——关于村里男人不忠行为的知识。但为什么老太

太的宣布使得村里的女人产生了对她们丈夫的屠杀行为

呢？这是因为，老太太的宣布使得这个群体里的女人的知识

结构发生了变化，本来“至少一个男人是不忠的”对每个女人

都是知识，但不是公共知识，而老太太的宣布使得这个事实

成为公共知识。所谓公共知识是指，一群体的每个人不仅知

道这个事实，而且每个人知道该群体的其他人知道这个事

实，并且其他人也知道其他的每个人都知道这个事实……这

涉及一个无穷的知道过程。在上述例子中，老太太未宣布之

前，对村子里的女人来说，“至少一个男人是不忠的”不是一

个公共知识。设想一下，假定共有3个女人A、B、C，那么

在未宣布之前，A想：由于自己不知道自己的丈夫不忠，其

他两个女人B、C也同样不知道，那么A想B不知道C是否

知道“至少有一个男人是不忠的”。而当老太太宣布了“至少一

个男人是不忠的”之后，“至少一个男人是不忠的”便成了A、

B、C之间的公共知识。在这个100人组成的小村里，老太

太的宣布使得“至少一个男人是不忠的”成了公共知识。于是，

推理与行动便开始了。这是大屠杀的原因！

本文发布于:2022-12-08 08:56:52，感谢您对本站的认可！

本文链接：http://www.wtabcd.cn/fanwen/fan/88/65044.html

上一篇：阿室于

下一篇：感受阳光

标签：博弈论案例分析

留言与评论（共有 0 条评论）