双人零和博弈

更新时间:2023-11-10 08:11:59 阅读: 评论:0

送老人-潮性办公室粤语

双人零和博弈
2023年11月10日发(作者:重英语)

一、双人零和博弈的概念

零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概

念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益

必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以

博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可

.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之

上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益

为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方

吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会

因此而增加一分.

二、双人零和博弈的模型的建立

建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参

与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记

双人零和博弈中的两个局中人为AB;局中人A的策略集为

a,,a,局中人B的策略集为b,,b;c为局中人A采取策略a

11

mni

ij

局中人B采取策略bA的收益(这时局中人B的收益为- c.

jij

收益矩阵见下表

1

局中人B

局中人A

b b b

1

2

n

1

a

1

a

2

a c c c

mm1m2mn

c c c

1112

1n

c c c

2122

2n

那么下面我们通过例子来说明双人零和博弈模型的建立:

1 甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳

头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则

是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,

算和局,均不得分.试列出对儿童甲的赢得矩阵.

本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出

两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表

2.

2

石头 剪刀

石头 0 -1 1

1 0 -1

剪刀 -1 1 0

2 从一张红牌和一张黑牌中随机抽取一张,在对B保密情况

下拿给A看,若A看到的是红牌,他可选择或掷硬币决定胜负,或让

B.若选择掷硬币,当出现正面,Ap元,出现反面,输q;

B猜,当B猜中是红牌,Ar元,反之B猜是黑牌,As.

A看到的是黑牌,他只能让B.B猜中是黑牌,Au元,反

2

B猜是红牌,At元,试确定AB各自的策略,建立支付矩阵.

A的赢得和损失分别是B的损失和赢得,故属二人零和博

.为便于分析,可画出如图3的博弈树图.

3中,○为随机点,□分别为AB的决策点,从图中看出A

的策略有掷硬币和让B猜两种,B的策略有猜红和猜黑两种,据此可

归纳出各种情况下AB输赢值分析的表格,见表4.

3

抽到红牌抽到黑球

1/2

1/2

B

掷硬币

B

正面反面猜红

1/21/2

p-q-rst-u

猜黑

猜红猜黑

4

B 抽到红牌(1/2 抽到(1/2

A

掷硬币 P t -u P -q -q

B -r t -u s -r s

正面(1/2 反面(1/2

猜红 猜黑 猜红 猜黑

对表4中各栏数字可以这样来理解:因让A看到红牌时或掷硬币

或让B.A决定选掷硬币这个策略,当出现正面,这时不管B

红或猜黑,A都赢p;当出现反面,不管B猜红或猜黑,A都输q.

同样A选择让B猜的策略后,他的输赢只同B猜红或猜黑有关,而与

3

掷硬币的正反面无关.又若抽到的牌是黑牌,A的决定只能让B猜,

因而掷硬币策略对A的胜负同样不起作用.考虑到抽牌时的红与黑的

概率各为1/2掷硬币时出现正反面的概率也各为1/2,故当A采取“掷

硬币”策略,而B选择“猜红”策略时,A的期望赢得为:

111

1

1

pq

+=

pq2t

t

222

2

4

A采取让B猜策略,B选择“猜红”策略时,A的期望赢得为:

111

1

1

rr

+=

t

rt

222

2

2

相应可求得其他策略对A的期望赢得值.由此可列出本例的收益矩

阵,见表5.

5

掷硬币

B

11

pq2tpq2u

44

11

rtsu

22

三、双人零和博弈的求解

定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U

如果存在混合战略=,…)和=,…)以

111

**

1m1

222

n

及一个常数v满足,对任意jv对任意的i

a

ij1

a

ij2

i1

j1

***

*

m

i

*

n

j

*

v,那么战略组合()为该博弈的Nash均衡.其中,v为参

1

**

2

与人1在均衡中所得到的期望支付,亦称该博弈的值.

这个极小极大定理,其基本思想就是:参与人1考虑到对方使自

4

己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵

循同样的思路,这样才能满足Nash均衡的互为最优反应的条件.这样

我们就可以得到双人零和博弈Nash均衡的计算方法了,如以下定理

定理2 对于给定的零和博弈,如果博弈的值v大于0则博弈的

Nash均衡()为以下对偶线性规划问题的解

1

**

2

Min

p

i

i1

m

s.t. 1 (j=1,,n)

ap

iji

i1

m

0 (i=1,,m)

p

i

Max

q

j

j1

n

s.t. 1 (i=1,,m)

aq

ijj

j1

n

0 (j=1,,n)

q

j

其中,Nash均衡支付

v

11

mn

ij

pq

i1j1

Nash均衡战略

11im

*

(vp,,vp,,vp)

21jn

*

(vq,,vq,vq)

由于此定理只适用于v大于0的情形,因此对于v小于等于0

情形,该定理所给出的方法需做适当的修改.

5

命题 如果支付矩阵U=的每个元素都大于0,0,那么

(a)a

ijmxnij

博弈的值大于0,v0.

定理3 如果支付矩阵U=是由U=的每个元素都加上

'

(a)

'

ij

mxn

(a)

ijmxn

一个常数c得到,即,那么支付矩阵UU所对应的零和

aac

'

ij

ij

'

博弈的Nash均衡战略相同,博弈的值相差c.

根据以上定理,可以得到如下求解一般零和博弈Nash均衡的方

:

(1) 若支付矩阵U中的所有元素都大于零,则可以直接根据定

理进行计算;若支付矩阵U中有小于0的元素,可以通过加上一个常数

使它们都大于0,然后再根据定理进行计算.

(2) 求解定理中的两个对偶线性规划问题.

下面通过实例来说明如何求解双人零和博弈的Nash均衡.

3 求解下图中战略式博弈的Nash均衡.

参与人2

L M R

U

参与人1 C

D

2-2 1-1 3-3

2-2 3-3 1-1

4-4 2-2 2-2

通过求解对偶线性规划问题求零和博弈的Nash均衡

根据前面的介绍,可知该博弈的支付矩阵为

213

U=

231

422

6

不难发现,该博弈的支付矩阵U=的每个元素都大于0,即

a

ij

3x3

a

ij

>0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战

略分别是=)和=,利用对偶线性规划

1

vp,vp,vpvq,vq,vq

123123

2

求解方法求解该战略式博弈的Nash均衡,构造规划问题如下.

Min

ppp

123

s.t. 1

2p2p4p

123

1

p3p2p

123

1

3pp2p

123

0,0,0

p

1

p

2

p

3

Max

qqq

123

s.t. 1

2qq3q

123

1

2q3qq

123

1

4q2q2q

123

0,0,0

qq

12

q

3

求解第一个规划问题,得到=1/4, =1/4, =0,参与人1

p

1

p

2

p

3

支付v=2.因此,参与人1的混合战略=1/2,1/2,0.同理,对

1

*

对偶问题求解,得到=0=1/4, =1/4,参与人2的损失v=2,

qq

12

q

3

此参与人的混合战略=0,1/2,1/2.所以,该博弈存在一个混合

2

*

战略Nash均衡(1/2,1/2,00,1/2,1/2.

4 求解下图中的战略式博弈的Nash均衡.

7

参与人2

L M R

U

参与人1 C

D

2-2 -2,2 1-1

-11 1,-1 00

3-3 0 ,0 2-2

通过求解对偶线性规划问题求零和博弈的Nash均衡

该博弈的支付矩阵为

221

U=

110

302

在上树支付矩阵U=中,<0, <0.为了利用对偶线性规

(a)

ij3x3

aa

1221

划模型求解博弈的解,构造支付矩阵U=,其中=+c.

''

(a)

'

ij

3x3

a

c=2,那么新构造的支付矩阵为

403

U=

'

132

524

ijij

a

设参与人1和参与人2的混合战略分别是=vp, vp, vp

11

'''

2

3

=vq, vq vq,,v为原博弈的值,v为新博弈的值,且

22

''''

1

3

v=v+2利用对偶线性规划求解方法求解新战略式博弈的Nash均衡,

'

构造规划问题如下.

Min

ppp

123

s.t. 1

4pp5p

123

1

3p2p

23

1

3p2p4p

123

8

0, 0, 0

p

1

p

2

p

3

Max

qqq

123

s.t. 1

4q3q

13

1

q3q2q

123

1

5q2q4q

123

0,0,0

qq

12

q

3

通过求解对偶问题,得到=0=3/13, =2/13,参与人1

p

1

p

2

p

3

支付v=13/5, =1/13, =4/13, =0,参与人2的损失v=13/5.

''

qq

12

q

3

因此,参与人1的混合战略=0,3/5,2/5, 参与人2 的混合战

1

*

=(1/5,4/5,0),原博弈的值v= v-2=3/5.所以,博弈存在一个

2

*'

混合战略Nash均衡(0,3/5,2/5(1/5,4/5,0).

9

辩论英语-一起走过的路

双人零和博弈

本文发布于:2023-11-10 08:11:59,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/zhishi/a/1699575119211426.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:双人零和博弈.doc

本文 PDF 下载地址:双人零和博弈.pdf

标签:零和竞争
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 实用文体写作网旗下知识大全大全栏目是一个全百科类宝库! 优秀范文|法律文书|专利查询|