博弈均衡求解的另一种处理方法
摘要:本文并不试图像大部分博弈论研究文献那样对日渐复杂的博弈结构提出精妙的均衡解,而是对诸如货币政策的动态一致性与古诺模型这样最基本的博弈问题,提出一种与传统处理方法不同的求解思路。本文提出的处理方法依旧沿袭了纳什均衡的核心思想,但在求解过程中不是将他人的行动看作主体决策的外生变量,而是将其看作受主体决策影响的内生变量,实则将战略看作相机抉择的行动规则而非决策的最终结果。使用本文提出的均衡处理方法,对于大量博弈问题我们会得出与传统处理方法完全不同的均衡结论,这种均衡结论的差异所展现的实际上是均衡实现机制的差异,所以可以认为本文的处理方法与传统方法分别适用于分析不同实现机制下的博弈均衡。本文的价值或许就在于对于求解某些均衡实现机制下的均衡问题提出了一种更为合适的处理方法,并且对于一些经典博弈模型的均衡解提出了新的看法。
关键词:博弈均衡处理方法实现机制
A new treatment of equilibrium in game theory Abstract: This text does not attempt to propo wonderful solution to the complicated structure of game theory like rearch document of most game theories , but to the question as most basic as the dynamic consistency of the monetary policy and Cournot model, put forward a treatment different from traditional method . The treatment put forward in
this text is still followed the key thought of Nash equilibrium , we do not regard others' action as the external variable of one’s decision, but regard it as endogenous variable that is influenced by his decisions, in fact we regard strategy as action rule but not final result of the decision of choice. According to the treatment in this text, we can draw conclusions completely different from traditional treatment method, what the difference of this kind of equilibrium conclusion reprented is the difference of the realizing-mechanisms proportionally, so can think the chess match that realizing-mechanisms different from suitable for analyzing parately by traditional treatment method herein is balanced . Herein value lie in , solve some realize balanced problem of mechanism put forward a treatment method suitable proportionally asking perhaps, play chess solution putting forward the new view to some classics proportionally of the model.
Key words:equilibrium in game theory treatment realizing-mechanisms
一、引言
纳什(Nash, 1950)提出了纳什均衡的概念:有n个参与人的战略式表述博弈G={S1,……,S n;u1,……,u n},战略组合s*=(s1*,……,s i*,……s n*)是一个纳什均衡,如果对于每个i,s i*是给定其他参与人选择s-i*=(s1*,……,s i-1*,s i+1*,……,s n*)的情况下第i个参与人的最有战略,
即:u i(s i*,s-i*)≥u i(s i,s-i*),对于任意的s i∈S i。或者用另一种表述方式,s i*是下述最大化问题的解:s i*∈argmax u i(s1*,……,s i-1*,s i,s i+1*,……,s n*),i=1,2,……,n。纳什均衡一经问世,立刻成为博弈理论的思想基础。本文提出的关于求解博弈均衡的另一种处理方法也完全沿袭了上述纳什均衡的思想。
本文提出的处理方法与传统方法的唯一差别在于对“战略”概念的认识,为简单起见,先分析两人完全信息静态博弈均衡:
传统处理方法:
在静态博弈中,“战略”与“行动”是同一概念,其表现的都是决策的结果,如古诺模型中选择的产量q i。因而当参与人i进行战略(行动)选择时,其将另一参与人j的选择结果s j(q j)看成是外生的。即i在s j(q j)给定的情况下选择s i*以最大化自己的效用。
本文处理方法:
在静态博弈中,“战略”与“行动”不是同一概念。“行动”与传统理解一样,指决策的结果,如古诺模型中选择的产量q i;而“战略”指决策规则,比如说“当i选择产量q i时,j的战略为选择产量q j=R(q i)”,q
=R(q i)就是j的战略s j,q j只是战略s j的结果,是j的行
j
动。因而当参与人i进行战略选择时,其将j的战略s j看作是外生的,而将选择的结果——行动(如古诺模型中选择的产量q)看作是内生的,即当i进行选择时,其会意识到j的行动会因自己的选择的变化而变化,只有j的战略(行动规则)是给定的、外生的。
简言之,在静态博弈中,传统方法认为战略就是行动,就是选择的结果;而本文的方法认为行动是选择结果,而战略不是,战略是选择规则,即“相机抉择”。
为了更形象的说明本文所提出的博弈均衡处理方法,以下两章将首先探讨两个经典的博弈模型。
二、第一个模型:货币政策的动态一致性
基德兰德与普雷斯科特(Kydland and Presscoot, 1977)在一篇经典论文中提出了政策的动态一致性模型,该模型已经成为宏观经济学中最著名的模型之一,几乎见诸于任何一本高级宏观经济学教科书。基德兰德与普雷斯科特运用传统的博弈均衡处理方法,证明尽管在理性预期假设下,货币政策不会对产出造成影响,但动态不一致性的存在使政府依然会选择高于最优通货膨胀率的货币政策。
本文提出的处理方法与传统处理方法到底存在怎样的差异?均衡结果又有什么实质性的区别?我们首先回顾基德兰德与普雷斯科特所运用的传统处理方法,再考虑本文提出的处理方法。
传统处理方法:
政策制定者的政策目标是最小化以下政府损失函数
2211[()*](*)22
e L y b y a ππππ=+--+- (1) 将预期通货膨胀率视为既定,最小化的一阶条件为
[()*](*)0e y b y b a ππππ+--+-= (2)
从(2)中解出π
2
22*(*)(*)e a b y y a b a b
ππππ=+-+-++ (3) 由于假设预期为理性预期,所以e
π=π,将此条件代人(3)得到 *(*)b y y a
ππ=+- (4)
结果表明实际通货膨胀率高于最优通货膨胀率,且产出依然为潜在产出。
本文处理方法:
政策目标同(1),但考虑政府在最小化损失函数时,意识到其即将选择的通货膨胀率将会被具有理性预期的公众完全预测到,即无论选择怎样的通货膨胀率,都会有e π=π,因而政府将e π视为内生变量,于是在求导一阶条件前先将e π=π代人(1),得到 2211[*](*)22
L y y a ππ=-+- (5) 再求一阶条件
a (π-π*)=0 (6)
从中解出最优通货膨胀率为
π=π* (7)
结果表明当政府不再将公众的通货膨胀预期看作是给定的外生变量,而是将本文所定义的“战略”e π=π这一公众的预期形成机制看作外生变量,将公众的通货膨胀预期e
π看作受政府通货膨胀决策影响的内生变量时,均衡结果将与传统处理方法中的结果存在实质性差异。此时由于政府意识到其通货膨胀决策会影响到公众的预期,因而不会试图通过通货膨胀
政策来拉动产出,所以选择通货膨胀率等于最优通货膨胀率,产出和传统处理方法中的一样,仍然为潜在产出。
使用本文提出的均衡处理方式,我们得出了可以说是与基德兰德与普雷斯科特相反的结论,即动态一致性。但本文绝非要否定基德兰德与普雷斯科特的动态不一致性理论,实际上他们的理论也并没有错。两种不同的处理方法导致的结论上的大相径庭源于博弈均衡实现机制的差异,不同的均衡处理方式适用于不同的实现机制,关于实现机制对处理方法的影响以及一系列相关理论问题我们将留待第四章进行讨论,下面再来看一个寡头垄断的博弈模型。
三、 第二个模型:古诺模型与伯川德悖论
古诺(Cournot, 1838)提出了著名的古诺模型,堪称纳什均衡的最早版本;伯川德(Bertrand, 1883)提出了与古诺模型相对的伯川德模型,两个模型都是博弈论中最著名的模型。古诺模型与伯川德模型考察的都是生产同质产品的双寡头垄断假设下的经济行为。模型的设定差异只在于前者垄断厂商确定产量,市场确定价格;后者垄断厂商确定价格,市场确定产量。看似无足轻重的差异却导致了迥异的结论:古诺模型中厂商选择介于完全竞争与完全垄断之间的产量,价格大于边际成本,利润大于零;伯川德模型中厂商选择与完全竞争同样的产量,价格等于边际成本,利润等于零,这便是著名的“伯川德悖论”。
“伯川德悖论”与现实相左,需要从模型假设中寻找原因,克服“伯川德悖论”的典型方法是引入更切合实际的产品差异性,但如果运用本文提出的求解博弈均衡的处理方法,则可以克服“伯川德悖论”,且均衡结果与完全垄断相似,两企业分别生产完全垄断产量的一半,使得边际成本等于边际收益,大于价格,获得最大利润,即实现卡特尔。下面分别考察古诺模型与伯川德模型。
古诺模型:
厂商的利润函数为
πi (q 1,q 2)=q i P(q 1+q 2)-C i (q i ), i=1, 2 (8)
传统处理方法:将q 1、q 2看作厂商1和2的“战略”。厂商1将2的产量q 2看作外生变量,选择q 1=R(q 2),以最大化利润π1;同理,厂商2选择q 2=R(q 1)最大化利润π2。按照古诺论文的简化假设,再根据最大化定理的一阶条件,得到
1221q *=R(q )=(a-q -c) 2
(9) 2111q *=R(q )=(a-q -c) 2
(10) 从(9)与(10)构成的方程组可以解得
121q *=q *=(a-c)3
) (11) 2121==()9
a c ππ- (12) 本文处理方法:将q 1、q 2看作 “行为”,将决策规则R 1、R 2看作“战略”,将“战略”作为外生变量,将“行为”作为内生变量。即在对方决策规则R i 既定的情况下选择自己的最优决策规则R j *,而将对方即将选择的产量q i 当作受到自己选择影响的内生变量,相应的反应函数为
R 1*=R 1(R 2) (13)
R 2*=R 2(R 1) (14)
通过递归,可以得到
R 1*=R 1(R 2)=R 2 (15)
R 2*=R 2(R 1)=R 1 (16)
121q *=q *=(a-c)4
(17) 1p=(a-c)2
(18) π1= π2=21()8
a c - (19) 均衡结果是,两厂商采取与对手同样的选择规则,并且选择与对手同样的产量,最终确定的产量相当于卡特尔下的产量。结论表明当厂商意识到自己的选择将会影响对方选择的时候,其会利用自己选择对对手选择的影响,以实现个人与集体效用的同时最大化。
伯川德模型:
传统处理方法:每一厂商都将对方定价视为外生变量,在假设对方定价以定,且与自身定价无关的情况下都试图降低自身价格以占领市场,最终厂商的竞价行为使产量和价格与完全竞争情况相同,所有利润都被挤干。
本文处理方法:由于每一厂商都考虑到自身定价对于对手定价的影响,因而最终采取与对方定同一价格的战略,其均衡解与(17)——(19)完全一样。
使用本文所提出的处理方法,我们得出古诺模型与伯川德模型具有一致的均衡解,从而克服了“伯川德悖论”。实际上我们是给两个模型同时引入了篡谋,而篡谋的实现有赖于本文提出的处理方法,进一步讲本文处理方法的可行性又极大程度上依赖于博弈均衡的实现机制。下面我们就着重讨论均衡的实现机制及相关理论问题。
四、
本文提出的博弈均衡处理方法的理论分析