博弈论知识点总结完整版

更新时间:2023-05-03 10:00:55 阅读：评论：0

博弈论

（一）：基本知识

1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。

1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重黄花梨怎么鉴别要的基本要素。

1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。

合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人

们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈：

a、完全信息静态博弈，纳什均衡，Nash(1950)

b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965）

c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968）

d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975） Kreps, Wilson(1982) Fudenberg, Tirole(1991)

1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈

1.5博弈模型的两种表示形式：策略式表述 (Strategic form), 扩展式表述（Extensive form）

1.6占优均衡：

a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。

对于所有的s-i， si*称为参与人i的严格占优战略，如果满足：

ui(si*,s-i)>ui(si',s-i) ∀ s-i, ∀ si' ≠si*

b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。

1.7重复剔除严劣策略均衡：

a、“严劣”和“弱劣”的含义：

设 si’和si’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立

ui(si’, s-i) < ui(si’’, s-i), 则说策略si’严劣于策略si’’ 。

上面式子中，若将“<”改为“≤”，则说策略si’弱劣于策略si’’ 。

b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。

（二）：纳什均衡（Nash Equili英文日期怎么写 brium）

2.1纳什均衡定义：对于一个策略式表述的博弈G= {N,Si, ui, i∈N}，称策略组合s*=(s1, …si, …, sn)是一个纳什均衡，如果对于每一个i ∈N, si*是给定其他参与人选择s-i*={s1*, … ,si-1*, si+1*, … ,sn*} 情况下参与人i的最优策略（经济理性策略），即：ui(si*, s-i*) ≥ ui(si, s-i*), 对于任意的 si∈Si ,任意的 i∈N均成立。

通俗定义：纳什均衡是一种策略组合，给定对手的策略，每个参与人选择自己的最优策略。纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后，每个人都满意自己

作出了正确的选择；没有人能得到更好的结果了。在博弈论中这种结果被称为纳什均衡（NE）。

2.2定理：

Nash在1950年证明：任何有限博弈，都至少存在一个NE——Existence of Nash Equilibrium。即在一个有n个参与人的策略式博弈G={S1,…,Sn; u1,…,un}中，如果n是有限的，且Si是有限集（i=1,…,n），则该博弈至少存在一个纳什均衡（在混合策略意义下）

Wilson（1971）证明，几乎所有有限博弈，都存在有限奇数个NE，包括纯策略NE和混合策略NE。——Oddness Theorem

2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系

定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡，但反过来不一定成立；

定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。

2.4划线法

先找出自己针对其他博弈方每种策略或策略组合（对多人博弈）的最佳对策，即自己的可选策略中与其他博弈方的策略或策略组合配合，给自己带来最大得益的策略（这种相对最佳策逃离的英文海南大学录取分数线略总是存在的，不过不一定唯一），然后在此基础上，通过对其他博弈方策略选择的判断，包中国平均工资括对其他博弈方对自己策略判断的判断等，预测博弈的可能结果和确定自己的最优策略。这就是划线法。

2.5箭头法

箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。对博弈中的每个策略组合进行分析，考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。如能，则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况，形成对博弈结果的判断。划线法和箭头法的结果是一致的，可以相互替代。

（三）：混合策略（Mixed Strategies）纳什均衡

3.1定义：混合策略的定义：在博弈G={N, Si, ui, i∈N}中，假设参与人i的纯策略构成的策略

集合为Si={si1,…, sik}，若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”，称这样的选择方式为混合策略。这里，0≤pij ≤ 1,对于j=1 ,…, k都成立，且有, pi1+…+ pik=1。纯策略可看成特殊的混合策略。上述定义是在有限博弈前提下进行的。

3.2混合策略意义下策略组合的表述

{x1∈X1, …, xn∈Xn}，其中Xi , i =1, …, n表示参与人i所有纯策略生成的概率空间，xi为参与人i的一个具体混合策略

猜硬币博弈的一个混合策略就可记为{（1/2, 1/2）,(1/2, 1/2)}

3.3VNM效用函数（Von Neumann and Morgenstern冯诺依曼和摩根斯坦）

如果某个随机变量X以概率Pi取值xi，i=1,2,…,n，而某人在确定地得到xi时的效用为u(xi)，那么，该随机变量给他的效用便是： U(X) = P1u(x1) + P2u(x2) + ... + Pnu(xn)

表示关于随机变量X的期望效用。因此U(X)称为期望效用函数，又叫做冯诺依曼——摩根斯坦效用函数（VNM函数）。

3.4基于混合策略意义下的博弈策略式表述

定义：基于(v-N-M效用的)策略式博弈由 a、参与人集合 b、每个参与人有一个（纯）策略集合 c、对于每一个参与人来说，由所有参与人纯策略组合构成的风险结果空间，存在一个v-N-M效用

3.5混合策略意义下的纳什均衡

定义：对于博弈G= {N, Si, ui, i∈N}，基于v-N-M效用的混合策略组合*是一个纳什均衡，若对于每一个i, 以及i的任意一个混合策略i，*对应的期望支付至少和(i，*-i )的期望支付一样大

换句话说，称混合策略组合*是一个纳什均衡，如果没有一个参与人通过偏离策略*i 实现支付的增加

3.6一个定理

对于N-人静态博弈问题，设混合策略纳什均衡对应的策略组合为(Xi , X –i ) 。

对于任意的i ,若最优混合策略为Xi= {x1,…,xl，0…0}(不失一般性，假设前l个分量严格大于0)，记分量xk (k=1,…, l) 对应的纯策略sk,

则对于参与人i而言，sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值,等于纳什均衡混合策略组合 (Xi, X –i )的收益值。即ui (sk, X –i ) = ui (Xi, X –i )成立， k=1,…, l

3.7方法：

a、求解混合策略均衡可以用期望收益等值法

本文发布于:2023-05-03 10:00:55，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/82/520480.html

上一篇：影响芯片可靠性设计的六大因素

下一篇：2017红宝书考研英语词汇(词汇分类整理)--基础词

标签：策略博弈组合参与混合策略选择

留言与评论（共有 0 条评论）