博弈论教学/最优反应函数
出自MyKnowledgeBa
< 博弈论教学
Bread crumbs: Main Page > 教学工作 > 博弈论教学 > 博弈论教学/最优反应函数
中英对照: Best Respon Function 最优反应函数;Discrete 离散的;Continuous 连续的;
目录
■1 背景
心理健康教育教案
■2 最优反应函数
■3 最优反应函数的纳什均衡
■4 举例1(离散型Discrete )
■5 举例2(连续型Continuous -协作关系)
■6 举例3(利用最优反应函数求纳什均衡)
■7 注释与参考文献
■8 See Also
三年级手工制作1 背景
1.考虑局中人,给定非局中人的行动,局中人的各种行动为她产生不同的盈利。但是,
我们对于最优行动感兴趣——即为她产生最高盈利的那些行动。
2.通过划线法等观察的方法,可以寻找简单型博弈的均衡状态,但是对于更为复杂的博
弈,“最优反应函数”是一个更好的方法。
商业保密协议
2 最优反应函数
1.最优反应函数(Best Respon Function)的定义:定义函数为:
. 即,对于局中人来说,当给定其他局中人的行动时,中的任何行动至少如局中人的每一个其他行动一样好,则称为局中人的最优反应函数。
2.是集值函数(Set-valued Function):它将一组行动与其他局中人的行动列表联系在一
起。
如果每一个其他局中人坚持,那么局中人不可能找到比选择中的成员更好的行动。
3 最优反应函数的纳什均衡
大班育儿知识
1.(回顾)纳什均衡是具有如下性质的行动组合:在给定了其他局中人的行动时,局中人不
可能通过改变自己的行动而做得更好。或者说,每一个局中人的行动是关于其他局中人行动的最优反应。
协作关系博弈
最优反应函数的纳什均衡命题:行动组合是具有序数偏好略型博弈的纳什均衡,当且仅当每一个局中人的行动是对其他局中人行动的最优反应:对于每个局中人,在中。
利用最优反应函数求解纳什均衡的步骤:
情景描述(协作关系)两个个体涉及一种协作关系。两个个体对这种关系奉献的努力越多,她们双方
境况就越好。对任意给定个体的努力,个体所作努力的回报先扬后抑。具体地说,努力水平是非负数,个体的偏好由盈利函数来
描述,其中是的努力水平,是另一个个体的努力水平,
是常数。 策略型博弈模型:
鼓动人心行动:每个局中人的行动集是努力水平(非负数)的集合。
偏好:局中人的偏好是由盈利函数
来描述的。问题:这里每个局中人有无限多个行动,所以不能采用博弈矩阵的方式来求解纳什均给定个体,个体的盈利函数是的二次函数,则个体关于的最优反应是:
。(可以通过二次函数的对
称性或者令局中人i 的盈利关于的导数等于求解得出) 具体是:,
最优反应函数图示,横轴为局中人假设最优反应函数的交点为
(即纳什均衡点),将该交点代人上述两个方程,则有方程组
,
。联立求解得该博弈有唯
一的纳什均衡
。在这个博弈中,每个局中人对于其他局中人的每一个行动都有唯一的最优反应,所以最
在两人策略型博弈中,每个局中人的行动集是非负数集合,并且局中人的盈利函数是
拜访英语怎么读
和,求博弈的纳什均衡。
王尔德简介
解答:
的盈利函数对求偏导数,并令其等于,可得,所以的最优反应函数为.
同理,局中人2的盈利函数对求偏导数,并令其等于
,所以局中人的最优反应函数为.
牛画假设博弈的纳什均衡是,则是两个最优反应函数的交点,两个最优反应函数如右图所示。分别代入最优反应函数得到方程组,,联立求得,,
所以博弈的纳什均衡为