经济博弈论考试复习

更新时间:2023-11-26 21:35:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

经济博弈论考试复习

一、

1.什么是博弈论?

“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。 2.什么是纳什均衡?

在博弈G=﹛S1,…,Sn;u1,…,un ﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn *)中,任一博弈方i的策略si*,都是对其余博弈

方策略组合(s1*,…,si?1*, si*,si?1*,… sn *)的最佳对策,也即ui(s1*,…,si?1*,

si*,si?1*,… sn *)》ui(s1*,…,si?1*, si*,si?1*,… sn *)对任意sij?Si都成立,

则称(s1*,…,sn *)为G的一个“纳什均衡”。

3.什么是囚徒困境?

囚徒困境的基本模型是这样的:警察抓住了两个合伙犯罪的罪犯。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们窜供或结成攻守同盟:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白这从轻处理,立即释放,而另一人则将重判八年徒刑;如果两人同时坦白认罪,他们将各被判五年监禁。

坦白 不坦白(囚徒2)

囚徒1 坦白 不坦白 -5,-5 -8, 0 0,-8 -1,-1 双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。由于

这两个囚徒不能串通,个人都追求自己的最大利益而不会顾及同伙的利益,又不敢相信对方,以此只能实现他们都不理想的结果。该博弈揭示了个体理性与团体立项之间的矛盾——从个体理性出发的行为往往不能实现团体的最大利益,最终也不能真正实现个体的最大利益,甚至会得到相当差的结果。 二、

1.什么是完全信息静态博弈?

完全信息静态博弈是指各博弈方同时决策,且所有的博弈方对各方得益都了解的博弈。完全信息是指信息的充分性、对称性和透明性,静态是指同时决策,没有时间的差别。 2.如何求解纳什均衡? (1)离散有限——划线法

通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。

例:囚徒的困境博弈

坦白 不坦白(囚徒2)

囚徒1 坦白 不坦白 -5,-5 -8, 0 0,-8 -1,-1 可以看出,只有策略组合(坦白,坦白)对应的得益系数(-5,-5)下面都划有短线,意味着只有这个策略满足双方的策略相互使对对方策略的最佳对策。就是博弈的结果。

划线法一策略之间的相对优劣为基础,在分析用得益矩阵表示的博弈问题时十分有普遍适用性。但事实上,也有许多博弈根本不存在确定性的结果,无法用这种方法。

(2)连续无限——函数法(求导,建立拉格朗日方程) ★反应函数法:

对一个一般的博弈,只要是得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。利用反应函数求博弈的纳什均衡的方

法称为“反应函数法” 设:Ux=Ux(x,y) Uy=Uy(x,y)

?2uy?2uxx,y,Ux,Uy连续,Ux,Uy二阶可微并且 2<0, 2 <0,

?y?x则求解反映函数:

?uy=0 ?y?ux=0。其解即为Nash均衡 ?x例:养羊博弈模型(P67)

局限性:1)对于不连续的得益函数无法用先求导数找出各个博弈方的反应函数的方法求纳什均衡,所以无法发挥作用。

2)并不能保证各博弈方的反应函数有交点,特别是唯一的交点。 (3)零和博弈

1)有限离散策略——最大最小值法:

X给出一个策略ax’,则y会给出一个行动ay’,使Ux(ax’,ay’)=minUx(ax,ay),而x要选择一个ax*,使Ux最大,Ux(ax*,ay*)=max minUx(ax,ay)=min maxUx(ax*,ay*). y的一个策略ay,x却会选一个ax’使Ux最大,即Ux(ax’,ay)=maxUx(ax,ay),则y会选一个ay*使Ux(ax*,ay*)=minmaxUx(ax,ay)

2)无限连续策略——反应函数方程(同上反应函数法) (4)循环相克博弈(混合战略)——无差异法

1)所谓循环相克博弈是指博弈者的任何一项战略行为都受到对方某种战略的完全克制,对手之间的各个战略,形成相互克制的封闭环。如: “石头、剪子、布”游戏

2)所谓混合战略:

设: ,Ax={ax1,ax2,……,axn},Ay={ay1,ay2,……,aym}

设x在Ax中随机选择战略,且某种战略被选择概率是?Xk,??Xk=1,则?X=

k?1n﹛?X1(aX1),?X2(aX2),......,?XN(aXN)﹜是x的混合战略。 同理,y的混合战略 ?y ={ ?y1(ay1),?y2(ay2),......,?ym(aym)}

例: P74~80

3)混合战略Nash均衡的确定原则——无差异原则

即给定我的混合战略,你的任何战略都是无差异的。同时,给定你的混合战略,我的任何战略也都是无差异的。

在循环相克博弈中,均衡的状态就是从彼此克制中摆脱,使彼此相克转为彼此都不能相克——彼此不被对方克制的状态就是一种双方同时实现最优的状态。因为,任何一种纯战略都会陷入被对方克制的局面,只有采取一种混合战略,才能摆脱相互克制的局面。同时,这种混合战略还必须使对方的战略都无差异。 3.如何甄别、区分多重均衡? (1)帕累托最优型Nash均衡

设x,y是两个player,(ax1,ay1)和(ax2,ay2)是两组Nash均衡策略,(ux1,uy1)和(ux2,uy2)是x和y在两种Nash均衡策略下的效用()

如果满足ux1>ux2,并且uy1>uy2,则称,(ax1,ay1)是帕累托最优的Nash均衡。 例:战争与和平博弈

-5 , -5 8 , -10 -10 , 8

10 , 10 这里有两组Nash均衡:(战争,战争),(和平,和平)。但ux和平>ux战争,并且uy和平>uy战争,因此,(ax和平,ay战争)是比(ax和平,ay战争)帕累托占优的Nash均衡。 (2)风险稳定(浮动)型Nash均衡

设(ax1,ay1),(ax2,ay2)是两组Nash均衡, (ux1,uy1),(ux2,uy2)是x和y的Nash均衡效用

如果ax1出现一个微量浮动⊿ax1,则ay1就不再是y的最优策略,uy(ax1+⊿ax1 ,ay1)

如果对于ax2的一个浮动⊿ax2, ay2仍是y的最优策略.uy(ax2+⊿ax2,ay2)>uy(ax2+

⊿ax2,ay1)。则称(ax2,ay2)是风险稳定型Nash均衡。 (3)聚点均衡

在多重Nash均衡中,如果存在某种因素使其中的一种均衡成为更可能繁盛的聚焦点,则这一Nash均衡称为聚占均衡。(这种因素可能使文化、历史、信息等)

(4)相关均衡

多重博弈均衡的实现与博弈的解的某种事件相关。 三、

1. 什么是完全信息动态博弈?

完全且完美信息动态博弈简称动态博弈,也称为多阶段博弈、序列博弈或扩展型博弈。特征是博弈方依次选择行动,后选择行为者是在看到先选择行为者的选择后在选择,博弈方互相了解得益情况。

对比静态博弈:博弈选择有先后顺序,行为者可观察到对手的策略选择,博弈过程要你来我往的多个回合

2.什么是子博弈精炼纳什均衡?为什么要找它?

①什么是子博弈?由博弈路径上一个单结信息集开始的,并且它的后续结不与其它信息集粘连的博弈过程。即动态博弈中满足一定要求的局部所构成的次级博弈。

特点:a.信息确定

b.信息不丢失,过去知道的现在亦知道。 ②子博弈精练Nash均衡

如果在一个完美信息的动态博弈中,个博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的作业子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”:第一,S是原博弈的纳什均衡。第二,S在每一个子博弈上给出纳什均衡。

③子博弈精练Nash均衡的价值在于剔除掉那些不可信的、只在特定的博弈路径(子博弈)上成立的均衡,因此是可信的、稳定的,在所有博弈路径上成立的均衡。

3.什么是逆向归纳法?

本文来源:https://www.bwwdw.com/article/8alt.html

Top