博弈论复习题及答案分析-共22页

更新时间:2023-12-22 13:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√ )

子博弈精炼纳什均衡不是一个纳什均衡。(× )

若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。 (× ) 上策均衡一定是纳什均衡。 (√)

在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。 (√)

在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。 (× )

在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。 (× ) 上策均衡是帕累托最优的均衡。 (×)

因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×)

在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)

在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×)

纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√ ) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√ )(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳

战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×)) 根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。

如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√ )

1、无限次重复博弈与有限重复博弈的区别:

a. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,

存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。 b. 无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,

必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。 c. 无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩

罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。

4、根据两人博弈的支付矩阵回答问题:

a b A 2,3 0,0 B 0,0 4,2 (1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分) (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。(7分) (1)策略 甲:A B 乙:a b

博弈树 (草图如下:

(2)Pure NE (A, a); (B, b)

都是Pareto有效,仅(B, b)是K-H有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。

参与人2

参与人1 解答:

A B

a 2,3 4,4 b 3,2 5,2 c 3,4 0,1 d 0,3 1,2 C D

3,1 3,1 4,1 4,1 1,4 -1,2 10,2 10,1 纯策略纳什均衡为(B,a)与(A,c) 分析过程:设两个参与人的行动分别为a1和a2,

?B,如果a2?a??B,如果a2?bplayer1的反应函数R1(a2)??

?A,如果a2?c?C或者D,如果a?d?2?c,如果a1?A??a,如果a1?Bplayer2的反应函数R2(a1)??

?c,如果a1?C?c,如果a?D?1交点为(B,a)与(A,c),因此纯策略纳什均衡为(B,a)与(A,c)。

6、(entry deterrence市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

在位者 进入 进入者 默许 (20,30)

在位者 进入 默许 (10,20)

斗争 (-10,0) 进入者 斗争 不进入 (-10,25)

不进入 .

(0,100) (0,100)

左图:温柔型 右图:残酷型

(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分)

(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)

(1)温柔 NE (in, accommodate) 和 (out, fight)。 SPNE为(in,

accommodate)

残酷 NE (out, fight). SPNE同理 (2)20p?10(1?p)??0 得到p??1/3

8、博弈方1 和博弈方 2就如何分 10,000 元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额 A 和 B,0≤A,B≤10,000。如果 A+B≤10,000,则两博弈方的要求得到满足,即分别得 A 和 B,但如果 A+B>10,000,则该笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么?

答十、纳什均衡有无数个。最可能的结果是(5000,5000)这个聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:(1)用囚徒困境的博弈表示如下表: 北方航空公司 合作 竞争 合作 500000,500000 0,900000 新华航空公司 竞争 900000,0 60000,60000 (2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:

万元)由下图的得益矩阵给出:

(1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么?

答(1)(低价,高价),(高价,低价) (2)(低价,高价)

13、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

(1)画出A、B两企业的支付矩阵。

(2)求纳什均衡。 3. 答:(1)由题目中所提供的信息,可画出A、B两企业的支付矩阵(如下表)。

B企业 做广告 不做广告 做广告 20,8 25,2 A企业 不做广告 10,12 30,6 (2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。

如果A厂商做广告,则B厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A厂商不做广告,则B厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。

如果B厂商做广告,则A厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B厂商不做广告,A厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A、B两厂商都做广告。

15、求出下面博弈的纳什均衡(含纯策略和混合策略)。

乙 L R U 5,0 0,8 甲

D 2,6 4,5 由划线法易知,该矩阵博弈没有纯策略Nash均衡。 可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash均衡((,),(,)

16、 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出:

(1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡?

18994377

参考答案: 由划线法可知,该矩阵博弈有两个纯策略Nash均衡,即(低质量, 高质量), (高质量,低质量)。

乙企业 高质量 低质量 高质

50,50 100,800 量 甲企

业 低质

900,600 -20,-30 量

该矩阵博弈还有一个混合的纳什均衡 Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得x?因此该问题的混合纳什均衡为((12856375,),(,))。 97971381381263 ,y?97138

17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?

乙企业 开发 不开发 甲企开发 -10,-10 100,0 业 不开

0,100 0,0 发

解:用划线法找出问题的纯策略纳什均衡点。 ??10,?10100,0? ?0,0??0,100?所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。 该博弈还有一个混合的纳什均衡((

101101,),(,))。 11111111如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为:

??10,?10?a100,0??0,0??0,100?a?,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需

a>10。此时乙企业的收益为100+a。

18、博弈的收益矩阵如下表: 乙 左 右 上 a,b c,d 甲 下 e,f g,h (1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足? (3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什

么?

(4)在什么情况下,纯战略纳什均衡不存在?

答:(1)a?e,c?g,b?d,f?h。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为(b,f)?(d,h);而对甲而言,占优策略为

(a,c)?(e,g)。综合起来可得到所需结论。

a?e。(2)纳什均衡只需满足:甲选上的策略时,同时乙选左的策略时,b?d,故本题中纳什均衡的条件为:b?d,a?e。

(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。

(4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

19、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John给Smith 3美元,如果不同,Smith给John 1美元。 (1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?

答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。 John 1 2 3 1 3,-3 -1,1 -1,1 Smith 2 -1,1 3,-3 -1,1 3 -1,1 -1,1 3,-3 (2)Smith选(1/3,1/3,1/3)的混合概率时,

John选1的效用为:U1??(?3)??1??1?? John选2的效用为:U2??1??(?3)??1?? John选3的效用为:U3??1??1??(?3)?? 类似地,John选(1/3,1/3,1/3)的混合概率时, Smith选1的效用为:U1'??3??(?1)??(?1)? Smith选2的效用为:U2'??(?1)??3??(?1)? Smith选3的效用为:U3'??(?1)??(?1)??3?

'?U',所以: 因为U1?U2?U3,U1'?U2313131313131313131313131313131313131313131313131311?111111?'U??U?是纳什均衡,策略值分别为John:;Smith:。 (,,),(,,)?333333?33??

20、假设双头垄断企业的成本函数分别为:C1?20Q1,C2?2Q22,市场需求曲线为P?400?2Q,其中,Q?Q1?Q2。

(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反

应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润,并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。 答:(1)对于垄断企业1来说:

max[400?2(Q1?Q2)]Q1?20Q1190?Q2 ?Q1?2 这是垄断企业1的反应函数。

其等利润曲线为:?1?380Q1?2Q1Q2?2Q12 对垄断企业2来说:

2max[400?2(Q1?Q2)]Q2?2Q2Q1 ?Q2?50?4 这是垄断企业2的反应函数。

其等利润曲线为:?2?400Q2?2Q1Q2?4Q22 在达到均衡时,有:

Q??190??50?1?4??Q?80 ?Q1???12?Q2?30 均衡时的价格为:P?400?2?(80?30)?180 两垄断企业的利润分别为:

?1?380?80?2?80?30?2?802?12800

?2?400?30?2?80?30?4?302?3600

均衡点可图示为:

190 企业2 企业1的反应线 均衡点 0 95 企业1 200

(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:

Q2?50?Q1/4

则企业1的问题可简化为:

?Q???max?400?2?Q1?50?1??Q1?20Q14????

?Q1?280/3???Q2?80/3 均衡时价格为:P?400?2??28080????160 33?? 利润为:?1?39200/3,?2?25600/9 该均衡可用下图表示:

190 企业2 企业1的反应线 Stackelberg均衡50 企业2的反应线 0 95 企业1 200

企业2领先时可依此类推。

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”

21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q2-q3,这里qi是企业i的产量。每一企业生产的单位成本为常数c。三企业决定各自产量的顺序如下:(1)企业1首先选择q1≥0;(2)企业2和企业3观察到q1,然后同时分别选择q2和q3。试解出该博弈的子博弈完美纳什均衡。

答:该博弈分为两个阶段,第一阶段企业1选择产量q1,第二阶段企业2和3观测到q1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。

(1)假设企业1已选定产量q1,先进行第二阶段的计算。设企业2,3的利润函数分别为:

?2?(a?q1?q2?q3)q2?cq2 ?3?(a?q1?q2?q3)q2?cq3

由于两企业均要追求利润最大,故对以上两式分别求一阶条件:

??2?a?q1?2q2?q3?c?0 (1) ?q2

??3?a?q1?q2?2q3?c?0 (2) ?q3a?q1?c (3) 3求解(1)、(2)组成的方程组有:

*q*2?q3?(2)现进行第一阶段的博弈分析:

对与企业1,其利润函数为; ?1?(a?q1?q2?q3)q1?cq1 将(3)代入可得:

?1?式(4)对q1求导:

??1?a?2q1?c?0 ?q1q1(a?q1?c)3 (4)

解得:

*q1?*?此时,?11(a?c) (5) 21(a?c)2 1211*(a?c),q*(a?c) 2?q3?26(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:

*q1?

25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P。

求(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60 (2)200-2Q=20,Q=90,Q1=Q2=45

26、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问:

(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示

该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博

弈并作简单分析。

(1)完全信息动态博弈。

博弈结果应该是工人偷懒,老板克扣。

(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。

28、给定两家酿酒企业A、B的收益矩阵如下表: A企业 白酒 啤酒 白酒 700,600 900,1000 B企业 啤酒 800,900 600,800 表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益。 (1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?

(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少?

(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡?

答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。

(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。

(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。

30、在纳税检查的博弈中,假设A为应纳税款,C为检查成本,F是偷税罚款,且C

(1)写出支付矩阵。

(2)分析混合策略纳什均衡。 答:(1)该博弈的支付矩阵如下表: 纳税人 逃税 不逃税 检查 A-C+F, -A-F A-C,-A 税收机关 不检查 0,0 A,-A (2)先分析税收检查边际:因为S为税务机关检查的概率,E为纳税人逃税的概率。给定E,税收机关选择检查与否的期望收益为:

K(1,E)?(A?C?F)E?(A?C)(1?E)?EF?A?C

K(0,E)?0?E?A(1?E)?A(1?E)

解K(1,E)?K(0,E),得:E?C/(A?F)。

如果纳税人逃税概率小于E,税收机关的最优决策是不检查,否则是检查。 再分析逃税边际:给定S,纳税人选择逃税与否的期望收益是:

K(S,1)?(?A?F)S?0?(1?S)??(A?F)S

K(S,0)??AS?(?A)(1?S)??A

解K(S,1)?K(S,0),得:S?A/(A?F)。即如果税收机关检查的概率小于S,纳税人的最优选择是逃税,否则是交税。 因此,混合纳什均衡是(S,E),即税收机关以S的概率查税,而纳税人以E的概率逃税。

34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线:

P=30-Q

2TR1?PQ1?(30?Q)Q1?30Q?Q1?Q1Q2其中Q为两厂商的总产量,即Q=Q1+Q2。 再假设边际成本为零,即 MC1=MC2=0

解释并讨论此例的纳斯均衡,为什么其均衡是一种囚徒困境。

厂商1的总收益TR1由下式给出:

2TR1?PQ1?(30?Q)Q1?30Q?Q1?Q1Q2厂商1的边际收益MR1为: MR1=30-2Q1-Q2

利用利润最大化条件MR1=MC1=0,得厂商1的反应函数(reaction function)或反应曲线为:

Q1=15-0.5Q2 (6-1) 同理可得厂商2的反应曲线为: Q2=15-0.5Q1 (6-2)

均衡产量水平就是两反应曲线交点Q1和Q2的值,即方程组6-1和6-2的解。可以求得古诺均衡时的均衡产量水平为:Q1=Q2=10。

因此,在本例中,两个寡头的总产量Q为Q1+Q2=20,均衡价格为P=30-Q=10。 刚才我们讨论了两寡头厂商相互竞争时的均衡产量。现在我们放松第(6)条不能串谋的假设,假定两寡头可以串谋。它们能共同确定产量以使总利润最大化。

这时,两厂商的总收益TR为:

2

TR=PQ=(30-Q)Q=30Q-Q 其边际收益MR为:

MR=30-2Q

根据利润最大化条件MR=MC=0,可以求得当Q=15时总利润最大。如果两厂商同意平分利润,每个寡头厂商将各生产总产量的一半,即Q1=Q2=7.5。其实,任何相加为15的产量Q1和Q2的组合都使总利润最大化,因此,把Q1+Q2=15称为契约曲线,而Q1=Q2=7.5是契约曲线上的一个点。

我们还可以求得当价格等于边际成本时,Q1=Q2=15,各厂商的利润为零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面。他们决策的不同组合导致收视率如下:

(1)如果两家是同时决策,有纳什均衡吗?

有(前面,后面)

(2)如果双方采用规避风险的策略,均衡的结果是什么? 此题应用的思想是最大最小收益法:

也就是说,在对手采取策略时,所获得的最小收益中的最大值。 电视台1:对方采取前面战略的最小收益为18 对方采取后面战略的最小收益为16

固电视台1 会选择收益为18的战略——前面 电视台2:前面的策略是一个优超策略——前面 策略均衡为(前面,前面)

(3)如果电视台1先选择,结果有什么?若电视台2先选择呢?

(4)如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果能是什么? 电视台1 许诺将好节目放在前面的许诺不可信。 因为电视台2,前面为占优策略,

而在电视台2 ,选择前面的时候,电视台1 选择后面的收益要大于前面的收益。 所以,最终结果为(前面,后面)

36、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问δ应满足什么条件,才存在子博弈完美纳什均衡?

乙 坦不坦白 甲 白 坦白 4,4 0,5 不坦白 5,0 1,1 参考答案:

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i的策略组合s的最好反应支付

?i(s)?maxPi(s?i,si)=5,Pi(s*)=4,Pi(s)=1。若存在子博弈完美纳什均衡,必须满

si?Sic

?i(s*)?Pi(s*)5?41??足:???i(s*)?Pi(sc)5?14,即只有当贴现因子?>1/4时,才存在子博弈完美

纳什均衡。

37、在Bertrand价格博弈中,假定有n个生产企业,需求函数为P=a-Q,其中P是市场价格,Q是n个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。并请解释δ与n的关系。 分析:此题可分解为3个步骤

(1)n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。

(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润

(3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。 参考答案:

(1)设每个企业的边际成本为c,固定成本为0 P=a-Q

TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c

则:Q=(a-c)/2 P=(a+c)/2

π=(P-c)*Q=(a-c)2/4

每家企业的利润为(a-c)2/4n

(2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 ,获得所有的垄断利润——(a-c)2/4

(3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑:

A企业不降价: (a-c)2/4n, (a-c)2/4n, …… A企业降价: (a-c)2/4, 0, …… 使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。

设贴现因子为δ

A不降价的贴现值: [(a-c)2/4n][1/(1- δ)] A降价的现值: (a-c)2/4

于是:[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4 解得: δ≥1-1/n

38、假设某劳动市场为完全竞争市场,其供求函数如下: SL:W=120+2L DL:W=360-L 已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10LK且其产品的需求与供给函数分别为 D:P=60-2q S: P=20+2q

试求 (a)该厂商的AC,MC及VMP各为多少?

L

L

L

0.5

0.5

(K=100)

(b)劳动工资为多少?厂商会雇用多少劳动? 由:S=D解得:W=280

L

L

由于产品市场为完全竞争市场,且要素市场也为完全竞争市场 所以,满足:产品市场均衡:P=MR=MC=W/MPL 要素市场均衡:W= ACL=MCL=VMPL 得到:ACL=MCL=VMPL=280

由:D=S解得:P= 40,q=10 厂商追求利润最大化的情况下: W*=VMPL=P*MPL=P*50/L

L*=[100/2*PW*]=51 (取整数)

1.试计算表1中的战略式博弈的重复剔除劣战略均衡。

表1 一个战略式表述博弈

A

对B而言,战略M严格劣于R;(因为1<4, 1<6,0<8),因此剔除B的战略M;构成新的博弈如下

A

在新的博弈中,

对于A而言,战略U严格劣于D(因为1<3,2<7),因此剔除A的战略U,构成新的博弈如下:

A

对于新的博弈中,已经没有严格的劣战略,因此没有严格的劣战略可以剔除。所以该博弈不是重复剔除严格劣战略可解的。

但是存在弱劣战略。对于B而言,战略L弱劣于R(因为6=6,1<8),因此

M D

B L 5,6 3,1 R 2,6 7,8 U M D

L 1,2 5,6 3,1 B

R 2,4 2,6 7,8 U M D

L 1,2 5,6 3,1 B M 3,1 7,1 2,0 R 2,4 2,6 7,8 2

0.5

剔除B的弱劣战略L,构成新的博弈如下:

A

M

B

R 2,6 D 7,8 在新的博弈中,对于A而言,战略M严格劣于D(因为2<7),因此剔除A的战略M,构成新的博弈如下:

A

因此,重复剔除(弱)劣战略均衡为(D,R)

(ps: 如果同学们用划线的方法求纳什均衡,就可以发现纯战略nash均衡有两个:(M,L)和(D,R)但采用剔除弱劣战略的方法,把其中一个纳什均衡剔除掉了)

2. 试给出下述战略式表述博弈的所有纳什均衡。

D

B R 7,8 2

L

U

2,2 R 3,3 D 4,4 1,2 给定1选择U,2的最佳选择是R(因为2<3),在相应位置划线 给定1选择D,2的最佳选择是L(因为4>2),在相应位置划线 给定2选择L,1的最佳选择是D(理由自己写),在相应位置划线 给定2选择R,1的最佳选择是U(理由自己写),在相应位置划线 找两个数字下都划线的,显然有两个纯战略纳什均衡:(U,R)和(D,L) 据Wilson的奇数定理,可能有一个混合战略均衡。 设1选U的概率为?,那么选D的概率为1?? 设2选L的概率为?,那么选R的概率为1??,

如果存在混合战略,那么2选战略L和R的期望收益应该应该相等,因此应

1

有UL?2??4(1??)?UR?3??2(1??)

??? 自己求解 (2分) 同样,1选战略U和D的期望收益应该应该相等

UU?2??3(1??)?UD?4??1(1??)

??? 得混合均衡:?

3.市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为P=16-Q。其中P是市场价格,Q为市场总产量。

(1)求古诺(Cournot)均衡产量和利润。

(2)求斯坦克尔伯格(Stackelberg)均衡产量和利润。

(1)设两个企业的产量分别为q1,q2,有Q?q1?q2,因此利润函数分别为:

?1?(16?q1?q2)q1?16q1?q12?q1q2

2?2?(16?q1?q2)q2?16q2?q2?q1q2

利润最大化的一阶条件分别为:

??1?16?2q1?q2?0 ?q1??2?16?2q2?q1?0 ?q2因此企业1和企业2的反应函数分别为:

q1?16?q2 216?q1 2q2?联立,得到q1?q2??。自己求解

(2)设企业1先行,企业2跟进。两个企业的产量分别为q1,q2,因此利润函数分别为:

?1?(16?q1?q2)q1?16q1?q12?q1q2

2?2?(16?q1?q2)q2?16q2?q2?q1q2

由逆向归纳法,在第二阶段,企业2在已知企业1的产量的情况下,最优化自己的产量,从

而得到企业2的反应函数:

??2?16?2q2?q1?0 ?q2因此企业2的反应函数为:q2?16?q1 2在第一阶段,企业1考虑到企业2的反应,从而自己的利润函数为:

?1?(16?q1?q2)q1?16q1?q12?q1q2?16q1?q12?q1(??1?0 ?q116?q1) (2分) 2要使企业1的利润最大,应满足一阶条件:

得到q1??。

所以q2??。

(PS: 古诺模型是完全信息静态博弈,求的是纳什均衡;斯坦伯格模型是完全信息动态博弈,求的是子博弈精炼纳什均衡)

4.(1)试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。(2)倘若2告诉1:2的战略是(c,i,j),问此时1的最优战略是什么?(3)在(2)中,1和2的战略组合构成一个纳什均衡吗?均衡结果是什么?(4)(3)中的纳什均衡不是子博弈精炼的,原因是什么?

1

a b

2 2

c d e j

(1,2) (2,1) 1 (6,3)

f g 2 (3,2) l i

(4,6) (0,2)

答: (1)

1

a b

2 2

c d e j

(1,2) (2,1) 1 (6,3)

(2分) f g 2 (3,2) l i

(4,6) (0,2) 由逆向归纳法,子博弈精炼均衡为[(b,g),(c,e,l)],均衡结果为(4,6)。 (2)若2的战略为(c,i,j),则1的最优战略为(b,f)。

(3)给定2的战略为(c,i,j),1的最优战略为(b,f);反之,给定1的战略

(b,f),战略(c,i,j)是2的一个最优战略。所以它们构成一个纳什均衡,均衡结

果为(6,3)。

(4)因为2的战略(c,i,j)中含有不可置信的威胁i,使1在f和g之间不敢选g。当博弈进行到2在l与i之间进行选择的时候,2必会选l,给定如此,1选g而不是f,此时2会选e,这就是子博弈精炼均衡。

5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。

1 R

(1,2)

L L?

2

l r l r

(2,4) (0,1) (3,1) (7,2)

当“2”看见“1”未选R时,设他认为“1”选L的概率为P, “1”选L?的概率为1-P,则“2”选l的期望支付为:

4P?1?(1?P)?1?3P

“2”选r的期望支付为

1?P?2(1?P)?2?P

当1?3P?2?P,即P?1时,“2”选l,而给定“2”选l,“1”选L收4益为2,选L?的收益为3,选R的收益为1,因此“1”会选L?。而给定“1”11选L?,“2”认为P?0?(注意:P是“1”选L的概率),与P?矛盾。故

441P?不会有均衡;

4当1?3P?2?P,即P?1时,“2”选r,给定“2”选r,“1”选L收益为0,4选L?的收益为7,选R的收益为1,因此“1”会选L?。而给定“1”选L?,“2”认为P?0,与P?1吻合。于是,得到均衡战略:?L?,P?0,r?,即“1”在第4一阶段选择L?,“2”虽然看不到“1”的选择,但“2”认为“1”选择L的概率为0,所以“2”在第二阶段选择r,这样的战略构成了一个贝叶斯精炼纳什均衡。均衡结果为(7,2)。

本文来源:https://www.bwwdw.com/article/g4p5.html

Top