博弈论复习题及答案

更新时间：2024-05-01 04:51:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

博弈论与生活推荐度：
相关推荐

博弈论

判断题（每小题1分，共15分）

1、囚徒困境说明个人的理性选择不一定是集体的理性选择。（√ ） 2、子博弈精炼纳什均衡不是一个纳什均衡。（× ） 3、若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（） 4、博弈中知道越多的一方越有利。（ ×） 5、纳什均衡一定是上策均衡。（× ） 6、上策均衡一定是纳什均衡。（√）

7、在一个博弈中只可能存在一个纳什均衡。（×） 8、在一个博弈中博弈方可以有很多个。（√）

9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√ ） 10、在博弈中纳什均衡是博弈双方能获得的最好结果。（× ） 11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（× ） 12、上策均衡是帕累托最优的均衡。（×）

13、因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）

14、在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。

15、囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×） 16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√ ） 17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√ ）

18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√ ） 19、如果阶段博弈G={A1, A2,?,An; u1, u2,?,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

20、零和博弈的无限次重复博弈中，所有阶段都不可能发生合作，局中人会一直重复原博弈的混合战略纳什均衡。（√ ）（或：零和博弈的无限次重复博弈中，可能发生合作，局中人不一定会一直重复原博弈的混合战略纳什均衡。（×）） 21、原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益：采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果，符合所有局中人的利益，因此，不管是重复有限次还是无限次，不会和一次性博弈有区别。（√ ）

22、原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，但惟一的纳什均衡不是效率最高的战略组合，存在潜在合作利益的

囚徒困境博弈。（√ ）（或：原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，不存在潜在合作利益的囚徒困境博弈。（×））

23、根据参与人行动的先后顺序，博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。

24、如果阶段博弈G有唯一的Nash均衡，那么对任意有限次T，重复博弈G(T)有唯一的子博弈完美结局：在每一阶段取G的Nash均衡策略。（√ ）

四、名词解释（每小题3分，共15分）

参与人(player)：指的是博弈中选择行动以最大化自己效用(收益)的决策主体，参与人有时也称局中人，可以是个人，也可以是企业、国家等团体；

策略(strategy)：是参与人选择行动的规则，如“以牙还牙”是一种策略；信息(information)：是指参与人在博弈中的知识，尤其是有关其他参与人的特征和行动的知识；

支付(payoff)函数：是参与人从博弈中获得的效用水平，它是所有参与人策略或行动的函数，是每个参与人很关心的东西；

结果(outcome)：是指博弈分析者感兴趣的要素的集合，常用支付矩阵或收益矩阵来表示；

均衡(equilibrium)：是所有参与人的最优策略或行动的组合。静态博弈：指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动；

动态博弈：指参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。博弈：就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

零和博弈：也称“严格竞争博弈”。博弈方之间利益始终对立，偏好通常不同完全信息静态博弈：即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。

上策：不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略

上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果

严格下策：不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略合作博弈纳什均衡：

二、计算与分析题（每小题15分，共45分）

1、无限次重复博弈与有限重复博弈的区别：

无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中，存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系，使重复博弈无法实

现更高效率均衡的关键问题。

无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题，必须考虑后一期得益的贴现系数，对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。

无限次重复博弈与有限次重复博弈的共同点：试图“合作”和惩罚“不合作”是实现理想均衡的关键，是构造高效率均衡战略的核心构件。

2、可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是（1）如果双方都不涨价，各得利润10单位；

（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；

（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；

求纳什均衡。

博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解。 3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到；都去按则同时到。若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得益，第二个数字是小猪的得益）：

大猪

求纳什均衡。

在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。即不管大猪选择按还是不按，小猪的最佳策略都是等待。也就是说，无论如何，小猪都只会选择等待。这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。所以纳什均衡是（大猪按，小猪等待）。

4、根据两人博弈的支付矩阵回答问题：

a b A 2,3 0,0 B 0,0 4,2 小猪

按等待按 5，1 4，4 等待 9，-1 0，0

(1)写出两人各自的全部策略，并用等价的博弈树来重新表示这个博弈（6分） (2)找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。（7分） (1)策略甲：ＡＢ乙：ａｂ

博弈树（草图如下：

(2)Pure NE (A, a); (B, b)

都是Pareto有效，仅(B, b)是Ｋ－Ｈ有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。

参与人1 解答：

纯策略纳什均衡为（B，a）与（A，c）分析过程：设两个参与人的行动分别为a1和a2，

?B,如果a2?a??B,如果a2?b的反应函数R1(a2)???A,如果a2?c?C或者D,如果a?d?2

A B

a 2,3 4,4 参与人2

b 3,2 5,2 c 3,4 0,1 d 0,3 1,2 C D

3,1 3,1 4,1 4,1 1,4 -1,2 10,2 10,1 player1

player2

?c,如果a1?A??a,如果a1?B的反应函数R2(a1)???c,如果a1?C?c,如果a?D?1

交点为（B，a）与（A，c），因此纯策略纳什均衡为（B，a）与（A，c）。

6、（entry deterrence市场威慑）考虑下面一个动态博弈：首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。

在位者进入进入者默许（20，30）

在位者进入默许（10，20）

斗争（-10，0）进入者斗争不进入（-10，25）

不进入 .

（0，100）（0，100）

左图：温柔型右图：残酷型

(1)找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡（12分）

(2)已有企业为温柔型的概率至少多少时，新企业才愿意进入（8分）

(1)温柔 NE (in, accommodate) 和 (out, fight)。 SPNE为(in, accommodate)

残酷 NE (out, fight). SPNE同理 (2)20p?10(1?p)??0 得到p??1/3

8、博弈方1 和博弈方 2就如何分 10，000 元钱进行讨价还价。假设确定了以下规则：双方同时提出自己要求的数额 A 和 B，0≤A，B≤10，000。如果 A+B≤10，000，则两博弈方的要求得到满足，即分别得 A 和 B，但如果 A+B>10，000，则该笔钱就没收。问该博弈的纳什均衡是什么？如果你是其中一个博弈方，你会选择什么数额？为什么？

答十、纳什均衡有无数个。最可能的结果是（5000，5000）这个聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。答：（1）用囚徒困境的博弈表示如下表：

新华航空公司合作竞争北方航空公司合作竞争 500000，500000 0，900000 900000，0 60000，60000 （2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（60000>0）；若新华航空公司选择合作，北方航空公司仍会选择竞争（900000>500000）。若北方航空公司选择竞争，新华航空公司也将选择竞争（60000>0）；若北方航空公司选择合作，新华航空公司仍会选择竞争（900000>0）。由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒，相应的利润（单位：

万元）由下图的得益矩阵给出：

（1）有哪些结果是纳什均衡？（2）两厂商合作的结果是什么？

答（1）（低价，高价），（高价，低价）（2）（低价，高价）

13、A、B两企业利用广告进行竞争。若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。 3. 答：（1）由题目中所提供的信息，可画出A、B两企业的支付矩阵（如下表）。

B企业做广告不做广告做广告 20，8 25，2 A企业不做广告 10，12 30，6 （2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利润8大于不做广告获得的利润2，故在8下面划一横线。如果A厂商不做广告，则B厂商的最优选择也是做广告，因为做广告获得的利润为12，而不做广告的利润为6，故在12下面划一横线。

如果B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润20大于不做广告所获得的利润10，故在20下面划一横线。如果B厂商不做广告，A厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得的利润25，故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解，因此，最终的纯策略纳什均衡就是A、B两厂商都做广告。

15、求出下面博弈的纳什均衡(含纯策略和混合策略)。

乙 L R U 5,0 0,8 甲

D 2,6 4,5 由划线法易知，该矩阵博弈没有纯策略Nash均衡。可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash均衡((1,8),(4,3)

9977

16、某产品市场上有两个厂商，各自都可以选择高质量，还是低质量。相应的利润由如下得益矩阵给出：

(1) 该博弈是否存在纳什均衡？如果存在的话，哪些结果是纳什均衡?

参考答案：由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即(低质量, 高质量)， (高质量,低质量)。

乙企业高质量低质量高质

50,50 100,800 甲企量业低质

900,600 -20,-30 量

该矩阵博弈还有一个混合的纳什均衡 Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630，可得x因此该问题的混合纳什均衡为((1297,8597),(63138,75138))?1297,y?63138

。

17、甲、乙两企业分属两个国家，在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利

益，可以采取什么措施？

甲企业

乙企业开发不开发开发 -10,-10 100,0 不开

0,100 0,0 发

解：用划线法找出问题的纯策略纳什均衡点。 ??10,?10??0,100100,0?0,0??

所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。该博弈还有一个混合的纳什均衡((

101111,1),(

101111,1))。

如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为：

??10,?10?a??0,100?a100,0?0,0??,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需a>10。

此时乙企业的收益为100+a。

18、博弈的收益矩阵如下表：乙左右上 a，b c，d 甲下 e，f g，h （1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系？（尽量把所有必要的关系式都写出来）

（2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？为什么？

（4）在什么情况下，纯战略纳什均衡不存在？

答：（1）a?e，c?g，b?d，

f?h。本题另外一个思考角度是从占优策略

均衡的定义出发。对乙而言，占优策略为(b,f)?(d,h)；而对甲而言，占优策略为

(a,c)?(e,g)。综合起来可得到所需结论。

b?d，（2）纳什均衡只需满足：甲选上的策略时，同时乙选左的策略时，a?e。故本题中纳什均衡的条件为：b?d，a?e。

（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。

（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。

19、Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同， John给Smith 3美元，如果不同，Smith给John 1美元。（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少？

答：（1）此博弈的收益矩阵如下表。该博弈是零和博弈，无纳什均衡。 John 1 2 3 1 3，-3 -1，1 -1，1 Smith 2 -1，1 3，-3 -1，1 3 -1，1 -1，1 3，-3 （2）Smith选（1/3，1/3，1/3）的混合概率时，

John选1的效用为：U1John选2的效用为：U2John选3的效用为：U3?131313?(?3)?131313?1?1313?1??131313

??1??(?3)?13?1????1??1??(?3)??类似地，John选（1/3，1/3，1/3）的混合概率时， Smith选1的效用为：U1'Smith选2的效用为：U2'Smith选3的效用为：U3'因为U1?131313?3?13?(?1)?13131313?(?1)?131313

??(?1)??3??(?1)?13??(?1)??(?1)??3?''?U2?U3，U1'?U2?U3，所以：

111??111(,,),(,,)??333333??是纳什均衡，策略值分别为John：U??13；Smith：U'?13。

20、假设双头垄断企业的成本函数分别为：C1为P?400?2Q2?20Q1，C2?2Q2，市场需求曲线

，其中，Q?Q1?Q2。

（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反应和等利润曲线，并图示均衡点。

（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并以图形表示。

（3）说明导致上述两种均衡结果差异的原因。答：（1）对于垄断企业1来说：

max[400?2(Q1?Q2)]Q1?20Q1190?Q2 ?Q1?2 这是垄断企业1的反应函数。其等利润曲线为：?1?380Q1?2Q1Q2?2Q12

对垄断企业2来说：

2max[400?2(Q1?Q2)]Q2?2Q2Q1?Q2?50?4

这是垄断企业2的反应函数。其等利润曲线为：?22 ?400Q2?2Q1Q2?4Q2 在达到均衡时，有：

Q1?Q1??190??50??4??2?Q?80??1?Q2?30

均衡时的价格为：P?400?2?(80?30)?180

两垄断企业的利润分别为：

?1?380?80?2?80?30?2?802?12800?2?400?30?2?80?30?4?302?3600 均衡点可图示为：

190 企业2 企业1的反应线均衡点 0 95 企业1 200

（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反应函数为：

Q2?50?Q1/4

则企业1的问题可简化为：

?Q1???max?400?2?Q1?50???Q1?20Q14?????Q?280/3??1?Q2?80/3

均衡时价格为：P 利润为：?180??280?400?2????1603??3

?39200/3，?2?25600/9

该均衡可用下图表示：

本文来源：https://www.bwwdw.com/article/1nqg.html

相关文章：

正在阅读：

博弈论复习题及答案05-01

2019届高三人教A版数学一轮复习练习：第十章计数原理、概率、随机变量及其分布第3节 Word版含解析08-06

天天象棋残局闯关攻略卒（兵）杀法小刀剜心怎么过 - 图文12-22

2016年天津市装饰装修工程预算基价04-01

信访工作个人先进事迹材料12-31

高中地理第01章地理环境与区域发展1.3第一章复习(2)限时考新人教04-25

上一篇：社会学习题下一篇：室外给水工程pe管施工组织设计