博弈论习题

更新时间:2024-01-20 17:29:02 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《博弈论》习题

一、选择题

1. 博弈论中,局中人从一个博弈中得到的结果常被称为( ):

A. 效用; B. 损益; C. 决策; D. 利润 2. 下列关于策略的叙述哪个是错误的( ):

A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略;

C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;

D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 3. 囚徒困境说明( ):

A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 4. 一个博弈中,直接决定局中人损益的因素是( ):

A. 策略组合; B. 策略; C. 信息; D. 行动。 5、策略式博弈,正确的说法是( ):

A. 策略式博弈无法刻划动态博弈; B. 策略式博弈无法表明行动顺序; C. 策略式博弈更容易求解; D. 策略式博弈就是一个支付矩阵。

6. 下列有关策略和纳什均衡的叙述正确的有( ):

A. 纯策略是博弈方采取“要么做,要么不做”的策略形式;

B. 混合策略是博弈方根据一组选定的概率,在两种或两种以上可能的行为

中随机选择的策略;

C. 有些博弈不存在纯策略纳什均衡,但存在混合策略的纳什均衡; D. 有些博弈既存在纯策略纳什均衡,也存在混合策略的纳什均衡。 7、古诺模型体现了寡头企业的( )决策模型。

A 成本 B 价格 C 产量 D 质量

1

8、 伯特兰德模型体现了寡头企业的什么决策模型。

A 成本 B 价格 C 产量 D 质量 9、用囚徒困境来说明两个寡头企业的情况,说明了:( )

A、每个企业在做决策时,不需考虑竞争对手的反应 B、一个企业制定的价格对其它企业没有影响

C、企业为了避免最差的结果,将不能得到更好的结果 D、一个企业制定的产量对其它企业的产量没有影响

10、 子博弈精炼纳什均衡( ):

A. 不是一个一般意义上的纳什均衡; B. 和纳什均衡没有什么关系;

C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡; D. 要求某一策略组合在原博弈上都构成一个纳什均衡。 11. 下列关于重复博弈的叙述哪些是正确的( ):

A. 重复博弈又称为序贯博弈;

B. 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性; C. 如果博弈重复无限次,则局中人采取的针锋相对策略意味着任何一方参

与人的一次性不合作将触发永远的不合作;

D. 在有限次重复博弈中,若阶段博弈纳什均衡的唯一性存在,则每个阶段 出现的都是一次性博弈的均衡结果。

12. 在动态博弈战略行动中( ):

A. 首先作出选择并采取相应行动的局中人往往可以获得更多的收益; B. 斯塔克博格模型与古诺模型对垄断厂商行为的分析方法及结论相同;

C. 一般而言,只有当局中人从实施某一威胁所能获得的总收益大于不实施

该威胁所获得的总收益时,该威胁才是可信的;

D. 承诺是当事人使自己的威胁策略变得可信的行动,但它也是有风险的。 13、市场交易中普遍存在的讨价还价属于哪种博弈。( )

A 完全信息静态博弈 B 完全信息动态博弈 C 不完全信息静态博弈 D不完全信息动态博弈 14、下面哪种模型是一种动态的寡头市场博弈模型( )

A 古诺模型

B 伯川德模型

2

C 斯塔克尔伯格模型 D田忌齐威王赛马

15、在一般产品销售市场上,以下哪种原因导致了逆向选择。 ( )

A 产品质量的不确定性 B 私人信息 C 公共信息 D 产品价格

16、完全信息动态博弈参与者的行动是( ) A 无序的 B 有先后顺序的 C 不确定的 D 因环境改变的 17、动态博弈参与者在关于博弈过程的信息方面是( )

A 不对称的 B 对称的 C 不确定的 D 无序的

二、判断正误并说明理由

1. 纳什均衡一定是上策均衡。

1.F 上策均衡是比纳什均衡更严格的均衡概论 2. 上策均衡一定是纳什均衡。

2.T 上策均衡是比纳什均衡更严格的均衡概论 3.在一个博弈中博弈方可以有很多个。

3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈 4. 在一个博弈中只可能存在一个纳什均衡。

4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战 5. 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与

损失之和恒为零,所以双方不存在合作可能性

6. 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳

什均衡

7. 在博弈中纳什均衡是博弈双方能获得的最好结果。

7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

3

9. 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而

减低自己的收益

10. 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 11. 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 12. 斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时

13. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

13. .T 无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。 14.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。 14. .T 无限次重复博弈必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以得益的现值为根据。

15. 子博弈精炼纳什均衡不是一个纳什均衡。 15. F 子博弈精炼纳什均衡一定是一个纳什均衡。

16. 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

16. T 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

17. 零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。

17.F 同第16题。 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

4

18.原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。 18.T 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管

是重复有限次还是无限次,不会和一次性博弈有区别。

19.不存在纯战略纳什均衡和存在惟一的纯策略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

19.T 有限次重复博弈,特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

20.在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

20.F 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

21.由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

21.F 只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

22.如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。

22.T 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。

三、计算与分析题

1、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B 企业不做广告,

5

即 P1*3+(1-P1)*0= P1*0+(1-P1)*2 解得 P1=2/5

即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡

对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即 P2*2+(1-P2)*0= P2*0+(1-P2)*4 解得 P2=2/3

即(2/3,1/3)按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P。 求:(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何? (3)用该案例解释囚徒困境。 答:(1)由已知条件 Q=200-P,P=200-Q

TC1=20q1,TC2=20q2 q1+q2=Q 可得1,2厂商的利润函数分别为:

K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2 K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2 令dK/dq1=0 得厂商1的反应函数为180-2Q1-Q2=0, 令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0, 联解可得q1=q2=60

K1=K2=3600

(2) 由已知条件 Q=200-P,P=200-Q

TC=TC1+TC2=20q1+20q2 =20Q 可得1,2厂商的总利润函数为: K=PQ-TC=(200-Q)Q-20Q=180Q-Q2 令dK/dQ=0 得 Q=90,q1=q2=45

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100 K1=K2=4050

(3) 将q1=45,q2=60 和q1=60,q2=45分别代入1,2厂商的利润函数

11

可得1,2厂商的利润为:

K1(q1=45,q2=60)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500

K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500 K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375 合作(q2=45) 合作(q1=45) 厂商1 不合作(q1=60) 4500,3375 3600,3600 根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600) 双方利润均低于(合作,合作)(4050,4050)显然它属于“囚徒困境”

12、假设双头垄断企业的成本函数分别为:C1?20Q1,C2?2Q22,市场需求曲线为

P?400?2Q厂商2 不合作(q2=60) 3375,4500 4050,4050 ,其中,Q?Q1?Q2。

(1)求古诺(Cournot)均衡情况下各自的反应函数和利润函数,以及均衡产量、价格和利润,并作图表示均衡点。

(2)假设垄断企业1为领导者,求斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润。

(3)比较古诺均衡和斯塔克博格均衡的结果,并简要说明导致上述两种均衡结果差异的原因

解:

(1)对于垄断企业1:

由目标函数max[400?2(Q1?Q2)]Q1?20Q1Q1?190?Q22可得其反应函数为

利润函数为:?1?380Q1?2Q1Q2?2Q12 对垄断企业2:

由目标函数max[400?2(Q1?Q2)]Q2?2Q2Q2?50?Q142

可得其反应函数为 利润函数为:?2?400Q2?2Q1Q2?4Q22

12

在达到均衡时,有:

Q??190??50?1?4??2Q1?

?Q1?80可得??Q2?30 均衡时的价格为:P?400?2?(80?30)?180 两垄断企业的利润分别为:

?1?380?80?2?80?30?2?802?12800 ?2?400?30?2?80?30?4?302?3600

均衡点可图示为:

企业2 190 企业1的反应函数曲线 古诺均衡点 50 企业2的反应函数曲线 0 95 200 企业1

(2)假设垄断企业1为领导者,企业2视企业1的产量为既定,其反应函数为:

Q2?50?Q1/4

则企业1的目标函数为:

?Q1???max?400?2?Q1?50???Q1?20Q14???? ?Q1?280/3???Q2?80/380??280P?400?2????160 均衡时价格为:

3??3 利润为:?1?39200/3,?2?25600/9

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,无需考虑企业2的反应,而企业2只能被动地接受企业1

13

的既定产量,计划自己的产出,这是一种“先发优势”

13、(市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

默许 (20,30)

在位者 进入 在位者 进入 进入者 默许 (10,20)

斗争 (-10,0) 进入者 斗争 不进入 (-10,25)

不进入 (0,100)

.

(0,100)

左图:温柔型 右图:残酷型

(1) 找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡 答:温柔型在位者的纳什均衡为 (进入, 默认)

残酷型在位者的纳什均衡为 (不进入, (进入,斗争)) (2) 已有企业为温柔型的概率至少多少时,新企业才愿意进入? 答:20p?10(1?p)??0 得到p??1/3

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。

囚徒乙 14

坦白 囚徒甲 坦白 -5, -5 不坦白 -1, -10 不坦白 -10, -1 -2, -2 (3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。

(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、解释并讨论古诺的双寡头模型的纳什均衡。为什么其均衡是一种囚徒困境?

见上课笔记 或计算题第11题

3、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉,或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

门卫 睡觉 小偷 偷 不睡觉 1,-1 -2, 0 不偷 0, 2 0, 0 (3)分析:通过划线法可知:这个博弈是没有纳什均衡的。门卫不睡觉,小偷不偷,双方

15

都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

16

都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

16

本文来源:https://www.bwwdw.com/article/lsao.html

Top