博弈论基础作业及答案
更新时间:2023-09-16 06:35:01 阅读量: 高中教育 文档下载
博弈论基础作业
一、名词解释
纳什均衡 占优战略均衡 纯战略 混合战略 子博弈精炼纳什均衡 贝叶斯纳什均衡 精炼贝叶斯纳什均衡 共同知识 见PPT 二、问答题
1.举出囚徒困境和智猪博弈的现实例子并进行分析。
囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;
以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。
请用同样的方法分析其他例子。
智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略
以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。
请用同样的方法分析其他例子。
2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。
破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。
3.当求职者向企业声明自己能力强时,企业未必相信。但如果求职者拿出自己的各种获奖证书时,却能在一定程度上传递自己能力强的信息。这是为什么?
由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。当然能力强的人也会声明自己的能力强。也就是说不同类型的求职者为了赢得职位会做出同样的声明。这样口头声明就不能有效的传递信息,因此企业不会轻易相信。而求职者拿出获奖证书就成了一个信号博弈。由于获得证书是要付出代价的,但代价却引人而异。能力强的个人可以相对轻易获得证书,而能力弱的个人却很难获得证书,以至于能力弱的人认为化巨大的代价获得证书,从而获得企业的职位是不划算的,因此干脆就不要获奖证书。因此获奖证书就成为个人能力的信号。
4.五个海盗抢得100颗钻石,他们为分赃发生了争议,最后达成协议,由抓阄确定出分赃顺序,然后按照民主程序进行分赃。首先由1号海盗提出分赃方案,五人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按1号提出的方案分赃,否则1号将被扔到海里喂鲨鱼。接着由2号提出方案, 四人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按2号提出的方案分赃,否则2号将被扔到海里喂鲨鱼,依此类推。如果你是1号海盗,你该提什么样的方案?说明理由。
假设(1)五个强盗都很聪明,而且大家知道大家很聪明,大家知道大家知道大家很聪明,如此等等。
(2)每个海盗都很贪婪,希望获得尽可能多的钻石,但是又不想为了钻石丢掉性命。
(3)给定一个方案,只有该方案大于他的备选方案所获的钻石时,海盗才选择赞成。
第一个海盗的提议应该是:五个海盗分别获得的钻石数目为97,0,1,0,2,或者97,0,1,2,0。
具体理由自己思考,方法是倒推法。
三、计算题
1.试计算表1中的战略式博弈的重复剔除劣战略均衡。
表1 一个战略式表述博弈
A
对B而言,战略M严格劣于R;(因为1<4, 1<6,0<8),因此剔除B的战略M;构成新的博弈如下
U M D
L 1,2 5,6 3,1 B M 3,1 7,1 2,0 R 2,4 2,6 7,8
A
在新的博弈中,
对于A而言,战略U严格劣于D(因为1<3,2<7),因此剔除A的战略U,构成新的博弈如下:
A
对于新的博弈中,已经没有严格的劣战略,因此没有严格的劣战略可以剔除。所以该博弈不是重复剔除严格劣战略可解的。
但是存在弱劣战略。对于B而言,战略L弱劣于R(因为6=6,1<8),因此剔除B的弱劣战略L,构成新的博弈如下:
A
M
B
R 2,6 M D
B L 5,6 3,1 R 2,6 7,8 U M D
B L 1,2 5,6 3,1 R 2,4 2,6 7,8 D 7,8 在新的博弈中,对于A而言,战略M严格劣于D(因为2<7),因此剔除A的战略M,构成新的博弈如下:
A
因此,重复剔除(弱)劣战略均衡为(D,R)
(ps: 如果同学们用划线的方法求纳什均衡,就可以发现纯战略nash均衡有两个:(M,L)和(D,R)但采用剔除弱劣战略的方法,把其中一个纳什均衡剔除掉了)
D
B R 7,8 2. 试给出下述战略式表述博弈的所有纳什均衡。
2
L
U
2,2 R 3,3 D 4,4 1,2 给定1选择U,2的最佳选择是R(因为2<3),在相应位置划线 给定1选择D,2的最佳选择是L(因为4>2),在相应位置划线 给定2选择L,1的最佳选择是D(理由自己写),在相应位置划线 给定2选择R,1的最佳选择是U(理由自己写),在相应位置划线 找两个数字下都划线的,显然有两个纯战略纳什均衡:(U,R)和(D,L) 据Wilson的奇数定理,可能有一个混合战略均衡。 设1选U的概率为?,那么选D的概率为1?? 设2选L的概率为?,那么选R的概率为1??,
如果存在混合战略,那么2选战略L和R的期望收益应该应该相等,因此应有UL?2??4(1??)?UR?3??2(1??)
??? 自己求解 (2分) 同样,1选战略U和D的期望收益应该应该相等
1
UU?2??3(1??)?UD?4??1(1??) ??? 得混合均衡:?
3.市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为P=16-Q。其中P是市场价格,Q为市场总产量。
(1)求古诺(Cournot)均衡产量和利润。
(2)求斯坦克尔伯格(Stackelberg)均衡产量和利润。
(1)设两个企业的产量分别为q1,q2,有Q?q1?q2,因此利润函数分别为:
?1?(16?q1?q2)q1?16q1?q12?q1q2
2?2?(16?q1?q2)q2?16q2?q2?q1q2
利润最大化的一阶条件分别为:
??1?16?2q1?q2?0 ?q1??2?16?2q2?q1?0 ?q2因此企业1和企业2的反应函数分别为:
q1?16?q2 216?q1 2q2?联立,得到q1?q2??。自己求解
(2)设企业1先行,企业2跟进。两个企业的产量分别为q1,q2,因此利润函数分别为:
?1?(16?q1?q2)q1?16q1?q12?q1q2
2?2?(16?q1?q2)q2?16q2?q2?q1q2
由逆向归纳法,在第二阶段,企业2在已知企业1的产量的情况下,最优化自己的产量,从而得到企业2的反应函数:
??2?16?2q2?q1?0 ?q2因此企业2的反应函数为:q2?16?q1 2在第一阶段,企业1考虑到企业2的反应,从而自己的利润函数为:
?1?(16?q1?q2)q1?16q1?q12?q1q2?16q1?q12?q1(??1?0 ?q116?q1) (2分) 2要使企业1的利润最大,应满足一阶条件:
得到q1??。
所以q2??。
(PS: 古诺模型是完全信息静态博弈,求的是纳什均衡;斯坦伯格模型是完全信息动态博弈,求的是子博弈精炼纳什均衡)
4.(1)试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。
(2)倘若2告诉1:2的战略是(c,i,j),问此时1的最优战略是什么?(3)在(2)中,1和2的战略组合构成一个纳什均衡吗?均衡结果是什么?(4)(3)中的纳什均衡不是子博弈精炼的,原因是什么?
1
a b
2 2
c d e j
(1,2) (2,1) 1 (6,3)
f g 2 (3,2) l i
(4,6) (0,2)
答: (1)
1
a b
2 2
c d e j
(1,2) (2,1) 1 (6,3)
(2分) f g 2 (3,2) l i
(4,6) (0,2) 由逆向归纳法,子博弈精炼均衡为[(b,g),(c,e,l)],均衡结果为(4,6)。 (2)若2的战略为(c,i,j),则1的最优战略为(b,f)。
(3)给定2的战略为(c,i,j),1的最优战略为(b,f);反之,给定1的战略
(b,f),战略(c,i,j)是2的一个最优战略。所以它们构成一个纳什均衡,均衡结
果为(6,3)。
(4)因为2的战略(c,i,j)中含有不可置信的威胁i,使1在f和g之间不敢选g。当博弈进行到2在l与i之间进行选择的时候,2必会选l,给定如此,1选g而不是f,此时2会选e,这就是子博弈精炼均衡。
5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。
1 R
(1,2)
L L?
2
l r l r
(2,4) (0,1) (3,1) (7,2)
当“2”看见“1”未选R时,设他认为“1”选L的概率为P, “1”选L?的概率为1-P,则“2”选l的期望支付为:
4P?1?(1?P)?1?3P
“2”选r的期望支付为
1?P?2(1?P)?2?P
当1?3P?2?P,即P?1时,“2”选l,而给定“2”选l,“1”选L收4益为2,选L?的收益为3,选R的收益为1,因此“1”会选L?。而给定“1”11选L?,“2”认为P?0?(注意:P是“1”选L的概率),与P?矛盾。故
441P?不会有均衡;
41当1?3P?2?P,即P?时,“2”选r,给定“2”选r,“1”选L收益
4为0,选L?的收益为7,选R的收益为1,因此“1”会选L?。而给定“1”选L?,
1“2”认为P?0,与P?吻合。于是,得到均衡战略:?L?,P?0,r?,即“1”4在第一阶段选择L?,“2”虽然看不到“1”的选择,但“2”认为“1”选择L的概率为0,所以“2”在第二阶段选择r,这样的战略构成了一个贝叶斯精炼
纳什均衡。均衡结果为(7,2)。
正在阅读:
博弈论基础作业及答案09-16
2017-2018学年湖北省武汉市硚口区(经开区)八年级下册(期末)03-19
环境监测招聘考试考题及答案03-14
第八章 长期股权投资09-06
水族景观规划与设计04-13
ARM处理器工作模式实验报告 - 图文10-10
第二次全国经济普查主要数据公报(第一号)04-25
- 上海大众、一汽大众、东风日产车型与VIN代号对照表
- 第2章服装原型及原型制作
- 江苏省工商行政管理系统经济户口管理办法及四项制度
- 纪检监察业务知识试题2
- 传感器综合题答案
- 北京第二外国语学院翻硕招生人数及学费
- 初三新编英语教材下册
- 公司庆中秋、迎国庆联欢会客串词
- 向区委常委会汇报安全生产工作材料
- 2006年GCT英语模拟试题(三)及答案解析
- 经济法概念的早期使用
- 我爱做家务课堂教学设计
- 学校安全工作月报表、消防安全排查表、消防隐患排查台账
- 成本会计毕业论文
- 班级文化建设论文
- 2018年天津市高考文科试题与答案汇总(Word版) - 图文
- 铁路论文
- 2017年嵌入式系统设计师考试时间及地点
- 1.111--灾害与突发公共卫生事件应急预案
- 起爆点主图 注意买入 拉升 逃顶源码指标通达信指标公式源码
- 博弈论
- 作业
- 答案
- 基础
- 仰邦WIFI无线控制卡 使用说明
- 广州市公安局青年民警思想状况调研报告
- 汽车加油加气充电站项目可研报告
- 美大集成灶安装流程
- 八年级走进文言文第32单元译文
- 第十讲 魏晋玄学的其他论题
- 参考答案
- 自考资料“中国现当代文学专题研究”
- 北京市昌平区2017-2018学年八年级下期末数学试题及答案
- CrT126-客户满意度调查问卷(外接物业)
- 分析化学 - 第三章 滴定分析法概论
- NSAC全国标准化考试联盟认证试题--Illustrator CS2
- 第八章 巷道掘进机
- 2017 - 2018学年八年级英语上册Unit1Wheredidyougoonvacation话题阅读与交际同步练习(新版)人教新目标版
- 2019-2020学年高一数学必修一:3.2.1《对数》同步练习(含答案)
- 电容测量电路实训报告
- 东南大学数模实验报告
- 好课锋从磨课出 精彩缘自苦磨来
- 6MW背压式汽轮机作业指导书
- 2019-2020学年七年级语文上册 3.15《天净沙 秋思》导学案 新人教版 doc