《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解
更新时间:2023-09-14 15:35:01 阅读量: 初中教育 文档下载
- 博弈论三大模型推荐度:
- 相关推荐
《博弈论:原理、模型与教程》
第二部分 完全信息动态博弈
第7章 子博弈精炼Nash均衡
7.2 子博弈精炼Nash均衡的求解(重点!)
(已精细订正!)
定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。
下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。 (讲!)
1
1 A x1 BC2 x2DFx6x4 1 x 3E2,1 x51,1 1,2 6 x73,0 图6-8 博弈树
考察图6-8中的博弈。参与人1在博弈开始时(即在信息集
I1(?x1?)上面临两种选择—行动A和行动B。参与人1此时选择哪种行
动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。从图6-8很容易知道参与人1选择行动B时所得到的支付为2;但是,如果参与人1选择行动A,则所得支付就要取决于参与人2在信息集I2(?x2?)上的选择,以及博弈达到决策结x3时参与人1在信息集
I1(?x3?)上的选择。也就是说,参与人
1选择行动A所得支付,取决于
子博弈?(x2)的结果。因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A的所得支付,而为了确定参与人1选择行动A的所得支付,就必须先求解子博弈?(x2)。如何求解博弈?(x2)呢?可以采用同样的方法来求解子博弈?(x2),即在求解子博弈?(x3)的基础上,确定参与人2在信息集I2(?x2?)上的选择,从而求解子博弈
?(x2)。
2
由以上分析可以得到图6-8中博弈的求解过程:
首先求解博弈树中最底层的子博弈?(x3)得到子博弈?(x3)的结果为
(3,0)(即参与人
1选择E);
再求解博弈?(x2),容易得到博弈的结果(1,1)(即参与人2选择D); 最后求解原博弈,即子博弈?(x1),得到博弈的结果为(2,1)(即参与人1选择B)。
(讲!)
考察更一般的情形。对于图7-6中的博弈树,参与人i在信息集
Ii({xi})选择行动L还是行动R,取决于选择行动L和行动R所带来的
后果。由于参与人i选择行动L时使博弈进入了子博弈?(xi?1),因此参与人i选择行动L的后果就是得到子博弈?(xi?1)。同样,参与人i选择行动R的后果就是得到子博弈?(xi?2)。所以,参与人i在信息集Ii({xi})上的最优选择,取决于参与人i在信息集Ii({xi})上可能采取的行动,所导致的各个子博弈。也就是说,参与人i在信息集Ii({xi})上的最优选择,一定是使博弈进入能给自己带来最大支付的子博弈。因此,为了确定参与人i在信息集Ii({xi})上的选择,就必须先求解参与人i在信息集Ii({xi})上可能采取的行动所导致的各个子博弈。而对于各个子博弈求解又可以采用同样方法进行。
3
i L xi R j xi?1 'L j xi?2 'R L''R
图7-6 一般情形的博弈树
由以上分析可以得到求解有限扩展式博弈的一般步骤: ?找出博弈的所有子博弈1。
?按照博弈进行的“反方向”逐一求解各个子博弈,即最先求解最底层子博弈,再求解上一层的子博弈,……,直至原博弈。也就是说,在求解每一个子博弈时,该子博弈要么不含有其他任何子博弈,要么所含子博弈都已被求解。
1
由于原博弈为有限扩展式博弈,因此博弈的子博弈有限。
4
上述求解有限扩展式的方法亦称“逆向归纳法”(backward induction)。由于逆向归纳法对各个子博弈逐一进行求解,因此逆向归纳法所得到的解在各个子博弈上构成均衡。这也意味着逆向归纳法所得的解为子博弈精炼Nash均衡。
(重点,讲!)
【例7-2】 考察如图7-7所以的扩展式博弈。图7-7中,博弈存在5个子博弈,即子博弈 ?(x3)、?(x4)、?(x5)、?(x2)和?(x1)(即原博弈),其中?(x3)、?(x4)和?(x5)为最底层的子博弈。
下面利用逆向归纳法求解博弈的子博弈精炼Nash均衡。
1 x1 L R 2 2 x x3 L 'R'L 'R x11'1 L x 2, 1 \1 x4 x5 x10 2, 3 R x9 4,1 \R x73, 2 \L x8 2, 3 \5, 1 图7-7 逆向归纳法求解扩展式博弈
5
正在阅读:
《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解09-14
法选论文(样本)05-24
仓库管理员个人年度工作总结报告08-10
物质英文命名手册01-26
在GNU工具链中使用STM32的C标准库01-03
浙江省法制办行政执法考试在线题库10套真题试卷(4)分解01-24
手术室护士题库 205-28
川教版 - - 初二历史下册 - 教案05-16
学习中小学教师职业道德规范心得体会8篇07-31
民法学平时作业1---404-12
- 二甲基甲酰胺安全技术说明书
- 南邮计算机网络复习题
- 高分子物理实验指导书 - 图文
- 2009.9.25 莞惠环控专业施工图设计技术要求
- 学生工作简报
- 揭阳市斯瑞尔环境科技有限公司废酸综合利用项目可行性研究报告-广州中撰咨询
- 今日靓汤(佘自强)
- 奥数 - 二年级 - 数学 - 第三讲时间的教师版计算答案 - 图文
- 如何命制一份好的物理试卷
- 数据库开题报告
- 禁用未经批准或已经废止或淘汰技术的制度流程
- 大学英语(二)第2阶段测试题
- 湘教版一年级上册美术教案(全)
- (整套)学生顶岗(毕业)实习手册
- 高频 二极管包络检波 - 图文
- 2018届中考英语复习题型四任务型完形填空备考精编含解析 - 186
- 郑煤集团超化煤矿一采区开采设计 - 图文
- 财政学习题
- 摄影摄像复习资料
- SMC D-A93接线方式 - 图文
- 精炼
- 博弈
- 均衡
- 博弈论
- 求解
- Nash
- 模型
- 原理
- 教程
- 3.综合管理信息系统质量管理使用说明书
- 实验问题整理
- 2016中国济南 高端中道医 公益免费技术学习大会
- Java语言电话本管理系统课程设计报告
- 对规下工业企业采用的抽样方法
- 金属切削重点总结
- 大学生职业生涯规划与发展
- 2016年执业药师-中药学专业知识(二)-模拟卷(二)
- 齿轮机构典型例题
- (答案)07级《线性代数与概率论》期末考试试题(A)
- 外灰工程施工承包合同
- 10建管施工组织A卷
- 材料学院本科毕业论文撰写规范
- 07-福特汽车4S店流程之维修过程及品质控制 - 图文
- (企业文化宣传标语)企业安全生产宣传标语
- 2018年甘肃省公务员考试行测真题
- 制鞋业的iso9000 - 图文
- 2012年上半年下午系统集成项目管理工程师答案及解析
- 论文初稿评语
- (最新)湘教版地理八年级下册《第七章 认识区域-环境与发展》单元综合检测试题(含答案解析)