《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解

更新时间:2023-09-14 15:35:01 阅读量: 初中教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《博弈论:原理、模型与教程》

第二部分 完全信息动态博弈

第7章 子博弈精炼Nash均衡

7.2 子博弈精炼Nash均衡的求解(重点!)

(已精细订正!)

定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。

下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。 (讲!)

1

1 A x1 BC2 x2DFx6x4 1 x 3E2,1 x51,1 1,2 6 x73,0 图6-8 博弈树

考察图6-8中的博弈。参与人1在博弈开始时(即在信息集

I1(?x1?)上面临两种选择—行动A和行动B。参与人1此时选择哪种行

动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。从图6-8很容易知道参与人1选择行动B时所得到的支付为2;但是,如果参与人1选择行动A,则所得支付就要取决于参与人2在信息集I2(?x2?)上的选择,以及博弈达到决策结x3时参与人1在信息集

I1(?x3?)上的选择。也就是说,参与人

1选择行动A所得支付,取决于

子博弈?(x2)的结果。因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A的所得支付,而为了确定参与人1选择行动A的所得支付,就必须先求解子博弈?(x2)。如何求解博弈?(x2)呢?可以采用同样的方法来求解子博弈?(x2),即在求解子博弈?(x3)的基础上,确定参与人2在信息集I2(?x2?)上的选择,从而求解子博弈

?(x2)。

2

由以上分析可以得到图6-8中博弈的求解过程:

首先求解博弈树中最底层的子博弈?(x3)得到子博弈?(x3)的结果为

(3,0)(即参与人

1选择E);

再求解博弈?(x2),容易得到博弈的结果(1,1)(即参与人2选择D); 最后求解原博弈,即子博弈?(x1),得到博弈的结果为(2,1)(即参与人1选择B)。

(讲!)

考察更一般的情形。对于图7-6中的博弈树,参与人i在信息集

Ii({xi})选择行动L还是行动R,取决于选择行动L和行动R所带来的

后果。由于参与人i选择行动L时使博弈进入了子博弈?(xi?1),因此参与人i选择行动L的后果就是得到子博弈?(xi?1)。同样,参与人i选择行动R的后果就是得到子博弈?(xi?2)。所以,参与人i在信息集Ii({xi})上的最优选择,取决于参与人i在信息集Ii({xi})上可能采取的行动,所导致的各个子博弈。也就是说,参与人i在信息集Ii({xi})上的最优选择,一定是使博弈进入能给自己带来最大支付的子博弈。因此,为了确定参与人i在信息集Ii({xi})上的选择,就必须先求解参与人i在信息集Ii({xi})上可能采取的行动所导致的各个子博弈。而对于各个子博弈求解又可以采用同样方法进行。

3

i L xi R j xi?1 'L j xi?2 'R L''R

图7-6 一般情形的博弈树

由以上分析可以得到求解有限扩展式博弈的一般步骤: ?找出博弈的所有子博弈1。

?按照博弈进行的“反方向”逐一求解各个子博弈,即最先求解最底层子博弈,再求解上一层的子博弈,……,直至原博弈。也就是说,在求解每一个子博弈时,该子博弈要么不含有其他任何子博弈,要么所含子博弈都已被求解。

1

由于原博弈为有限扩展式博弈,因此博弈的子博弈有限。

4

上述求解有限扩展式的方法亦称“逆向归纳法”(backward induction)。由于逆向归纳法对各个子博弈逐一进行求解,因此逆向归纳法所得到的解在各个子博弈上构成均衡。这也意味着逆向归纳法所得的解为子博弈精炼Nash均衡。

(重点,讲!)

【例7-2】 考察如图7-7所以的扩展式博弈。图7-7中,博弈存在5个子博弈,即子博弈 ?(x3)、?(x4)、?(x5)、?(x2)和?(x1)(即原博弈),其中?(x3)、?(x4)和?(x5)为最底层的子博弈。

下面利用逆向归纳法求解博弈的子博弈精炼Nash均衡。

1 x1 L R 2 2 x x3 L 'R'L 'R x11'1 L x 2, 1 \1 x4 x5 x10 2, 3 R x9 4,1 \R x73, 2 \L x8 2, 3 \5, 1 图7-7 逆向归纳法求解扩展式博弈

5

本文来源:https://www.bwwdw.com/article/wrfh.html

Top