中微补充讲义(7)关于广延性博弈的几个问题

更新时间：2023-12-19 16:44:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

微信补充信息推荐度：
相关推荐

中微补充讲义（7）北京大学：平新乔

关于广延性博弈的几个问题

一、

完美信息的广延性博弈转化为策略性博弈应注意的几个问题

1. 策略与行动计划

在广延性博弈里，如果参与人的信息集不止一个，则其策略就会成为一整套计划，参与人必须考虑到当自己处于什么“站”应当用什么应对计划的问题。这样，“策略”与“计划”就有了区别：“计划”是指参与人在某个信息集上选取的行动；而“策略”是在每个信息集上只选取一个计划的前提下，由各个信息集下所选取的一个一个行动计划构成的。

2. 一个策略所含的计划个数与策略集所含的策略个数

为什么当完美信息的广延型博弈转化为策略性博弈时，有时策略所包含的计划个数不止一个？原因就在于参与人在广延型博弈里的信息集不止一个。参与人i的一个策略sij（ j?1,2,...J,其中J为i各用的策略个数）所含的行计划的个数等于参与人i拥有的信息集个数。i拥有n个信息集，其每一个策略便有n元。请看下例：

在图11.1里，参与人“1”便有两个信息集：一个数在博弈的初始点，用空心表示；另一个信息集是在“1”走了C，参与人“2”走了E之后，又轮到“1”决策的那个信息集。这里，由于信息是完美的，从而参与人“1”的每个信息集都只含有一个决策点。因此，在该博弈里，参与人1有两个信息集，而参与人2则只有1个信息集。

１ C 2 （2，0） E 1 G H （0，0） F （3，1）Ｄ（1，2）图11.1 参与人1拥有两个信息集的广延型博弈这样，参与人2的每一个“策略”就只包含一元。即只含有一个行动计划，当“2”决策时，s2或者是“E”，或者是“F”。但参与人1的每个策略都必须只含有二元：即必须表示参与人1在博弈开始点的行动计划与当参与人2行动之后再由参与人1所做出的反应计划。这样，参与人1的策略就会是（C,G），（C,H)，（D,G），（D,H）这样的构成方式，其每个策略都是一套计划，而不是只含有一个计划。

那么，参与人i在信息完美的广延型博弈里的策略个数是怎么决定的呢？设具有K个信

K息集，在第k个信息集参与人i拥有nk个行动计划，则i策略集中策略个数为?nk，这里，

k?1K?k?1是连乘号。在上例中，参与人1有两个信息集，且其在每个信息集都拥有两个行动计

划，从而，他有四个策略：（C,G），（C,H)，（D,G），（D,H）。

3. 纳什均衡的精炼程度

把图11.1所表示的广延型博弈转化为策略型博弈，便有表11.2：

E 参与人1 （C,G）（C,H）（D,G）（D,H） 1,2 0,0 2,0 2,0 表11.2 与图11.1所对应的策略型博弈

表11.2里有两个纳什均衡：一个是参与人1选D，这样无论参与人选2选E或F，无论参与人1在第二次做决策时是选G还是选H，都不会改变支付水平（2，0）。另一个纳什均衡是（（C，H），F），即参与人2用选F来结束博弈。但是，这后一个纳什均衡，如果按“反向归纳”法，是会被排除掉的。之所以要排除掉这后一个纳什均衡，是由于一旦参与人2处于自己主动采取行动的决策点，他的“理性”要求他选E，因“2”知道若我选“E”，则“1”会选G。下一章我们会详细讲“子博弈完美性”，就是分析每个决策人在每个信息集上都要讲理性，都要找出在每个信息集上的纳什均衡。而按这个原则，表11.2中的（（C，H），F）就不再是纳什均衡了。

因此，当我们把完美信息的广延型博弈转化为策略型博弈时，所带来的问题是，这种转化会导致经不起仔细推敲的纳什均衡，即不够精炼的纳什均衡。

参与人2 F 3,1 3,1 2,0 2,0 二、信息完美的子博弈完美纳什均衡举例

1 C D 2 F G H 2 I J E 2 K （3，0）（1，0）（1，1）（2，1）（2，2）（1，3）

图12.3 先行者在某些子博弈中有多个最优行动的广延型博弈在图12.3中，长度（历史长度）为1的子博弈有3个，即由参与人2选择行动的3个子博弈。长度为2的子博弈有1个，就是原博弈本身。

我们来讨论该例的子博弈完美性：

由于历史(?,E)之后的子博弈（最右边的那个子博弈）中，参与人2的最优行动是K，而在另外两个子博弈里，“2”的行动选择不会影响其本人的支付水平，从而，按理性原则（利己但不损人），参与人2的最优策略应该有4个：FHK，FIK，GHK，GIK。注意，参与人2的每个策略都有3元，因他有三个信息集。

下面讨论对参与人1来说，什么是他的最优策略？

对于参与人2的最优策略FHK与FIK来说，“C”是参与人1的最优策略；

对于参与人2的最优策略GHK来说，则无论是C，还是D，还是E，均是参与人1的最优反应；对于参与人2的最优策略GIK来说，参与人1的最优策略是D。由参与人2与参与人1之间的最优策略组成的，满足在每个子博弈都达到纳什均衡要求的“子博弈完美的纳什均衡”便有6个：（C，（FHK）），（C，（FIK）），（C，（GHK）），（D，（GHK）），（E，（GHK））与（D，（GIK））。

如果我们把符合子博弈完美性要求的行动路径用黑线标出来，以上六个子博弈完美纳什均衡的均衡路径为下图：

1 C 2 F （3，0）

1 E 2 I （2，1） J （2，2） K （1，3） F （3，0） 2 G （1，0） H （1，1） C 2 I （2，1） J （2，2） D E 2 K （1，3） D 2 G （1，0） H （1，1）图12.4（1）图12.4（2） 4

1 C 2 F （3，0） 2 F （3，0）

三．信息不完美的广延型博弈与序贯均衡其中，xH1 E 2 I （2，1） J （2，2） K （1，3） F （3，0） 2 G （1，0） H （1，1） C 2 I （2，1） J （2，2） D E 2 K （1，3） D 2 G （1，0） C G （1，0） ?x,LH （1，1） 1 2 H （1，1） yHL图12.4（3）图12.4（4） 1 E 2 2 K （1，3） F （3，0） G （1，0） H （1，1） C 2 I （2，1） J （2，2） D E 2 K （1，3） D I （2，1） ?y。

J （2，2）图12.4（5）图12.4（6）

例：设某产业存在n?2个潜在的进入企业，它们需决定是否进入该产业。已知市场需求的

反函数为：p?x?y?q。这里，p为价格，q为总供应量，而x与y都是随机参数。x与y之间是互相独立的，并且都只取两个值，相应的概率分布为：

?xH,?x??L?x,1???y,y??L?y,H

?1??显然，如x值与y值高，则企业产品的卖价便高；反之，则卖价就低。企业若想了解x的值与y的值，则需要耗费调查成本，设每了解一个变量（x或y）的成本为ｒ＞0。一旦企业决定进入该行业，首先需投入沉没成本K，而进入该产业后，生产的边际成本为零。

假设进入后的企业按古诺模型进行产量博弈。

我们假定： (A.1):?xH?yH(A.2): (A.3): (A.4):

2?L16?K

2?xH?y???9?K 4?K??x?yLH?x?yLH2?29

?xL?yL24?K

这些假定是有经济含义的：这里要进一步扩展古诺均衡的解。若一个行业有n个一样的企业，边际成本等于单位成本等于c，进入的沉没成本为K，且需求反函数为

np?a?q?a??qi则必有?i?i?1?a?c?2?N?1?2?K对所有i的成立。在这个例子中，a?x?y，

因此当c?0时：

（A.1）表示如进入的企业有3个，当x?xH,（A.2）表示当x?xH,（A.3）表示当x?xL,则必然都亏损；

（A.4）表示当x?xL且y?yL时，连一家企业经营也要亏本。下面给出一个数字例子，说明“序贯均衡”的含义： ????12,xH； y?y时，企业都会亏损（?i?0）

H； y?y时，可以允许两个企业进入，因?i?0（对i?1,2）

y?yHL时，只允许一家垄断企业盈利；但如两家企业竞争，

?17,x?7,yLH?11,yL?5,K?50（请注意，这个数字例子满足了

假定（A.1）－（A.4））。

命题：在上述数字例子中，下述策略与信念就形成了“序贯均衡”：

企业A知道x，并且只有当x?xHH?17时它选择进入。如果A未遇上与之竞争的企

业，则A相信状态为（x?x?17,y?y?5）并且生产出垄断产量qLM?xH?y2L=11；

如果A遇上了与之相竞争的企业B，则A“相信”状态为（x?xxHH?17,y?yH?11），并

且选择古诺均衡产量

?y3H?283。

企业B知道y，并且只有当y?yH?11时才进入，如果未遇上竞争对手，B便相信状

态为（x?x,y?y），并且选择垄断产量qLHM?x?y2LH?9；如果B遇上了竞争者，则

B相信状态为（x?xH?17,y?yH，从而选择古诺均衡产量?11）

xH?y3H?283。

下面分两步来证明上述两个企业各自的信念与策略构成了“序贯均衡”：第一步：两家企业各自的“信念”（beliefs）是与事实一致的。这是由于，A与B可以按对手是否进入来更新自己对市场状态的判断与信念。如果B不进入，A在产业内，A相信“x?xH,y?yL”就是与事实一致的，因B只有当y?yH才进入。同理，我们可以证明B的信念也是一致的。

第二步，要证明企业A与B各自的策略是满足序贯理性的。首先，一旦A与B决定进入，无论其选择垄断产量，还是选择古诺均衡产量，其利润都为正，并且对于给定的对手的决策，都是最优反应。要进一步证明的是：

（1）

当A知道x?xL,y?yH时，A不会选择进入，这可用反证法。如果这时A进入，则B会认为x?xH?17,y?yH?11，B会选择古诺均衡产量xH?y3H?283。由于B选择了qB?283，则A的产量只能为

28??LHx?y???2（这是古诺模型中的反应函数），而

3??1328??LHx?y?2???3?3?p?x?yLH，市

413场

133价格相应为

?283?133?7?11??，于是A的利润为

??13?2?????50??18.78?50?0。显然，这时若进入，不是最优的策略。 ????3??（2）另一个反叛行为来自企业B。当B知道x?x,y?y时贸然进入，这不如不进入。为什么？因一旦B进入，企业A按自己最优反应策略选定qA?这样企业B的最优反应只能为?xH?yL??p?xHHL283。

?1928?，市场价格为2??3?3?y?L283?193?17?5?47?3193，从而企业B的利润为

??19?2?????50??0，这不如不进入。 ????3??

当我们排除了上述两类反叛行为之后，便证明了前面表述的企业A与企业B的信念与策略构成了“序贯均衡”。

本文来源：https://www.bwwdw.com/article/93x5.html

相关文章：

正在阅读：

中微补充讲义(7)关于广延性博弈的几个问题12-19

青岛版小学数学六年级下册04-07

浙江省高院关于审理建设工程施工合同纠纷案件若干疑难问题的解答01-21

高考语文复习技法及考点归纳01拼12-16

单片机接口及其技术复习要点10-04

尔雅通识课社会心理学答案- 完整课后习题答案（亲自鉴定）11-04

上一篇：高速铁路运输组织基础第四次主观题作业下一篇：教育学原理叶澜