中微补充讲义(7)关于广延性博弈的几个问题

更新时间:2023-12-19 16:44:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中微补充讲义(7) 北京大学:平新乔

关于广延性博弈的几个问题

一、

完美信息的广延性博弈转化为策略性博弈应注意的几个问题

1. 策略与行动计划

在广延性博弈里,如果参与人的信息集不止一个,则其策略就会成为一整套计划,参与人必须考虑到当自己处于什么“站”应当用什么应对计划的问题。这样,“策略”与“计划”就有了区别:“计划”是指参与人在某个信息集上选取的行动;而“策略”是在每个信息集上只选取一个计划的前提下,由各个信息集下所选取的一个一个行动计划构成的。

2. 一个策略所含的计划个数与策略集所含的策略个数

为什么当完美信息的广延型博弈转化为策略性博弈时,有时策略所包含的计划个数不止一个?原因就在于参与人在广延型博弈里的信息集不止一个。参与人i的一个策略sij( j?1,2,...J,其中J为i各用的策略个数)所含的行计划的个数等于参与人i拥有的信息集个数。i拥有n个信息集,其每一个策略便有n元。请看下例:

在图11.1里,参与人“1”便有两个信息集:一个数在博弈的初始点,用空心表示;另一个信息集是在“1”走了C,参与人“2”走了E之后,又轮到“1”决策的那个信息集。这里,由于信息是完美的,从而参与人“1”的每个信息集都只含有一个决策点。因此,在该博弈里,参与人1有两个信息集,而参与人2则只有1个信息集。

1

1 C 2 (2,0) E 1 G H (0,0) F (3,1) D (1,2) 图11.1 参与人1拥有两个信息集的广延型博弈 这样,参与人2的每一个“策略”就只包含一元。即只含有一个行动计划,当“2”决策时,s2或者是“E”,或者是“F”。但参与人1的每个策略都必须只含有二元:即必须表示参与人1在博弈开始点的行动计划与当参与人2行动之后再由参与人1所做出的反应计划。这样,参与人1的策略就会是(C,G),(C,H),(D,G),(D,H)这样的构成方式,其每个策略都是一套计划,而不是只含有一个计划。

那么,参与人i在信息完美的广延型博弈里的策略个数是怎么决定的呢?设具有K个信

K息集,在第k个信息集参与人i拥有nk个行动计划,则i策略集中策略个数为?nk,这里,

k?1K?k?1是连乘号。在上例中,参与人1有两个信息集,且其在每个信息集都拥有两个行动计

划,从而,他有四个策略:(C,G),(C,H),(D,G),(D,H)。

2

3. 纳什均衡的精炼程度

把图11.1所表示的广延型博弈转化为策略型博弈,便有表11.2:

E 参与人1 (C,G) (C,H) (D,G) (D,H) 1,2 0,0 2,0 2,0 表11.2 与图11.1所对应的策略型博弈

表11.2里有两个纳什均衡:一个是参与人1选D,这样无论参与人选2选E或F,无论参与人1在第二次做决策时是选G还是选H,都不会改变支付水平(2,0)。另一个纳什均衡是((C,H),F),即参与人2用选F来结束博弈。但是,这后一个纳什均衡,如果按“反向归纳”法,是会被排除掉的。之所以要排除掉这后一个纳什均衡,是由于一旦参与人2处于自己主动采取行动的决策点,他的“理性”要求他选E,因“2”知道若我选“E”,则“1”会选G。下一章我们会详细讲“子博弈完美性”,就是分析每个决策人在每个信息集上都要讲理性,都要找出在每个信息集上的纳什均衡。而按这个原则,表11.2中的((C,H),F)就不再是纳什均衡了。

因此,当我们把完美信息的广延型博弈转化为策略型博弈时,所带来的问题是,这种转化会导致经不起仔细推敲的纳什均衡,即不够精炼的纳什均衡。

参与人2 F 3,1 3,1 2,0 2,0 二、 信息完美的子博弈完美纳什均衡举例

1 C D 2 F G H 2 I J E 2 K (3,0) (1,0) (1,1) (2,1) (2,2) (1,3)

图12.3 先行者在某些子博弈中有多个最优行动的广延型博弈 在图12.3中,长度(历史长度)为1的子博弈有3个,即由参与人2选择行动的3个子博弈。长度为2的子博弈有1个,就是原博弈本身。

3

我们来讨论该例的子博弈完美性:

由于历史(?,E)之后的子博弈(最右边的那个子博弈)中,参与人2的最优行动是K,而在另外两个子博弈里,“2”的行动选择不会影响其本人的支付水平,从而,按理性原则(利己但不损人),参与人2的最优策略应该有4个:FHK,FIK,GHK,GIK。注意,参与人2的每个策略都有3元,因他有三个信息集。

下面讨论对参与人1来说,什么是他的最优策略?

对于参与人2的最优策略FHK与FIK来说,“C”是参与人1的最优策略;

对于参与人2的最优策略GHK来说,则无论是C,还是D,还是E,均是参与人1的最优反应;对于参与人2的最优策略GIK来说,参与人1的最优策略是D。由参与人2与参与人1之间的最优策略组成的,满足在每个子博弈都达到纳什均衡要求的“子博弈完美的纳什均衡”便有6个:(C,(FHK)),(C,(FIK)),(C,(GHK)),(D,(GHK)),(E,(GHK))与(D,(GIK))。

如果我们把符合子博弈完美性要求的行动路径用黑线标出来,以上六个子博弈完美纳什均衡的均衡路径为下图:

1 C 2 F (3,0)

1 E 2 I (2,1) J (2,2) K (1,3) F (3,0) 2 G (1,0) H (1,1) C 2 I (2,1) J (2,2) D E 2 K (1,3) D 2 G (1,0) H (1,1) 图12.4(1) 图12.4(2) 4

1 C 2 F (3,0) 2 F (3,0)

三.信息不完美的广延型博弈与序贯均衡 其中,xH1 E 2 I (2,1) J (2,2) K (1,3) F (3,0) 2 G (1,0) H (1,1) C 2 I (2,1) J (2,2) D E 2 K (1,3) D 2 G (1,0) C G (1,0) ?x,LH (1,1) 1 2 H (1,1) yHL图12.4(3) 图12.4(4) 1 E 2 2 K (1,3) F (3,0) G (1,0) H (1,1) C 2 I (2,1) J (2,2) D E 2 K (1,3) D I (2,1) ?y。

J (2,2) 图12.4(5) 图12.4(6)

例:设某产业存在n?2个潜在的进入企业,它们需决定是否进入该产业。已知市场需求的

反函数为:p?x?y?q。 这里,p为价格,q为总供应量,而x与y都是随机参数。x与y之间是互相独立的,并且都只取两个值,相应的概率分布为:

?xH,?x??L?x,1???y,y??L?y,H

?1??显然,如x值与y值高,则企业产品的卖价便高;反之,则卖价就低。企业若想了解x的值与y的值,则需要耗费调查成本,设每了解一个变量(x或y)的成本为r>0。一旦企业决定进入该行业,首先需投入沉没成本K,而进入该产业后,生产的边际成本为零。

5

假设进入后的企业按古诺模型进行产量博弈。

我们假定: (A.1):?xH?yH(A.2): (A.3): (A.4):

2?L16?K

2?xH?y???9?K 4?K??x?yLH?x?yLH2?29

?xL?yL24?K

这些假定是有经济含义的:这里要进一步扩展古诺均衡的解。若一个行业有n个一样的企业,边际成本等于单位成本等于c,进入的沉没成本为K,且需求反函数为

np?a?q?a??qi则必有?i?i?1?a?c?2?N?1?2?K对所有i的成立。在这个例子中,a?x?y,

因此当c?0时:

(A.1)表示如进入的企业有3个,当x?xH,(A.2)表示当x?xH,(A.3)表示当x?xL,则必然都亏损;

(A.4)表示当x?xL且y?yL时,连一家企业经营也要亏本。 下面给出一个数字例子,说明“序贯均衡”的含义: ????12,xH; y?y时,企业都会亏损(?i?0)

H; y?y时,可以允许两个企业进入,因?i?0(对i?1,2)

y?yHL时,只允许一家垄断企业盈利;但如两家企业竞争,

?17,x?7,yLH?11,yL?5,K?50(请注意,这个数字例子满足了

假定(A.1)-(A.4))。

命题:在上述数字例子中,下述策略与信念就形成了“序贯均衡”:

企业A知道x,并且只有当x?xHH?17时它选择进入。如果A未遇上与之竞争的企

业,则A相信状态为(x?x?17,y?y?5)并且生产出垄断产量qLM?xH?y2L=11;

如果A遇上了与之相竞争的企业B,则A“相信”状态为(x?xxHH?17,y?yH?11),并

且选择古诺均衡产量

?y3H?283。

企业B知道y,并且只有当y?yH?11时才进入,如果未遇上竞争对手,B便相信状

6

态为(x?x,y?y),并且选择垄断产量qLHM?x?y2LH?9;如果B遇上了竞争者,则

B相信状态为(x?xH?17,y?yH,从而选择古诺均衡产量?11)

xH?y3H?283。

下面分两步来证明上述两个企业各自的信念与策略构成了“序贯均衡”: 第一步:两家企业各自的“信念”(beliefs)是与事实一致的。这是由于,A与B可以按对手是否进入来更新自己对市场状态的判断与信念。如果B不进入,A在产业内,A相信“x?xH,y?yL”就是与事实一致的,因B只有当y?yH才进入。同理,我们可以证明B的信念也是一致的。

第二步,要证明企业A与B各自的策略是满足序贯理性的。首先,一旦A与B决定进入,无论其选择垄断产量,还是选择古诺均衡产量,其利润都为正,并且对于给定的对手的决策,都是最优反应。要进一步证明的是:

(1)

当A知道x?xL,y?yH时,A不会选择进入,这可用反证法。如果这时A进入,则B会认为x?xH?17,y?yH?11,B会选择古诺均衡产量xH?y3H?283。由于B选择了qB?283,则A的产量只能为

28??LHx?y???2(这是古诺模型中的反应函数),而

3??1328??LHx?y?2???3?3?p?x?yLH,市

413场

133价格相应为

?283?133?7?11??,于是A的利润为

??13?2?????50??18.78?50?0。显然,这时若进入,不是最优的策略。 ????3??(2) 另一个反叛行为来自企业B。当B知道x?x,y?y时贸然进入,这不如不进入。为什么?因一旦B进入,企业A按自己最优反应策略选定qA?这样企业B的最优反应只能为?xH?yL??p?xHHL283。

?1928?,市场价格为2??3?3?y?L283?193?17?5?47?3193,从而企业B的利润为

7

??19?2?????50??0,这不如不进入。 ????3??

当我们排除了上述两类反叛行为之后,便证明了前面表述的企业A与企业B的信念与策略构成了“序贯均衡”。

8

本文来源:https://www.bwwdw.com/article/93x5.html

Top