四川大学 骆帧 博弈论与经济分析(不完全信息动态)

更新时间:2024-03-03 11:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章 不完全信息动态博弈

第一节 完美贝叶斯均衡

引入“完美贝叶斯均衡”的目的是进一步“精炼”贝叶斯纳什均衡。就像子博弈完美的条件是为了“精炼”动态博弈中的纳什均衡一样,其是为了剔除不可置信的威胁(或者承诺)。

子博弈完美不仅要求参与者的策略组合是一个纳什均衡,而且要求其在每一个子博弈中都是纳什均衡。和子博弈完美纳什均衡类似,当不完全信息博弈由静态发展到动态之后,我们也面临对原有“均衡”概念进一步精炼的要求。

当然,本章中,我们不是考虑“子博弈”,而是考虑更加广义的“后续博弈(continuation game)”,和子博弈相比,它可以不是始于单节的信息集。

(请联系后面“完美贝叶斯均衡”“序贯均衡”的定义,思考:不同的“均衡”定义是如何以何种方式考虑到前面提到的“后续博弈”的)

和上一章一样,本章中的博弈存在“不完全信息”,这涉及到参与者行动时所依据的“信念”。因此,对均衡解的“精炼”,就必须设计对“信念”的考察。而我们对不完全信息的处理,仍然沿用上章的“海塞尼转换”,假设有个0博弈方“自然”,决定各参与人的类型但是只将类型告诉本人。于是,“不完全信息”可以转变为“不完美信息”。

当然,处理“不完全信息动态”博弈中“均衡”的“精炼”问题时,子博弈完美并不能“胜任”。但是,既然“不完全信息”可以通过“海塞尼转换”转变为“不完美信息”,则对“不完全信息”的精炼方法,同样适用于“不完美信息动态博弈”。

(回忆前面的“完全但不完美信息动态博弈”,为什么没用考虑到进一步的“精炼”,或者说本章将要进行的对“信念”的精炼?因为前面的信息“不完美”是由于“同时选择”造成的,而且我们假定其“同时选择的子博弈”中有唯一的纳什均衡,因此,不需要对信念进行进一步的精炼)

首先,我们通过以下例子来说明进一步“精炼”的必要性:

1 R L 2 L’ (2, 1) L L’ R’ M R’ (1, 3)

R’ L’ (0, 0) (0, 2) (0, 1)

2, 1 0, 0 M 0, 2 0, 1 R 1, 3 1, 3

此博弈有两个NE:(L,L’)和(R,R’),而且本博弈没有子博弈,因此,子博弈完美的要求自然满足。然而,(R,R’)却依赖一个明显不可信的威胁。

为了“精炼”掉这样的NE,我们提出以下要求:

要求1:在每一个信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪一个节点有一个推断(信念belief)。

要求2:给定参与者的推断,参与者的策略必须满足序贯理性(sequentially rational)的要求。

比如上例中:

1 R L p L’ (2, 1) 2 (1, 3)

M 1-p R’ R’ L’ (0, 0) (0, 2) (0, 1)

给定推断(p,1-p),L’的期望得益=p1+(1-p)2=2-p>R’的期望得益=1-p。因此,就排除

了(R,R’)。

这是一种特殊情况,那么,参与者的信念是否有都是“理性”的呢?

定义:对于一个给定的扩展式博弈中给定的均衡,如果博弈根据均衡策略进行时,将以正的概率到达的信息集,我们称是处于均衡路径上的;反之,则称为是非均衡路径上的信息集。

要求3:在处于均衡路径上得信息集中,推断由贝叶斯法则及参与者的均衡策略给出。(信念要与策略相容)

以上三个要求包含了完美贝叶斯均衡的主要内容,Wilson and Kreps(1982)将推断(信念)提到了和策略同等重要的位置。在这里,一个均衡不再只是一个策略组合,还包括每一个行动集的推断。

In dynamic Bayesian games, an assessment consists of a strategy profile σ and a system of belief μ.

The belief μi of player i is strategically consistent with the strategy profileσ, if it is derived from the Bayesian rule when it’s along the equilibrium path.

The strategy σi of player i is sequentially rational if given μi and all other players’ strategy, σi maximizes i’s (expected) payoff starting from each of his information set.

An assessment [σ, μ] is said to be a weak perfect Bayesian equilibrium, if (1) every player’s belief is strategically consistent with σ, and (2) every player’s strategy is sequentially rational.

但是,这并不足够。如下例所示:

12, 0, 0 B2Upl 1, 2, 1 1 2 A 3 l r B 3 L r r 3l 0, 1, 2 D1-p r A3, 3, 3 0, 1, 1

U 2,0,0 2,0,0 1,2,1 3,3,3 D 2,0,0 2,0,0 0,1,2 0,1,1 NE: (A, U, l) (A, D, l) (A, D, r) (B, U, r)

除(A, D, r)中2的策略不满足“序贯理性要求”外,其他都是WPBNE

然而,只有(B, U, r)是子博弈完美的。

这是因为,WPBNE并没有考虑到“均衡路径”外的情况。 对于“均衡路径”外地信念的精炼,有两种思路: (1)序贯均衡sequential equilibrium

Let σ be an assessment. Let {σ(v)} be any sequence of completely mixed behavior strategy profile which converges to σ as v tends to infinitely. For each v, let μv be the beliefs computed by the Bayesian rule according toσv. Let μ be the limit of {μv }. Thenμ is said to be consistent with σ.

对于上例:

(2)要求4:处于均衡路径之外的信息集,推断有贝叶斯法则和可能情况下的参与者均衡策略决定。

定义 满足要求1到4的策略及其推断(信念)构成博弈的完美贝叶斯均衡。

对于上例:

但仍有缺陷:

完美贝叶斯均衡要求参与者不可威胁使用始于任何信息集的严格劣策略,即使是处于均衡路径之外的。

(思考子博弈完美为什么不足够?一是有可能没有子博弈,二是完美贝叶斯均衡要求给定信念,策略要最优,同时给定策略,信念要理性……如此循环,逆推归纳是很难满足的。) 上述例子事实上还隐含了要求5:在均衡路径之外的推断中,如果一个节点只有在另一参与者选择始于某些信息集的严格劣策略时才能到达,则到达该节点的概率为0.

第二节 信号博弈

信号发送者S;信号接受者R

1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,∑p(ti)=1 2、S观察到ti后从可行的信号集M中选择信号mj发送 3、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak 4、双方收益为us(ti,mj,ak),ur(ti,mj,ak)

简单情况T={t1,t2},M={m1,m2},A={a1,a2},pro{t1}=p

a1 a1 m1 t1 m2 a2 P 0 1-p a1 m1 t2 a2 m2 a2

a1 a2

接受者和发送者都有四个纯策略:

混同(pooling)策略,如果类型多于两种还可能存在部分混同(partially pooling)或者称为准分离(semi-separating)策略。

分离策略

“杂合策略”(hybrid strategies),比如t1选择m1,t2却随机地选择m1或m2.

如果最后的均衡中,若发送者的策略是混同的,则称为混同均衡,如果是分离的,则称分离均衡。

我们把前面完美贝叶斯均衡的要求替换为以下信号要求:

信号要求1:在观测到M中任何信号mj后,接受者对哪些类型会发送mj有个推断:

p(ti|mj),p(ti|mj)?0且?p(ti|mj)?1。

ti?T信号要求2R:对M中每一mj,在给定哪些类型可能发送mj的推断p(ti|mj)条件下,接受者的行动a(mj)必须使接受者的期望收益最大化。

信号要求2S:对于T中的每一ti,在给定接受者策略a(mj)的条件下,发送者选择信号m(ti)必须使发送者的收益最大化。

信号要求3:对于每一M中的mj,如果T中存在ti使得m(ti)?mj,则接受者在对应于mj的信息集中所持有的信念取决于贝叶斯法则和发送者策略:

????p(ti|mj)?ti?Tjp(ti)

?p(ti)其中,Tj是根据S的策略,所有可能选择mj的ti的集合。

?定义 信号博弈中一个纯策略完美贝叶斯均衡为一对策略m(ti)和a(mj)以及信念

?p(ti|mj),满足上述信号要求1,2S,2R,3.

(以上定义中Tj不是空集,说明其信息要求没有考虑“均衡路径”之外的信念,但是后面的例子中,我们在分析中仍然考虑了均衡路径之外的信息集,注意是怎么分析的)

例子:

1,3 u 2,1

L t1 R qu d p4,0 d 0,0

0.5 0 2,4 u 0,1 只考虑纯策略 1、混同于L 2、混同于R 3、分离t1选L 4、分离t1选R

1-p 0.5 1-q L t2 R d 1,0

u d 1,2

3,2 u L t1 R qu 1,0

d p2,0 d 0,1

0.5 0 1,0 u 1,1 1-p 0.5 1-q L t2 R d 2,1

u d 0,0

考虑混同均衡L,L→要求5

通常思路:给出S的策略

→根据贝叶斯法则和先验概率计算看到某信号后的“推断(信念)” →R根据该推断选择最大化自己期望得益的行动

→给定R的推断和行动,考察S的策略是否是最优的,即有没有偏离的动机(某些情况下要考虑非均衡路径上的选择)。

这背后的纳什均衡的思路包括了对信念的考察,简单说,给定策略,该信念是理性的,给定该信念,该策略是最优的,那么,给定该策略和信念组合,没有人会有偏离的动机。

第三节 信号博弈应用

1、劳动力市场上的教育信号 (1)没有信号的情形

聘 好0.1 0 差0.9 否 聘 否

(2)信号成本c=2,C=6

10,20 5,0 10,-3

5,0

Y D 好0.1 0 差0.9 N D N Y NY N Y N Y D 好0.1 0 差0.9 N D N Y NY N Y N 10-c,20 5-c,0 10,20 5,0 10-C,-3 5-C,0 10,-3 5,0

8,20 3,0 10,20 5,0 4,-3 -1,0 10,-3 5,0

N N

(3)Spence1973、1974模型

A、自然决定工人的生产能力η=H or L,prob[η=H]=q B、工人知道自己的能力,并选择一个教育水平e≥0 C、两个企业看到教育水平e,并开出工资水平w

D、工人接受着两个工资中较高的一个,若相等则随机选择

工人的收益w?c(?,e),其中c(?,e)为η能力的工人获得e教育的成本。企业收益为

y(?,e)?w,其中y(?,e)为η能力且获得e教育的工人的产出,产出不仅取决于能力,教

育水平也能提高工人的生产能力。

不考虑教育的时间持续性以及由此带来的动态选择问题。

关键假设1:对于?e,有ce(L,e)?ce(H,e)

关键假设2:竞争使得企业的期望利润为0.

即信息要求2R变为,给定观测到e之后的推断,开出的工资要等于工人的期望产出:

w(e)??(H|e)?y(H,e)?[1??(H|e)]?y(L,e) (1)

完全信息条件下:

工人可以获得工资w(e)?y(?,e),他选择e,最大化以下问题:

maxy(?,e)?c(?,e)

e

工人能力为私人信息的时候:

A、 低能力冒充高能力的成本过高,及时获得高工资也不足以补偿:

w*(L)?c[L,e*(L)]?w*(H)?c[L,e*(H)]

B、 低能力的人有动机冒充高能力的人,即w(L)?c[L,e(L)]?w(H)?c[L,e(H)]

****

我们几种均衡的例子:

(i)两种类型的工人都选择单一的教育水平ep

给定工人的信息策略,经验概率等于先验概率,即?(H|ep)?q,于是,工资等于

wp?q?y(H,ep)?(1?q)?y(L,ep) (2)

为完成均衡条件,我们还必须给出其他教育水平的w,并考察两种工人混同于ep是否是最优选择。

比如我们可以考虑以下推断:

??0,e?ep?(H|e)??

q,e?e?p?虽然这个推断显得不那么合理,并且在后面我们附加条件会将其“精炼”掉,但是信

号博弈的三个条件对非均衡路径上的信念并没有任何规定。

根据该推断,企业的工资为:

??y(?,e),e?epw(e)??

??wp,e?ep由下图可知,在给定上述推断和策略下,两种类型的工人混同于ep是最优选择。

从该图还可构造出更多的完美贝叶斯均衡。

(ii)分离均衡

最自然而然的分离均衡[e(L)?e(L),e(H)?e(H)] 给定该策略,?(H|e(L))?0,?(H|e(H))?0 于是工资为w[e(L)]?w(L),w[e(H)]?w(H)

为完成均衡的考察,还必须给出其他教育水平的推断和工资,并证明在这些条件下,工人采取该分离策略是最优的。比如:

********

若“假冒”成本太高,即w(L)?c[L,e(L)]?w(H)?c[L,e(H)],则该策略和信念组合下,该分离均衡对低能力的工人也是最优的。

但是,如果w(L)?c[L,e(L)]?w(H)?c[L,e(H)]不满足,则低能力的工人会假冒高能力的工人使得该均衡不成立,那么高能力的工人必须选择更高的教育水平(牺牲福利水

********

平)来证明自己的能力:

当然,还有更多的分离均衡。

(iii)杂合均衡:一种类型选择某一教育水平,另一类型随机地选择是否混同。

假设高能力的工人选择eh,低能力的以概率π选择eh或者以概率(1-π)选择eL。

给定该策略,有以下推断:?(H|eh)?q,?(H|eL)?0。

q?(1?q)?由?(H|eL)?0可得w(eL)?y(L,eL),那么根据该推断和策略,低能力工人选择“分离”信号时,最大化自己得益,因此eL?e(L)。

下面确定eh:

低能力工人对两种策略无差异:

(3)

企业期望得益为0:

* (4)

未知数:eh,wh,?

给定eh,若(3)所得wh?y(H,eh)则可通过(4)确定唯一的?,否则该均衡不存在。

第四节 空谈博弈

特征:信号不需要成本,也无义务和约束 空谈在Spence模型中不起作用,为什么? 空谈起作用的三个条件:

1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,∑p(ti)=1 2、S观察到ti后从可行的信号集M中选择信号mj发送 3、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak 4、双方收益为us(ti,ak),ur(ti,ak) 双方的得益与信号无关,总存在混同均衡:

1、 两种类型例子:

2、连续类型

类型T=[0, 1]切服从均匀分布,M=T,A=[0, 1]

UR(t,a)??(a?t)2 US(t,a)??[a?(t?b)]2

本文来源:https://www.bwwdw.com/article/xmva.html

Top