第六章 不完全信息静态博弈

更新时间:2024-01-21 19:26:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章 不完全信息静态博弈

博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出一种特别的魅力。不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的,如在拍卖商品或工程招投标中,参加拍卖的潜在买主愿意为拍卖品支付的最高价格或参加工程招投标的投标者愿意为工程开出的最低价格只能是各个潜在买主或投标者心中的秘密,其他人是不清楚的,即使潜在买主或投标者告诉其他人他们愿支付的最高价格或最低价格,其他人也不会相信他们说的是真的。潜在买主或投标者也知道其他人并不清楚他们愿开出的最高价格或最低价格,因而也不会直接说出真实的价格底线。信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。当然,对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

6.1 不完全信息博弈:基本概念

在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型是不清楚的。如果一些局中人不知道另一些局中人的支付函数,或支付函数不是共同知识,局中人就不知道他在与谁博弈,因而在1967年以前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。Harsanyi(1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N”。N首先行动,它决定每个局中人的特征。每个局中人知道自己的特征,但不知道别的局中人特征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N的行动选择,第二阶段是除N外的局中人的静态博弈。这种转换被称为“Harsanyi转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

称局中人拥有的私人信息为他的“类型”,许多情况下局中人类型由其支付函数完全决定,故常将支付函数等同于类型。用?i表示局中人i的一个特定类型,Hi表示局中人i所有可能类型的集合,即?i?Hi,称Hi为局中人i的类型空间,i?1,?,n。 在不完全信息静态博弈中,由于局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同,其中之一就是局中人的行动空间Ai将随类型?i

205

而变化,即Ai?Ai(?i),如企业能够选择的产量范围依赖于其成本函数。由于支付函

数刻画了类型,或支付函数也是类型依存的,如同样产量不同成本函数的企业的利润就不同。我们可将其记为[1]

ui?ui(a1,?,ai,?,an,?i)

(6.1)

i?1,?,n

在其他局中人已选定行动aj,j?1,?,n,j?i时,局中人选行动ai?Ai(?i)获得的支付由式(6.1)给出。显然给定aj时最大化ui的ai与?i有关,即ai*?ai*(?i),其中ai*是给定aj时最大化ui的ai。这里,我们用“类型依存”来描述包括最优战略在内的概念与类型的对应关系。可以预料到,当局中人的类型给定时,其最优战略ai*的范围也就是给定了的,当其是唯一存在的时,有ai*?ai*(?i)。在前面介绍的行动空间Ai,其类型依存就是Ai(?i)。

对于局中人i来说,他不知道其他局中人的类型。当他选择任一行动ai?Ai(?i)时,对于其他局中人的任一可能的类型组合?1,?,?1?1,?1?1,?,?n,如果给定其他局中人类型与其最优战略aj的一个对应组合a*j(?j),j?i,j?1,?,n,其支付为

ui(a1(?1)?ai?1(?i?1),ai,ai?1(?i?1)?an(?n),?i)****

假定局中人i认为其他局中人的类型组合恰好为??i的概率为Pi???i?i?。这一概念与局中人i的类型?i有关,还与博弈开始之时局中人i对?1??i??n的概率分布知识有关,记这一事前的分布密度(局中人在博弈之前掌握的知识使其对?1??i??n的取值可能性判断)为Pi(?1,??i,?,?n),称为“先验概率”。显然,Pi???i?i?就是一种条件概率的概念,即当局中人i的类型为?i时,他认为??i取值?i的概率为

Pi???i?i?? ?P(?i,??i)P(?i)P(?i,??i) (6.2)

?P(???i?H?i?i,?i)式(6.2)是概率论中著名的贝叶斯公式(Bayes equition)。

此时,因为i不知道??i,与第3章中的混合博弈支付函数构造相类似,我们这里用von·Neumann——Morganstern效用函数刻画这种不确定下的支付函数,即i的期望支付为[2]

?P??i?i?u(a?i(??i),ai,?i) (6.3) ?i*??i显然,最大化式(6.3)的ai就是i的最优战略ai*,它与?i有关,故ai*?ai*(?i)。

*),满足 当存在一组“类型依存”的最优战略a*?(a1*,?,ai*,?,anai?argmax*ai?Ai(?i)?P{?i?i|?i)u(a?i(??i),ai,?i) (6.4)

*??i*i?1,?,n则称a

是一个(纯战略)纳什均衡,也称为贝叶斯纳什均衡(Bayes Nash

206

equilibrium)。显然a*是类型依存的,即ai*?ai*(?)。为了减少复杂性,假定博弈开始之前各个局中人掌握的关于(?1,?,?n)的分布密度知识是相同的,于是有:

Harsanyi公理:假定概率分布密度P(?1,?,?n)是所有局中人的共同知识。这一公理表明所有局中人有关自然行动的信念(belief)是相同的。

贝叶斯纳什均衡(也简称贝叶斯均衡)是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。

有时也称不完全信息静态博弈为静态贝叶斯博弈或贝叶斯静态博弈。

在上面,我们实际上已给出了静态贝叶斯博弈的战略式表述,以下给出正式的战略式表述和一些例子。

6.2 静态贝叶斯博弈的战略式表述:贝叶斯纳什均衡

定义6.1(n人静态贝叶斯博弈的战略式表述)局中人类型空间H1,?,Hn;条件概率P1,?,Pn;战略空间A1(?1),?,An(?n);支付函数u1(a1,?,an,?1),?,un(a1,?,an,?n)。

i知道?i。用G??A1,?,An,?1,?,?n,P1,?,Pn,u1,?,un?表示该博弈。

博弈顺序为:

①自然N选??(?1,?,?n),?i?Hi,局中人i观察到?i,但局中人j?i仅知道

Pj(??j|?j),不能观察到?i。

②n个局中人同时选行动(战略)a?(a1,?,an),ai?Ai(?i)。 ③i得到支付ui(a1,?,an,?i),i?1,?,n。

注意,该定义不排除局中人j可能拥有关于局中人i类型的某种信息,而当所有局中人类型空间只有一个元素时,不完全信息静态博弈就退化为完全信息静态博弈。

同时,这里假定了Ai(?i)和ui(ai,a?i,?i)本身是共同知识,即尽管其他局中人不知道i的类型?i,但他们知道i的战略空间和支付函数是如何依赖于他的类型的,即当他们知道?i时,就必然知道Ai(?)和ui(?)。

n人不完全信息静态博弈G??A1,?,An,?1,?,?n,P1,?,Pn,u1,?,un?的纯战略贝

叶斯纳什均衡是一个类型依存战略组合?ai*(?i)?i?1,满足[3]:

nai(?i)?argmaxi?1,?,n

*ai?Ai(?i)?P{?i?i|?i)ui(a?i(??i),ai,?i)

*可以定义混合战略贝叶斯纳什均衡,并且模仿第4章中的方法不难证明有限博弈的不完全信息静态博弈至少存在一个贝叶斯纳什均衡,这一工作可留给读者自己去完成。

需要指出的是:纯战略只是一个行动ai如何依类型?i而变的规则,不是指一个具

207

体的结果。

6.3 某些静态贝叶斯博弈的例子

例子6.1 市场进入博弈

一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。

表6.1 市场进入博弈 B

A

进入 不进入

高成本 默认 40,50 0,300 斗争 -10,0 0,300 低成本 默认 30,80 斗争 -10,100 0, 400

假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同。假若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。

当A不知道B的成本情况时,他的选择将依赖于他对B的成本类型的主观概率或先验概率密度。

设A对B是高成本的先验概率判断为P,则A认为B为低成本的概率为1?P。 如果A进入,其期望支付为

P(40)?(1?P)(?10) 如果1不进入,其期望支付为0。 当且仅当P(40)?(1?P)(?10)?0或P?不进入。

于是,贝叶斯均衡为:

(进入,默认),高成本,P? (进入,斗争),低成本,P?

208

15时,A选择进入;反之,当P?15时,A

1515; ;

(不进入,*),P?15

其中*表示可以是斗争,也可以是默认。 例6.2 成本信息不对称的古诺博弈

例3.10给出的古诺博弈中,每个厂商的成本函数是共同知识。这里,我们假设每个厂商的成本函数是私人信息,具体规定如下:两个企业生产相同产品在同一市场上进行竞争性销售,市场需求函数为Q?a?P,a?0,P为产品价格,Q为市场需求量。假设a充分大时总有a?P?0,企业i的成本函数为Ci?biqi,其中Ci为企业i的总成本,qi为其产量,bi为其平均成本,bi为常数且bi?0,故bi也是边际成本。企业j不知道bibi是企业i的私人信息,

d?e。且进一步假定bid?0,e?0,但认为bi在[d,e]上呈均匀分布,

在[d,e]呈均匀分布是共同知识,i?j,i?j?1,2。

企业i的支付函数是其利润函数?i

?i?Pqi?ci ?(a?Q)qi?biqi

因 Q?q1?q2

故 ?i?(a?q1?q2)qi?biqi

设静态贝叶斯均衡为?qi*?i?1,2,则由均衡战略的类型依存性有 qi*?qi*(bi), i?1,2 于是

?i?(a?q1(b1)?q2(b2))qi(bi)?biqi(bi) ? ?i(bj)****

i的期望支付为

ui??P(biHjj|bi)?i(bj)dbj

显然P(bj|bi)?P(bj),由概率分布密度P(bj)的归一化条件

?P(bHjj)dbj?1

及bj在[d,e]上呈均匀分布假设,有 P(bj)?dbj?1

Hj 或[e?d]P(bj)?1 即P(bj)?1e?d

????q(b)dbq?bq(e?d)? ?jjj?iiiHj??????于是,ui???(a?qi)(e?d)?e?d????1一阶条件:

209

?ui???(e?d)qi?(a?qi)(e?d)???qi(e?d)??1(a?bi)(e?d)?2(e?d)??0 ?qj(bj)dbj?bi(e?d)??Hj?即 qi??qj (6.5)

同样由对称性有 qj?(a?bj)(e?d)?2(e?d)22?qi (6.6)

在上式两端对bj进行积分

a(e?d)?e?d22e?d22e?d2322?

?qj??qi (6.7)

在式(6.5)两端对bi积分

a(e?d)??

?qi??qj (6.8)

将式(6.7)代入式(6.8)的右端,得

a?

?qi? (e?d) (6.9)

a?e?d23(e?d)

由对称性有?qj??qi?代入式(6.5)得

a?qi?2a?3bi? ?6*e?d23(e?d)(a?bi)(e?d)?2(e?d)e?d2

同理有q*j?2a?3bj?6e?d2

2a?3b1?6e?d2,2a?3b2?6e?d2)。

于是得静态贝叶斯均衡为(*当a充分大时,qi*和qj均为非负数。

*当b1?b2时,q1*?q2;

**??2,即成本较高的一方利润较低,产量较均衡利润?1*?(P?b1)q1*?(P?b2)q2低。

210

当e?d时,博弈退化成完全信息静态博弈的场合。为了与例3.26相比较,进一步设d?e?c,b1?b2?c,则

q1?q2?**13(a?c)

这正好回到例3.26的结果。 若假设d?c?e,c?q1?q2?**d?e2,b1?b2?c,则

13(a?c)d?e2,这与完全信息博弈均衡相同。

若假设c?q1?q2?**,b1?b2?c,则

,此时每个厂商都误以为对方的成本较自己高的可能性大一

13(a?c)些,从而过于自信地扩大产量。

相反,若假设c?q1?q2?**d?e2,b1?b2?c,则

13(a?c),此时每个厂商都误以为对方的成本较自己低的可能性大一

些,从而过于谨慎地计划自己的产量。

例6.3 不完全信息市场交易模型

本例介绍一个模型,它描述一个潜在的商品卖者与一个潜在买者在信息不完全情况下的交易可能性及交易价格的决定。这个模型表达的现实交易内容是广泛的,如可以应用于企业招聘工人的场合(如Hall与Lazear(1984))。

假设买方对商品的估价为vb,卖方的估价为vs,双方的估价都是私人信息,并且服从[0,1]区间的均匀分布。博弈规则是:卖方确定一个卖价Ps,买方同时给出一个买价Pb。当Pb?Ps,则交易达成且价格为P?Pb?Ps2;当Pb?Ps,则不发生交易。

当交易达成时,买方的支付为vb?P,否则支付为0;交易达成时卖方支付为P?vs,否则为0。

设静态贝叶斯均衡为?Pb(vb),Ps(vs)?,给定vb,Pb?Pb(vb)是最大化如下期望支付的解:

maxPb?Pb?Ps(vs)P(vs|vb)[vb?Pb?Ps(vs)2]dvs

该条件可表为

???max?vbPb???Pb?P(vPb?Ps(vs)s|vb)dvs?Ps2?P(vPb?Ps(vs)s?Pb?Ps(vs)P(vs|vb)dvs?|vb)Ps(vs)dvs??? ???? 211

??Pbprob(Pb?Ps(vs))????max?vbprob(Pb?Ps(vs))?Pb?????P(vPb?Ps(vs)s|vb)Ps(vs)dvsprob(Pb?Ps(vs))2??prob(Pb?Ps(vs)?????????P?E[Ps(vs)|Pb?Ps(vs)]?? (6.10) ??max?vb?bprob(P?P(v)bss??Pb2????其中E[Ps(vs)|Pb?Ps(vs)]是在卖方价格小于买方价格条件下,卖方价格的期望值。类似地,给定vs,Ps?Ps(vs)是最大化如下期望支付的解:

?P?E[Pb(vb)|Pb(vb)?Ps]?max?s?vs?prob[Pb(vb)?Ps] Ps2?? (6.11)

其中E[Pb(vb)|Pb(vb)?Ps]为在买方价格大于卖方价格Ps的条件下,买方价格的期望值。

该模型不仅存在贝叶斯均衡,而且均衡是十分多的。下面给出一个均衡,称为“单一价格均衡”。此均衡在交易达成时,交易价格就只是单一的一种价格。在这个均衡

中,Pb(vb)和Ps(vs)的规定如下:

令x?[0,1]

?xPb(vb)???0?xPs(vs)???1vb?xvb?xvs?xvs?x

我们来证明如此构造的Pb(vb)和Ps(vs)构成一个贝叶斯均衡。

给定买方战略,若vs?x,当Ps?x时,不会成交,因为买方价格Pb不会超过x,而卖方报出Ps?x时,在vb?x时可以成交且以P?x售出,此时卖方支付为

x?vs?0,当Ps?x时,成交时必有vb?x且Pb?x,成交价为

Ps?x2?x,此时卖方

支付没有报Ps?x的成交价x高,所以,此时Ps?x是最优的。若vs?x,当Ps?x时,不会成交,而Ps?x时即使成交卖方支付也不会为正。所以,此时卖方的最好选择是不成交,可以令Ps?1,此时不会成交。于是,给定Pb(vb)如上规定,Ps(vs)是卖方的最优战略。

给定Ps(vs),下面证明如上规定的Pb(vb)是买方的最优战略。

若vb?x,买方报出Pb?x时在vs?x时会以价格

Pb?x2?x成交,但不如报出

Pb?x好,因此时将以x价格成交,当vs?x时,若Pb?1会以价格

1成交,但买方支

付此时不会为正,不如报Pb?x不成交为好。所以,当vb?x时,买方报Pb?x比报

Pb?x为好。若Pb?x,不会成交。当Pb?x时,在vs?x

212

时成交,买方支付为vb?x?0。

所以,当vb?x时,Pb?x是最优的。当vb?x时,买方只有报Pb?x才会成交,但此时买方支付vb?Pb?0,所以不成交为好。令Pb?0就可达到不成交的目的。所以,给定卖方战略,买方战略是最优的。

图6.1 单一价格均衡的交易达成区域

x

1

vs

x 1

交易达成区域

vb=vs

vb

在图6.1中,满足Pb?Ps的区域即交易达成区域仅是有效率交易区域vb?vs的一部分,但其中阴影部分尽管是有效率的交易区域但却不能达成交易。

下面,我们尝试找出另外的一些均衡,譬如最优战略都是线性函数的情形。之所以专门考察线性战略的情形,是因为线性均衡有着如下将要表述的十分有趣的效率特征。

设卖方的战略为Ps(vs)?as?csvs,则Ps服从区间[as,as?cs]上的均匀分布,此时当as?Pb?as?cs,prob[Pb?Ps(vs)]?prob(Pb?as?csvs)

(vs? ?probPb?ascs)

?当Pb?as,prob(Pb?Ps(vs))?0 当Pb?as?cs,prob(Pb?Ps(vs))?1

Pb?ascs

当Pb?as时,prob(Pb?Ps(vs))?0,期望支付也为0。 令函数f(Pb,Vb)??Vb?则

?f(Pb,Vb)?Pb?as?Pb??Pb?as1?P? b???2?2cs????6Pb?2as?4Vb4cs?

213

?f?Pb?0,则Pb?2323Vb?Vb?1313asas23Vb?13as

是Pb的严格增函数

当Pb?当Pb?,则,

?f?f?Pb?0,f?Pb13?0,f是Pb的严格减函数

故f(Pb,Vb)在Vb?32as处达到最大值。

1)若Vb?3213as?as?Vb?as

则当Pb?as时,Prob?Pb?Ps(vs)??0 期望支付也为0。

当Pb?as?cs时,期望支付为

Vb?12?Pb?as?cs/2?

它是Pb的减函数,在Pb?as?cs处为

Vb?as?3cs4

当as?Pb?as?cs 期望支付?f(Pb,Vb)

?as?as??1?在Pb?as处,f??Vb??as????0?0 22????在Pb?as?cs处,较大的一个支付为

Vb?as?3cs4??3cs/4?0(设cs?0)

23Vb?13as故所有Pb??0,as?都是最优报价,期望支付为0,故最优报价可取Pb?

2)若as?23Vb?13as?as?cs

32cs。

? 此时f在Vb?32as?Vb?as?13as

(Vb?as)3cs2处达到最大值

?0,而当Pb?as?cs在Pb趋于

as?cs时的支付为

Vb?as?3cs4

2因为有

(Vb?as)3cs?Vb?as?3cs42

acs42这是由于上式等价于(Vb?as)?3cs(Vb?as)?

214

?0

2或??(V?a)?3c??bs2s??0 ?这是显然成立的。 故最优报价为

P2b?3V1b?3as

3)若23V?1b3as?as?cs

? V3b?as?2cs

这时若Pb?as?cs,则Pb趋于as?cs时,期望支付为

Vb?as?3cs4

而当Pb?as?cs时,期望支付为

f(P)??1?b,Vb?Vaas?as?cs???b?2??c?ss?2????1 ? ?V14a?3csb?2?s2

?V4a?3csb?s4

?V3csb?as?3cs/4?4?0

故此时最优报价为Pb?as?cs。

于是在给定Ps(Vs)?as?csVs下,买方的类型依存战略为

?2?Vb?1a 0?V?a?3c, ??a?3c?1??P(V?33sbs2s?s2s?bb)?????as?cs 1?Vb?as?32cs为了获得线性解,我们假设a?3s2cs?1,则

P(V?23V1bb)b?3as 以下再看给定买方的上述战略,卖方的最优战略是什么。

给定Vs,Ps?Ps(Vs)是最大化如下期望支付的解:

max?P?E[P?sb(Vb)/Pb(Vb)?Ps?V?s?Prob?Pb(Vb)?PP?2?s? s因为P?112?b(Vb)是?a?3s,3as?3??上的均匀分布。 当P1s?3as时,Pro?Pb(Vb)?Ps??1

215

6.12)

E?Pb(Vb)Pb(Vb)?Ps??1?12??11?1a?a??a????sss?2?33??33?3

??1??11P?a???Ps?(as?1)s?s?3??33期望支付为??Vs??1??Vs 22??????它是Ps的增函数,在Ps?Pro?Pb(Vb)?Ps??013as,期望支付为as?311613?Vs,当Ps?1313as?23时,

,期望支付为零。当

as?232/3?Psas?Ps?as?2/3时,

1Pro?Pb(Vb)?Ps??3

13as?2/32E?Pb(Vb)Pb(Vb)?Ps??Ps?

12??P?a?ss??1233a??PsP??s?s332?Vs?期望支付为?

22/3????????12??3P?a??4Vsss??1233??????as??Ps?

8/33?3?

?1???3Ps?as?2/3?4Vs?3??8(as?2?3Ps)

?g(Ps)

?g?Ps381???3Ps?as?2/3?4Vs?3??8(?3)

?(as?2?3Ps)? ?2as?4?12Vs?18Ps 令

?g?Ps?0,得Ps?2?as?6Vs9?g?Ps?g?Ps?0?0?2?as9?23Vs

当Ps?当Ps?2?as92?as9??2323Vs Vs

216

故g(P2?ass)在

9?23Vs处达到最大值。

为了获得线性的Ps,我们假设?4?

13a2?ass?9?23Vs?13as?2/3

且g??2?as?2V?,g??2?as?2V?11?93s??0??93s??a?3s?6?Vs

这就要求3Vs?2?as?1?3Vs 显然成立。

?2?2因g??2?as3a3?2V??s?4/s???9?23V?s???2

故g??2?as2?9?3V?s??0自然成立。 ??2?23a/3?2V?往证

?s?4s??8?13a1s?6?Vs

2即1?2?1aV??1?1?3s?s?2/3????a?3s?Vs?? ?6?2?1a4?1?3s?V?s???3?a?V??4?2??3ss??9?1a?V??1 ?3ss??3??13a?2?1?1s?Vs???3as?Vs???0

??3??92即??11?3a?s?Vs?3??0?

自然成立。 即可。 此时有P12b?3as?3Vb

P2?as2s?9?3Vs 故 a2?ass?9

c2s?3

a1b?3as

217

6.13) (

cb?23

1414解得:as?显然 as?解得:as?1,cs?2/3,ab?112,cb?2/3 (6.14)

满足上述约束。

1,ab?,cb?2,cs?2 , (6.15)

41233故线性均衡为:

Pb(vb)?213vb?12

P2 s(v s)?1 3vs?4这个博弈的规则要求当且仅当Pb?Ps才达成交易。 图6.2中给出了满足这一条件的区域。 由式(6.16)知交易条件为

213vb?112?23vs?4

即 v1b?vs?4

Ps,Pb 1112

912

Ps(vs) Pb(vb) 1 4

1

12 1

3 1

vs, vb

44

图6.2 线性交易条件

图6.3用更直观的方法给出了交易区域。

218

6.16)

vb

1 vb?vs?

4vb=vs 1

交易区域

1

vs

图6.3 线性交易区域

比较图6.1和图6.3,它们分别表示在单一价格均衡及线性均衡时,交易发生所要求的估价组合范围。在这两种情形、交易的潜在价值最大时即vs?0且vb?1时,交易都会达成。但单一价格均衡漏掉了一些有效率的交易如vs?0且vb?x??,其中

?是充分小的正数,而且还包含了一些基本是无效率的交易如vs?x??且vb?x??。

相反,在线性均衡中,漏过了所有效率较低的交易,只包含了效率或价值至少在1以

4上的交易。

这说明从局中人可得到的期望支付看,线性均衡要优于单一价格均衡。 这里并未回答是否还存在另外的均衡,其中局中人的福利还更好一些。Myerson与Satterthwaite(1983)曾证明,对于这里假设的估价的均衡分布而言,线性均衡中局中人的期望支付高于博弈的其他任何贝叶斯均衡(包含但不限于单一价格均衡)。这意味着不存在这样的贝叶斯均衡:交易当且仅当有效率时将会发生(即当且仅当vb?vs时)。他们同时证明后一结果是很普遍的,即若vb在区间[xb,yb]连续分布,vs在区间[xs,ys]连续分布,其中ys?xb且yb?xs,则买方和卖方之间不存在他们所乐于进行的交易博弈,在其贝叶斯均衡中,当且仅当有效率时交易达成。

作为应用,Hall与Lazear(1984)提出的就业模型证明:如果企业有关于工人边际产出的私人信息,工人则掌握了自己机会成本的私人信息,则企业与工人之间不存在他们乐于进行的讨价还价博弈,当且仅当雇佣有效率(即边际产出?机会成本)时达成雇佣协议。

6.4 拍卖与招投标模型

在拍卖或工程项目的招标投标中,不对称信息是一个关键性的特征因素。当一件古董或名画在索斯比拍卖行进行拍卖时,参加竞价拍卖的潜在买主们每一个在其心目

219

中对古董或名画都有一个价值评价或估价,这个估价别人是不知道的,是每一个潜在买主的“私人信息”。类似地,当一个地方政府打算在流经城区的一条河上修建一座桥梁时,参加承建的建筑公司会来竞标承包这一工程。对每个公司来说,它都有一个最低标价,当政府支付的承包价低于这一最低标价时,公司不会接受承包合同。这一最低标价是每个公司的“私人信息”,别人是不清楚的。这样,参加拍卖的潜在买主们每人心中有一最高价格,它是每个潜在买主的私人信息,而参加竞标的每个公司都有一个别的公司和政府都不清楚的最低标价,它是每个竞标公司的私人信息。

拍卖的或竞标的在本质上是相同的,以下仅就拍卖的经济机理进行博弈分析,同样的结论完全适用于招投标。

拍卖有两个目的,一是寻找最高出价的买家,二是在直接的卖者或买者以代理人身份出现时,拍卖也有助于减少买者与卖者之间的损害委托人的合谋。譬如,一个城市的市长可以任意出租土地给企业时,很难保证得到土地的企业不是贿赂市长但只付很低租金的企业。但若采用公开拍卖方式出租土地,市长接受贿赂的可能性就小得多。

如果拍卖是买主们公开透明地报出其买价,且其他的买主能知悉任一买主报出的价格,则拍卖就容易出现“围标”现象。所谓“围标”,就是买主们串通起来压低买价(或卖主们抬高卖价)。由于任一买主的报价都是共同知识,所以这种串谋是可以实施的,因为串通起来的买主群体能够对擅自报出较高买价(或较低卖价)的人进行惩罚[4]。

当拍卖一件古董或一幅名画时,“围标”会使卖者蒙受损失。譬如,古董价值在买主们的估价中最高为100万元,但围标可能使它最终以90万元卖出去,因为围标者达成的协议是任何买主报出的买价最多不超过90万元。

解决围标的一种办法是通过减低买主们报价的透明性。譬如,当买主的估价最高为100万元时,如果每个买主报出的价格别的买主都不知道,则估价最高的那位买主要报出高于估价第二高的估价但低于100万元就可获得古董或名画,同时还有正的消费者剩余。当然,这里潜在假定拍卖规则是如此规定的:每一位买主独立地(别的买主不知道地)报出其买价,卖主根据报价最高的那位买主报出的价格将古董或名画卖给报价最高的人。当多位不同的买主报出相同的价格时,由他们之间按掷骰子的方式随机决定最终获得古董或名画的买主,但支付的价格仍为他们早先报出的最高价格。这就是所谓“一级密封价格拍卖(the first—price Sealed auction)。这种拍卖方法是要求买主们同时将自己的出价写下来装入一个信封并密封后交给拍卖人。拍卖人打开信封,决定将古董或名画卖给出价最高的买主,按他的出价支付价格。当多位买主同时报出相同最高价格时,拍卖者通过掷骰子随机地将古董或名画卖给其中的一位买主,按他们报出的最高价格支付价格。一级密封价格拍卖可以避免围标,因为每一个买主的报价对于其他买主来说是不可观测的(当然,要做到这样,还要求成交后拍卖者要

220

对买主的报价保密),因而每个买主的行为不受围标组织者的约束。一级密封价格拍卖尽管可以避免围标,但不能保证买主们会报出他们心目中的真实估价或最高价格,即关于古董或名画值多少钱买主们不会说真话。譬如,当最高估价者只有一位且其估价为100万元,则估价最高者知道,当他报出100万元的价格时,尽管可能拿到古董或名画,但其消费者剩余为零,而当他的报价低于100万元时,他有正的概率获得商品,此时有正的消费者剩余。因而其预期消费者剩余即消费者剩余的期望值为正。我们假定买主们是风险中性的,则他的最优选择是报出低于100万元但大于零的价格。其实,对于那些估价不是最高的100万元价格的买主来说,同样的道理使他们相信最优选择是报出低于他们心中的估价但大于零的价格。关于这一点,我们下面给出一个模型加以说明。设有一件古董需要按一级密封价格拍卖进行拍卖,有n个完全相同的(支付函数完全相同)的买主参加,第i位买主的支付函数为其消费者剩余:

?vi?bi, bi?bj, j?i??1ui(bi,bj,vi)??(vi?bi), 若有m?n位买主的报价?m?0, bi?某个bj, i?j?bk(包括第i位买主)与bi相等且bi?bj,j?i(6.17)

其中,bi是第i位买主的报价。

vi是第i位买主的估价,假定对于第j位买主来说(j?i),vi是区间[0,1]上的均

匀分布的贝叶斯随机变量。

由于多位买主同时报出相同价格的概率在连续分布情形实际上为零,所以对此情形不予考虑在数学上会方便一些。设bi(vi)是类型依赖的均衡报价战略,不妨设bi(vi)是严格增函数。显然,bi?1不是最优的,因为此时的预期支付为负,还不如bi?vi带来的预期支付(为零)大。由于这是一个对称博弈,我们下面只考虑对称的均衡出价战略,即bi(vi)?bj(vj),当vi?vj。令均衡出价战略的一般形式为

b?b(v)

*给定v,第i个买主选择报价b的期望或预期支付为

ui?(v?b)prob(b?bj,j?i) (6.18) 其中prob(b?bj,j?i)是第i位买主报价最高的概率。

这里的一级密封价格拍卖实际上保证了各个买主的报价是相互独立的,因而有prob(b?bj,j?i)??prob(b?bj)。

j?i令?(b)?b*?1(b),则

221

prob(b?bj)?prob(b(vj)?b) ?prob(vj?b*?1*(b))

?prob(vj??(b)) ??(b)最后一个等式由均匀分布的假定得出。 于是,第i位买主的最大化问题是

??n?1max?ui?(v?b)?prob(bj?b)?(v?b)?(b)?bj?i??

一阶条件

??n?1(b)?(n?1)(v?b)?n?2(b)??(b)?0 (6.19)

上式两端同除以?n?2(b):

??(b)?(n?1)(v?b)??(b)?0

?v?(n?1)(v?b)dvdb?0 n?1nv?v解微分方程得b*(v)?,每个买主都低报价格。

显然,b*(v)随n的增加而增加,当n趋向无限大时,b*趋于v,即买主愈多,卖者得到的价格就愈高,故让更多的人加入竞标在招投标中是符合招标人的利益的。在公共管理中,政府的采购和公共工程招投标中通常规定要进行公开招标,并在参加竞标的公司数目上有下限规定,其缘故正是如此,因为更多的竞争者参加投标会压低工程报价,从而使政府开支得到一定程度的节省。

美国经济学家Vickrey发明的“二级密封价格拍卖”(The Second-Price Sealed auction,又称为Vickrey招投标法),可以使买主们报出真实的估价,即让买主们说出真话。这一种方法目前已是国际性招投标中常用的方法,但在1970年代,当时美国联邦政府为大量公共工程招投标中严重的围标现象感到头疼时,经济学家们向他们推荐这种“Vickrey招投标法”。由此,联邦政府在公共工程中随后节省了大量开支。Vickrey于1996年与Mirrles一道获得当年的经济学诺贝尔奖,Vickrey招投标法是一个重要因素,因为它是以往被认为是过于抽象的博弈论走向实用的一个重要代表。

与一级密封价格拍卖法唯一不同的是,二级密封价格拍卖是将拍卖品卖给出价最高的买主的同时要求其支付第二高的报价。此时,若他赢得古董或名画,则他支付的价格或成本对于他的各种可能的报价选择来说是固定的,即他的报价选择与其潜在的成本无关。这样,给定成本不变,买主会极大化其赢得拍卖品的概率,这就使得他会尽量选择高的报价。买主报出的价格不会超过他的估价,这是因为,与报出等于估价的价格相比,报出高于估价的报价是劣战略。事实上,当报价高于估价时,若赢得拍

222

卖品,则当第二高报价高于他自己的估价时,他的支付是负的,小于当他报出等于估价的支付(为零),当第二高报价低于他自己的估价时,他报出等于自己估价的价格也会赢得拍卖品且带来相同的支付。与估价相比,报价低于估价的战略也是劣战略。因为,当他报价低于估价时,他赢得拍卖品的概率小于报出估价的情形,而当报价不超过估价时,一旦赢得拍卖品,支付是相同的。下面在均匀分布下证明这一结论。

当第1位买主选择报价为b1(v1)时,则期望支付为

u1??j?2b(v)?b?b11jkk?2j?k?[v1?bj(vj)]P(v2,?,vn)dv2?dvn

因为任何两个买主报相同价格的概率在连续分布下为零,故这里不考虑有多个买主报相同价格的情形。

假定bj(vj)是严格增函数,则由对称性及独立性有

nbj(b1)j?1b2(bj)?1bk(bj)bn(bj)?1?1u1???dvj?20?0????[v001?bj(vj)]P(v2?vn)dv2?dvk?dvn

k?j,1nbj(b1)?1???j?2n0[v1?bj(vj)]P(vj)dvj?b2(bj)?10P(v2)dv2??bk(bj)?10P(vk)dvk??bn(bj)?10P(vn)dvn

k?j,1

???j?2bj(b1)?10[v1?bj(vj)]b2(bj)?bk(bj)?bn(bj)dvj

?1?1?1 k?j,1

当v1?bj(vj)时,它显然是b1的严格增函数,这要求bj(b1?1(b1))?b1?v1,故最优的b1为v1。由对称性有bj?vj,j?1,?,n。这样,二级密封价格拍卖使买主报价他们心目中对拍卖品的真实估价。如果说每个买主的估价相同,则这种方法将拍卖品以最高的价格卖出去,卖者获得最大的拍卖价值。当不同买主的估计不同但相差不大时,卖者也会获得较大的拍卖价值。这正是二级密封价格拍卖的优点,它既避免了围标,也以较大的价值将拍卖品卖出或以较低的价格招标。这种方法的一个重要的功能是诱使买主或投标人说出真话。这正是博弈论的机制设计功能,我们将在后面系统加以介绍。

6.5 最优拍卖机制设计:Myerson定理

在6.4节中,我们介绍了几种拍卖或招投标方法。一个顺理成章的问题是,在不同的拍卖或招投标方法中,有没有一种方法对于拍卖人或招标人来说是最优的。这是

223

因为,尽管二级密封招标法优于一级密封招标法,但或许还存在更好的招标法呢。Myerson(1981)在其经典论文中对此进行了研究,本节将概要地介绍他的工作。

这个问题的一般性表述是:

一个卖者打算将其拥有的一件物品卖给n位打算购买这一物品的潜在购买者中的某一位,但卖者不知道这些潜在的购买者所愿意为这一物品所支付的最高价格,即卖者对于不同买者对于该物品的价值评价或支付意愿具有不完全信息。现在,卖者的问题是如何设计一个拍卖博弈规则,它存在一个纳什均衡,该均衡为卖者带来一个最高的期望支付(或期望效用)。下面,我们遵循Myerson的方法来导出相当广泛意义上的一大类可能的拍卖机制设计中的最优拍卖机制。

6.5.1 基本假定与定义

假定有一位拍卖者打算把其拥有的一件物品出售。他面对n个潜在的购买人,记为1,2,?,n。用N表示潜在买者构成的集合,即

N??1,?,n? (6.20)记第i个买者对物品的价值评价或支付意愿为vi,它是买者的私人信息,i?N。假设对于卖者和其他买者来说,他们对买者i的价值评价vi的信念是:vi是[ai,bi]上的随机变量(贝叶斯统计学意义上),且密度函数为fi(vi),并且这也是包括所有买

?vi?[ai,bi];者和卖者在内的局中人的共同知识,假定???ai?bi???,fi(vi)?0,

且fi(vi)是[ai,bi]上的连续函数。设vi的分布函数为Fi(vi),即

Fi(vi)??viaifi(si)dsi (6.21)

记V为买者们价值评价的所有可能的组合:

V??[ai,bi] (6.22)

i?N记V?i为除买者i之外的其他买者的价值评价组合,即

V?i??[aj?Nj?ij,bj]

(6.23)

假定n个买者的价值评价是互相独立的随机变量,于是V上的联合密度函数f(v)满足如下关系:

f(v)??j?Nfj(vj) (6.24)

其中v?(v1,?,vn)。

假定买者i和卖者在v?i上的联合密度函数为:

f?i(v?i)??j?Nj?ifj(vj)

(6.25)

其中,v?i?V?i。

224

记卖者自己对物品的估价为v0,并设它是所有博弈局中人的共同知识。局中人对物品的估价之所以是私人信息,存在两个方面的原因。首先,某局中人的偏好是其他局中人不知道的。譬如,当物品是一幅画时,其他人并不知道他在欣赏这幅画的过程中所获得的愉悦程度。其次,买者可能拥有一些关于物品内在质量(intrinsic quality)的特殊信息。我们分别称这两种因素为偏好的不确定性(preference uncertainty)和质量不确定性(quality uncertainty)。这种区分是十分重要的。如果仅存在偏好不确定性,将买者j的估价信息告诉买者i将不会引起买者i修正其估价(这并不意味着当买者i知道买者j的估价后不会修改其报价战略,这仅意味着买者i在拥有货币与物品之间的原初偏好顺序是不变的)。然而,当存在质量不确定时,买者在知道了其他人对物品的估价后将倾向于修正其自己的估价。也就是说,如果买者i知道vj很低的话,他会认为买者j收到了有关物品质量的不好的信息,于是,买者i将根据自己的判断也降低自己对物品的估价。在许多讨论拍卖的文献中,仅就只存在偏好不确定性的情形加以考虑,譬如,Vickrey(1961)。与之不同,Myerson拓宽了这一研究的范围。他的研究将一定形式的质量不确定性因素也考虑在内。假定存在n个“修正效应函数”(revision effect function)ej,其定义如下:

ej是定义在[ai,bi]上的实函数,如果局中人i知道了vj,则i会通过ej(vj)对自己

的估价加以修正[5]。因此,若i知道了v?(v1,?,vn)是n个买者最初的估价向量,则i将修正其估价如下:

~(v)?v?vii?ej?Nj?ij(vj)

(6.26)

类似地,我们假定卖者也会重新对物品进行估价:

~(v)?v? v?ej(vj) (6.27)00j?N在仅存在纯偏好不确定性假设下,ej(vj)?0[6]。

6.5.2 可行的拍卖机制

~,给定上述密度函数fi,修正函数ei和v卖者的问题是选择一种拍卖机制最大化i其期望支付(或期望效用)。我们只需将注意力限制在一类特别的拍卖机制上,这就是“直接显示机制”(direct revelation mechanism)。

在直接显示机制中,买者们同时且老老实实地向卖者揭示其估价,卖者决定谁将会买得物品和买者需要支付的价格,这一价格是买者们报出的估价向量v?(v1,?,vn)的某种函数。因此,直接显示机制可以表达为一对产出函数(P,x)(定义为

P:V?R和x:V?Rnn),满足如下性质:如果v是揭示出来的估价向量,则Pi(v)是是i必须支付给卖者的货币量[7]。

225

i得到物品的概率和xi(v)

以下总假定卖者和买者都是风险中性的(risk neutral),并且对于货币和物品具有可加的可分性效用函数(additively separable utility functions)。因此,给定i知道vi,其在一个特定的拍卖机制(P,x)下的期望支付为

Ui(P,x,vi)??v?i~(v)P(v)?x(v)]f(v)dv [viii?i?i?i (6.28)

其中dv?i?dv1?dvi?1dvi?1?dvn。

类似地,卖者在给定的这一拍卖机制中获得的期望支付为

?~(v)??1?U0(P,x)???v0?v????Pj(v)?????xj(v)?f(v)dv???j?N?j?N (6.29)

其中dv?dv1?dvn。

并非每一对函数(P,x)都表达一种可行的拍卖机制,然而,有三种类型的约束必须施加于(P,x)。

首先,因为仅有一种待售物品,函数P须满足下列概率条件:

?Pj(v)?1且Pj(v)?0,?i?N,?v?V (6.30)

j?N其次,当潜在买者不参加拍卖时,其期望效用为零,故欲使买者参与拍卖,就有如下的“个人理性”(individual rationality)约束条件:

Ui(P,x,vi)?0,?i?N,?vi?[ai,bi] (6.31)

最后,假定卖者并不能使买者在其估价上对他不说谎话。

因此,只有没有一位买者会从说谎中获益,直接显示机制才可能被实施。这就是说,此时说实话才会是一个纳什均衡。如果买者i在其真实估价为vi时宣称其估价为

si,则期望支付为

~??v(v)P(vv?iii?i,si)?xi(v?i,si)?f?i(v?i)dv?i

其中(v?i,si)?(v1,?,vi?1,si,vi?1,?,vn)。因此,为了保证没有一位买者有谎报其估价的动机,下列“激励相容”(incentive compatibility)约束必成立。

~(v)P(v,s)?x(v,s)?f(v)dv (6.32) Ui(P,x,vi)???vii?iii?ii?i?i?iv?i?i?N,?vi?[ai,bi], ?si?[ai,bi]

当且仅当式(6.32)、(6.31)、(6.30)同时成立时,称机制(P,x)是可行的(feasible)(或称机制(P,x)表达了一种可行的拍卖机制)。也就是说,若卖者打算据P配置物品和据x索取货币支付,则当且仅当式(6.30)—(6.32)成立时,该程序将在买者们说真话的情况下得到贯彻。

到目前为止,我们仅考虑了其中买者们总是说真话的直接显示机制。但是,卖者也可设计其它类型的拍卖博弈。在一般性的拍卖博弈中,每个买者拥有某些备选战略

集?i,并且存在产出函数

226

n?:?:??i?Rn P??i?R且xi?Ni?N它描述了物品配置及买者支付的费用是如何依赖于买者们的战略的(即若

?(?)就是i获得物品的概率和x?i(?)是i向则P??(?1,?,?n)是买者们选择的战略组合,i卖者支付的期望支付)。

一个拍卖机制就是这样的一种拍卖博弈且附加了关于买者们打算选择的战略计划的一种描述。形式上,一个战略计划(Strategic Plan)可表达为一个函数

??i:[ai,bi]??i满足当i的估价为vi时,??i(vi)是i打算选择的战略。在此一般性的规

定下,直接显示机制就显然是这样一种拍卖机制即?i?[ai,bi]和??i(vi)?vi。 在这个一般性的框架内,一个可行的拍卖机制必须满足式(6.30)—(6.32)给

?(?)必须为非负的且出的约束条件。由于仅有一件待售品。对于任何?来说,概率Pi总和不会大于1。给定任何估价值,拍卖机制必须对每个买者都给出非负的期望支付,否则买者不会参与拍卖。在一个拍卖博弈中,所有的战略计划必须构成一个纳什均衡,否则某些买者将修正其计划。

显而易见的是,最优拍卖设计问题是难以求解的,因为对于卖者在其构造的拍卖

博弈中所要使用的战略空间?i的大小和复杂程度没有任何限制。使我们能解决拍卖机制设计问题的一个基本的出发点是我们仅考虑直接显示机制时并未损失一般性。这一结论来自如下事实:

引理6.1(显示性原理)给定任何一个可行拍卖机制,存在一个等价的可行的直接显示机制(equivalent feasible direct revelation mechanism),它给予卖者及所有的买者予与给定机制完全相同的期望支付。

Myerson(1979)曾在更为一般的贝叶斯公共选择问题中证明了这个显示性原理,但这里我们可以根据直观明白该引理成立的原因。假定给定一个可行的拍卖机制,其

?和x?;战略计划为??i。考虑如下定义的一个直接显示战略空间为?i,产出函数为P机制(P,x),其中P:V?Rn;x:V?Rn,且

?(??(v),?,??(v))P(v1,?,vn)?P11nn?(??1(v1),?,??n(vn))x(v1,?,vn)?x

也就是说,在直接显示机制(P,x)中,卖者首先要求每一个买者说出其类型(即估价),然后根据给定的拍卖机制的战略计划计算出买者将选择的战略。最后实施由这些战略给出的产出。因此,直接显示机制(P,x)总给出与给定拍卖机制相同的产出,故所有局中人在两种机制中获得的期望支付相同。(P,x)必满足式(6.32)给出的激励相容约束,因为给定可行机制中的战略计划构成了一个均衡(如果任何一位买者在显示性博弈中可以通过向卖者撒谎来获取好处,则他可以在给定机制中通过“向自己

撒谎”或修正他的战略计划来获益)。因此,(P,x)是可行的。

227

采用显示性原理,我们不失一般性地假设卖者只考虑可行的直接显示机制中的拍卖机制。也就是说,我们今后将可行的拍卖机制与所有满足式(6.30)、(6.31)、(6.32)的产出函数(P,x)的集合等同起来。卖者的拍卖设计问题就是选择这样的函数

P:V?Rn和x:V?Rn使得U0(P,x)在式(6.30)—(6.32)约束下达到最大化。

注意,我们在这里并未用到式(6.25)或式(6.26)。所以,式(6.30)—(6.32)

?i:V?R计算其修正估价刻画了所有可行拍卖机制的特征,甚至包括买者用函数v?i(v)的情形,而这种函数可以不是式(6.26)给出的那种特殊的可加形式。然而,当vMyerson为导出最优拍卖设计的显性解时,他不得不将研究限于式(6.25)及(6.26)给出的范围之内。

6.5.3 模型分析

给定拍卖机制(P,x),对于任意的买者i和任意的估价vi,定义

?i(P,vi)??v?iPi(v)f?i(v?i)dv?i (6.33)

?i(P,vi)是买者i在给定其估价为vi时将在拍卖机制(P,x)中获得物品的条件概

率。

我们下面首先要简化对可行拍卖机制的刻画。于是有如下引理:

引理6.2 (P,x)是可行的当且仅当下列条件成立:

若si?vi则?i(P,si)??i(P,vi),?i?N,?si,vi?[ai,bi] (6.34)

Ui(P,x,vi)?Ui(P,x,ai)?vi?ai ?i(P,si)dsi,?i?N,?vi?[ai,bi] (6.35)

Ui(P,x,ai)?0,?i?N (6.36) 和

?Pj?Nj(v)?1且Pi(v)?0,?i?N,?v?V (6.37)

~(v)的函数形式的一个特别的假定,有 证明:利用式(6.26)即我们关心vi

~(v)?v~(v,s)?v?svii?iiii~(v)?v~(v,v)即vii?ii~(v,s)?v?s?vi?iiii

?v?i~(v)P(v,s)?x(v,s)]f(v)dv[vii?iii?ii?i?i?iv?i??[?~(v,s)?(v?s)]P(v,s)?x(v,s)](vi?iiiii?iii?ii?f?i(v?i)dv?i?Ui(P,x,si)?(vi?si)?i(P,si)所以,激励相容约束式(6.32)等价于

228

Ui(P,x,vi)?Ui(P,x,si)?(vi?si)?i(P,si),?i?N,?vi,si?[ai,bi]

(6.38)

故(P,x)是可行的当且仅当式(6.30)、(6.31)和式(6.38)成立。我们现在将证明式(6.31)及(6.38)意味着式(6.34)—(6.36)成立。两次运用式(6.38)(将si与vi互换),有

(vi?si)?(P,si)?Ui(P,x,vi)?Ui(P,x,si)?(vi?si)?i(P,vi)

则式(6.34)在si?vi时成立。

这些不等式在对于任意的??0都可重写为:

?i(P,si)??Ui(P,x,si??)?Ui(P,x,si)??i(P,si??)?

令??0,则

?i(P,si)??Ui?si??i(P,si)

因?i(P,si)对于si是递增的,它是黎曼可积的,故

??i(P,si)dsi??viai??Ui?sidsi???i(P,si)dsi

?i(P,si)dsi?Ui(P,x,vi)?Ui(P,x,ai)

它给出式(6.35)。

当然,式(6.36)直接由式(6.31)导出,式(6.37)就是式(6.30),故引理2中的所有条件都从可行性得出。

现在我们必须证明引理2中的条件也意味着式(6.31)和式(6.38)(从而式(6.32))成立。 因据式(6.37)有?i(P,si)?0,而式(6.31)来自式(6.35)和(6.36)及?i(P,si)?0。

为了证明式(6.38),假设si?vi,则由式(6.34)和(6.35)有:

Ui(P,x,vi)?Ui(P,x,si)? ?Ui(P,x,si)?vi??si?i(P,vi)dvivisi?i(P,si)dvi

?Ui(P,x,si)?(vi?si)?i(P,si)类似地,若si?vi则

Ui(P,x,vi)?Ui(P,x,si)? ?Ui(P,x,si)???sivi?i(P,vi)dvisivi?i(P,si)dvi

?Ui(P,x,si)?(vi?si)?i(P,si)故式(6.38)由式(6.34)和(6.35)导出。当然,式(6.30)就是式(6.37)。所以,由引理2中的条件也导出可行性。证毕!

229

所以,(P,x)是一种最优拍卖当且仅当它在约束(6.35)—(6.37)和式(6.34)下最大化U0(P,x)。下面的一个引理为最优性提供了某些简单的条件。

引理6.3 假设P:V?Rn在约束(6.30)和(6.34)下最大化如下积分

??1?Fi(vi) [v?e(v)??v]P(v)iii0i?f(v)dv (6.39)?v??fi(vi)?i?N?还假定

~(v)?xi(v)?Pi(v)vi?viaiPi(v?i,si)dsi,?i?N,?v?V (6.40)

则(P,x)就是一种最优拍卖。

证明:回忆式(6.29),我们可将卖者的目标函数改写为:

U0(P,x)??vv~(v)f(v)dv?0~(v)?v~??P(v)[vi?Nvii0(v)]f(v)dv ??i?N~?[xi(v)?Pi(v)vi(v)]f(v)dvv (6.41)

但运用引理6.2,可知对任何可行的(P,x)有:

?[xvi~(v)]f(v)dv(v)?Pi(v)vibiai???Ui(P,x,vi)fi(vi)dvi???[Ui(P,x,ai)?aibi?viai?i(P,si)dsi]fi(vi)dvifi(vi)?i(P,si)dvidsi??Ui(P,x,ai)???Ui(P,x,ai)???aibivibiviai???ii(P,si)dsidFi(vi)bi (6.42)

aiai?bi??Ui(P,x,ai)????i(P,si)dsi?0???ai??Ui(P,x,ai)???Ui(P,x,ai)??ai?Fi(vi)?i(P,vi)dvi?????biai[1?Fi(vi)]?i(P,vi)dviv[1?Fi(vi)]Pi(v)f?i(v?i)dv由式(6.25)和(6.26)有

~(v)?v~(v)?v?v?e(v) vi0i0ii (6.43)

将式(6.42)和(6.43)代入式(6.41),得

U0(P,x)????1?Fi(vi)?v?v?e(v)?P(v)?f(v)dv0ii?i?i?v??fi(vi)??i?N??~(v)f(v)dv? ??v?Ui(P,x,ai)0vi?N (6.44)

故卖者的问题就是在引理2中的约束(6.35)、(6.36)、(6.37)和(6.34)下最大化式(6.44)。在此表述中,x仅出现在目标函数中的最后一项和约束(6.35)、(6.36)

230

中。这两个约束可重写成:

?v?i~(v)?[Pi(v)vi?viaiPi(v?i,si)dsi?xi(v)]f?i(v?i)dv?i

?Ui(P,x,ai)?0, ?i?N,?vi?[ai,bi]若卖者据式(6.40)选择x,则他同时满足式(6.35)和(6.36)且他获得

?Ui(P,x,ai)?0

i?N它是式(6.44)中该项的可能最好的取值。

所以,利用式(6.40),我们可以在卖者的问题中整个将x丢掉。进一步,式(6.44)右端中的第二项是独立于(P,x)的常数。所以,目标函数可被简化为式(6.39),且式(6.34)和(6.37)是唯一需要满足的约束条件。

证毕!

方程(6.44)有一个重要推论,它是如此重要以至于下面将其作为一个定理给出 定理6.1 (收益等价性定理)卖者从一个可行拍卖机制中获得的期望支付完全由概率函数P及Ui(P,x,ai)(对所有i)所决定。

也就是说,一旦我们知道了在每种可能情况下(由P刻画)谁获得了物品,以及每个买者在其估价为其最低可能水平ai时的期望支付为多少,则卖者从拍卖中得到的期望支付并不依赖于产出函数x。因此,譬如,对于任意两个拍卖机制,只要它们具有性质(1)物品总是卖给高于v0的最高估价者和(2)如果其估价位于其最低可能估价,则买者的期望支付为零,则卖者会从它们中获得相同的期望支付。

6.5.4 正规情况下的最优拍卖

在一种简单的通常假定下,我们能够直接从引理6.3计算出最优拍卖机制。如果函数

ci(vi)?vi?ei(vi)?1?Fi(vi)fi(vi) (6.45)

是vi的严格递增函数(对N中的每一个i),我们称问题是正规的(regular)。也就是说,当ai?si?vi?bi,若ci(si)?ci(vi),则问题是正规的(我们曾假定

fi(vi)?0(对所有[ai,bi]中的vi),故ci(vi)总有定义且是连续的)。

i?N现在,考虑一种拍卖机制,其中当v0?max[ci(vi)]时卖主不出售物品,否则他把物品卖给报出最高ci(vi)的买主。如果ci(vi)?cj(vj)?max[ck(vk)]?v0,则卖主可以

k?N通过将物品交给最低编号的买主或其它的随机性规则解决配置问题(在正规情况下这种情形发生的概率为零)。所以,对于这一拍卖机制,有

Pi(v)?0意味着ci(vi)?max[cj(vj)]?v0 (6.46)

j?N对所有V中的v,这一机制最大化如下的和

231

?[ci?Ni(vi)?v0]Pi(v)

约束条件为

?Pj(v)?1且Pi(v)?0,?i

j?N故P在约束条件式(6.30)下最大化式(6.39)。为了验证它也满足式(6.34),我们需要使用正规性假设。假设si?vi,ci(si)?ci(vi),且当买主i提交一个估价si就会赢得物品时,如果他将估价变为vi,他也会赢。也即是对所有的v?i有

Pi(v?i,si)?Pi(v?i,vi)。故在vi为给定估价时,i赢得物品的概率?i(P,vi)是vi的增函

数,这正是式(6.39)所需的。所以P满足引理6.3中的所有条件。

为了完成最优拍卖的构造,我们设x为式(6.40)中的取值:

?xi(v)?Pi(v)?vi???????ej(vj)??j?N?j?i??viaiPi(v?i,si)dsi

这一公式可以按如下方式重新以更为直观的方式写出来。对于除i之外的所有买

主的任何估价组合v?i,设

zi(v?i)?inf?si|ci(si)?v0且ci(si)?cj(vj),?j?i?

(6.47)

则zl(v?i)是i在给定v?i下所有可赢得物品的买价中的下确界,故

?1 若si?zi(v?i)Pi(v?i,si)?? (6.48)

?0 若si?zi(v?i)这给出

?viai?vi?zi(v?i) 若vi?zi(v?i)Pi(v?i,si)dsi?? (6.49)

?0 若vi?zi(v?i)最后,式(6.40)变成

?zi(v-i)??ej(vj) 若Pi(v)?1?j?Nxi(v)?? (6.50) j?i??0 若P(v)?0即买主i仅在他获得物品时才会付钱,且若他提交其可能最低的赢得价时,他支~(v,z(v))是物品对于他的价值。 付的vi?ii?i若所有的修正效应函数恒为零(即ei(vi)?0)且若所有买主是对称的

(ai?aj,bi?bj,fi?fj)zi(v?i)?maxci(v0),maxvjj?i?和正规的,则

?1? (6.51)

即我们的最优拍卖变成了一个修正的Vickrey拍卖法(Vickrey,1961),其中卖主自己提交一个等于ci?1(v0)的买价(注意:在这种对称情形,有ci?cj,且正规性保证有ci是可逆的)且将物品交给最高出价买主,价格是第二高的报价。然而,仅当买主是对称的时且函数ci(?)是严格递增时,这一结论才成立。

232

譬如,假设对每个i和每个在0和100之间的vi,v0?0,每个ai?0,bi?100,

ei(vi)?0且fi(vi)?1100,则直接的计算给出ci(vi)?2vi?100,它是vi的增函数。所

以卖主将把物品卖给最高出价的买主,价格为第二高出价,除非他自己提交一个

ci(v0)?0??11002?50的买价。通过宣布一个保留价格

?1?50,卖主冒着以概率???2?1002n不能

将物品售出即使某些买主愿支付高于v0的价格买物品的风险(至少有某个

c?1i(vi)?c?1i(v0?0)?50,物品才能被卖出,但这就要求vi??50,由于vi在

,但卖主仍然提?0,100?中均匀分布,故概率只有0.5,物品不能被卖出的概率为0.5n)高了其期望收益,因为他在物品售出时可以获得一个较高的价格。

于是,最优拍卖不是“事后”有效的。为了更加清晰地说明这一点,考虑上面的

例子,并令其中的n?1。则卖主有估价v0?0,且唯一的买主有一个取自[0,100]上均匀分布的估价。事后有效要求买主总能得到物品,只要其估价是正的。

但是,由于任何正的买价都会赢得物品。买主不会报出任何大于无穷小的买价。故卖主若不打算保留物品,则他只会得到零期望收益。事实上,卖主的最优政策是对于任何低于50的价格都拒绝出售物品,这会带给他25的期望收益。

更为一般地,当买主是不对称的时,最优拍卖有时甚至可能将物品卖给估价不是最高的一位买主。譬如,当ei(vi)?0且fi(vi)?有修正效应时的一般性均匀分布情形),有

ci(vi)?2vi?bivi1(bi?ai)对于所有[ai,bi]中的vi成立(没

(F(vi)??aifi(vi)dvi?fi(vi)(vi?ai)?vi?ai(bi?ai),由式(6.45)得到此式)

它是vi的增函数。故在最优拍卖中,具有最高ci(vi)的买主将得到物品。若bi?bj,则即使vi?vj买主i也会赢得物品,只要2vi?bi?2vj?bj。事实上,对于估价上界较高的买主,最优拍卖是歧视他们的。这种歧视对于那些低于代表性估价的买主是不利的,而对于那些接近于较高bj上界的是有利的。

6.5.5 一般情形下的最优拍卖

如果没有正规性假设,前述拍卖机制可能不是可行的,因为它将违反式(6.34)。为了将我们得到的解扩充至一般情形,我们需要一些更为仔细选择的定义。 买主i的分布函数Fi:[ai,bi]?[0,1]是连续的和严格递增的,因为我们假定密度函数fi总是严格正的。故Fi(?)有反函数Fi?1:[0,1]?[ai,bi],它也是连续的且严格递增。

对于每个买主i,我们现在定义四个函数,它们定义在单位区间[0,1]上。首先,

233

对于[0,1]中的任何q,设

hi(q)?Fi(q)?ei[Fi(q)]? ?ci[Fi(q)]?1?1?11?qfi[Fi(q)] (6.52)

?1且设

Hi(q)??q0 hi(r)dr (6.53)

再设Gi:[0,1]?R为函数Hi(?)的凸包;在Rockafellar的记号中(Ro-ckafellar, R. T., 1970,P36),有

Gi(q)?conrHi(q) ?min?wHi(r1)?(1?w)Hi(r2)|?w,r1,r2??[0,1]且wr1?(1?w)r2?q?

(6.54)

即Gi(?)是[0,1]上的最高凸函数满足Gi(q)?Hi(q)对每个q成立。作为凸函数,Gi在除可数个点外是连续可微的且其导数为单调增的,定义gi:[0,1]?R满足

gi(q)?Gi(q)

' (6.55)

当该导数一旦被定义后,我们就可运用右连续方法将gi(?)扩充至[0,1]上所有点上。定义ci:[ai,bi]?R满足

ci(vi)?gi(Fi(vi)) (6.56)

(可直接验证的是,在ci(?)是递增的正规情形,我们得到Gi?Hi,gi?hi,且

ci?ci)。最后,对所有估价向量v,设M(v)为其ci(vi)是所有买主中最大的且大于v0的那些买主的集合。

M(v)?i|v0?ci(vi)?maxcj(vj) (6.57)

j?N??我们现在能陈述主要的结果:在最优拍卖中,物品总是被卖给有最高ci(vi)的买主,只要ci(vi)不低于v0。

所以,我们可将ci(vi)视为当买主i的出价为vi时买主在卖主的最优拍卖中的先验水平(Priority level)。

定理6.2 设P:V?Rn和x:V?Rn满足

?1 若i?M(v)?|M(v)| (6.58) Pi(v)???0 若i?M(v)?且

~(v)?xi(v)?Pi(v)vi?viaiPi(v?i,si)dsi (6.59)

对于V中所有v和N中所有i成立。则(P,x)是一种最优拍卖机制。 证明:

首先,利用分部积分,有下列方程

234

?[hvi(Fi(vi)]?gi[(Fi(vi))]Pi(v)f(v)dv[hi(Fi(vi))?gi(Fi(vi))]?i(P,vi)fi(vi)dvibivi?ai??biai (6.60)

?[(Hi(Fi(vi))?Gi(Fi(vi)))?i(P,vi)] ??bivi?ai[Hi(Fi(vi))?Gi(Fi(vi))]d?i(P,vi)但Gi是Hi在[0,1]上的凸包且Hi是连续的,故Gi(0)?Hi(0)且Gi(1)?Hi(1)。所以,上述最后一个表达式的内部项为零。

现在,回忆引理3中的最大化项式(6.39),利用式(6.60)有

??1?Fi(vi)?v0?Pi(v)f(v)dv?vi?ei(vi)?f(v)ii??i??vi?N?????hvi?N(Fi(vi)?v0?Pi(v)f(v)dv(vi)?v0?Pi(v)f(v)dv ? ?i?N???cvi?Ni??hvi(Fi(vi))?gi(Fi(vi))?Pi(v)f(v)dv bi(6.61)

???(c(v)?v)P(v)?ii0i?f(v)dv? ??v?i?N?i?N??vi?ai?hi(Fi(vi))?Gi(Fi(vi))?d?i(P,vi) 现在,考虑定理中定义的那种(P,x)。不难观察到,P总是将所有的概率放在那些(ci(vi)?v0)是非负和最大化的买主上。所以,对满足式(6.30)的所有P都有

??(c(v)?v)P(v)?ii0i?f(v)dv??v??i?N???(c(v)?v)P(v)?ii0i?f(v)dv?v??i?N? (6.62)

当然,P本身并不满足概率条件(6.30)。

对于满足式(6.34)的所有P(即对于?i(P,vi))是vi递增函数,都有

?bivi?ai(6.63) ?Hi(Fi(vi))?Gi(Fi(vi))?d?i(P,vi)?0

因为Hi?Gi。

为了看出P满足式(6.34),观察到ci(vi)是vi的增函数,因为Fi和gi都是增函数。故Pi(v)对于任何给定的v?i来说是vi的增函数,并且?i(P,vi)也是vi的增函数。所以P满足式(6.34)。

由于G是H的凸包,我们知道G?H是水平的;即若Gi(r)?Hi(r),则?i(P,vi)在vi的某个领域为常数。这就意味着

bi?vi?ai?Hi(Fi(vi))?Gi(Fi(vi))?d?i(P,vi)?0 (6.64)

将式(6.62)、(6.63)和(6.64)回代进式(6.61),我们就看到P在约束(6.34)和(6.30)下最大化式(6.39)。这一事实联同引理3就证明了定理。

为了对这些重要的ci函数加以某种实践性的理解,考虑n?1的特别情形;即假设仅有一个买主。则我们的最优拍卖问题就变为:

235

?1 若c1(v1)?v0 Pi(v1)??0 若c(v)?v1i0?x1(v1)?P1(v1)?min?s1|c1(s1)?v0?

即卖者将以如下价格出售物品

?1c1(v0)?min?s1|c1(s1)?v0?

且若买者不打算支付这一价格,他就将物品保留在手中。

因此,如果买者i是唯一的买主,则卖主将出售物品与i当且仅当ci(vi)大于或等于v。换句话说,ci(vi)是卖主个人估价v0的最高水平,以致于如果所有买主都被迁移走,卖主将会把物品以vi或比它更低的价格售给i。 6.5.6 独立性假设

在前面,我们假定买主的估价之间是相互独立的随机变量。独立性假设是过强的假定,故我们现在考虑一个例子,并表明其中的最优行动看起来好象并非估价是互相独立的。

为简单计,我们考虑一个离散的例子。假设有两个买主,其中每一个的估价或者为vi?10或者为vi?100。假设(v1,v2)的联合概率分布为:

prob(10,10)?prob(100,100)?prob(10,100)?prob(100,10)?1316

显然,这两个估价值是相互不独立的。若两个买主都有较高的估价(v1?v2?100),则以价格100将物品卖给其中某个买主,并以相等的概率随机地决定哪一个买主得到物品。若一个买主有较高的估价(100)和另一个有较低的估价(10),则将物品卖给出价较高的(100)那位,且向报较低价格的买主索取30(但他得不到物品)。若两个买者都只有较低的估价(10),则将15单位货币给其中一位,且将5单位货币和物品交给另一位,同时随机地选择物品的获得者。

这个拍卖机制的产出函数(P,x)是:

?11?P(100,100)??,??P(10,10)

?22?P(10,100)?(0,1),P(100,10)?(1,0) x(100,100)?(50,50),x(10,10)?(?10,?10) x(10,100)?(30,100),x(100,10)?(100,30)

这看起来是一个非常令人感到奇怪的拍卖,但事实上它是最优的。不难验证:在这个拍卖博弈中,说实话是一个纳什均衡,给定另一位买主说实话,任何买主都没有谎报估价的动机。进一步,物品总是转移给了估价最高者,并且无论其估价是高还是低,每一个买主从这个拍卖机制中获得的期望支付为零。故这个拍卖机制是可行的并

236

且它使得卖主将买主的所有消费者剩余都拿走。因此,这是一个最优拍卖机制,并且它带给卖主的期望收益为

U0(P,x)?13(100)?16(130)?16(130)?13(?20)?70

为了看出为何这个拍卖机制如此运行,观察一下卖者实际上干着两件事情。首先,他将物品以最高的买主估价卖给估价最高的买主之一。其次,若买主说他的估价等于10,则这个买主就被强制性要求如下行事:“如果其他买主的估价为100,则支付10;如果其他买主的估价为10,则获得150”。对于真实估价为10的买主,这使得买主的期望值为0,因为在另一位的估价为100时条件概率为,另一位估价为10时条件

31概率为

23。但是,当一位买主的估价为100但他却说谎并报出10的价格,则这使得

2313(10)??50323他的期望值为(?30)?(因为现在他将对于其竞争对手的估价为100和

1310的两种情况分别赋予条件概率和)。这个对于说谎买主的负数期望值恰好抵消了买主以较低价格买到物品的说谎诱惑。

在独立性假设下,这个方法是不可能发挥的,因为每个买主关于其他买主的估价的条件概率为常数。但是,在一般的非独立情形,我们可以预测这个方法很可能出现。即卖主总可以通过以最高报价者的估价将物品卖给最高出价者将物品的价值全部获取,然后设置一个这种方法,若说实话则获得零期望值但若说谎则获负的期望值。当这种方法被仔细设计时,他们就能抵消为了以低价购得物品而说谎的冲动。

当然,在这个分析中,我们大量使用了风险中性假设。对风险中性买主,最优拍卖不太极端。在我们这个例子中所提出的拍卖博弈有不太好的第二个均衡,其中两个买者总是声称是低类型,尽管可设计出其他的最优拍卖机制,其中说实话均衡是唯一的(例如,将x变为:

x(100,100)?(100,100),x(10,10)?(?15,?15) x(10,100)?(40,0),x(100,10)?(0,40)

而P保持上述的不变)。

是否在我们的例子中存在一种最优拍卖,它没有这样一种奇怪的性质即有时让卖者向买者支付价格?答案是否定的。如果我们附加一种约束即卖者绝不向买主支付货币(即所有的xi(v)?0),则没有一种可行的拍卖机制给卖者带来大于6623的期望支

付。为了证明这一点,我们观察到如上例中那样估价值是有限的情形拍卖设计问题是一个线性规划问题。该问题的目标函数是U0(P,x),它对于P和x是线性的。可行约束有三种类型:概率约束[Pi(v)?0,?Pi(v)?1],个人理性约束[Ui(P,x,vi)?0]和激

i励相容约束。所有这些约束是P和x的线性函数。故我们得到一个线性规划问题,且

237

对于我们的例子来说其最优值为70,以及上述最优解。但若我们对所有i及v添加约束xi(v)?0,则最优值跌落到66(对于这个例子来说)。为了获取这个“次优”值663223和非负的x,卖主应在v1?v2?10时保留物品,且否则卖主将物品卖与高出价买主从而获得100。

6.6 混合战略的贝叶斯博弈解释

我们在第三章中对混合战略博弈的方法论基础展开了讨论,并指出其中蕴含的哲学问题。关于混合战略博弈,第三章中的讨论给出了多种可能的解释,其中主流的诠释来自Harsanyi的工作(Harsanyi, 1973)。这里,我们再重新回到这个问题上,并通过一个具体的例子说明Harsanyi解释的要点。在第三章中引出混合战略博弈时,我们假定信息是完全的,为了获得纳什均衡,我们扩充了局中人的战略空间,在纯战略空间基础上加入了随机选择纯战略的混合战略。这样,局中人在玩混合战略时,表现出来的特征是局中人选择纯战略上的不确定性。Harsanyi的理解是:表面上看来似乎存在选择不确定性的混合战略,实际上是局中人在关于其他局中人类型把握上的信息不完全性的反映。当局中人的类型是私人信息时,其他局中人在纯战略选择上就存在不确定性。这是因为,如果对手的类型存在多种可能,特定局中人的最优纯战略也相应地有多种可能的选择。对于特定的局中人来说,倘若他不知道对手的类型,因而也就不知道对手的最优纯战略。因此,当他预测对手的纯战略选择时,他只能根据自己对对手类型的先验信息(对手类型的先验概率分布)作出对手即将选择的各种纯战略的预测,而这种预测是基于概率分布意义上的各种可能性。这样,对特定局中人来说,他好像感觉到对手是在随机地进行纯战略选择。给定这种预期,特定局中人就选择其期望支付最大化的纯战略,于是,当所有局中人都如此行为时,这构成了静态贝叶斯均衡。Harsanyi(1973)证明,当局中人类型的私人信息很小时,或博弈的信息不完全程度很弱时,这种本质上是静态贝叶斯博弈的博弈在数学形式上就等价于前面给出的完全信息混合博弈。当然,这种等价性是建立在数学家们所说的“几乎处处”的假设之上的,直观上说就是例外很少。下面,我们以第三章给出的“性别战”模型为例对此加以说明。在表6.2中,我们分别在男孩和女孩的支付函数上添加一个不确定变量tb和tg,它们分别是男孩和女孩的私人信息[8]。

表6.2 存在私人信息时的性别战博弈 男

足球 芭蕾

238

足球 2+tb,1 0,0 芭蕾 0,0 1,2+tg

假设tb和tg是相互独立且服从[0,x]区间上均匀分布的贝叶斯随机变量。这里,两人的类型空间都为[0,x],条件概率为P(tg|tb)?P(tb|tg)?1x。

现在来看这一贝叶斯静态博弈。我们将证明,当男孩和女孩分别采用以下类型依存的战略时,将构成一个贝叶斯纳什均衡。

?足球 tb?c男孩:sb?? (6.65)

?芭蕾 tb?c女孩:sg??芭蕾 tg?P????足球 tg?P (6.66)

其中,c,P分别是[0,x]上的某个待定参数。 给定女孩的战略,男孩选择看足球的期望支付为

PxPx(2?tb)?x?Px?0?Px(2?tb)

(6.67)

男孩选择看芭蕾的期望支付为

?0?PxxPxPx?Px?1?1?PxPx (6.68) ,男孩选择看足球是最优的,这等价于

当且仅当 tb?若令c?(2?tb)?1??3

(6.69)

?3,则男孩选择是最优的。

类似地,给定男孩的战略,女孩选择看芭蕾的期望支付为

? ?0??(2?tg)?(2?tg) (6.70)?xx?x?女孩选择看足球的期望支付为

? ?1??0?1? (6.71)?xx?x?当且仅当

cx(2?tg)?1?xcxccx?x?c?cc?x?c?cc时,女孩选择看芭蕾是最优的,这等价于

(6.72)

tg?若令P?个条件式

c?xP?3

?3,则女孩选择是最优的,从而构成一个贝叶斯纳什均衡。联立这两

?3

239

P?xc?3

得一方程式:P2?3P?x?0,解得: P??3?9?4x2?3?2 (6.73)

(6.74)

由对称性有 P?c?9?4x其中的负根按模型含义舍去。 于是,男孩选择看足球的概率为

x??3?x9?4x2?1??3?9?4x2x1lim(1?x?0

当私人信息x很小时,即x?0时,这一概率的极限为

49?4x2?23?3?9?4x2x)?1?lim2x?0

这里使用了罗必塔法则。

由对称性,当x很小时女孩选择看芭蕾的概率极限也为,而这正是完全信息下

32性别战博弈的混合战略纳什均衡。

尽管这里的方法可以说是对混和战略博弈的贝叶斯博弈解释,但与前面对混和战略博弈的说明所不同的是,这里的男孩选择看足球的概率是指女孩对于男孩类型不确定性的认识。男孩自己是知道自己的类型的,因而不存在男孩自己随机地选择纯战略的问题。男孩子选择纯战略的随机性是女孩看来是如此的。但是我们在前面关于混和战略博弈的解释中,男孩是自己随机地选择纯战略的。当然,对于女孩来说,也存在类似的不同。

6.7 显示性原理

在上一节中,我们用到了由R B.Myerson提出并证明的著名的“显示性原理”。在这一节中,我们来给出这一原理由Myerson给出的原初表述及证明。“显示性原理”是博弈论中的一个著名的结果,也是Myerson作为一个博弈论专家在研究中所达到的一个引入注目的高度。这里,我们介绍Myerson在其原始论文(Myerson,1979)中给出的描述和证明,并采用他在这篇文章中使用的符号。

6.7.1 显示性问题的提出与表述

假定有一个仲裁者(arbitrator),他打算在一群行为主体(a group of individuals)

240

各自提出的要求的情况下完成一种群决策(collective choice),他对于这些主体的偏好和禀赋都只拥有不完全的信息。譬如,在拍卖活动中,拍卖人对于竞标者所愿支付的最高价格及他们的财富水平是不太清楚的,这个仲裁者不仅要努力摆平(Settling fairly)这些不同主体的可能是相互冲突的要求,而且他有时还会首先要搞清楚这些主体的真实偏好。当然,他可以要求其委托人告诉他自己他们需要知道什么,但若他不能迫使他们说实话的话,他就要面临某些主体可能说谎并试图由此操纵他的最终决策的问题。在这里,Myerson提出了一种解决这个仲裁者问题的方法,其基础是由Hurwicz提出的激励相容(incentive—compatibility)概念(Hurwicz, 1972)和纳什提出的讨价还价解(Bargaining Solution)概念(Nash, 1950)。

在形式上,我们可以将仲裁者问题表述成如下的贝叶斯群决策问题(Bayesian Collective Choice Problem),其表达为

(C,A1,A2,?,Ar,U1,U2,?,Un,P) (6.75)

其中,博弈的行为主体即除仲裁者之外的局中人为1,2,?,n。C是仲裁者可选择的战略的集合。对于任一局中人i,Ai是局中人i的类型空间,即每一个ai?Ai都给出了局中人i相关特征的一个完整的描写,这些相关特征包括他的偏好,信念(belief)、

能力及禀赋等等。Ui是局中人i的支付函数或效用函数,它将C?A1???An中的元素映射到实数域中,使得Ui(c,a1,a2,?,an)是当c?C被选定且(a1,a2,?,an)为局中人的真实类型向量时局中人i将获得的支付。因此,假定Ui的取值是按von Neumann—Morgenstern效用函数方式计测的。最后,P是A1???An上的一个概率分布,满足如下性质:P(a1,?,an)是仲裁者认为(a1,?,an)是局中人真实类型向量的概率。

为避开数学上的复杂性,假设C和所有的Ai都是非空有限集。

也就是说,每个局中人都只有有限种可能的类型,而对于这群主体来说也只有有限种群选择(Choice Options)。然而,我们不排除随机性选择的混合战略,即仲裁者可以选择C上的某些个概率分布,使得C上的实际选择按此分布随机地选出。

仲裁者关于这一群决策问题的解决方案的一种典型表达是:

仲裁者首先要求每一个局中人说出有关其自身类型的一些信息,然后在C中选出一个分配方案,或以一种概率分布在C中进行选择。在仲裁者的这一选择过程中,他使用了局中人告诉他的信息。为将这一过程模型化,我们定义一种选择机制(Choice mechanism),它是定义在C?(S1?S2???Sn)上的一个实值函数?,对于反应集(response set)S1,S2,?Sn的乘积S1?S2??Sn中的每一个向量(s1,?,sn)和C中的所有c都有:

??(c|sc?C1 ,?,sn)?1和?(c|s1,?,sn)?0 (6.76)

这里,每个Si是局中人i可能给予仲裁者问题的所有可能反应的集合,并且每一

241

个?(c|s1,?,sn)是仲裁者在(s1,?,sn)为他从主体群那里获得的反应组合时他将赋予选择c的概率。

如果仲裁者只是简单地向每一位局中人询问他的真实类型是什么,那么局中人i的反应集将为Si?Ai,因为他的任何一个可能类型都将是一个回答。我们将称Ai为“标准反应集”(Standard response set)。除本小节和小节6.7.3之外,我们都将假定选择机制是建立在标准反应集上的。

假定每个局中人的反应是非合作地报告给仲裁者的。这样,当局中人i在其Si中选择其反应si时,他并不知道其他局中人的反应是什么,并且他必须独立于其他局中人的决策过程完成他的选择。

有一些“真实反应”Ti:Ai?Si,使得Ti(ai)是当局中人i的真实类型为ai时局中人i的真实的反应(truthful response)。对于标准反应集,一个自然的真实反应就是Ti(ai)?ai。我们并不假定仲裁者有什么办法迫使局中人一定会给出真实的反映。完全知道其真实类型的局中人只有局中人自己,并且当局中人从说谎中可以谋得好处时没有人可以阻止他说谎。另一方面,如果说谎并无什么好处,我们假定局中人会说实话。

假定局中人总是接受仲裁者在C中所作出的最终推荐,即裁决是约束性的(binding)。

最后,假定由Harsanyi提出的“一致性条件”成立(Harsanyi, 1967)。为了在这个框架中表达这种一致性,需要以下定义。首先,每个局中人被给定了与仲裁者相同的信息(他知道基本结构(6.75))以及额外的一些事实,即局中人i还知道自己的真实类型ai。倘若仲裁者知道了局中人i的类型是ai,则仲裁者将重新估计类型向量

??(?1,?,?n)的后验(Posterior)条件概率为:

?P(?1,?,?n)/Ri(ai) 若?1?aiPi(?1,?,?n|ai)?? (6.77)

?0 若?1?ai其中Ri(ai)是ai的边缘概率(Marginal Probability),这是贝叶斯公式。

Ri(ai)?1(?1,?,?n)?A1???An ?i?ai?P(?,?,?n)

(6.78)

一致性条件假定:Pi(?1,?,?n|ai)也是当局中人的类型为ai时局中人i将对

(?1,?,?n)的概率所作出的估计。为何如此呢?一种辩护理由是:假设局中人的类型

由某一众所周知的随机过程所决定,例如,如果局中人是从一个人群中随机挑选出来的,而这个人群中各种类型的比例是众所周知的[10]。

6.7.2 贝叶斯激励相容约束

在这一小节中,我们假设反应集都是标准反应集。也就是说,仲裁者向每个局中

242

人询问其类型是什么,局中人i的答案总是在Ai中。

因为仲裁者不能迫使局中人一定作出真实反应,他必须设计一种选择机制使得它不会激励说谎行为。给定一个选择机制?,对于任意局中人i和任意的ai?Ai和

bi?Ai,设

Zi(?,bi|ai)?i??A1???An c?C?P(?|ai)?(c|??i,bi)Ui(c,?) (6.79)

其中(??i,bi)?(?i,?,?i?1,bi,?i?1,?,?i)(回忆当?i?ai有Pi(?|ai)?0)。则

Zi(?,bi|ai)是当局中人i预期所有其他局中人都说实话且他自己的类型为ai且他在

选择机制为?时向仲裁者报告说他的类型为bi时,他将得到的条件——期望支付。

如果有

Zi(?,ai|ai)?Zi(?,bi|ai),任给i,ai?Ai,bi?Ai (6.80)

则称建立在标准反应集基础上的选择机制?为“贝叶斯激励相容的”[11]。

如果一个选择机制是贝叶斯激励相容的,则没有一个局中人会期望当其他局中人都预计会说真话时他一个人说谎会获得好处。因此,当且仅当选择机制是贝叶斯激励相容的时,所有局中人都说真话才是一个均衡[12]。

因此,除非选择一个贝叶斯激励相容机制,通过标准反应集进行机制选择的仲裁者不能期望得到真实的反应。

如果选择了机制?及每个人都是说真话的,则局中人的条件期望支付为

vi(?|ai)?Zi(?,ai|ai) (6.81) 与机制?相关的条件期望支付配置(allocation of conditionally——expected payoff)为[13]

v(?)?[(v1(?|a1)a1?A1,?,(vn(?|an)an?An]

(6.82)

向量v(?)是当局中人知道仲裁者打算使用选择机制?及预期所有局中人都对仲裁者说真话时,局中人在其所有类型情况下将获得的期望支付。如果仲裁者能使用任意的选择机制及预期所有人都说真话,则我们可定义期望配置向量的“可行集”(feasible set)如下:

F??v(?):?是选择机制? (6.83)

不幸的是我们知道,除非机制是贝叶斯激励相容的,否则不能指望反应一定是真实的。故我们必须将注意力限制在能达到贝叶斯激励相容机制的F的一个子集上去。于是,定义激励——可行的期望配置向量集为

F*??v(?):?是贝叶斯激励相容的? (6.84)

我们有如下定理:

定理6.3 F*是F的一个非空凸紧子集。

证明:建立在标准反应集上的选择机制是定义在C?A1???An上的一个实值函

243

数,且满足:

??(c?|?)?1和?(c|?)?0 (6.85)

c??C式(6.85)实际上在实变函数的理论框架中是按“几乎处处成立”来理解的,即不成立的点所构成的集合的勒贝格测度为零。假设有函数?1和?2都几乎处处满足条件式(6.85),?是[0,1]中的数,则函数??1?(1??)?2也显然在?1和?2的满足式(6.85)的自变量集的交集上也满足式(6.85),?1中不在此交集中的点必在?2的一个零测集中,故这些点组成的集为一零测集。?2中不在此交集中的点也必在?1的一个零测集中,故这些点组成的集也为一零测集。所以,此交集外的所有点组成的集合也为零测集,因此,??1?(1??)?2也几乎处处满足式(6.85)。所以,建立在标准反应集上的所有选择机制构成定义在C?A1???An上的所有实函数向量空间的一个凸子集。现在假设有一串机制??k?皆几乎处处满足式(6.85),且??k?几乎处处收敛于函数?。显然,(6.85),于是?也是一个建立在标准反应集上的选择机制。?也几乎处处满足式

所以,建立在标准反应集上的所有选择机制构成定义在C?A1???An上的所有实函数向量空间的一个紧子集。

据式(6.79),Zi(?,bi|ai)是线性依赖于?的。不难看出,通过类似于上述分析的步骤,可证明满足式(6.80)的机制也构成一个紧凸子集,即贝叶斯激励相容机制的集合也构成一个紧凸集,因为它们几乎处处满足式(6.85)和(6.80)。激励相容机制的确是存在的。譬如,对所有c?C和?,令?(c|?)?1C,则式(6.80)为恒等式,

故式(6.80)成立,同时,条件式(6.84)也自然成立。所以,激励相容机制集是非空的,F和F*也是非空的。 据式(6.81)、(6.82)知v(?)线性依赖于?。因为F*是激励相容机制集的一个线性映射,故F*必是配置空间中的一个非空紧凸集。F*的非空性直接由激励相容机制的非空性得到。F*的凸性是显然的,因为对于??[0,1]和?1,?2?F*,则

?v(?1)?(1??)v(?2)?v(??1?(1??)?2),而已知??1?(1??)?2是激励相容机制(已

证激励相容机制的凸性),故v(??1?(1??)?2)?F*。F*的紧致性直接由线性映射将紧集映为紧集的性质得到。

证毕!

众所周知的是:激励相容约束是一个有意义的约束,即F*比F小得多(见Hurwicz(1972)和Rosenthal(1979)),这一事实对于仲裁者有着重要的含义,因为他由此可以找到一种给所有局中人带来较高期望支付水平的选择机制。倘若某一机制?“严格”被占优于(Strictly dominated)另一机制??,即

vi(?|ai)?vi(??|ai) 对所有i和ai?Ai成立 (6.86)

则仲裁者必一采用机制?。

244

但是,对于许多群决策问题(见后面的例子),大多数非被占优的(undominated)或F的弱帕累托最优前沿可能在激励相容集F*的外面。

因为我们不能在F*的外面获得说真话均衡的配置,我们现在将提出这样一个问题:一个生成F*外面的期望支付配置的选择机制能否具有一种均衡(允许预期有说谎行为)?在6.7.3小节中,我们将证明对此问题的答案是否定的,即对于任何选择机制来说,局中人的均衡反应行为总是带来一个F*中的配置。

6.7.3 反应——计划均衡

在前述分析中,我们只考虑了建立在标准(Ai)反应集上的选择机制。我们现在转向考虑更加一般的情形。在整个这一小节中,我们仅假定每个局中人的反应集Si是一个非空有限集。

局中人i的一个反应计划(response plan)是一个将每一类型ai?Ai映射到其反应集Si上的一个概率分布的一个函数?i。也即是说,若?i是局中人i的反应计划,则

?i(si|ai)是当其真实类型为ai时局中人i将向仲裁者报告说他的类型是si的概率(因

此,对所有i和ai,我们有?i(si|ai)?0和??i(si'|ai)?1)。

si?Si''若局中人i知道ai是其真实类型及(?1,?,?n)列出了局中人在选择机制?下的反应计划,则局中人i的期望支付为

W1(?,?1,?,?n|ai)????P(?i|ai)??A1???Ans?S1???Snc?C?n? ????j(sj|aj)???(c|s)Ui(c,?)???j?1? (6.87)

由(?1,?,?n)生成的条件期望支付向量为[14]

W(?,?1,?,?n)?(Wi(?,?1,?,?n|ai)ai?Ai)i?1 (6.88)

?n?注意,在这一小节中,我们不能将反应计划区分为“说真话”和“说谎”两大类,

因为对于抽象的反应集Si,我们还未定义说真话的反应函数。

遵循Harsanyi(1967-8),我们说对于选择机制?(?1,?,?n)是一个反应—计划均衡(response—plan equilibrium),如果对任何局中人i和类型ai?Ai,对局中人i的每一个可能反应计划?i'有

Wi(?,?1,?,?n|ai)?Wi(?,?1,?,?i?1,?i,?'i?1,?,?n|ai)

(6.89)

也即是说,一组反应计划构成一个均衡,如果没有一个局中人可以指望通过单方面的改变其计划而获利。

我们现在定义均衡——可行期望配置向量集为

F**??Wi(?,?1,?,?n):?是选择机制且(?1,?,?n)是对于?的反应?计划均衡? (6.90)

仲裁者可以通过承诺采用相应的选择机制?并且向局中人建议他们采用生成这一期

245

望支付配置的?i反应计划而带来任一F**中的期望配置向量。可以确信局中人们会遵循他的建议,因为据均衡的定义,没有人会指望采用别的反应计划会带来更好的结果。

本小节的主要结果是均衡—可行性并不比激励相容性更为一般性。也就是说,对于任意选择机制的任何反应—计划均衡,存在一个等价的激励相容机制,它给所有类型的全体局中人带来相同的期望支付。因此,假定仲裁者将会选择建立在标准反应集上的激励相容机制不会失去一般性。

定理6.4 F**?F*

证明:这一定理可以作为Rosenthal在1979年的文献中提出的定理3的一个推论而获得证明(Rosenthal,1979),但这里我们将直接采用Myerson的证明(Myerson,1979)。

如果(?1,?,?n)是S1,?,Sn上的机制?的一个反应—计划均衡,则我们能定义一个A1,?,An上的一个等价的选择机制??:

?n???(c|?)???(c|s)???(s|?)? i???iis?S1???Sn?i?1?不难验证有

v(??)?w(?,?1,?,?n)

所以,它们生成的配置是相同的。进而,?的均衡条件不等式(6.88)意味着??的激励相容不等式(6.80)成立。因此,由x?w(?,?1,?,?n)?F**就可推出

*x?v(??)?F。故F**?F。

*为了验证还有F*?F**,只需观察到对于任意的激励相容机制??,定义一个说真话的反应计划?1',?,?n'如下:

?i(bi|ai)??'?1 若bi?ai?0 若bi?ai

它构成??的一个反应计划均衡。故x?v(??)?F*意味着有

''**x?w(??,?1?,?n)?F。

证毕!

246

注释:

[1] 一般地有ui?ui(a1,?,ai,?an,?i,??i),但大多数场合ui不包含??i,故有式(6.1)。

[2] 如果通过确定性效用函数构造不确定性下的效用函数,这一问题可以说是至今尚未完全解决。Von. Neuman-Morganstern效用函数是通过将确定性效用函数的概率加权来获得不确定性下的效用函数,这一思路尽管有着直观意义上的依据,但给出的函数并不满足效用函数的性质,因为它在一般性的严格增函数复合下不能给出不变的偏好序,它只是在正线性变换下才给出不变的偏好序。支付函数应该在大多数场合就是效用函数,这里和第3章采用了Von. Neuman-Morganstern效用函数主要应该是基于其直观意义。

[3] ??i从严格意义上看并非随机变量,但这里从局中人i的角度看它是在Hi上分布的随机变量。这种将主观上未知的变量作为随机变量处理的统计学背景被称为贝叶斯统计学,其方法论在学术界至今仍存在争议。但由贝叶斯(Bayes)发明的这种统计学在经济学中却得到大量应用。也就是从这个意义上,我们将这里介绍的博弈称为静态贝叶斯博弈。

[4] 不难验证,只有当我们做出这样的假设时,才可能获得线性最优战略。后面的结果将保证这一假设是成立的。

[5] 这种围标活动的组织和对“违规者”的惩罚有时甚至由黑社会来操纵,称为“黑道围标”。

[6] 这里的修正函数与i无关,意味着含有每一个局中人的修正函数是相同的假设。

[7] 为了说明vi作为i的最初估价的合理性,我们可以假设修正函数具有零期望值,故

bj?ajej(vj)fj(vj)dvj?0

否则,其他局中人将修正对vj的分布的信息。然而,对以下所要得到的结果来说,这一假设不是必需的。在没有这一假定的情形,仅仅是对vj的理解有所不同。

[8] 注意:我们这里允许存在这样的可能性,即即使买者未得到物品,他也可能支付一定的价格,如购买门票等。

[9] 显然,这种假定的含义是当男孩非常喜爱足球时,即他从欣赏足球中获得的效用较大时,他会选择去看足球。对女孩来说也有类似的解释。

[10] 对于以下的分析来说,这一一致性假设实际上并不是必需的。事实上,我们只需应用条件概率函数Pi和边缘概率函数Ri。反对一致性假设的读者可以将这些函数以如下方式理解:设Pi(?1,?,?n|ai)是当局中人的真实类型为ai时局中人i赋予

247

类型向量(?1,?,?n)的主观概率(Subjective Probability),且设Ri(ai)是仲裁者赋予局中人i的类型为ai这一事实的先验(Prior)边际概率。在这种理解基础上,我们以下的所有结果都是成立的。

[11] D’Aspremont 和Gerard—Varet(1977)曾建议引入形容词“贝叶斯”,以将此定义区别于由Hurwicz(1972)给出的关于激励相容的另一较强的定义。这里,我们有时也省略掉形容词“贝叶斯”并同样指式(6.79),因为这里不会用到其它的有关“激励相容”的定义。

[12] 回忆我们曾假定局中人向仲裁者独立提交报告,因而没有一个局中人知道其他局中人向仲裁者说了什么。所以,每个局中人都是在给定其自身真实类型下比较其期望支付的大小来选择其最优反应。

n[13] v(?)是?Ai个实数值的一个表列或向量,其标号是与各个Ai集合的不相

i?1交并集中的元素相1-1对应的。

n[14] 这是一个有着?Ai个分量的向量,正如6.7.2中的v(?)向量那样。

i?1

248

本文来源:https://www.bwwdw.com/article/jvro.html

Top