轮流出价的讨价还价模型

更新时间:2023-03-15 13:03:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

轮流出价的讨价还价模型

纳什讨价还价解是一个合作博弈模型,它是由几个看起来合理的公理导出的结果,这些公理包括效用测度的无关性(invariance)、帕累托有效性(efficiency)、无关选择的独立性(independence of irrelevant alternatives)和对称性(symmetry)。在实际的讨价还价中,这些公理可能都在背后起作用,但讨价还价通常是一个不断的“出价一还价”(offer-counteroffer)过程。罗宾斯泰英(Rubinstein,1982)的轮流出价模型(alternating offers)试图模型化这样一个过程。在此模型里,两个参与人分割一块蛋糕,参与人1先出价(offer),参与人2可以接受(accept)或拒绝(reject)。如果参与人2接受,博弈结束,蛋糕按参与人1的方案分配;如果参与人2拒绝,参与人2出价(还价),参与人1可以接受或拒绝;如果参与人1接受,博弈结束,蛋糕按参与人2的方案分配;如果参与人1拒绝,参与人1再出价;如此一直下去,直到一个参与人的出价被另一个参与人接受为止。因此,这是一个无限期完美信息博弈,参与人l在时期1,3,5,?出价,参与人2在时期2,4,6,?出价。如同在单阶段同时出价模型中一样(见上一章),这个博弈也有无穷多个纳什均衡,但罗宾斯泰英证明,它的子博弈精炼纳什均衡是唯一的。

我们用x表示参与人1的份额,(1一x)表示参与人2的份额,x1和(1一x1)分别是参与人1出价时参与人1和参与人2的份额,x2和(1一x2)分别是参与人2出价时参与人1和参与人2的份额。假定参与

x出,参与人2的支付的贴现值是π人1和参与人2的贴现因子分别为δ1和δ2。这样,如果博弈在时期t结束,t是参与人i的出价阶段,参与人1的支付的贴现值是π1=δ1

t-1

i2

=δ2(1-xi)。

t-1

在讨论无限期博弈之前,让我们先来讨论有限期博弈的情况。如果博弈的期限是有限的,我们可以使用逆向纳归法求解子博弈精炼纳什均衡。首先假定博弈只进行两个时期,在T=2,参与人2出价,如果他提出x2=0,参与人1会接受,因为参与人1不再有出价的机会(一般地,如果参与人在接受和拒绝之间无差异时,我们假定他选择接受)。因为参与人2在T=2时得到1单位等价于在t=l时的δ2单位,如果参与人1在t=1时出价1一x1≥δ2,参与人2会接受;因为参与人1没有必要给参与人2多于他会接受的最低份额,子博弈精炼均衡结果是参与人1得到x=x1=1一δ2,参与人2得到1一x=δ2。现在假定T=3,在最后阶段,参与人1出价,他可以得到的最大份额是x1=1。因为参与人l在T=3时1单位等价于t=2时的δ1单位,如果参与人2在t=2出价x2=δ1,参与人1将会接受;因为参与人2在t=2时的(1一δ1)单位等价于t=l时的δ2(1一δ1)单位,如果参与人l在t=l时出价1一x1=δ2(1一δ1),参与人2将会接受。因此,子博弈精炼均衡结果是x=l一δ2(1一δ1)。假定T=4,参与人2最后出价。使用上述结果,因为参与人2在t=2时最大可得(1一δ1(1一δ2)),参与人l在t=l时将出价1一x1=δ2(1一δ1(1一δ2)),子博弈精炼均衡结果是x=1一δ2(1一δ1(1一δ2))。假定T=5,参与人1最后出价。因为参与人2在t=2时最大可得为1一δ1(1一δ2(1一δ

1

)),子博弈精炼均

衡结果为x=1一δ2(1一δ1(1一δ2(1一δ1)))。读者可以使用上述方法推导出任何给定的T<≦的子博弈精炼纳什均衡。

现在让我们来看看子博弈精炼均衡结果与贴现因子δ和博弈期限T之间的关系。从上面的例子可以看出,如果δ1=δ2=0,不论T为多少,子博弈精炼均衡结果是x=1;就是说,如果两个参与人都是绝对无耐心的(下阶段的任何支付等价于本阶段的0),第一个出价的参与人得到整个蛋糕。如果δ2=0,不论δ1为多少,子博弈精炼均衡结果仍然是经=1;但是,如果δ1=0,δ2>0,子博弈精炼均衡结果是x=1一δ2,因为如果参与人2在t=l拒绝了参与人1的出价,参与人2在t=2得到整个蛋糕,但贴现到t=l只值δ2,参与人2在t=l将接受任何1一x1≥δ2的出价。在上述几种情况,均衡结果与T无关(假定T≥2)。现在让我们考虑另外的情况。假定δ1=δ2=1(即双方都有无限的耐心),那么,如果T=l,3,5,?,均衡结果是x=1;如果T=2,4,6,?,均衡结果是x=0。这里,我们得到“后动优势”(last-mover advantage),其原因是,给定δi=1,如果参与人i最后出价,他将拒绝任何自己不能得到整个蛋糕的出价,一直等到博弈的最后阶段得到整个蛋糕。

一般来说,如果0<δi<1,i=1,2,均衡结果不仅依赖于贴现因子的相对比率,而且依赖于博弈时期长度T和谁在最后阶段出价。然而,这种依存关系随T的变大而变小;当T趋于无穷时,我们得到“先动优势”:如果δ1=δ2=δ,唯一的均衡结果是x=1/(1十δ)。这就是下面要讨论的间题。

定理(Rubinstein,1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是:

212*

11δδδ??=x(如果δ1=δ2=δ,δ+=11*x)

现在让我们来证明上述定理。因为T=≦,博弈没有最后阶段,我们不可能使用逆向归纳法求解。但根据萨克德和沙腾(Shaked and Sutton,1984),因为从参与人1出价的任何一个阶段开始的子博弈等价于从t=l开始的整个博弈,我们可以应用有限阶段逆向纳归法的逻辑寻找子博弈精炼均衡。假定在时期t≥3参与人1出价,参与人1能得到的最大份额是M。因为对参与人1而言,t期的M等价于t一1期的δ1M,参与人2知道在t一1期的任何x2≥δ1M的出价将被参与人1接受,因此参与人2出价x2=δ1M,自得1一δ1M;因为对参与人2而言,t一1期的1一δ1M等价于t一2期的δ2(1一δ1M),参与人1知道在t一2期的任何x1≤1一δ2(1一δ1M)出价将被参与人2接受,因此参与人1出价x1=1一δ

2

(1一δ1M),留给参与人2 δ2(1一δ1M)。因为从t一2开始的博弈与从

t开始的博弈完全相同,参与人l在t一2期能得到的最大份额一定与其在t期得到的最大份额相同,因此我们有:

x1=M=1-δ2(1-δ1M) 解上式得

212

11δδδ??=M

现在假定参与人l在t期能得到的最小份额为m。因为t期的m等价

于t一1期的δ1m,参与人2在t一1期最多得到1一δ1m。因为t一1期的1一δ1m等价于t一2期的δ2(1一δ1m),参与人1在t一2期至少得到x1=1一δ2(1一δ1m)。因此我们有:

x1=m=1-δ2(1-δ1m) 解上式得:

212

11δδδ??=M

因为参与人1能得到的最大份额与最小份额相同,均衡结果是唯一的:

212

11δδδ??=x

因为t是任意的,上述证明过程表明,参与人1的子博弈精炼均衡战略是:“在t=1,3,5,?时总是要求(1一δ2)/(1一δ1δ2),在2=2,4,6,?时接受任何大于或等于δ1(1一δ2)/(1一δ1δ2)的份额,拒绝任何较小的份额。“为了说明这一点,注意到:

2112212

1)1(111δδδδδδδ???=??

等式右边的第二项是参与人1出价时参与人2的份额。如果参与人1提出更高的要求从而被参与人2拒绝,参与人2在t十1期要求(1一δ

1

)/(1一δ1δ2)(注意对称性,此时参与人2处于参与人1的位臵),参

与人1的支付(贴现值)是:

212212212111

1111)111(δδδδδδδδδδδ??

因此提出更高的要求不是最优的。同样,接受任何低于δ1(1一

δ2)/(1一δ1δ2)的份额也不是最优的,因为等待一个阶段他就可以得到的份额。

类似地,参与人2的子博弈精炼均衡战略是:“在t=1,3,5,?时,接受任何大于或等于δ2(1一δ1)/(1一δ1δ2),拒绝任何较小的份额;在t=2,4,6,?时,总是要求(1一δ1)/(1一δ1δ2)的份额。”

这个博弈当然还有许多其他纳什均衡。特别地,下列战略组合是一个纳什均衡:“参与人1总是要求x1=1的份额,拒绝参与人2任何x2<1的出价;参与人2总是要求1一x2=0,接受参与人1的任何出价。”但这个纳什均衡不是子博弈精炼均衡,如果参与人2拒绝了参与人1的第一次出价,提出x2≥δ1,参与人1应该接受,因为如果拒绝的话,即使他在下一阶段拿到整个蛋糕,也只值δ1。

子博弈精炼均衡结果是参与人贴现因子(耐心程度)的函数,这是罗宾斯泰英模型得到的重要结论。特别地,给定δ2,当δ1?l时x=1,即参与人1得到整个蛋糕;给定δ1,当δ2?1时,x=0,即参与人2得到整个蛋糕。这可以说是?耐心优势?。直观地讲,有绝对耐心的人总可以通过拖延时间使自己独吞蛋糕。这个?耐心优势?在一般情况下也是成立的:给定其他情况(如出价次序),越有耐心的人得到的份额越大。比如说,如果δ1=0.5,δ2=0.9,即参与人2比参与人1更有耐心,那么,均衡结果是参与人l得到x=0.182,参与人2得到1一x=0.812。注意,当δ2=0,参与人1也得到整个蛋糕,因为参与人2没有任何耐心等待下一阶段;但,当δ1=0时,参与人2不能得到整个蛋糕,除非δ2=1,就是说,没有任何耐心的参与人1也可以得

*

*

*

*

到一点份额。导致这一差异的原因是,除耐心优势外,这个博弈还有个?先动优势?::当δ1=δ2=δ<1时,x=1/(1十δ)>1/2,即参与人1的份额总是多于参与人2的份额。如果每一阶段的长度任意小,这个先动优势将消失。另外,当δ1=δ2=1时,这个博弈也有无穷多个子博弈精炼均衡,x=1/2可能是一个聚点均衡(也是纳什讨价还价解)。

贴现率可以理解为讨价还价的一种成本,类似蛋糕随时间的推延而不断缩小,每一轮讨价还价的总成本与剩余的蛋糕成比例。讨价还价的另一类成本是固定成本。

举例来说,如果工会和企业的磋商拖延了工期,企业要承受两种损失,一类是推迟出售的利息损失(与价值成比例),另一类是不能按期交工的违约罚款(一般是固定的)。这两种成本对均衡结果的影响是不同的。

为了说明这一点,假定δ1=δ2=1,但参与人i每出价一次要承担ci>0的损失。有三种可能的情况。第一种情况是c1=c2=c,此时,均衡结果是不确定的;第二种情况是c1c2,此时,参与人l得到x=c2,参与人2得到l一x=1一c2。

固定成本的一种特殊形式是外部机会(类似机会成本)。容易想象,外部机会越好(从而机会成本越高),参与人越处于不利地位。

*

*

*

*

本文来源:https://www.bwwdw.com/article/0r7v.html

Top