11031004 - 丁凯 - 可持续发展问题的博弈分析(自然辩证法论文)

更新时间:2023-09-30 06:33:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

可持续发展问题的博弈分析

丁凯(11031004) dingkai.zju@gmail.com

摘要:近几十年来,全球问题的产生和日趋严重,使得传统发展模式的可持续性受到严重挑战,进而引发人们思考如何通过科技创新与制度创新的匹配来解决全球问题、实现可持续发展。本文运用博弈论中的纳什均衡理论以及“囚徒困境”模型分析全球问题和可持续发展问题,进而分析如何摆脱全球问题的“囚徒困境”推动可持续发展。

关键词:可持续发展,人与人协调,博弈,纳什均衡,囚徒困境

一、可持续发展概念

1987年,世界环境与发展委员会,在对世界重大经济、社会、资源和环境等问题进行系统调查研究的基础上,提出了著名的《我们共同的未来》这份报告,其中采纳了“可持续发展”的概念,并提出了现在已为国际社会普遍接受的关于可持续发展的定义,即“可持续发展是指既满足当代人的需要,又不损害后代人满足其需要能力的发展”。1

全球问题的产生是由“人与自然不协调”和“人与人不协调”两方面造成的。不解决全球问题,社会就不能可持续发展。相比“人与自然的不协调”,“人与人的不协调”是更为根本的原因。“人与自然的不协调”归根结底也是“人与人的不协调造成的”。因此,只有实现“人与人协调发展”,才能解决全球问题,实现社会可持续发展。

二、纳什均衡与“囚徒困境”模型

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

博弈的分类根据不同的基准也有所不同。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的

时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡,子博弈精炼纳什均衡,贝叶斯纳什均衡,精炼贝叶斯纳什均衡。

假设有若干个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化,所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。2

纳什均衡不意味着博弈双方达到了一个整体的最优状态。“囚徒困境”是纳什均衡一个经典案例。假设有两个小偷A和B联合犯事、私闯民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪,再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私闯民宅的罪名将两人各判入狱1年。这个博弈的支付矩阵如表1所示:

A\\B 坦白 抵赖 坦白 -8,-8 0,-10 抵赖 -10,0 -1,-1 表1:囚徒困境的支付矩阵

关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是

由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保,假设每个人都是理性的,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。3 三、可持续发展问题的博弈分析

人与自然的不协调、全球问题和不可持续发展这三个问题,归根到底都是人与人的不协调或者不合作造成的。4“囚徒困境”模型表明了个人理性和集体理性的冲突。实际中很多现象,例如寡头竞争、军备竞赛、团队生产中的劳动供给、公共产品供给等,都可以利用“囚徒困境”模型进行解释。许多制度就是为解决“囚徒困境”而存在的。

“囚徒困境”模型是从许多具体情境中抽象出来的。下面给出“囚徒困境”的一般表示:如果博弈双方都采取合作态度,双方的获益都为R;如果博弈双方都采取不合作态度,双方的获益都为P;如果博弈双方中的一方采取合作态度,另一方采取不合作态度,双方的获益分别为T,R。其中,满足条件T>R>P>S,(S+T)<2R。“囚徒困境”一般表示的支付矩阵如表2所示:

A\\B 合作 合作 不合作 R,R S,T 不合作 T,S P,P 表2:“囚徒困境”一般表示的支付矩阵

已知T>R>P>S,(S+T)<2R,双方都采取合作态度时,双方的利益总和达到最大值。如果进行一次博弈,由纳什均衡理论可知:无论对方如何选择,己方的最优选择是不合作,因此可以预测双方最后都将采取不合作态度,无法实现双方利益总和最大化。重复博弈将会使参与者从注重T>R>P>S逐渐转变成注重2R>T+S,发现相互合作的获益最大,进而有可能从不合作态度转变为合作态度,使得双方脱离“囚徒困境”。

下面以实例来说明如何运用“囚徒困境”模型分析全球问题和人与人协调发

展问题。

一、政治学例子:军备竞赛

在政治学中,两国之间的军备竞赛可以用“囚徒困境”来描述。两国都可以声称有两种选择:增加军备(不合作)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的理性行为,但结果却显得非理性(例如会阻碍本国的经济建设等)。

二、经济学例子:关税战

两个国家,在关税上可以有以两个选择: 1. 提高关税,以保护自己的商品。(不合作)

2. 与对方达成关税协定,降低关税以利各自商品流通。(合作)

当一国因某些因素不遵守关税协定,而独自提高关税(不合作)时,另一国也会做出同样反应(不合作),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(双方不合作的结果)。然后二国又进行谈判,重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大)

三、商业例子:广告战

商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争,广告互相影响,即A公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

此时B公司可以有二种选择:

1. 互相达成协议,减少广告的开支。(合作)

2. 增加广告开支,设法提升广告的质量,压倒对方。(不合作)

若B公司不信任对方,不合作成为支配性策略时,两个公司将陷入广告战,而广告成本的增加损害了两个公司的收益,这就是陷入“囚徒困境”。在现实中,要两个互相竞争的公司达成合作协议是较为困难的,多数都会陷入“囚徒困境中”。

四、摆脱“囚徒困境”,促进可持续发展

要解决全球问题,实现可持续发展,必须摆脱人与人之间的“囚徒困境”,

使得人与人之间由不合作态度转变为合作态度。

摆脱“囚徒困境”的关键是重视长远利益,不要只顾眼前利益。当博弈只进行一次时,每个参与人都只关心一次性的支付;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前的利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响到博弈均衡的结果。在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争, 即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。

对于管理层而言,可以制定适当的制度来影响博弈,改变博弈的支付量,从而有助于实现合作,摆脱“囚徒困境”。具体来说,管理层可以对采取不合作态度的个人(团体)进行适度的惩罚。那么受该制度约束的“囚徒困境”一般表示为:如果博弈双方都采取合作态度,双方的获益都为R;如果博弈双方都采取不合作态度,双方的获益都为P,但都要受到处罚为X;如果博弈双方中的一方采取合作态度,另一方采取不合作态度,双方的获益分别为T,R,不合作方收到处罚X。其中,满足条件T>R>P>S,(S+T)<2R,R>T-X。这个博弈的支付矩阵如表三所示:

A\\B 合作 合作 R,R 不合作 S,T-X 不合作 T-X,S P-X,P-X 表三:受制度限制的“囚徒困境”一般表示的支付矩阵

由于引入了对不合作一方的惩罚,并且满足R>T-X,由纳什均衡理论可知:无论对方如何选择,己方的最优选择是合作,因此可以预测双方最后都将采取合作态度,实现了双方利益总和最大化。 五、总结

人与自然的不协调、全球问题和不可持续发展这三个问题,归根到底都是人与人的不协调或者不合作造成的。人们应该重视长远利益,不要只顾眼前利益,要变短期行为为长期行为。管理层要制定适当的制度,鼓励合作,对不合作方做

适当的惩罚,促使人与人之间有不合作态度转变为合作态度。只有人与人之间协调发展,才能实现可持续发展。

参考文献:

12

陈邦耀主编. 可持续发展战略读本. 中国计划出版社. 1996 王春永编著. 博弈论的诡计. 中国发展出版社. 2007 3

张维迎编著. 博弈论与信息经济学. 上海人民出版社. 1996 4

许为民、王诗宗、张刚、王建安编著. 自然 科技 社会 与辩证法. 浙江大学出版社. 2002

本文来源:https://www.bwwdw.com/article/lgdd.html

Top