第6讲博弈论与竞争策略

更新时间：2023-05-18 12:30:01 阅读量：实用文档文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

第6讲国家一切权力属于人民教案推荐度：
相关推荐

管理经济学

第6讲博弈论与竞争策略第1节

博弈论的基本概念, 第2节

完全信息静态博弈, 第三节

重复博弈和序

列博弈在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什(Nash)、泽尔腾(Selten)和海萨尼( Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两个方面的原因： 1.传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞不完全竞争的，行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分信息不对称析。当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。1

H Y X 201012-16

管理经济学

第一节博弈论的基本概念一.博弈论及其特点博弈论及其特点 1.博弈和博弈论博弈是指具有不同利益和目标的多个行为主

体共同参加并相互影响的事态发展过程中的策略决策。博弈论(Game Theory)也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的理性的多个行为主体的决策和行动直接理性的相互作用和影响时，事态发展过程的决策和 H Y 均衡问题。广泛应用于政治、军事、经济、 X 2010外交和日常生活的许多领域。 12-16

管理经济学

2.特点： (1)参与者具有各自的目标： (2)参与者都是理性行为者； (3)参与者之间具有相关性； (4)事态发展的结果取决于全部参与者的共

同行为； (5)参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优 H 化论是一种单人决策理论单人决策理论；博弈论所揭示的规单人决策理论 Y X 律是一种多人决策理论多人决策理论。多人决策理论201012-16 3

管理经济学

二.博弈论的基本概念在博弈论中，博弈的基本要素被概括为以下概念： ( 1)参与者Players (玩家): 即参加博弈过程的行为和决策主体

,也是利益主体。在一

个博弈中，最少要有两个参与者。 ( 2 ) 策略Strategies (战略或策略行为):即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间策略空间。策略空间 ( 3 ) 收益Payoff ( 支付、得益)和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。 ( 4)结局 outcome(结果):指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。 ( 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 H Y X ( 6)博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 201012-16 4

管理经济学

例：可口可乐与百事可乐(参与者参与者)的价格决策：参与者双方都可以保持价格不变或者提高价格(策略策略) 策略博弈的目标和得失情况体现为利润的多少(收益收益) 收益收益函数) 利润的大小取决于双方的策略组合(收益函数收益函数博弈有四种策略组合，其结局结局是：结局 (1)如果双方都不涨价，各得利润10单位； (2)如果可口可乐不涨价，百事可乐涨价，可口可乐利润100 ,百事可乐利润-30; (3)如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20 ,百事可乐利润30; (4)如果双方都涨价，可口可乐利润140,百事可乐利润35; 博弈的稳定状态有两个：都不涨价或者都涨价(均衡均衡),均衡均衡 H 称为博弈的解，它是由博弈规则博弈规则(即参与者采取什么策略会博弈规则 Y 取得什么结局，市场的需求弹性、交叉价格弹性等)决定的 X 。 201012-16 5

管理经济学

三.博弈的表述方法博弈一般用数学模型表达，分为标准和扩展模型两种。 1. 博弈的标准模型包括三个要素：参与者、每个参与者可以选

择的策略以及收益函数。在两个参与者的有限博弈中，标准模型可以用收益矩阵收益矩阵表示。收益矩阵如上例的可乐价格博弈可以表示如下：在收益矩阵中，包含了标准博弈模型的基本信息，表格中各组数字表示不同策略组合条件下的结局。在每个结局中，第一个数字代表参与者1 的收益，第二个数字代表参与者2的收益。

参与者2 百事可乐不涨价涨价参与者1 不涨价 10,10可口可乐

100,-30 140,35

H Y X 201012-16

涨价

-20,30

返回 6

管理经济学

2. 博弈的扩展模型包括五个要素：参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中，扩展模型可以用博弈树博弈树表示。如上例的博弈树可乐价格博弈可表示如

图下：博弈树一般用来

H Y X

分析动态博弈。在博弈过程中，从某一个决策点开始，参与者在已有行动的基础上开始选择，到参与者1 博弈结束，称为可口可乐 “子博弈”。子博弈是相对的，从事态发展的历史来看，所有的博弈都是子博弈。

140,35 参与者2 2百事可乐

-20,30 100,-30

参与者2百事可乐

10,107

201012-16

管理经济学

四.博弈的分类(1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。可以达成协议的为合作博弈cooperative game,合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。不能达成协议的为非合作博弈non-cooperative game,非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈，双方的利益和目标有冲突，难以达成可以实施的协议，双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。 (2)静态博弈与动态博弈根据参与者选择策略的关系划分。参与者同时或独立选择策略的博弈是静态博弈。参与者按照一定的次序选择策略，后选择者了解先选择者的行动，这种博弈是动态博弈。 H (3)完全信息博弈与不完全信息博弈根据参与者对其他参与 Y 者的特征、策略空间、收益函数等信息的了解程度划分。 X 全部相互了解即为完全信息博弈，否则是不完全信息博弈。 201012-16 8

管理经济学

一.囚徒的困境与纳什均衡 1.囚徒的困境：假设有两个嫌疑犯作案后被抓获，并在不

第二节完全信息静态博弈静态博弈

同的房间审讯。警察告诉他们，如果两人都坦白，各判刑8 年；如果两人都抵赖，各判刑1年；如果其中一人坦白而另一人抵赖，坦白者释放，抵赖者判刑10年；这样，每个犯人就有两种策略，即坦白和抵赖。这个博弈的收益矩阵如下

,坦白)是博弈的解，即均衡结局。因为不管对方怎样行动，两个囚徒都会选择坦白。囚徒的困境说明，个人理性(最优)与集体理 H 性(最优)可能不一致 Y X 。如寡头之间的广告投入、产量控制等。 201012-16

在这个博弈中，(坦白

囚徒2 坦白囚徒1 坦白 -8,-8 抵赖 -10,0 抵赖 0,-10 -1,-19

管理经济学

2.纳什均衡纳什均衡是指由所有参与者的最优策略组成的策略组合。在这

H Y X 201012-16

种情况下，没有人可以从改变策略中得到好处，因而形成了一种均衡(僵局)。一种制度或者协议要能够自动实行(即得到自觉遵守),必须满足纳什均衡的条件。可以通过画圈的方法求解纳什均衡。即设定一个参与者的策略，然后把另一个参与者将会选择的策略可以带来的收益圈起来。如果

收益矩阵中某个策略组合中的两个收益都被圈起来，则这个策略组合就是纳什均衡。例如，前述可乐定价博弈收益矩阵可以确定有(涨价，涨价) 和(不涨价，不涨价)两个纳什均衡。在这个博弈中，出现了两个纳什均衡，参与者不能判断对方会采取什么策略，因而可能出现非均衡的结局(涨价，不涨价) 和(不涨价，涨价);或者对双方不利的均衡(不涨价，不涨价)。因此，纳什均衡只说明均衡存在的可能，不能解释均衡 10 的结果。

管理经济学

二.支配性策略dominant strategy均衡支配性策略均衡也称上策均衡或优势策略均衡。在博弈中，对

有些参与者来说，不管对手采取什么策略，他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略(上策或优势策略)。当存在支配性策略时，可以首先确定支配性策略，然后确定对手的选择，从而得出博弈的均衡解。例如，两个寡头厂商的广告博弈收益矩阵如下：参与者2 个支配性策略，即不管可口可百事可乐乐是否有广告，他都会有广告。在此基础上，可口可乐必然有广告无广告也会有广告。博弈的结果就是 15,0 (有广告，有广告)。这种均参与者1 有广告 10,5 H Y 衡称为支配性策略均衡。它也 X 是纳什均衡，但纳什均衡不一 20,6 可口可乐无广告 6, 8 2010-定是支配性策略。12-16 11

在这个博弈中，百事可乐有一

管理经济学

三.合作的诱惑在类似囚徒的困境这样的博弈中，个体

H Y X 201012-16

理性往往导致集体的非理性。在有多个纳什均衡的博弈中，参与者判断失误，或者某个参与者非理性行为，都会导致双方的严重损失。因此，存在着通过合作(共谋、勾结和串通)改善博弈结果的诱惑，这样可以是大家的收益都得到改善。例如，在上述广告博弈中，如果双方都不做广告，比都做广告收益高。但这种合作难以自动实现。12

管理经济学

1.对社会无害的合作，往往通过某些规则实现。如香烟广告，交通规则，重复建设。下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个

十字路口，每个驾驶员都有开和等两种选择，博弈结果如下开等：

在这个博弈中，(

开，等)和(等，开)是两个纳什均衡，但在完全信息静态博弈中，可能由于判断失误导致交通事故，或无谓 H 地延误时间。因此 Y 通过交通规则引导 X 博弈。 201012-16

驾驶员2 开开驾驶员1 等 0,4 0,013

等 4,0

-8,-8

管理经济学

避免重复建设例如两个厂商进行产品开发博弈的收益矩阵。两个厂商同时

开发一个市场(麦片),市场需要甜和脆两种产品，每个厂商只能生产其中一种产品

。从收益矩阵可以看出，在理性行为条件下博弈的两个纳什均衡是(脆，甜)和(甜，脆)。但由于推出甜的厂商有较多利润，可能导致(甜，甜)的重复建设结果。因此，应该通过发布信息和政策引导。国外不允许厂商之间勾结分割市场，主要靠准确的市场信息。

厂商2 脆H Y X 201012-16

甜 10,20 -8,-814

厂商1

脆甜

-5,-5 20,10

管理经济学

2.对社会有害的合作，设法制止在囚徒的困境博弈中，如果两个囚徒可以互相协商

,并形成攻守同盟，则罪犯得到好处，对社会不利。例如在寡头厂商的定价博弈中，勾结定高价对双方都有好处，但对社会不利，因此受到反垄断法的严密监控。寡头厂商的价格博弈收益矩阵如下：厂商2 高价H Y X 201012-16

低价 10,70 30,3015

厂商1

高价低价

50,50 70,10

管理经济学

四.最大最小策略纳什均衡是建立在参与者理性行为基础上的，这就使参与者的

决策时面临可能出现某些非理性行为的风险。为了降低风险，决策者可以采取最大最小策略最大最小策略以便降低风险，即在各种策略的最大最小策略最小收益中，选择具有最大收益的策略。其代价是放弃最优策略。下图是一个产品开发博弈的收益矩阵。其中，按照理性行为会有两种纳什均衡，(无新产品，有新产品)以及(有新产品，无新产品)。但如果采取最大最小策略，两个企业都不推出新产品。厂厂商2 商无新品无新品H Y X 201012-16

有新品 3,6 2,2 2

4,4 6,3 3

厂商1 有新品厂商2的最小收益

1 的 3 最小收 2 益16

管理经济学

支配性策略必要。在下图的博弈中，乙方采取“右”是一个支配性策略。因为不管甲方选什么，乙方采取右的策略都比左的策略好，可以得到1的收益。在期望乙方采取右的情况下，甲方应该采取“下”,并得到2的收益。这样，支配性策略均衡为(下，右 )。如果甲方比较慎重，考虑到乙方可能不一定理性，或者可能故意捉弄甲方，则应该采取最大最小策略，形成(上，右) 的博弈结果。在有些情况下，为了避免陷入被动，采取最大最小策略十分

甲方的最收

乙方上左 1,0 右 1,1 2,1 1 1 小 -8 益

H Y X 201012-16

甲方

下 -8,0 乙方的最小收益 0

管理经济学

第三节重复博弈和序列博弈在现实经济社会，完全信息静态博弈的条件并不经常

可以得到满足。特别是在市场竞争中，厂商之间的竞争不是一次性的，而是长期和反复的。同时，厂商之间的行为往往是有先后次序的，决策者可以先了解对手的行动，在充分掌握信息的基础上，然后再决定自己的对策。这种情况称为完全信息动态博弈。它对于分析具有

多个纳什均衡的博弈结果很有帮助。

H Y X 201012-16

管理经济学

一.重复博弈 Repeated game 重复博弈是指参与者之间的博弈不是一次性的，而是可以重复

的。这样，参与者就可以通过分析对手的行动采取相应的策略。

1.摆脱囚徒的困境的条件以寡头之间的价格竞争为例，在下图的价格博弈中，如果是静态博弈，厂商很容易陷入囚徒的困境(低价，低价)。但如果博弈可以无限重复下去，则厂商的最佳策略是“以牙还牙以牙还牙”。这以牙还牙样，考虑到对手会以牙还牙，从长远和整体来看，降低价格不会有什么好处，博弈可能达到合作合作的结果。合作厂商2 低价H Y X 201012-16

高价 100,-50 50, 5019

低价厂商1 高价

10, 10 -50,100

管理经济学

2.合作的条件和困难在现实经济运行中，寡头之间的价格默契并不容易，主要原因有： (1)如果博弈重复是有限的，则最后一次博弈会采取低价策略，理性的结果是抢先低价，一直到第一次博弈；但是，只要以牙还牙的理性行为有一定折扣或(怀疑),合作以避免价格战的结果仍然会出现。 (2)厂商较多，使以牙还牙以牙还牙(对欺骗者进行报以牙还牙复和惩罚)难以实现，合作就十分困难。如航空运输市场 H Y X (3)厂商之间的成本差别较大，需求和成本变 201012-16 化很快，难以达成默契。

管理经济学

二.序列博弈 Sequential game一方后行动。 1.先行者优势在现实中，较常见的是序列博弈，即一方先行动，另

在序列博弈中，先行者处于有利地位，可得到竞争优势。在下

图中，两家厂商进行产品开发的博弈，如果是静态博弈，两家厂商必须同时宣布决策。根据最大最小原则，可能大家都无新产品。但如果其中某一厂商具有研发优势，可以率先推出新产品，则另一厂商只好放弃进入该市场的打算。厂商2 厂商2 无新产品有新产品 0,10 -5, -521

H Y X 201012-16

无新产品厂商1 厂商1 有新产品

2, 2 10, 10, 0

本文来源：https://www.bwwdw.com/article/fmk4.html

相关文章：