第1章博弈论基本模型

更新时间：2023-05-17 23:10:01 阅读量：实用文档文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

第1章开局一张三分体验卡推荐度：
相关推荐

第1章博弈论基本模型

第1章博弈论基本模型章(Game Theory)

华侨大学商学院

第1章博弈论基本模型

什么是学习? 什么是学习?大学之道, 学习的三个层次(大学之道,在明明德,在亲民,在止于至善大学之道在明明德,在亲民,在止于至善) 专业学习: 专业学习:谋职,谋生(身无长物,何以生存). 事理学习: 事理学习:明白事理,懂得分析生活中的很多问题.(崔琦: 明白这个世界是一个什么样子,这很重要).一个人,其实只要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质世界中生活的很好.但这只是像一个盲人一样在生活,"春天来了,但我却看不到" .(明明德) 人生学习: 人生学习:充实人生,提高人生的境界,把学习融入人的生活中.人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习.一个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来也不思考什么是天行健,好像也是在生活.看看很多人下班后在做什么?打牌,或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味. (身体在成长,心灵也在成长吗?)(新民) 仰望星空

第1章博弈论基本模型

为什么学习? 为什么学习?从学习中获得心灵的提高,获得心灵的享受. 学习,其实就为自己创造一个美丽的心灵世界的过程. 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些"无用"的知识,你怎么驾驭哪些实用的知识呢? "世人只知有用之用,而不知无用只用". 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感慨"现在一读书就头痛";农村现在不要为生存而挣扎了,那做什么呢?"我不打牌又做什么呢?" 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人只知现实世界的繁华,却不知心灵世界的清新和高远.行万里路, 读万卷书,就是为追求心灵世界.这些年我深刻体会到:生活的基础是衣食住行,但生活的重点在于文化和精神.我不知道文化有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医. 大医医心:能医心者,才是大医.

第1章博弈论基本模型

0一,从三国演义谈起

绪论

1,曹操走华容道,有一条大路和一条小路,走哪条路呢? 2,田忌与齐王赛马,孙膑出主意. 3,三个和尚没水喝,为什么? 4,一个村子里,道路泥泞,村子里一家很富有,其他贫穷, 该修一条好路,能修成吗? 5,剪刀-石头-布,为什么成为猜先的选择? 6,黔驴是如何技穷的? 7,A,B,C三人去钓鱼,A钓了5条,B钓了3条,C没钓着, 中午一起吃饭,把钓的鱼吃完了,C不好意思,就给了A和B 共8元钱,A和B如何分配?

第1章博弈论基本模型

二,什么是博弈论1,安

踏的广告是什么? 2,一般人平时的思维是怎么样的? (决策,只知其一不知其二)("我以为…","我觉得…") 3,博弈论的思想是什么?(对策) 博弈,就是对手之间的游戏(game),在游戏中如何做到立于不败之地. 博:? 弈:? 下棋的最高享受是什么? 囚徒困境(Prisoner's dilemma) 囚徒困境

第1章博弈论基本模型

博弈论的创立与发展1,博弈论思想最早产生于我国古代 ,2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治国策略,就蕴育了丰富和深刻的博弈论思想. 田忌赛马:齐威王的上,中,下马分别优于大将田忌的上,中,下, 但田忌上马,中马分别优于齐威王的中,下马.比赛规则:每次双方各出三匹马,一对一比赛三场,第一场的输方要赔一千金给赢方. 齐田忌策略: 田忌策略: 田结果: 齐谋士孙膑策略: 策略: 田结果: 上马 ∨ 上马中马 ∨ 中马下马 ∨ 下马

田忌将军每次输掉三千金上马 ∨ 下马中马 ∧ 上马下马 ∧ 中马

田忌将军胜二负一赢一千金

第1章博弈论基本模型

博弈论的创立与发展2,博弈论的发展阶段 , 第一阶段:萌芽期(20世纪年代前). 世纪40年代前第一阶段:萌芽期世纪年代前 .利益冲突的研究是分散和初步的,带有很大程度的随意性. 孙子兵法:古诺(Cournot,1883)—古诺的"双寡头垄断"模型;艾奇沃思 (F.Y.Edgeworth , 1925)——" 双寡头等分市场 " ; 霍特林 (H.Hotelling,1929)——产品差异而引起的"价格竞争"模型;斯塔克尔伯格(H.V.Stackelberg,1934)——"领导——跟随(leader—follower)" 模型 ; 斯威齐 (P.M.Sweezy , 1939)——" 折弯的需求曲线 (Kinky Demand Curve)"模型等等. 第二阶段:创立期(20世纪年代). 世纪40年代第二阶段:创立期世纪年代 .博弈论首次系统地被引入经济学. 1944年冯诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作出版了《对策论与经济行为》,从而奠定了合作博弈的理论与方法.

第1章博弈论基本模型

博弈论的创立与发展第三阶段:大发展期(20世纪世纪50's—90's).非合作博弈以及合作博弈的理论获得了第三阶段: 大发展期世纪 . 空前的发展. 纳什(Nash,1950)——n人非合作博弈及提出博弈均衡的定义塔克(A Tucker)——提出"囚徒困境"(prisoner's dilemma)模型泽尔腾(Selten,1965)——提出精练子博弈纳什均衡概念,并把这一概念引入到了动态分析之中海萨尼(J.Harsnyi,1967~1986)——提出贝叶斯纳什均衡概念,并把这一概念引入不完全信息博弈模型研究泽尔腾(Selten ,1975),克瑞普斯(Kreps,1982)和威尔森(Wilson,1982). 弗得伯格(Fudenberg,1991)和泰勒尔(Tirole,1991)研究了精练贝叶斯纳什均衡, 解决动态不完全信息博弈.泽尔腾定义了"颤抖手均衡"(trembling hand equilibrium); 克瑞普斯和威尔森定义了"序贯均衡"(Sequential equilibrium)并提出了著名的"信誉" 问题模型

;弗得伯格和泰勒尔给出了"精练贝叶斯均衡"的正式定义. 颤抖手均衡>序贯均衡>精练贝叶斯均衡(但在许多情况下,三个概念是一致的) 博弈论近期发展:除了博弈论与信息经济学的结合外,还出现了新的理论与应用分支诸如博弈学习理论,进化(演化)博弈论,博弈论与新制度经济学,博弈论与行为科学, 博弈论与实验经济学,博弈论与组织管理的结合.

第1章博弈论基本模型

1.1 有限扩展型博弈模型博弈模型的构建应用博弈论方法分析研究问题,首先要构造出博弈模型来,因而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这些要素进行严格,准确的刻画后,形成博弈模型. 将博弈活动构造成博弈模型,需要了解以下6个方面的情况: 1.局中人; 2.外生事件的概率分布; 3.局中人选择行动的次序; 4.局中人所能选择的行动; 5. 局中人在选择行动时所了解的信息. 6.局中人的支付.

第1章博弈论基本模型

构造博弈模型所需要的要素N = {0,1,2, L, n} ,称 N 为局中人或参与人集合.N 中元素称为参与人或局中人.参与人不专指人,它泛指参与博弈活动的政府,企业,地区,国家, 个人……等决策主体.通常用"0"表示虚拟局中人,它的行为是以确定的概率分布进行随机选择, i = 1,2, L , 表示实际参与人. n

1.局中人集合局中人集合

2.行动集合行动集合

称参与人 i ∈ N在博弈中所有可能选择的行动构成的集合 A i 为局中人i的行行动集合. 行动. 动集合 A i 中的元素 a i 称为局中人i 的行动行动局中人的行动集合可能是有限集,也可能是无限集.如果博弈活动中每个局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称该博弈为有限博弈有限博弈. 有限博弈

3.博弈树博弈树对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1 所示(见p2上的例子).

第1章博弈论基本模型

旺盛

I ① 01

疲软

①进入② 容许不进容许进入②

①不进抵制

图1-1 市场进入博弈树

4. 支付向量博弈树中终点Z下面的向量 u = (u1,u 2 , L , u n ) 称为支付向支付向 i(= 1,2, L , n) 个分量表示博弈结束于Z时,局中量,它的第人i所得的支付.支付可表示参与人的某种收益或损失.本书中的支付指收益,效用,利润等.正式地,支付向量是终点集合Z到n维向量集合R n 的映射.

U : Z → R n , U ( z ) = (u1 ( z ),u 2 ( z ), L , u n ( z )), z ∈ Z

第1章博弈论基本模型

5. 信息集与信息集分割信息集由同一个局中人,在相同的时点上的具有相同信息的决策节点组成.用 I ik (i = 0,1,2, L , n, k = 0,1,2, L , ri )表示局中人i的第k个信息集.它满足 I (1) ik ≠ Φ ( Φ 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能

选择的行动集合都相同(因为局中人在同一信息集的不同节点上具有相同的信息). 在博弈树上,将属于同一信息集的节点用虚线框在一起. 称 I i = {I i1 , I i 2 , L,I ir } 为局中人 i(= 0,1,2, L , n) 的信息集类信息集类(在数信息集类学上,称以集合为元素的集合为类). 称 I = {I 0 , I 1 , I 2 , L,I n } 为信息集分割信息集分割. 信息集分割i

第1章博弈论基本模型

有限扩展型博弈模型的定义定义1.1 称 G = N, Y, U, I, q 为有限扩展型博弈模型.其中N为参与有限扩展型博弈模型. 定义有限扩展型博弈模型人集合,Y为博弈树,U为支付向量,I为信息集分割,q为外生事件的概率分布. 完全信息博弈与不完全信息博弈如果所有的局中人对构成G的元素N,Y,U,I,q都完全了解,称G为完全完全信息博弈,否则为不完全信息博弈不完全信息博弈. 信息博弈不完全信息博弈静态博弈与动态博弈如果所有的局中人都同时选择行动,称G为静态博弈静态博弈,否则,称G为静态博弈动态博弈.静态博弈动态博弈静态博弈更本质的特征是所有局中人在选择行动时不知道静态博弈对手选择了什么行动.

第1章博弈论基本模型

例1.1 考虑按以下步骤进行的博弈活动. 第1步局中人1从字母T,H中选一个; 第2步局中人2不知第1步的选择,再从H,T中选一字母; 第3步局中人知道1,2两步的选择,又从T,H中选一字母; 第4步局中人2不知第3步的选择,但知1,2两步的选择,最后从T,H中选一字母,博弈结束.按照每步选择的结果,每个局中人各得一笔报酬(略). 该博弈的局中人集合 N = {1,2.} 该博弈的信息集合分别为I = {I1 , I 2 } ,其中 I1 = {I11 , I12 , I13,I14 , I15 }, I 2 = {I 21 , I 22 , I 23,I 24 , I 25 } .T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①

I11H ② T H ① I15 T ② H T ② I 25 H T H ② H

I 21

I13H T ② T H ② T

① I14 H

I 23

I 24H T

图1-2

第1章博弈论基本模型

信息集可以告诉我们以下4点信息集可以告诉我们以下点 1.在一个信息集上应由哪个参与人选择行动. 2.从一个信息集出发,局中人可能选择哪些行动. 3.局中人在一个信息集上选择行动时已知道了哪些信息. 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息集的博弈历程. 完美信息博弈如果G的每个信息集都是单点信息集.表明博弈的每个参与人在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈完美信息博弈. 完美信息博弈扩展型博弈不仅能刻画动态博弈, 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈

第1章博弈论基本模型

静态扩展型博弈的例子例1.2 两个参与人同时从字母T,H中选择一个,博弈结束时两个参与人各得一笔支付,该博弈的博弈树如图1-3所示. 练习:写出剪刀-石头-布的博弈树.T ② T H 图1-3 ①

I11H ② T H

I 21

囚徒困境问题: 囚

徒困境问题:p11 例1.6 完全信息: 完全信息:博弈各方对各个节点的支付都很明了. 支付都很明了. 完美信息: 完美信息:博弈各方对博弈进行的路径都很明了,完美信息这一概念只用径都很明了, 于动态博弈. 于动态博弈.

① I11坦白抗拒

②坦白抗拒

I 21坦白

②抗拒

5 5

0 8

8 0

1 1

图1-4

第1章博弈论基本模型

扩展型博弈的子博弈扩展型博弈的子博弈扩展型博弈的子博弈大体上说是原博弈的一部分,但它不能破坏原博弈的信息集. 定义1.2 设 G = N, Y, U, I, P 为一有限扩展型博弈,从Y的决定义策节点h出发的子博弈 G = N , Y , U , I , P 满足子博弈 (1)h是G的单点信息集; (2) N h N ; (3) Yh 是Y的子树,它由h及其后的所有节点与终点构成; (4)G h 不能割裂G的信息集; Nh Gh (5)若"自然"仍属于 ,则中"自然"的概率分布 P = P h ; U ( z) = U ( z) Ph (6)设Z为的终点,支付向量 .h h h h h h

第1章博弈论基本模型

1.2 有限扩展型博弈的策略策略的定义定义1.3 局中人 i = 1,2, L , n 的策略集合 S i 表示, 策略集合用定义策略集合 Si si 策略.它定义为局中中的元素称为局中人 i 的策略策略 Ai Ii 人i的信息集类到行动集 i 的映射:S i : I i → Ai , S i ( I ik ) = a i , a i ∈ Ai , i = 1,2, L , n, k = 1,2, L , ri

策略是信息集的映射,行动是映射值. 策略是信息集的映射,行动是映射值.两者是不同的概念.相当于策略是函数,行动是函数值. 同的概念.相当于策略是函数,行动是函数值.

第1章博弈论基本模型

例1.3 考虑图1-1所示的扩展型博弈的策略.(p7)旺盛

◎I11不进

I01疲软

①进 I 入② 21 容许

①进入② 容许

I22抵制

不进

S1 =

图1-1 市场进入博弈树

, 11 a 12 }

S 2 = {( x1 , x2 ) x1

= a 21,a 22 ,

= a 21,a 22 }

= {( a 21, a 21 ), ( a 21, a 22 ), ( a 22, a 21 ), ( a 22, a 22 )}

策略 (a 22 , a 21 ) 表明参与人2 在第1个信息集 I 21 上选择行动 , a 22 I 22 a 21 在第2个信息集上选择行动 .其余策略可同样理解.a11---进入;a12---不进入;a21---允许;,a22---抵制. x1---表示2在I21上选择的行动,可以是a21和a22; x2---是在I22上的选择.

第1章博弈论基本模型

例1.4 考虑例1.1所给出的扩展型博弈的策略.S1 = {( x1 , x 2 , x3,x 4 , x5 ) x = T, H, k = 1,2,3,4,5} k

S 2 = S1

例1.5 考虑例1.2给出的扩展型博弈的策略. 在静态博弈模型中,局中人策略与行动等在静态博弈模型中, 同.s1 = A1 = {T, H}, s 2 = A 2 = {T, H}

第1章博弈论基本模型

1.3 一般扩展型博弈模型构成一般扩展型博弈模型的要素 (1)一个有限的局中人集合:N = {0,1,2,L, N},其中"0"表示虚拟局中人—"自然",它以确定的概率分布进行随机选择. (2)一个满足下列三条性质的行动序列集合H. ①H中包含一个空序列,即 Φ ∈ H ; ②如果局中人的有限行动序列 (a k )K=1 ∈ H,则对正整数 L < K ,都有 k (a k )∞=1 ∈ H; k k ∞

③对于局中人的无限行动序列 ( a ) k =1 ,若对任何正整数 L 都 k ∞ L 有 (a k )k =1 ∈ H ,则 (a k )∞=1 ∈ H,否则 ( a ) k =1 H.称满足以上三条性质的行 k 动序列集合H为历史集历史集.称历史集中的元素 h ∈ H为博弈的一段历史一段历史. 历史集一段历史 k k +1 称一段历史 (a ) k =1 ∈ H为博弈的终点,如果它是无限的(k = ∞ )或不 k K 存在 a k +1 使 (a ) k =1 ∈ H.博弈全体终点构成集合记为 Z . (3)局中人映射 P : H \ Z → N, P(h ) = i, h ∈ H \ Z ,表示历史h之后应由局中人i 选择行动. (4)定义"自然"的行动集合上的概率分布为q.

本文来源：https://www.bwwdw.com/article/a0s4.html

相关文章：

正在阅读：

第1章博弈论基本模型05-17

中秋赏月作文350字06-21

砖题库：公务员考试时政热点：“放开二胎说”非官方口径10-12

上海经大学政治经济学专业01-23

《邓小平理论及“三个代表”重要思想概论》期末试题及答案E卷09-14

2021年社区党总支书记抓基层党建工作述职报告08-23

上一篇：高中数学教学论文——优化课堂教学设计,提高课堂教学效率论文下一篇：(人教版)北京市东城区(南片)2018-2019学年下学期初中八年级期末考试物理试卷

第1章 博弈论基本模型

第1章博弈论基本模型