博弈论_纳什均衡

更新时间:2023-09-07 00:35:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

博弈论_纳什均衡

湖南科技大学商学院 2009-2010学年秋季学期李宾

完全信息静态博弈非合作博弈与合作博弈个人理性 vs团体理性

完全信息博弈每个局中人的策略集和支付函数都是共同知识

静态博弈每个局中人同时独立地采取自己的策略,且只进行一次。石头、剪刀、布

先讨论完全信息静态博弈最为简单的博弈类型;博弈研究的基础

智猪博弈环境:猪圈的一边有一个食槽,另一边有一个食料输送按钮。按下按钮、再走到食槽边,要耗费2个单位。食物进料8个单位。大猪先到,可吃7个单位小猪先到,可吃4个单位两猪同时到,大猪吃5个单位,小猪吃3个单位。小猪按按大猪等待 (7, -1) (0, 0) (3, 1)等待 (2. 4)

夫妻爱好问题一对夫妻协商业余活动有两个选择看足球比赛看芭蕾演出

妻子看足球看足球看芭蕾 (-1, -1)

更偏好在一起。若分开,各自的收益均为-1两人将分别采取什么策略?各自的收益是多少?丈夫

(2, 1)

看芭 (-1, -1)蕾

(1, 2)

猜钱币游戏一枚硬币,正面朝上还是反面朝上一人盖住,让另一人猜若猜对,则猜的人+1分,盖的人-1分若猜错,则猜的人-1分,盖的人+1分。两人分别采取什么样的策略?各自的收益是多少?盖硬币的人正面反面

猜正面 (1, -1) (-1, 1)硬币的反面 (-1, 1) (1, -1)人

符号表述这些例子都属于完全信息下的静态博弈三个基本要素都是共同知识每个局中人都是在明确这三个基本要素的前提下,选择自己的行动策略,以谋求自己收益的最大化

局中人集合:N={1, 2,···, n}策略集:Si={si}={s1(i), s2(i),···, sm(i)}, i∈N策略组合:s= (s1, s2,···, sn), si∈Si, i∈ N支付函数:Pi(s)是策略组合s的函数。最大化Pi在G=[N,{Si},{Pi}]中研究局中人对策略的选择

占优的定义在博弈G=[N,{Si},{Pi}]中,若 sk(i)和 sh(i),是局中人i的两个策略,对任意的策略组合s,都有: Pi(sk(i),s-i )> Pi(sh(i),s-i ),s-i∈S-i则称局中人的策略 sk(i)严格占优策略 sh(i),或者称策略 sh(i)相对于 sk(i)是严格劣策略。 s-i= (s1, s2,···, si-1, si+1,···, sn)当某个局中人的一个策略占优于另一个策略时,其它局中人的策略选择没有影响力。若>号变为≥号,则成为弱占优,或弱劣策略

占优均衡的定义对于局中人i,若存在一个策略 sk(i),使得该局中人的任何其它策略 sh(i)(h≠k),都有 Pi(sk(i),s-i )> Pi(sh(i),s-i ),s-i∈S-i,则称策略 sk(i)为局中人i的占优策略。在博弈G=[N,{Si},{Pi}]中,如果每一个局中人i都存在一个占优策略si*,则策略组合s*= (s1*, s2*,···, sn*)称为占优策略均衡 (dominant-strategy equilibrium

),简称为占优均衡。对应的支付称为占优均衡结果。

占优均衡的例子:囚徒困境嫌疑犯B承认承认嫌疑犯A不承认 (-10,0) (-1,-1) (-8,-8)不承认 (0,-10)

重复剔除占优均衡重复剔出严格劣策略过程由于局中人不会选择自己策略集Si中的严格劣策略,所以如果存在这样的严格劣策略,那么可把它从策略集中删除掉,形成的新的策略集Si’,进而形成新的博弈G’。在博弈G’中,任何局中人对策略的选择,将与G中的策略选择相同。这一过程可以一直进行下去

重复剔出严格劣策略可使得博弈中局中人的策略集变小,使得博弈分析变得简单。特别地,若经过重复剔出,所有局中人只剩下一个策略

重复剔除占优均衡那么,由所有局中人仅剩的策略所组成的策略组合,称为博弈G的重复剔除占优均衡。对应的支付结果,称为重复剔除占优均衡结果。例子:智猪博弈占优均衡一定是重复剔除占优均衡,但反过来不一定成立。例子:囚徒困境与智猪博弈在实际问题中总是希望可以重复剔出严格劣策略,但并不总是有效。例:夫妻爱好、猜钱币

重复剔出严格劣策略的例子局中人2左上局中人1中下 (4, 3) (2, 1) (3, 0)中 (5, 1) (8, 4) (9, 6)右 (6, 2) (3, 6) (2, 8)

不是重复剔除占优均衡的例子局中人2左上局中人1中下 (4, 3) (2, 1) (5, 0)中 (5, 1) (8, 4) (9, 6)右 (6, 2) (3, 6) (2, 8)

纯策略纳什均衡对于有些博弈问题,可以使用重复删除的严格劣策略的方法,得到重复剔除的占优均衡,从而回答了局中人关于策略选择的问题。但在很多博弈中,这一方法并不适用。例如夫妻爱好问题。更一般的解,需要用到纳什均衡。定义:纯策略纳什均衡点;Pi(s*)为均衡结果当局中人选定的策略组成纳什均衡后,形成一个平衡局面。任何一方单方面地改变自己的策略,只可能使自己的收益下降(或不变),而不会增加。

对纳什均衡的理解纳什均衡是所有参与人最优策略的组合:给定该策略中别人的选择,没有人有积极性改变自己的选择假设博弈中的所有参与人事先达成一项协议,规定出每个人的行为规则,那么,在没有外在强制力的约束时,参与方是否会自觉地遵守这个协议,或者说这个协议是否是自动实施的(self-enforcing)?给定别人遵守协议,没有人有积极性偏离协议。如果一个协议不构成纳什均衡,它不可能自动实施,因为至少有一个参与方会违背这个协议;不满足纳什均衡要求的协议是没有意义的。

双矩阵博弈的划线法双矩阵博弈的定义支付函数aij、bij,(A,B)双矩阵博弈的表示方式在双矩阵博弈中,寻求纯策

略纳什均衡的方法——划线法给定局中人1的策略为i,局中人2根据bij选择,划线给定局中人2的策略为j,局中人1根据aij选择,划线两个元素下面都有划线的,即为纯策略纳什均衡点定理2.2.2;例2.2.1,例2.1.2,例2.1.3

用划线法求解智猪博弈环境:猪圈的一边有一个食槽,另一边有一个食料输送按钮。按下按钮、再走到食槽边,要耗费2个单位。食物进料8个单位。大猪先到,可吃7个单位小猪先到,可吃4个单位两猪同时到,大猪吃5个单位,小猪吃3个单位。小猪按按大猪等待 (7, -1) (0, 0)等待

(3, 1)

(2. 4)

用划线法求解夫妻爱好问题一对夫妻协商业余活动有两个选择看足球比赛看芭蕾演出

妻子看足球看足球看芭蕾 (-1, -1)

更偏好在一起。若分开,各自的收益均为-1两人将分别采取什么策略?各自的收益是多少?丈夫

(2, 1)

看芭 (-1, -1)蕾

(1, 2)

用划线法求解猜钱币游戏一枚硬币,正面朝上还是反面朝上一人盖住,让另一人猜若猜对,则猜的人+1分,盖的人-1分若猜错,则猜的人-1分,盖的人+1分。两人分别采取什么样的策略?各自的收益是多少?盖硬币的人正面猜硬币的人反面

正面 (1, -1) (-1, 1)反面 (-1, 1) (1, -1)

用划线法求解双矩阵博弈把一人的某策略当作s-i,判断另一人的策略选择局中人B左中右

上局中人 A下

(1, 2) (0, 4)

(1, 3) (0, 2)

(0, 2) (2, 0)

求解广告博弈的纳什均衡两个企业生产和销售同一种产品每个企业都有“打广告”和“不打广告”两个选择两家都打广告,会导致恶性竞争,利润反而比不上不打广告的情形若一家打广告、另一家不打,则打广告的高纳什均衡是什么?企业2打广告企业 1打广告不打广告

(4, 4) (15, 1)

不打 (1, 15) (10, 10)广告

求解工作博弈的纳什均衡两个人合作做事情每个人都有“努力工作”和“偷懒”两个选择两人收益分配结果如右图所示;有点类似于智猪博弈纳什均衡是什么?此例类似早年的“大锅饭”工人2努力工作工人 1努力工作偷懒 (6, 6) (8, 0)偷懒

(0, 8) (2, 2)

用划线法求解纳什均衡(提问)局中人B左上局中人A中下 (10, 4) (9, 9) (1, 98)中 (1, 5) (0, 3) (0, 100)右 (98, 4) (99, 8) (100, 98)

用划线法求解纳什均衡(提问)局中人2左上局中人 1下 (0, 0) (1, 2) (1, 2)中右

(1, 1)

(1, 1)

(0, 0)

多重性与存在性的例子妻子夫妻爱好问题看足球看芭蕾猜钱币游戏正面猜硬币的人反面盖硬币的人

丈夫

看足球

(2, 1)

(-1, -1)

正面 (1, -1) (-1, 1)反面 (-1, 1) (1, -1)

看芭 (-1, -1)蕾

(1, 2)

纳什均衡点与其它两个概念的区别定理2.2.1:重

复剔除的占优均衡与纳什均衡证明:从定义出发,用反证法。适于熟悉定义纳什均衡点与多目标规划问题的区别博弈是参与者之间有相互影响的多人决策问题一个替代的思路:多目标规划问题纳什均衡点和多目标规划问题的求解是不同的概念囚徒困境的策略集、支付函数;收益用图表示 B、C、D三点是非劣解,A点为劣解多目标规划有联合行动的意向,而G为个人竞争

弱占优的例子(一)剔出弱劣策略,有可能改变原博弈的一些特性对A,策略“下”弱占优策略“上”对B,策略“右”弱占优策略“左”但如果删除A的策略“上”,会删除掉潜在的其它纳什均衡,即改变了博弈的特性 B左上 A下 (1, 1) (2, 2)右

(1, 1) (1, 1)

弱占优的例子(二)“2中”弱占优“2左”和“2右”用弱占优去剔除,不同的顺序会导致不同的结果删“2左”,会有(下,中)、(下,右)的纳什均衡删“2右”,会有(上,左)、(上,右)的纳什均衡局中人2左局中人 1上下 (1, 1) (0, 0)中 (1, 1) (1, 2)右 (0, 0) (1, 2)

颤抖的手重复剔除的占优均衡对人的理性要求很高相互知道对方是绝对理性的。每个局中人都对对手有充分的信念一个看起来可信的结果,在现实中不一定成立。(上,左)→ (下,左) 2在选左时手颤抖了一下局中人2左右

局上 (8, 10) (-100,9)中人 1下 (7, 6) (6, 5)

第一次作业书:《博弈论及其应用》,汪贤裕、肖玉明第14页:第1.1题,第1.2题用策略式表述一个单次的“石头、剪刀、布”游戏。胜者赢1分,负者输1分,平局0分。然后设想一个行动方案,将此策略式博弈表述为一个扩展式博弈。第55页:第2.1题,第2.2题不用抄题目;直接写题号和解答。交作业的时间:9月29日(星期二)

三人博弈问题B C的策略:甲左右 C的策略:乙左右 B

上 0, 0, 10 -5, -5, 0 A下 -5, -5, 0 1, 1, -5 A

上 -2, -2, 0 -5, -5, 0下 -5, -5, 0 -1, -1, 5

三人博弈的划线法局中人C的支付结果写在支付向量第3个位置局中人集合 N={A, B, C}策略集集合SA={上,下}, SB={左,右}, SC={甲,乙}

策略组合的例子:s= (下,左,乙)提问:P2(s)=?,P3(s)=?策略组合的例子:s= (上,右,甲)提问:P1(s)=?,P3(s)=?

三人博弈的划线法s-A= (左,甲), (左,乙)给定某个s-A,看A的最优反应是什么?把s-A全部走完,在A的最优支付结果下划线

s-B=?给定某个s-B,看B的最优反应是什么?把s-B全部走完,在B的最优支付结果下划线

s-C=?给定某个s-C,看C的最优反应是什么?把s-C全部走完,在C的最优支付结果下划线

无限策略博弈的求解思

路回顾两个概念:有限博弈与无穷博弈完全信息静态博弈G的三个要素;s-i的写法差别在于,策略集Si由无限多的策略组成,比如 Si=[0,+∞)如何求解无穷策略博弈?思路:寻找每个人的最优反应函数;求解最优反应函数方程组。对谁的反应?自变量:s-i;因变量:si∈Si。划线法是在有限策略集合里寻找最优反应函数

无限策略博弈的求解步骤第一步:写出支付函数Pi(si, s-i)第二步:判断Pi(si, s-i)是否关于si拟凹?定义:拟凹函数;严格拟凹函数对拟凹函数的直观认识;正例与反例通常遇到的是凹函数(二阶导数为负);是凹函数,就一定严格拟凹。最优反应函数的定义第三步: Pi对si求偏导,相当于求极大值问题第四步:由n维方程组,求纯策略纳什均衡解

例:古诺模型两个寡头垄断厂商,厂商1和厂商2,生产同种产品。产量分别是q1和q2,注意它们是变量。边际成本分别为c1和c2,正常数,无固定成本该产品的市场反需求函数:p= a - b(q1+ q2)参数 a> c1>0, a> c2>0,b>0市场需求情况和两个厂商的成本都为共同知识两厂商之间不协商;同时作出产量的决策目标:追求利润最大化。问:各自均衡产量?

古诺模型求解第一步该产品的市场反需求函数:p= a - b(q1+ q2)写出两个厂商的利润函数π1(q1, q2)= pq1 - c1q1=[a - b(q1+ q2)] q1– c1q1π2 (q1, q2)= pq2 - c2q2=[a - b(q1+ q2)] q2– c2q2

古诺模型的求解步骤第一步:写出两个厂商的利润函数第二步:判断利润函数是否关于产量为凹第三步:若为凹,求偏导,让其等于0(MR= MC),获得si对s-i的最优反应函数第四步:联立两个厂商的最优反应函数,求解出均衡产量(q1*,q2*),此即为纳什均衡解将均衡产量代入利润函数,可得纳什均衡结果一个厂商的最优产量不仅仅取决于自己

本文来源:https://www.bwwdw.com/article/2ach.html

Top