工程博弈论课程作业5

更新时间:2024-06-21 09:46:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

工程博弈论

?1. 求下述博弈问题的纳什均衡解

Player2 U(p1) D(1-p1-p2) M(p2) Player1 L 1,3 2,4 4,1 R 4,2 2,1 1,3 解:

在Player2 的策略空间中,令p1=p2=1/2,D是在U,M的混合策略(1/2,1/2)意义下的严格劣势策略,故可以直接在策略空间中删除。得到下表:

Player1 L(q) R(1-q) Player2 1,3 4,2 U(p) 4,1 1,3 M(1-p) 通过划线法可以知道上述博弈不存在纯策略纳什均衡,但一定存在混合策略

纳什均衡。

Player2的payoff为:

?14??q?u2(p,q)??p1?p????1?q? 41??????????????????pq?4p(1?q)?4q(1?p)?(1?p)(1?q)(1)

Player1的payoff为:

?32??q?u1(p,q)??p1?p????? ?13??1?q????????????????3pq?2p(1?q)?q(1?p)?3(1?p)(1?q)(2)

对应的BR为:

?u2(p,q)1?q?4(1?q)?4q?(1?q)?q?4?8q?1?q?0?q??p2 (3)

?u1(p,q)2BR1??3p?2p?(1?p)?3(1?p)?0?p??q3BR2?综上,混合策略纳什均衡时Player1的策略为(2/3,0,1/3),Player2的策略为(1/2,1/2)

? 2. 100名海盗的钱混到一起无法分辨。他们的首领(不属于这100人中)提

出:每个人将自己的钱数写在一张纸上,如果填写的数额综合不大于实际钱

的总数,则每个人获得自己写的钱数,如果数额总和大于了实际钱的总数, 则首领则没收这笔钱。试着分析这一博弈问题的均衡,你觉得最可能出现的 结果是什么

解:

海盗分钱问题的纳什均衡很自然的会想到是填写自己实际的钱的数目。如果对方都采用了该策略,其中一方如果填写小于实际钱数所获得的收益显然小于填写实际钱数的收益,如果填写超过实际钱数的金额,将会一无所获。显然在纳什均衡下各方都无法通过单一改变己方策略来获取更高的收益;所以大家都会选择填写自己的实际钱数,这也是纳什均衡的一致预见性在起作用。

? 3. 甲乙两个彩电厂商生产的电视有A、B两种制式,假设同时采用A制式,甲 有1单位收益,乙有3单位收益,同时采用B制式,则二者都有2单位收益,制式不同则大家都没有好处。试分析这一博弈问题的均衡及其含义

甲 制式 之争 A(p) B(1-p) 乙 A(q) 1,3 0,0 B(1-q) 0,0 2,2 解:

可以依题意写出博弈双方的支付矩阵如表所示,通过划线法可以得知有两个纯策略纳什均衡点(A,A)和(B,B)。很明显甲乙双方对于这两个均衡点有着不同的偏好,甲更倾向于(B,B)这个均衡点,而乙方更加倾向于(A,A)。下面来求解混合策略纳什均衡,仍然可以按照第1题的解题思路进行,现采用另一种思路:

实际上,这个问题就是经典“夫妻之争”问题,现在设甲方选取A机制的概率为p,选取B机制的概率为1-p,甲方不希望乙方利用自己的选择倾向占上风,所以希望使得乙方选择两种不同策略时的期望收益相同

3p?(1?p)?0?p?0?(1?p)?2?p?0.4 (4)

同理,可以设乙方选取A机制的概率为q,选取B机制的概率为1-q,乙方不希望甲方利用自己的选择倾向占上风,希望使得甲方选择两种不同策略时的期望收益相同

q?(1?q)?0?q?0?(1?q)?2?q?2/3 (5)

所以甲方以概率分布(0.4,0.6)选择A和B两种制式,乙方会以概率分布(2/3,1/3)选择A和B两种制式。在该混合策略纳什均衡下,甲方的收益为0.664,乙方的收益为1.296。

混合策略纳什均衡下的收益低于任意一个纯策略纳什均衡的结果,这就是没有充分沟通带来的负面影响,如果其中的一个厂商做出适当的让步,双方的收益都将会进一步提高。

?4.举出一个电力系统中(或自己专业方向上)的一个二人零和博弈的例子,建立其博弈模型

(TPZ在通信物理层安全中的应用实例)

图 1 中继系统模型示意

考虑 TDD 系统中一个源节点(Alice),一个中继(Relay),一个终端( Bob)和一个干扰者(Eve)组成的无线通信网络模型。中继在本模型中为可信中继,作用是协作源节点一起抵抗 Eve 的恶意行为并提高系统的保密传输速率。其可以帮助源节点转发信号(使用 DF 表示),也能够对 Eve 进行干扰(使用 RJ 表示);Eve 可以对通信信号进行窃听(使用 E表示),也可以对终端或中继进行干扰(使用 J 表示)。中继和 Eve 的目标是对立的,两者不可能存在共赢关系,因此建模为零和博弈,即严格竞争的博弈。

定义本博弈中的系统收益为源节点到终端的保密速率uSys?Rs,中继的收益为通信链路的传输速率uRelay?RS?R?B,Eve 的收益为使通信链路传输速率降低的值uEve??RS?R?B,则系统可达的安全收益为:uSys?uRelay?uEve

中继可以选择译码转发的行为和帮助源节点的协作干扰行为,定义中继的策略空间为X,策略x?X为转发和协助干扰,分别简记为 DF 和 RJ;Eve 能够采取的策略为窃听或者干扰,定义 Eve 的策略空间为 Y,策略y?Y简记为 E 和 J。(x,y)?X?Y称为局势。

需求出

??maxuRelay?maxuRelay(x|y) ?maxu?maxu(y|x)?EveRelay?(6)

从而找到系统的可达收益:

uSys?uSys(x*,y*)

(7)

?6. 写出下述二人零和博弈的对偶线性规划模型

3 -1 2 解:

0 1 -2 2 0 1 由于原来的支付矩阵A中有小于零的元素,为了利用对偶线性规划模型求

''解博弈的解,构造支付矩阵A'?(aij),其中aij?aij?c,令c?2;

?524?? A'??132????403??(8)

设参与人1和参与人2的混合战略分别是?1?(v'p1,v'p2,v'p3)和

?2?(v'q1,v'q2,v'q3),v为原博弈的值,v为新博弈的值,且v=v+2,利用对偶线

性规划求解方法求解新战略式博弈的Nash均衡,构造对偶线性规划问题如下:

??????????min?pii?13''?????????max?qii?13s.t.??5p1?p2?4p3?1??????2p1?3p2?1??????4p1?2p2?3p3?1s.t.??5q1?2q2?4q3?1???????q1?3q2?2q3?1???????????????q1?3q3?1?????p1?0,p2?0,p3?0??????q1?0,q2?0,q3?0 ???????? (9)

通过求解对偶问题,得到p1?衡时的收益为:v'?1?i2314,p2?,p3?0,q1?,q2?,q3?0,纳什均13131313?pi?1313313'?2?,故该博,则原问题的收益为v?v?c?5552314,,0),(,,0)。 13131313弈存在一个混合策略纳什均衡(

本文来源:https://www.bwwdw.com/article/tci3.html

Top