第四章贝叶斯决策分析

更新时间：2023-10-21 12:52:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

第四章骆驼祥子主要内容推荐度：
相关推荐

第四章贝叶斯决策分析

前面所讨论过的风险型决策，其基本方法是将状态变量视为随机变量，用先验状态分布表示状态变量的概率分布，用期望值准则计算方案的满意程度。由于先验状态分布与实际情况存在一定误差，为了提高决策质量，需要通过市场调查，收集有关状态变量的补充信息，对先验分布进行修正，用后验状态分布进行决策，这就是本章将要介绍的贝叶斯决策。

第一节贝叶斯决策的基本方法

一．贝叶斯决策的意义

在管理决策的实际过程中，往往有两种偏向。一是缺乏市场调查，对状态变量概率分布情况的掌握和分析还十分粗略，就匆忙进行决策分析，使得决策结果与市场现实的出入过大，造成决策失误；二是市场调查费用过高，收集的信息没有给企业带来应有的效益。

所以既要充分重视信息对决策的价值，同时也要注意信息自身的价值，少花钱多办事。只有将两者合理的结合起来，才能提高决策分析的科学性和效益性。如何将两者有机的结合也就是贝叶斯决策所要解决的问题。

在讨论贝叶斯决策方法之前，我们先来回顾在概率统计中学过的全概率公式和贝叶斯公式。

…………

1．离散情况：设有完备事件组{}，（j=1，2，，n），满足条件θi?θj=Ф（i，j=1，2，，

n；i ? j ），且为

P（H）=

，（P（?） > 0）（4-1） ?P（H|?）P（?）jjn??j?1nj=?，对任一随机事件H，其全概率公式和贝叶斯公式分别

jj?1P（H|?i）P（?i） P（θi|H）= P（H）P（H|?i）P（?i） =

?j?1n（i=1，2，，n；P（H）>0）（4-2） P（H|?）P（?），

jj。。。

2．连续情况：设随机变量θ的概率密度为p(θ),则对一随机变量τ，有

h（τ）= k（θ| τ）= =

??????（?|?）P（?）d? （4-3）

?（?|?）P（?）

h（?）?（?|?）P（?）??????（?|?）P（?）d? （h（τ）> 0）（4-4）

利用补充信息休整先验状态概率分布，这是贝叶斯决策的关键，下面是一个实例。【例4-1】某公司经营一种高科技产品，若市场畅销，可获利1万5千元；若市场滞销将亏损5千元。根据历年的市场销售资料，这产品畅销的概率为0.8，滞销的概率为0.2，为了准确的掌握该产品的市场销售情况，准备聘请某咨询公司进行市场调查和分析，该咨询公司对该产品畅销预测的准备率为0.95，滞销预测的准确率为0.90。试根据市场咨询分析结果，该公司经营该产品应如何决策？

解：设有两种方案，即经营方案（a1）,不经营方案（a2），该产品的市场销售也有两种状态，即畅销（θ1），滞销（θ2）。状态变量θ的先验分布为

P（θ1）=0.8，P（θ2）=0.2

根据题意，该公司的收益矩阵为

Q =（qij）2?2

= ???15000?5000?? ?0?0?于是，由风险型决策的期望结果值准则，

E（a1）=

?qj?1221j=15000 ?0.8 +（-5000）?0.2=11000（元） P（?j） E（a2）=

?qj?12j=0 P（?j）因此，按状态变量的先验分布进行决策，最满意的行动方案为a1，即由于

E（a1）>E（a2） a1 ? a2 故有 aopt =a1

这表示，不论市场状态是畅销或滞销，应该作出经营该产品的决策。

如果补充市场调查分析的信息，应该如何决策？根据市场预测的准确率，即在实际状态值θj(j=1,2)的条件下，预测值Hi（i=1,2）的条件概率P（Hi|θj）。这里预测值H1表示预测市场畅销，H2表示预测市场滞销，据题意，有

P（H1|θ1）=0.95 P（H2|θ1）=0.05 P（H1|θ2）=0.10 P（H2|θ2）=0.90

市场预测的准确率可以表示为矩阵

P（Hi|θ1） P（Hi|θ2）

H1H2 ???0.950.10?? ??0.050.90?由全概率公式（4-1），咨询公司预测该产品的畅销和滞销概率分别为

P（H1）=

?P（Hj?1221=0.95 ?0.8 + 0.10 ?0.2 = 0.78 |?j）P（?j） P（H2）=

?P（Hj?12= 0.05 ?0.8 + 0.90 ?0.2 = 0.22 |?j）P（?j）68

由贝叶斯公式（4-2），可得

P（θ1|H1）=

P（H1|?1）P（?1）0.95?0.8==0.9744

0.78P（H1）P（H1|?2）P（?2）0.10?0.2==0.0256

0.78P（H1）P（H2|?1）P（?1）0.05?0.8==0.1818

0.22P（H2）P（H2|?2）P（?2）0.90?0.2==0.8182

0.22P（H2） P（θ2|H1）=

P（θ1|H2）=

P（θ2|H2）=

用补充信息（市场预测）对状态变量（畅销或滞销）的先验分布进行修正，得到的状态变量的概率分布称为后验分布，后验分布表示为矩阵，称为后验分布矩阵，即

P（θ1|H i） P（θ2| Hi）

?0.97440.0256? ??0.1818 0.8182?? H2??当市场预测为畅销时，即事件H1发生，用P（θ1|H1），P（θ2|H1）代替P（θ1），P（θ2），再

计算方案a1，a2的期望收益值

E（a1|H1）=

H1?P（?j?12j|H1）q1j

= 0.9744 ?15000 – 0.0256 ?5000 =14487.2（元） E（a2|H1）=

?P（?j?12j|H1）q2j=0（元）

于是，a（H1）=a1，表示当预测值H1发生时，最满意方案为经营该产品。当市场预测为滞销时，即事件H2发生，用P（θ1|H1），P（θ2|H1）代替P（θ1），P（θ2），计算方案a1，a2的期望收益值，即

E（a1|H2）=

?P（?j?12j|H2）q1j

=0.1818 ? 15000 – 0.8182 ? 5000 = -1364元

E（a2|H2）=

?P（?j?12j|H2）q2j

= 0元

此时，a（H2）=a2，表示预测为H2时，最满意方案为不经营该产品。

从例1我们可以看出，贝叶斯决策就是通过市场调查分析获取补充信息，利用补充信息修正状态变量的先验分布，依据风险型决策的期望值准则，用后验分布替代先验分布，使得更符合实际情况，从而作出决策，找到最满意方案，提高决策的科学性和效益性。

二．贝叶斯决策的基本方法

设风险型决策问题（Ω，A，F）的状态变量为θ，通过市场调查分析所获取的补充信息，用已发生的随机事件H或已取值的随机变量τ表示，称H或τ为信息值。信息值的可靠程度用在θ的条件下，信息值H的条件分布P（H|θ）表示，在离散的情况下，θ取n个值θj（j=1,2,….,n）,H取m个值Hi(i=1,2,….,m),则条件分布矩阵

?P（H1|?1）P（H1|?2）??P（H2|?1）P（H2|?2）?????P（H|?）P（H|?）?m1m2?P（H1|?n）?P（H2|?n）

???P（Hm|?n）???? ???

称为贝叶斯决策的似然分布矩阵，它完整的描述了在不同状态值θj的条件下，信息值Hi 的可靠程度。贝叶斯决策基本方法是，利用市场调查获取的补充信息值H或τ，去修正状态变量θ的先验分布。经过修正的状态变量θ的分布，称为后验分布，后验分布能够更准确的表示状态变量实际的分布情况，再利用后验分布对风险性决策问题（Ω，A，F）作出决策分析，并测算信息的价值和比较信息的成本，从而提高决策的科学性和效益性。贝叶斯决策的关键，在于依据似然分布用贝叶斯公式求出后验分布。贝叶斯决策的基本步骤如下：

1．验前分析：依据时常历年的统计数据和资料，决策分析人员按照自身的经验和判断，

应用状态分析方法测算和估计状态变量的先验分布，并计算各可行方案在不同自然状态下的条件结果值。利用这些信息，根据某种决策准则，对各可行方案进行评价和选择，找出最满意方案，称之为验前分析。由于依据先验分布进行决策，故称为验前分析。如果客观条件限制，例如时间，人力，物力和财力等条件限制，不可能更充分的进行市场调查收集信息，决策分析人员仅能完成验前分析这一步骤。 2．预验分析：如果决策问题十分重要，而且各条件允许，应该考虑是否进行市场调查

和补充收集新信息，决策分析人员要对补充信息可能给企业带来的效益和所花费的成本进行权衡分析，如果信息的价值高于信息的成本，则应当补充信息，反之则补充信息大可不必。这种比较分析补充信息的价值和成本的过程，称为预验分析，如果获得补充信息的费用很小，本步骤可以省略，直接进行调查和收集信息。

3．验后分析：经过前两个步骤，决策分析人员作出补充信息的决定，并通过市场调查

和分析补充信息，为验后分析做准备，验后分析的关键是利用补充信息修正先验分布，得到更加符合市场实际的后验分布。再利用后验分布进行决策分析，选出最满意的可行方案，并对信息的价值和成本做对比分析，对决策分析的经济效益情况做出合理的说明，验后分析和预验分析一样，都是通过贝叶斯公式修正先验分布，两者不同之处在于，预验分布是依据可能的调查结果，侧重于判断是否补充信息，验后分析是根据实际调查结果，侧重于选出最满意方案。

4．序贯分析：社会经济实际中的决策问题，情况都比较复杂，可适当的将决策分析全

过程划分为若干阶段，每一阶段都包括先验分析，预验分析和验后分析等步骤。这样多阶段相互连接，前阶段决策结果是后阶段决策的条件，形成决策分析全过程，称之为序贯决策。

下面通过实例来说明该基本方法。

【例4-2】为开发某种新产品，某企业需要更新设备，有三种方案可供选择，即引进大型设备（a1），引进中型设备（a2），引进小型设备（a3），市场对该新产品的需求状态也有三种，即需求量大（θ1），一般（θ2），小（θ3），根据市场预测，三种方案在三种不同的市场需求状态下，企业的效益用收益矩阵表示为

?5020?20? Q=（qij）3?3 =?3025?10

?101010???? ??其中，qij（i，j=1，2，3）表示方案aj在需求状态下θj下的收益值。根据历年资料，该产品各需求状态的概率分别为P（θ1）=0.3，P（θ2）=0.4，P（θ3）=0.3，为使新产品开发产销对路，该企业利用试销法做市场调查，在市场需求状态θj 的条件下，调查结果值Hi 的条件概率P（Hi|θj）如表4-1所示，H1,H2,H3分别表示需求量大，需求量一般，需求量小。试对该企业新产品开发方案进行决策。 P（Hj|θj） θj Hi H1 H1 H1 θ1 0.6 0.3 0.1 θ2 0.2 0.5 0.3 0.2 0.2 0.6 θ3 表4-1 解：

1．验前分析：

设本问题的收益矩阵为Q=（qij）3?3

验前状态概率向量 P=（p1，p2，p3）T =（0.3 ，0.4，0.3）T 行动方案向量 A=（a1，a2，a3）T 可得E（A）=QP=（17，16，10）T 因此 a1 >a2 >a3 所以 aopt=a1

即投资引进大型设备，且最大期望收益值E1=17（万元）

2．预验分析：

由全概率公式，分别求出各需求状态调查结果值Hi 的概率，即

P（H1）=

?P（Hj?131 |?j）P（?j） =0.3 ? 0.6 + 0.4 ?0.2 +0.3 ?0.2

=0.32

P（H2）=0.35 P（H3）=0.33 再由贝叶斯公式（4-2）及似然分布矩阵数据，分别计算

P（H1|?1）P（?1） P（θ1|H1）==0.56 P（H1）同理可得

P（θ2|H1）=0.25 P（θ3|H1）=0.19 P（θ1|H2）=0.26 P（θ2|H2）=0.57

P（θ3|H2）=0.17 P（θ1|H3）=0.09 P（θ2|H3）=0.36 P（θ3|H3）=0.55

于是当市场调查值H=H1时，用后验分布代替先验分布，计算各方案的期望收益值

3 E（a1|H1）=

?P（?j|H1）q1j

j?1 =0.56 ? 50 + 0.25 ? 20 + 0.19 ?（-20） =29.2

E（a2|H1）=21.5 E（a3|H1）=10

因此，最大期望收益值

E（aopt|H1）=max{ E（a1|H1），E（a2|H1），E（a3|H1）}

=E~1=29.2 当时常调查值H=H1时，最满意方案为a1 应当选择引进大型设备的投资方案同样，当市场调查值为H2时

3 E（a1|H2）=

?P（?j|H2）q1j =21

j?13E（a1|H1）=

?P（?j|H2）q2j =20.35

j?13E（a1|H1）=

?P（?j|H3）q3j =10

j?1因此，最大期望收益值

E（aopt|H2）=max{ E（a1|H2），E（a2|H2），E（a3|H2）}

=E~2=21

故仍应引进大型设备。

当市场调查值为H3时，用后验分布计算各方案的期望收益值

3 E（a1|H3）=

?P（?j|H3）q1j =0.7

j?13 E（a1|H3）=

?P（?j|H3）q2j =6.2

j?13 E（a1|H3）=

?P（?j|H3）q3j =10

j?1 72

最大期望收益值

E（aopt|H3）=max{ E（a1|H3），E（a2|H3），E（a3|H3）} =E3=10 故此时应该选择引进小型设备的投资方案该企业通过市场调查所得到的期望收益值 E2=

?EP（H）iii?13~~ =0.32 ? 29.2 + 0.35 ? 21 + 0.33 ? 10

=19.99（万元）

而该企业在验前分析中的最大期望收益值为E1=17，由此可见，通过市场调查，该企业的期望收益值增加了2.99万元，只要调查费用不超过2.99万元，那么进行调查行为就是有利可图的。

3．验后分析

验后分析是把调查信息和验前信息结合起来，修正状态变量的先验分布，得到后验分布，并以此计算在调查信息值发生的条件下，各可行方案的期望收益值，比较得到最满意的决策方法，这一计算过程在预验分析阶段已经完成。

综上所述，如果市场调查费用不超过2.99万，就应该进行市场调查，若超过，则不应做市场调查。若进行市场调查，如果调查结果为需求量大，则选择引进大型设备，可获得期望收益值29.2万，如果调查结果为需求量一般，仍然选择引进大型设备，可获得期望收益值21万，如果调查结果为需求量小，则选择引进小型设备，可获得期望收益值10万。

第二节贝叶斯决策信息的价值

从上面的例子可以看出，信息本身既有成本，也有价值。如何测算信息的价值也是本节将要讨论的问题。

一．完全信息的价值（EVPI）

通常，将能够提供状态向量真实情况的补充信息称为完全信息。掌握了完全信息，风险决策就转化为确定型决策，这对于解决决策问题无疑是有益的。例如，在例4-1中，若将状态θj （j =1，2）发生时H1的条件概率改为

P（H1 |θ1）=0.95 ， P（H1 |θ2）=0 则可以计算信息值H1发生时的后验概率，可发现 P（θ1 | H1）=1 P（θ2 | H1）=0

这表示，当预测市场畅销时，该产品实际进入市场必定畅销，预测值H1是完全信息值，该公司按此信息值决策，经营该产品则无任何风险。

1．完全信息的意义

设H1为补充信息值，若存在状态值θ0，使得条件概率 P（θ0 | Hi）=1

或者当状态不为θ0时，总有

P（θ | Hi）=0

则称信息值Hi 为完全信息值

设决策问题的收益函数为Q=Q（a，θ），其中a 为行动方案，θ为状态变量。Hi 为完全信息值，掌握了Hi的最满意方案为a（Hi），其收益值为Q（a（Hi），θ）=maxQ（a，θ），验前

a最满意方案aopt的收益值为Q（aopt，θ），掌握了完全信息值Hi前后收益值的增加量

max Q（a，θ）- Q（aopt，θ）（4-5）

a称为在状态变量为θ时的完全信息值Hi的价值。

例如，在例4-1中，若P（θ2 | H2）=1，则H2是完全信息值，公司掌握了完全信息值H2，最满意方案为a2，即不经营该产品，a（H2）=a2。由于先验最满意方案为a1，Q（aopt，θ2）=-5000，于是

Q（a（H2），θ2）- Q（aopt，θ2）=maxQ（a，θ2）- Q（aopt，θ2）

a =0-(-5000)=5000元

因此，在θ=θ2时，完全信息值H2的价值为5000元。

如果补充信息值Hi对每一个状态值θ都是完全信息值，则完全信息值Hi对状态值θ的期望收益值称为完全信息价值的期望值（Expected Value of Perfect Information），简称完全信息价值，记作EVPI。

2．完全信息价值的计算根据完全信息价值的意义，如果信息值H对每一状态值θ都是完全信息值，则信息值H的完全信息价值EVPI，可以用公式（5-5）对θ求数学期望得到，即

EVPI=E[maxQ（a，θ）- Q（aopt，θ）]

a = E[maxQ（a，θ）] – E[Q（aopt，θ）]

a （4-6）

其中E 表示对状态变量θ求数学期望。

公式（4-6）可以表示为两种形式。在离散情况时，可写成

EVPI=

?maxqj?11?i?mnijpj - E（aopt）（4-7）

其中，收益矩阵为Q=（qij）m×n，状态概率为P（θj）=pj（1，2，…..，n），E（aopt）表示验前最满意行动方案的期望收益值。在连续情况下，可写成

EVPI=

?????maxQ（a，?）?p（?）d? - E（aopt）（4-8）

a上面三个公式可以看出，完全信息价值EVPI，实质上是掌握完全信息与未掌握完全信

息时，决策者期望收益值的增加量。

【例4-3】试求例4-1中决策问题的完全信息价值。

解：该决策问题的收益函数为离散情况，完全信息价值用（4-7）式计算。由例4-1可知

E（aopt）=E（a1）=11000（元）收益矩阵为

Q=（qij）2?2= ???15000?5000?? ?0?0?在掌握了完全信息的条件下，当θ=θ1时，采取行动方案a1；当θ=θ2时，采取行动方案a2，

于是，掌握了完全信息的期望收益值 E[maxQ（a，θ）]=

a?maxqj?11?i?22ijpj

=15000 ? 0.8 + 0 ? 0.2 =12000（元）因此，完全信息价值 EVPI=

?maxqj?11?i?22ijpj - E（aopt）

=12000-11000 =1000（元）

【例4-4】试求例4-2中新产品开发问题的完全信息价值解：由例4-2可知

E（aopt）= E（a1）=17（万元）收益矩阵

?5020?20??? Q=（qij）3?3 =?3025?10?

?101010???于是

3?maxqj?11?i?3ijpj=50?0.3+25?0.4+10?0.3

=28（万元）

由公式4-7 ，可得 EVPI=

?maxqj?11?i?33ijpj - E（aopt）

=28-17=11 （万元）

二 .补充信息的价值（EVAI）

在贝叶斯决策的实际工作中，获取完全信息是困难的。在一般情况下，信息值Hi对状态值θ0来说，条件概率<1，信息值Hi并非完全信息。因此，需要讨论补充信息的价值及其计算。

1．补充信息价值的意义

设Hi （或τ）为补充信息值，决策者掌握了补充信息值Hi （或τ）前后期望收益值的增加量，或者掌握了补充信息值Hi （或τ）前后期望损失值的减少量，称为补充信息值Hi （或τ）的价值。全部补充信息值Hi （或τ）价值的期望制，称为补充信息价值的期望值，简称

补充信息价值，记作EVAI（Expected Value of Additional Information）。

例如，由例4-1知，对于补充信息值H1，即市场预测畅销，掌握了H1前后的最满意方案都是a1，于是掌握了补充信息前后期望收益值的增加量为0，即信息值H1的价值为0元，对于补充信息值H2，即市场预测滞销，掌握了H2前的最满意方案为a1，其期望收益值为

E（a1|H2）=-1364（元）

掌握了H2后的最满意方案为a2，其期望收益值

E（a2|H2）=0（元）

于是，掌握了H2前后期望收益值的增加量为

E（a2|H2）- E（a1|H2）=0-（-1364）=1364（元）因此，补充信息价值

EVAI=0 ? P（H1）+1364 ? P（H2） =0 ? 0.78+1364 ? 0.22=300元 2，补充信息价值的计算

补充信息价值的计算公式有三种形式，可以证明，这三种形式是等价的。 1）.按定义计算

EVAI=Eτ{Eθ|τ[Q（a（τ），θ）- Q（aopt，Q）]} （4-9）

其中，a（τ）表示在信息值τ下的最满意方案，Eθ|a 表示在信息值τ的条件下对状态值θ求期望，Eτ 表示对信息值τ求期望。

公式（4-9）可分为两种情况。在离散情况时，则为 EVAI=

?Q（a?{?[Q（a（H），?）ijij????opt，?j）]P（?j|Hi）}P（Hi）（4-10）

在连续情况下，则为 EVPI=

??? {?[Q（a（?），?）?Q（aopt，?）]k（?|?）d?}h（?）d? （4-11）

?? 式中，k（θ|τ）表示在信息值τ的条件下θ的条件密度函数，h（τ）表示信息值的密度函数。

2）.按期望收益值的增加值计算

EVAI=E?{EΘ|?[Q(a(τ),θ)]}-E(aopt) （4-12）它表示，补充信息价值等于掌握补充信息前后，最满意行动方案期望收益值的增加量。下面，以离散情况为例，由公式（4-9）推出公式（4-12），由公式（4-10）右边第二项

= =

?[?Q（aijopt ，?j）P（?j|Hi）]P（Hi）?[Q（ajopt，?j）P（Hi）] ?P（?j|Hi）i?[Q（ajopt，?j）P（?j）]

=EΘ[Q（aopt ，θ）]=E（aopt）即得公式（4-12）。

3）.按期望损失值的减少量计算

EVAI=E[R（aopt ，θ）-Eτ{Eθ|τ [R（a（τ），θ）]} （4-13）

公式（4-13）由损失函数形式给出，表示补充信息价值等于掌握补充信息前后，最满意行动

方案期望损失值的减少量。

下面由公式（4-12）推出（4-13）

EVSI={ E? [EΘ|?maxQ（a，θ）] –E[Q（aopt，θ）]}

a - { E? [EΘ|?maxQ（a，θ）] - E? [EΘ|?Q（a（τ），θ）]}

a = {E[maxQ（a，θ）] –E[Q（aopt，θ）]}

a - E?{ EΘ|?[maxQ（a，θ）- Q（a（τ），θ）]}

a = E[R（aopt ，θ）-Eτ{Eθ|τ [R（a（τ），θ）]} 通过一个实例来说明补充信息价值计算公式的应用。

【例4-5】试计算例4-1中咨询公司提供的补充信息价值。解：由公式（4-12），咨询公司提供的补充信息价值 EVAI=Eτ{EΘ|τ[Q（ a(τ),θ)]}-E(aopt) 并由上一节例1可知

E(aopt)=E(a1)=11000(元)

a(H1) =a1 ， a(H2) =a2

于是，

E?{EΘ|? [Q（a(τ),θ)]}

?{?Q（a（H），?）P（?iji?1j?122j |Hi）}P（Hi） = {?Q（a，?）P（?1jj?122j2j |H1）}P（H1） + {?Q（a，?）P（?j?1j |H2）}P（H2） =14487.2 ? 0.78 + 0 ? 0.22

=11300（元）因此，

EVAI=11300-11100=300（元）

三．补充信息价值与完全信息价值的关系

上面，我们介绍了完全信息和补充信息及其价值，这两者之间有什么关系？从它们的定义和计算公式不难证明，任何补充信息价值都是非负的，且不超过完全信息价值，即

EVPI ? EVAI ? 0 （4-14）事实上，由（4-13）可知

EVAI=E[R（aopt ，θ）-Eτ{Eθ|τ [R（a（τ），θ）]} 由4-6式，得

EVPI= E[maxQ（a，θ）] – E[Q（aopt，θ）]

a 77

=E[R（aopt，θ）]

于是，

EVAI=EVPI- Eτ{Eθ|τ [R（a（τ），θ）]} （4-15）

上式右边两项均非负，且第一项显然不小于第二项，因此，有 EVPI ? EVAI ? 0

（4-14）式告诉我们，信息价值对于管理决策具有普遍意义，任何补充信息不会降低决策方案的经济效益，完全信息是一类特殊的补充信息，它是最有价值的信息。同时，这也从理论上说明，信息工作是科学决策十分重要不可缺少的环节。

第三节. 抽样贝叶斯决策

由前知道，贝叶斯决策的关键是利用补充信息修正先验分布，使后验分布更加符合市场

实际，从而提高决策质量。那么，获取补充信息主要途径是什么？这是本节所要讨论的内容。在管理决策中，最常用获取补充信息的方法是抽样，用抽样方法修正先验分布的决策，称做抽样贝叶斯决策。

一. 抽样贝叶斯决策的基本方法

1.抽样贝叶斯决策的意义

设（ε1，ε2,....,εN）为来自决策总体ε的随机样本，为描述总体ε的性质，选择一个适当的统计量X，称为决策统计量。在状态变量θ固定的条件下，决策统计量X取值称为抽样信息值。利用抽样信息值作为补充信息值，去修正状态变量的先验分布，得到后验分布，再依据后验分布进行的贝叶斯决策，称为抽样贝叶斯决策。

2．抽样贝叶斯决策的步骤

抽样贝叶斯决策除了补充信息是靠抽样方法获取之外，其基本方法和步骤与一般贝叶斯决策相同，即按照验前分析，预验分析，验后分析和序贯分析四步骤进行。在多数情况下，抽样分布可以应用数理统计中的二项分布计算，根据不同条件，也可以应用泊松分布，正态分布等其它分布计算。

【例4-6】设某公司的一条生产线成批的生产某种零件，每批为800件。现将零件组装成仪器，根据过去的统计资料分析，零件的次品率及其相应的概率如表4-2。

表4-2 状态θj（次品率）概率P（θj） θ1=0.02 0.40 θ2=0.05 0.30 θ3=0.10 0.15 θ4=0.15 0.10 θ5=0.20 0.05 若组装成仪器调试时，发现次品零件则需要更换，每件更换的改装费为15元。若采取某种技术措施，可使每批零件的次品率降到最低为0.02，但每批要花费技术改造费500元，进行技术改造之后，采取抽样检验，抽取20个零件，发现一个次品。试对该公司是否应该采取技术改造措施作出决策分析。

解：先进行验前分析，设a1，a2分别表示不采取和采取技术措施，先验状态变量的概率向量为

P=（0.40，0.30，0.15，0.10，0.05）T 由题设给出的条件，方案a1在各状态下的收益值

。。。。

Q（a1，θj）=q1j=-15 ? 800θj ，（j=1，2，，5）

方案a2在各状态下的收益值

Q（a2，θj）=q2j =-15?800?0.02-500

=-740（j=1，2，，5）于是，收益矩阵

Q=（qij）2?5 =??相应的损失矩阵

。。。。

??240?600?1200?1800?2400?? ???740?740?740?740?740?046010601660??0? R=（rij）2?5 =?? ?500140000??方案a1，a2的期望损失值 E[R（a1，θ）]=

5?rj?151j=0 ? 0.4 + 0 ? 0.3 + 460 ? 0.15 P（?j） + 1060 ? 0.10 + 1660 ? 0.05 =258 E[R（a2，θ）]=

?rj?12j= 242 P（?j）因此，验前最满意行动方案aopt=a2，即采取技术措施。

再进行预验分析。利用二项分布计算抽样分布，设统计量X表示抽取20个零件中发现次品的个数，“X=1”表示抽取20个零件中发现一个次品，由数理统计知识计算条件概率。例如，当p（θ2）=0.05时，条件概率

P（X=1|θ2）=20?0.05?（0.95）19=0.3773 同样，可求出其余状态下的条件概率 P（X=1|θj），（j=1，3，4，5）

将上述结果代入后验概率计算表4-3的第（3）列，再计算各状态下的概率乘积 P（θj）P（X=1|θj），（j=1，2，3，4，5）

例如，P（θ2）P（X=1|θ2）=0.30*0.3773=0.11319，并将结果置于表4-3的第（4）列。于是，由全概率公式可得P（X=1）=0.27927

而后验概率

P（θj|X=1）= P（θj）P（X=1|θj）/P（X=1）求出所有状态下的后验概率，并置于第（5）列。

因此，方案a1和a2的期望损失值

Eθ|X=1[R（a1，θ）]=

?rj?151j P（?j|X?1） =0 ?0.3903 +0 ? 0.4053 + 460 ? 0.14509 +1060 ? 0.04899

+ 1660 ? 0.01031 = 135.79 Eθ|X=1[R（a2，θ）]=

?rj?152j P（?j|X?1） =251.89

由此可知，验后最满意方案a（H=1）=a1，即不采取技术措施，其结论与验前分析相反。表4-3

（1）次品率 θj 0.02 0.05 0.10 0.15 0.20 ? （2）验前概率 P（θj） 0.40 0.30 0.15 0.10 0.05 1.00 （3）条件概率 P（X=1|θj） 0.2725 0.3773 0.2701 0.1368 0.0577 —— （4）概率乘积（5）后验概率 P（θj）P（X=1|θj） P（θj|X=1） 0.10900 0.11319 0.04052 0.01368 0.00288 0.39030 0.40531 0.14509 0.04899 0.01031 P(X=1)=0.27927 1.00000 二．抽样信息的价值（EVSI）

用抽样方法得到的信息，其价值称为抽样信息价值（Expected Value of Sampling Information）,记为EVSI。

由补充信息价值计算公式，容易推出抽样信息价值的计算公式，也有三种形式： 1）EVSI= EX{Eθ|X[Q（a（X），θ）- Q（aopt，θ）]} （4-16）

其中，X表示抽样信息值，a（X）表示掌握了抽样信息值X后的最满意行动方案，公式表示抽样信息价值等于全部抽样信息值的价值的期望收益值，是按其定义进行计算的。

2） EVSI= EX{Eθ|X[Q（a（X），θ）]} - E（aopt）（4-17）

公式表示，抽样信息价值等于掌握了抽样信息前后期望收益值的增加量。 3） EVSI= E[R（aopt，θ）] - EX{Eθ|X[R（a（X），θ）]} （4-18）

公式表示，抽样信息价值等于掌握了抽样信息前后期望损失值的减少量。

下面，通过实例说明EVSI计算公式的应用。

【例4-7】试计算例4-6中技术改造决策问题的抽样信息价值。

解：由公式（4-18），根据前面例子的计算结果知，aopt=a2 ，于是， E[R（aopt，θ）]=E[R（a2，θ）]=242（元）

再计算公式4-18中等式右端的第二项，当X=1时，由前面例子计算结果可知，a（X=1）=a1，且

Eθ|X=1[R（a（X=1），θ）]= Eθ|X=1[R（a1，θ）]=135.79 用同样的方法，当抽样信息值X?1时，由

P（θj| X?1）=

P（?j）P（X?1|?j）P（X?1）

容易求出

P（θ1| X?1）=0.40376 ， P（θ2| X?1）=0.25920 P（θ3| X?1）=0.15191 ， P（θ4| X?1）=0.11977 P（θ5| X?1）=0.06537 于是，有

Eθ|X?1[R（a1，θ）] =305.35 Eθ|X?1[R（a2，θ）] =238.17 因此，a（X?1）=a2 ，而

Eθ|X?1[R（a（X?1），θ）]= Eθ|X?1[R（a2，θ）]=238.17

所以

EX{ Eθ|X[R（a（X），θ）]} = Eθ|X?1[R（a（X?1），θ）]P（X?1） + Eθ|X=1[R（a（X=1），θ）]P（X=1） =238.17 ? 0.72073 + 135.79 ? 0.27927 =209.58 所以，由公式（4-18），抽样信息价值

EVSI=E（R（aopt，θ））－EX{Eθ|X[R（a（X），θ）]} =240 – 209.58 = 32.42（元）三. 最佳样本容量

用抽样方法获取补充信息，提高了决策的效益。然而抽样需要支付费用，费用大小与样本容量有关，样本容量越大，抽样费用越高。如何确定样本容量的一个最佳值，既能提高决策的效益，又使支付费用尽量的小。，下面，将讨论抽样的规模问题。

1．抽样成本和抽样净收益

在抽样贝叶斯决策中，抽样所支付的费用称为抽样成本，记作CS，由于抽样成本是样本容量N的函数，抽样成本常记为CS（N）。

当N?0时，抽样成本CS（N）分为两部分，固定成本Cf和可变成本CvN，其中Cv

表示单位可变成本。于是，抽样成本

CS（N）=Cf + CvN ，（N?1）（4-19）同样，抽样信息价值也是样本容量N 的函数，记为EVSI（N），抽样信息价值与抽样成本之差，称为抽样净收益值（Expected Net Gain from Sampling），记做ENGS，由于抽样净收益值ENGS也是样本容量N的函数，故有

ENGS（N）=EVSI（N）-CS（N）（4-20）

抽样净收益值ENGS（N）是抽样贝叶斯决策的重要指标，以此确定抽样调查工作的必要性。当ENGS（N）>0时，抽样分析给决策带来正效益，应该进行抽样分析。反之，当ENGS（N）?0时，抽样分析给决策带来负效益，一般情况下，应否定抽样调查方案。当然，特殊情况应例外，例如社会公益性决策，以社会效益为主，经济效益从属第二位。

2．最佳样本容量当抽样净收益值ENGS（N）>0时，样本容量常有若干个，此时，应该选择使ENGS（N）取最大值的样本容量N，使ENGS（N）达到最大值的样本容量N 的非负整数，称为最佳样本容量，记作N，如果最佳样本容量N存在若干个，则取其最小的一个。

由于

ENGS（N）=EVSI（N）-CS（N）>0 于是，有

CS（N）

所以 CS（N）

Cf + CvN ? EVPI

则N < (EVPI-Cf)/ CV (4-21)

上式给出了样本容量N 的取值范围，在此范围内，找到有限个N值，分别计算相应的ENGS（N）值，并列表比较，从中找出最大值ENGS（N），从而求得最佳样本容量N

。

应该指出，当样本容量N变化范围较大时，求最佳样本容量N的计算量较大。在实际应用中，一般用计算机编程计算。另外，也可以用几何描点法寻求N近似解。先找出一些有代表性的N值，计算出响应的ENSI（N）和CS（N）值，并求出对应的ENGS（N）值，用描点法分别绘出相应曲线。在曲线ENGS（N）上，找出最大值所对应的样本容量，即最佳样本容量N的近似值。（见下图）

EVPI EVSI（N）

NCS（N） *ENGS（N）

第四节贝叶斯风险和贝叶斯原则

一．决策法则

在前面我们已经讨论了贝叶斯决策的基本方法。其基本思路是用补充信息修正先验分布，依据后验分布决策，选择最满意方案。当补充信息值确定后，通过适当的方法确定对应的最满意行动方案。这种过程，实际上就是一种补充信息值对应最满意行动方案的法则。一般地，从补充信息值τ（或H）的集合到行动方案a的集合的单值对应称为决策法则。记作

a=δ（τ）或 a=δ（H）

例如，在例4-1中，补充信息值集{H1，H2}到行动方案集{a1，a2}的对应法则共有22=4个，即

δ1（H）=a1 当H=H1 或H=H2

δ2（H）=??a1，当H?H1?a2，当H?H2

?a2，当H?H1 δ3（H）=?

a，当H?H2?1 δ4（H）=a2，当H=H1或H=H2

一般地，若某决策问题有m个行动方案，n个补充信息值，则决策法则共有m个。

在这m个法则中，通过某一原则，选出其中最佳者，称为最佳决策法则。二．贝叶斯风险

设决策法则δ（τ），对于状态变量θ的任一值。当补充信息值τ确定后，行动方案a=δ（τ）也就随之确定，则对应的损失值为R（δ（τ），θ）。显然，损失值越小，决策法则越优。为了给出一个评价决策法则δ优劣的标准，对任一状态变量值θ，取损失值R（δ（τ），θ）对所有补充信息值τ的数学期望，作为评价指标。在状态值θ下，损失值R（δ（τ），θ）对补充信息值τ的数学期望，称为决策法则δ的风险函数，记作

ρ（δ，θ）=Eτ|θ[R（δ（τ），θ）] （4-22）类似地，在抽样信息情况下，风险函数可以记为

ρ（δ，θ）=EX|θ[R（δ（X），θ）] （4-23）

这表示风险函数ρ（δ，θ）仍是在状态值θ下，决策法则δ对全部补充信息值的平均损失。

风险函数ρ（δ，θ）仍是状态变量θ的函数。一个最佳决策法则，应该对于所有状态值θ，其平均风险函数值最小。为此，引入贝叶斯风险的概念。

设决策法则δ，风险函数ρ（δ，θ）对状态θ的数学期望，称为决策法则δ的贝叶斯风险，记作

B（δ）=Eθ[ρ（δ，θ）] （4-24）应该指出，贝叶斯风险B（δ）是一个常数，表示决策法则δ，对一切补充信息值τ和状态值θ的平均损失值。

三．贝叶斯原则

以贝叶斯风险作为评价决策法则优劣的原则，称为贝叶斯原则。在贝叶斯原则下，贝叶斯风险最小的决策法则称为最佳决策法则。

下面，通过实例说明贝叶斯风险和贝叶斯原则。

【例4-8】在例4-1中，试求各决策法则的贝叶斯风险以及贝叶斯原则下的最佳决策法则。

解：如前所述，该问题有四个决策法则，即δk（H）（k=1，2，3，4），其损失矩阵

R=（rij）2?2=??n

5000??0? ??150000?并且，有

P（θ1）=0.8 P（θ2）=0.2 P（H1|θ1）=0.95 ， P（H1|θ1）=0.05 P（H1|θ2）=0.10 ， P（H2|θ2）=0.90 对于决策法则

δ1（H）=a1 当H=H1 或H=H2时风险函数

ρ（δ1，θ1） = EH|θ1[R（δ1（τ），θ1）]= EH|θ1 [R（a1，θ1）] =R（a1，θ1）P（H1|θ1）+ R（a1，θ1）P（H2|θ1） =0 ? 0.95+0 ? 0.05=0

ρ（δ1，θ2） = EH|θ2[R（δ1（τ），θ2）]= EH|θ2 [R（a1，θ2）]

=R（a1，θ2）P（H1|θ2）+ R（a1，θ2）P（H2|θ2） =5000 ? 0.10+5000 ? 0.90=5000

于是，由公式（4-24），则决策法则δ1的贝叶斯风险

B（δ1）=Eθ[ρ（δ1，θ）]

=ρ（δ1，θ1）P（θ1）+ρ（δ1，θ2）P（θ2）

=0 ? 0.8+5000 ? 0.2=1000

同样可以计算其余决策法则δ1，δ2，δ

δ2（H）=?对于

δ3（H）=?3

的贝叶斯风险。对于

?a1，当H?H1?a2，当H?H2?a2，当H?H1?a1，当H?H2 有B（δ2）=700

有B（δ3）=12300

对于

δ4（H）=a2，当H=H1或H=H2，有B（δ4）=12000

则

min{B（δ1），B（δ2），B（δ3），B（δ4）}= B（δ2）=700

因此，贝叶斯原则下最佳决策法为δ2，即当市场预测畅销时经营该产品，当市场预测滞销时不经营该产品。这与例4-1贝叶斯决策的结论完全一致。

最后，我们要指出，可以证明，贝叶斯决策所得到的决策法则，就是贝叶斯原则下的最佳决策法则，并且，最佳决策法则的贝叶斯风险等于后验完全信息价值，即 B（δopt）=后验EVPI

=Eτ{Eθ|τ[R（a（τ），θ）]}

其中，δopt表示贝叶斯原则下的最佳决策法则。由公式（4-15）推知，δopt的贝叶斯风险也可

以用完全信息值与补充信息价值之差计算，即

B（δopt）=EVPI - EVAI

参考资料： 1．彭勇行。《管理决策分析》。科学出版社，2000 2．胡永宏，贺思辉。《综合评价方法》。科学出版社，2000

习题四：

1．某厂家试制某新产品准备投产。有两种可行方案，大批量投产（a1）和不投产（a2）。

根据统计资料，新产品的销售状态和收益如表4-4。由于滞销亏损较大，厂家考虑采取试销法，试销费用60万元。根据过去资料，试销对市场情况估计的可靠程度如表4-5。对此问题：

1作出贝叶斯决策分析，并画出决策树图。 ○

2求出EVPI和EVAI。 ○ qij θj ai a1 a2 P(Hi|θj) θj Hi H1（畅销） H2（一般） H3(滞销) θ1（畅销） P（θ1）=0.25 15 0 θ1（畅销） 0.65 0.25 0.10 θ2（一般） P（θ2）=0.30 1 0 θ2（一般） 0.25 0.45 0.30 θ3（滞销） P（θ3）=0.45 -6 0 θ3（滞销） 0.10 0.15 0.75 表4-4 2．某公司经营某种商品，可以采取的经营方案有三种：a1（大批量），a2（中批量），a3（小批量）。市场销售状态有三种：θ1（畅销），θ2（一般），θ3（滞销），其收益矩阵（单位：万元）为

?10030?60??? Q=（qij）3?3=50 40 ?20 ????1096?? 已知市场销售状态概率P（θ1）=0.2，P（θ2）=0.5，P（θ3）=0.3。该公司通过进行市

场预测，其似然分布矩阵为

P（Hi|θ1） P（Hi|θ2） P（Hi|θ3）

H1 H2

H30.02?0.20?0.80?0.15 ? 0.08 0.70???0.90?0.10?0.05?其中H1，H2，H3分别表示预测值畅销，一般，滞销。市场预测费用为5万元。对此问题：

1 计算EVPI。 ○

2 计算EVAI，并判断是否进行市场预测。 ○

3 画出决策树。 ○

3．有两类外表相同的盒子。甲类盒子只有一个，其中装有80个红球，20个白球；乙类盒

子共有三个，每个盒子装有20个红球，80个白球。今从中任取一盒，请猜是哪类盒子。猜中得1元，不中不得钱。如果允许从盒子中取出一个球观察

1 试进行抽样贝叶斯决策； ○

2 计算EVSI。 ○