浅谈贝叶斯公式及其应用

更新时间:2023-08-07 05:44:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

浅谈贝叶斯公式及其应用

摘 要

贝叶斯公式是概率论中很重要的公式,在概率论的计算中起到很重要的作用。本文通过对贝叶斯公式进行分析研究,同时也探讨贝叶斯公式在医学、市场预测、信号估计、概率推理以及工厂产品检查等方面的一些实例,阐述了贝叶斯公式在医学、市场、信号估计、推理以及产品检查中的应用。为了解决更多的实际问题,我们对贝叶斯公式进行了推广,举例说明了推广后的公式在实际应用中所适用的概型比原来的公式更广。从而使我们更好地了解到贝叶斯公式存在于我们生活的各个方面、贝叶斯公式在我们的日常生活中非常重要。

关键词:贝叶斯公式 应用 概率 推广

第一章 引言

贝叶斯公式是概率论中重要的公式,主要用于计算比较复杂事件的概率,它实质上是加法公式和乘法公式的综合运用。贝叶斯公式出现于17世纪,从发现到现在,已经深入到科学与社会的许多个方面。它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率.贝叶斯公式在实际中生活中有广泛的应用,它可以帮助人们确定某结果(事件

B)发生的最可能原因。

目前,社会在飞速发展,市场竞争日趋激烈,决策者必须综合考察已往的信息及现状从而作出综合判断,决策概率分析越来越显示其重要性。其中贝叶斯公式主要用于处理先验概率与后验概率,是进行决策的重要工具。

贝叶斯公式可以用来解决医学、市场预测、信号估计、概率推理以及产品检查等一系列不确定的问题。本文首先分析了贝叶斯公式的概念,再用贝叶斯公式来解决实际中的一些问题。然后将贝叶斯公式推广,举例说明推广后的贝叶斯公式在实际应用中所适用的概型。

第二章 叶斯公式的定义及其应用

2.1贝叶斯公式的定义

给出了事件B随着两两互斥的事件A1,A2,...,An中某一个出现而出现的概率。如果反过来知道事件B已出现,但不知道它由于A1,A2,...,An中那一个事件出现而与之同时出现,这样,便产生了在事件B已经出现出现的条件下,求事件Ai(i 1,2,...n)出现的条件概率的问题,解决这类问题有如下公式:

2.1.1定义 设B1B2,...,Bn为 的一个分割,即B1B2,...,Bn互不相容,且 Bi ,如果

i 1n

P( A ) > 0 ,P(Bi) 0 (i 1,2,...,n) ,则P(Bi/A)

P(Bi)P(A/Bi)

P(B)P(A/B)

j

j

j 1

n

,i 1,2,...,n。

证明 由条件概率的定义(所谓条件概率,它是指在某事件B发生的条件下,求另一事件A的概率,记为P(A/B))

P(Bi/A)

P(ABi)

P(A)

对上式的分子用乘法公式、分母用全概率公式, P(ABi) P(Bi)P(A/Bi) P(A) P(Bi)P(A/Bi)

j 1n

P(Bi/A)

P(Bi)P(A/Bi)

P(B)P(A/B)

j

j

j 1

n

,i 1,2,...,n

结论的证。

2.1.2 分析贝叶斯公式的定义

贝叶斯公式可以作如下解释:假定有n个两两互斥的“原因” A1,A2,...,An可引起同一种“现象”B的发生,若该现象已经发生,利用贝叶斯公式可以算出由某一个原因

Ai(j 1,2,...,n)所引起的可能性有多大,如果能找到某个Ai,使得 P(Aj/B)=max P(Ai/B) 1 i n

则Aj就是引起“现象” B最大可能的“原因”。 生活中经常会遇到这样的情况,事件A 已发生,我们需要判断引起A 发生的“原因”这就需要用到贝叶斯公式来判断引起A 发生的“原因”的概率。贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。

本文首先给出贝叶斯公式的定义以及证明,对条件概率公式和全概率公式进行了回顾,加深了对贝叶斯公式的理解,为下面对贝叶斯公式自如地运用做铺垫。

2.2 贝叶斯公式的应用

2.2.1 贝叶斯公式在医疗诊断上的应用

例1、某地区肝癌的发病率为0.0004,先用甲胎蛋白法进行普查。医学研究表明,化验结果是存在错误的。已知患有肝癌的人其化验结果99%呈阳性(有病),而没有患肝癌的人其化验结果99.9%呈阴性(无病)。现某人的检查结果呈阳性,问他真患肝癌的概率是多少?

解 记B事件“被检查者患有肝癌”, A为事件“检查结果为阳性”,有题设知

P(B) 0.0004 P() 0.9996

P(A/B) 0.99 P(A/) 0.001

我们现在的目的是求P(B/A),由贝叶斯公式得 P(B/A)

P(B)P(A/B)

P(B)P(A/B) P(B)PA/B)0.0004 0.99

0.0004 0.99 0.9996 0.001

0.284

这表明,在检查结果呈阳性的人中,真患肝癌的人不到30%。这个结果可能会使人吃惊,但仔细分析一下就可以理解了。因为肝癌发病率很低,在10000人中越有四人,而约有9996人不患肝癌。对10000个人中,用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有约有9996 0.001 90996个呈阳性。另外四个真患肝癌者的检查报告中约有4 0.99 3.96个呈阳性,仅从13.956个呈阳性者中看出,真患肝癌的3.96人约占28.4%。

进一步降低错检的概率是提高检验精度的关键,在实际中由于技术和操作等种种原因,降低错检的概率有事很困难的。所以在实际中,常采用复查的方法来减少错误率。或用另一些简单易行的辅助方法先进行初查,排除了大量明显不是肝癌的人后,再用甲胎蛋白法对被怀疑的对象进行检查,此时被怀疑的对象群体中,肝癌的发病率已大大提高了,譬如,对首次检查得的人群再进行复查,此时P(B)=0.284,这时再用贝叶斯公式计算得

P(B/A)

0.284 0.99

0.284 0.99 0.716 0.001

0.997

这就大大提高了甲胎蛋白法的准确率了。

在上面的例子里面,如果我们将事件B(“被检查者患有肝癌”)看作是“原因”,将事件A(“检查结果呈阳性”)看作是最后“结果”。则我们用贝叶斯公式在已知“结果”的条件下,求出了“原因”的概率P(B/A)。而求“结果”的(无条件)概率P(A),用全概率公式。在上例中若取P(B)=0.284,则

P(A) P(B)P(A/B) P()PA/) 0.284 0.99 0.716 0.001

0.2819

条件概率的三公式中,乘法公式是求事件交的概率,全概率公式是求一个复杂事件的概率,而贝叶斯是求一个条件概率。

在贝叶斯公式中,如果P(Bi)为Bi的先验概率,称P(Bi/A)为Bi的后验概率,则贝叶斯公式是专门用于计算后验概率的,也就是通过A的发生这个新信息,来对Bi的概率作出的修正。

评注:此例子是现实生活中很常见的一个例子。用了两次贝叶斯公式,第一次利用贝叶斯公式计算出检出是阳性然后患肝癌的概率,第二次利用贝叶斯公式计算出利用甲胎蛋白检测的准确率。通过计算出来的概率,人们采用有效的方法降低错检的概率。使人们的生命财产得到更多的保障。

2.2.2 贝叶斯公式在市场预测中的应用

例2、我们知道,国外的旧车市场很多。出国留学或访问的人有时花很少的钱就可以买一辆相当不错的车,开上几年也没问题。但运气不好时,开不了几天就这儿坏那儿坏的,修车的钱是买车钱的好几倍,经常出毛病带来的烦恼就更别提了。

为了帮助买旧车的人了解各种旧车的质量和性能,国外出版一种专门介绍各品牌旧车以及各年代不同车型各主要部件质量数据的旧车杂志。比如有个买主想买某种型号的旧车,他从旧车杂志上可发现这种旧车平均有30%的传动装置有质量问题。除了从旧车杂志上寻找有关旧车质量的信息外,在旧车市场上买旧车时还需要有懂车的内行来帮忙。比如可以找会修车的朋友帮助开一开,检查各主要部件的质量。因为旧车杂志上给出的是某种车辆质量的平均信息,就要买的某一辆来讲可能是好的传动装置,也可能会有问题。比较常见的方法是花一点钱请个汽车修理工帮助开几圈,请他帮助判断一下传动装置和其他部件的质量。当然,尽管汽车修理工很有经验,也难免有判断不准的时候。假定从过去的记录知道某个修理工对于传动装置有间题的车,其中90%他可以判断出有问题,另有10%他发现不了其中的问题。对于传动装置没问题的车,他的判断也差不多同样出色,其中80%的车他会判断没问题,另外的20%他会认为有问题,即发生判断的错误。根据这些已知信

息请你帮助买主计算如下的问题:

1、若买主不雇用修理工,他买到一辆传动装置有问题的车的概率是多少?

2、若买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率是多少?

3、当修理工说该车“传动装置没问题”时而该车传动装置真有问题的概率是多少?

解 1、问题是简单的,即有30%的可能性买到一辆有传动装置间题的旧车,我们在这里只利用旧车杂志的信息。

第2问和第3问是贝叶斯估计或者利用贝叶斯公式进行决策的问题。

2、我们知道,贝叶斯公式是个条件概率的公式,即

P(Ai/B)

P(Ai)P(B/Ai)

k

j

P(A)P(B/A)

j

j 1

其中P(Ai/B)称为事件Ai的后验概率,即在已知事件B发生条件下事件Ai发生的概率;P(Ai)是事件Ai的先验概率;P(B/Ai)称为样本信息,即在Ai发生条件下事件B的概率。对于第2问,我们不妨令:

A1=实际有问题,A2=实际没问题

, B2=修理工判断“没问题” B1=修理工判断“有问题”则可将贝叶斯公式改写成:

P(实际有问题/修理工判断“有问题”)

=

P(实际有问题)P(修理工判断“有问题”/实际有问题)

P(实际有问题)P(修理工判断“有问题”/实际有问题)+P(实际没问题)P(修理工判断“有问题”/实际没问题)

=

P(A1)P(B1/A1)

P(A1)P(B1/A1) P(A2)P(B1/A2)

根据已知条件,计算式中各项的概率分别为:

P(A1) P(实际有问题)=0.3 P(A2) P(实际没问题)=0.7

P(B1/A1) P(修理工判断“有问题”/实际有问题)=0.9

P(B1/A2) P(修理工判断“有问题”/实际没问题)=0.2 P(B2/A1) P(修理工判断“没问题”/实际没问题)=0.1 P(B2/A2) P(修理工判断“没问题”/实际没问题)=0.8 代入上式

P(实际有问题/修理工判断“有问题”)

=

=

P(A1)P(B1/A1)

P(A1)P(B1/A1) P(A2)P(B1/A2)

0.3 0.9

0.3 0.9+0.7 0.2

=0.66

这个结果表明,当修理工判断某辆车的传动装置“有问题”时,实际有问题的概率为0.66,即修理工的判断有问题使得真有问题的概率由0.30增长到0. 66。

3、P(实际有问题/修理工判断“没问题”)

=

P(实际有问题)P(修理工判断“没问题”/实际有问题)P(实际有问题)P(修理工判断“没问题”/实际有问题)+P(实际没问题)P(修理工判断“没问题”/实际没问题)

=

P(A1)P(B1/A1)

P(A1)P(B2/A1) P(A2)P(B2/A2)

由问题2知道

P(实际有问题/修理工判断“没问题”)

==

P(A1)P(B2/A1)

P(A1)P(B2/A1) P(A2)P(B2/A2)

0.1 0.3

0.3 0.1+0.7 0.8

=0.05

这个结果表明,当修理工判断某辆车的传动装置“没问题”时,实际有问题的概率为0.05,即修理工的判断没问题而实际上有问题的概率由0.3下降到0.05。

评注 这是一个生活中很常见的问题。利用贝叶斯公式计算出买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该车传动装置真有问题的概率,当修

理工说该车“传动装置没问题”时而该车传动装置真有问题的概率。如果买主没有请修理工,他买到的旧车有质量问题的概率高达0.3,但是如果请修理工帮忙试车的话买到的旧车有质量问题的概率却可以降到0.05。这样不仅为买主剩下较多修车的钱,还帮助买主避免了日后的很多麻烦。

2.2.3 贝叶斯公式在信号估计中的应用

例3 背景:1948年,美国科学家香农发表了著名的论文《通信的数学理论》。世界上第一个给通信系统建立了数学模型。他认为通信系统由以下几个基本要素组成:信源、信道、编码、译码和干扰源。

信源指产生信息的来源。信道指传递信息的通道。将噪声统一为干扰源。编码是从消息到信号的函数,而译码是从信号到消息的函数。

因为信源发出什么消息是随机的,所以信源发出的消息可用随机变量来表示,于是可以用随机变量的分布律来描述信源。

信道由三个因素构成:输入信号,输出信号,以及输入信号与输出信号间的统计联系转移概率。转移概率一般用转移概率矩阵表示。

当信源发出某个消息后,由编码转变为信号,信号通过信道,因为信道中存在干扰,所以进入信道的是某个信号,从信道出来的可能不再是这个信号。那么自然我们要问,当接收到一个信号后,进入信道的信号是什么?

解 建模:有一个通信系统,假设信源发射0、1两个状态信号(我们将编码过程省略),其中发0的概率为0.55,发1的概率为0.45。无论信源发送的是什么,接收端可能接收到的是0,1,或“不清”。它的转移概率矩阵为:

0.90.050.05

0.050.850.1

分析: 利用贝叶斯公式求解, 设事件A表示信源发出“0”的信号,表示信源发出“1”的信号,B表示接收到一个“1”的信号。当B发生后,分别计算事件A与事件的概率。 由贝叶斯公式:

P(A/B)

P(A)P(B/A)

P(A)P(B/A) P()P(B/)

0.067

P(/B)

P()P(B/)

P(A)P(B/A) P()P(B/)

0.933

因为 P(A/B) P(/B),即接收到信号“1”后,信源发出的是“0”

的可能性比信源发出的是“1”的可能性小得多,所以我们应该判断信源发出的信号是“1”。

评注 某一信号在传输后得到各种信号的概率称为转移概率(包括得到它自身)。此例子运用贝叶斯公式,求得当B发生后,分别计算事件A与事件的概率,人们通过此概率可以做出最好的决策。

2.2.4 贝叶斯公式在概率推理中的应用

例4、有朋自远方来,他坐火车、坐船、坐汽车、坐飞机的概率分别是0.3,0.2,0.1,0.4,而他坐火车、坐船、坐汽车、坐飞机迟到的概率分别是0.25,0.3,0.1,0,实际上他是迟到了,推测他坐那种交通工具来的可能性大。

解 设A1 {做火车来} A2 {坐船来} A3 {坐汽车来} A4 {坐飞机来} B {迟到}

P(A1) 0.3 P(A2) 0.2

P(A3) 0.1 P(A4) 0.4 P(B/A1) 0.25 P(B/A2) 0.3 P(B/A3) 0.1 P(B/A4) 0

由贝叶斯公式分别可以算得 P(A1/B)

P(A1)P(B/A1)

4

P(A)P(B/A)

i

i

i 1

0.3 0.25

0.3 0.25 0.2 0.3 0.1 0.1 0.4 00.3 0.25

0.5172

0.145

P(A2/B)

P(A2)P(B/A2)

P(A)P(B/A)

i

i

i 1

4

0.2 0.3

0.4184

0.145

P(A3/B)

P(A3)P(B/A3)

P(A)P(B/A)

1

i

i 1

4

0.1 0.1

0.0690

0.145

P(A4/B)

P(A3)P(B/A3)

P(A)P(B/A)

i

i

i 1

4

0

比较以上四个概率值,可见他坐火车和坐船的概率大,坐汽车的可能性很小,且不可能是坐飞机过来的。

评注 此例子运用了四次贝叶斯公式,用所求出的概率判断某人迟到了,选择了何种交通工具的可能行最大。由果索因,果是某人迟到了,因是某人选择了那种交通工具。

2.2.5 贝叶斯公式在工厂产品检查中的应用

例5、某厂生产的产品次品率为0.1%,但是没有适当的仪器进行检验,有人声称发明一种仪器可以用来检验,误判的概率仅为5%.试问厂长能否采用该人所发明的仪器?

分析:“5%的误判率”给检验带来怎样的可信度,这是厂长决策的依据,即弄清“被检验出的正(或次)品中实际正(或次)品率”.

解:设事件A表示“客观的次品”,事件B表示“经检验判为次品的产品”,由题意知: P(A) 0.001,P() 0.999,P(B|A) 0.95,P(B|) 0.05. 由贝叶斯公式可计算“被检验出的次品中实际次品率”为:

P(A|B)

P(A)P(B|A)

P(A)P(B|A) P()P(B|)

0.001 0.95

0.001 0.95 0.999 0.05

0.018664

同理,“被检验出的正品中实际正品率”为: P(|) 0.999947

由P(A|B) 0.018664可知,如果产品的成本较高,厂长就不能采用这 仪器,因为被仪器判为次品的产品中实际上有98%以上的是正品,这样导致损耗过高.同时,我们也注意到该仪器对正品的检验还是相当精确的,若检验对产品没有破坏作用,倒是可以在“被认定次品”的产品中反复检验,挑出“假次品”,这就降低了损耗,又保证了正品具有较高的可信度.

第三章 贝叶斯公式的推广及其应用

3.1 贝叶斯公式的推广

当试验的随机过程不少于两个的时候,在影响目标事件的每一个试验过程中

分别建立完备事件组,贝叶斯公式就可以进一步推广.

3.1.1贝叶斯公式推广定理

设Ai(i 1,2, n)和Bj(j 1,2, ,n)是先后两个试验过程中的划分,

C为目标事件.当

P(C) 0,P(Ai) 0,P(Bi) 0,P(AiBj) 0,i 1,2, ,n,j 1,2, ,m时,则有:

P(Ai) P(Bj|Ai)P(C|AiBj)

(1)P(Ai|C)

n

m

j 1

P(C)

,i 1,2 ,n

(2)P(Bj|C)

P(A)P(B

i

i 1

j

|Ai)P(C|AiBj)

,j 1,2 ,m

P(C)

(3)P(AiBj|C)

P(Ai)P(Bj|Ai)P(C|AiBj)

P(C)

m

,i 1,2 ,n,j 1, ,m

m

证明:(1):P(Ai|C)

P(ACi)

P(C)

P(ABC) P(A)P(B

i

j

i

j 1

j

|Ai)P(C|AiBj)

P(C)

=

j 1

P(C)

同理可以证明(2)、(3).

3.1.2 贝叶斯公式推广定理在摸球模型中的应用

例6 已知甲、乙两个口袋中各装有3个白球和5个黑球.现从甲袋中任取1个球然后放人乙袋中,再从乙袋中任取1个球再放回到甲袋中,最后从甲袋中取出1个球.试问:(1)已知最后从甲袋中取出的是1个黑球,则第一次从甲袋 取出的也是黑球的概率;(2)已知最后从甲袋中取出的是l个黑球,则第二次从乙袋中取出的也是黑球的概率;(3)已知最后从甲袋中取出的是1个黑球,则第一次

和第二次取出的都是黑球的概率.

解:设Ai表示“从甲中取出i个黑球放人乙中”,i 0,1;Bj表示“从乙中取出:个黑球又放回甲中”,j 0,1;C表示“第二次从甲中取出1个黑球”.由题意

53353可得:P(A0) ;P(A1) ;P(B0|A0) ;P(B1|A0) ;P(B0|A1) ;

99888

65645

P(B1|A1) ;P(C|A0B0) ;P(C|A0B1) ;P(C|A1B0) ;P(C|A1B1) .

98888

(1)由贝

1

叶斯推广(1)可得:

P(Ai) P(Bj|A1)P(C|A1Bj)

P(AC1)

j 0

P(C)

53465

( )

7

5128

同理可得:(2)、(3):

565356565

52

P(B1|C) ; P(A1B1|C) .

5123

88

所以,(1)已知最后从甲袋中取出的是1个黑球,则第一次从甲袋 取出的也是黑球的概率为

7

; 12

(2)已知最后从甲袋中取出的是l个黑球,则第二次从乙袋中取出的也

是黑球的概率为

2

; 32。 15

(3)已知最后从甲袋中取出的是1个黑球,则第一次和第二次取出的都

是黑球的概率为

评注:此例子运用了贝叶斯公式的推广定理,说明了推广后的公式在实际应用中所适用的概型比原来的公式更广。

第四章 总结

随着社会的飞速发展,市场竞争日趋激烈,决策者必须综合考察已往的信息及现状从而作出综合判断,利用概率来决策越来越显得重要。利用贝叶斯公式定量地对医学问题进行相关分析,使其结论具有与可信度,更有利于促进对病人的对症施治等。

本文详细地介绍了贝叶斯公式的定义,贝叶斯公式在医学诊断、市场预测、信号估计、概率推理以及工厂产品检查等方面的应用,并介绍了贝叶斯公式的推广定理以及其推广定理在摸球模型中的应用。

通过本次研究,我知道了贝叶斯公式在日常生活中的许多应用,很多时候我们可以利用贝叶斯公式来进行决策、推理判断等。但由于对贝叶斯公式研究的时间比较短,此次研究还存在很多不足之处。本文只是列举了几个例子来说明贝叶斯公式的应用,事实上贝叶斯公式的应用远远不止这些,贝叶斯公式还可以用来解决保险、工程、垃圾邮件的处理等一系列不确定的问题。

参考文献

[1] 张丽 闫善文 张亚东 全概率公式与贝叶斯公式的应用及推广 [J],文理学院数学

系,城市铁路中学数学组 大庆,2005-03-25.

[2] http://www.77cn.com.cn/tongjixue/online/6/c9_3.htm[Z]

[3] 吴亚森 孙爱霞 概率论与数理统计[M],广州:华南理工大学出版社 1993-11 第

二版

[4] 朱燕堂 赵选民 徐伟 应用概率统计方法[M],西北工业大学出版社,1986-04 第

一版

[5] 茆诗松 程依明 濮晓龙 概率论与数理统计教程[M],北京:高等教育出版社 2004-07

第一版

本文来源:https://www.bwwdw.com/article/o3cj.html

Top