概率统计常见题型及方法总结

更新时间:2024-04-03 19:51:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

常见大题:

1. 全概率公式和贝叶斯公式问题 B看做“结果”,有多个“原因或者条件

Ai”可以导致

B这个“结果”发生,考虑结果B发生的概率,或者求在B发生的条件下,源于某个原因

全概率公式:

P?B???P?Ai?P?B|Ai?i?1nAi的概率问题

nj贝叶斯公式:

P(A?)i|BP(iA)|P(BA)i?j?1P(|A)P(jBA)

一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有a只红球和b只白球。先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少? 解 Bi表示从第i个口袋放入第i?1个口袋红球,i?1,2,3,4

Ai表示从第i个口袋中任取一个球为红球, 2分

P(B1)?a, 2分 a?bP(A1)?P(B1)P(A1B1)?P(B1)P(A1B1) ?aa?1baa?? 2分

a?ba?b?1a?ba?b?1a?b依次类推 2分

a a?b 二(10分)袋中装有m只正品硬币,n只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷r次,已知每次都出现国徽,问这只硬币是次品的概率为多少? P(Ai)? 、解 记B={取到次品},B={取到正品},A={将硬币投掷r次每次都出现国徽} 则P?B??nm1,P?AB??1,P?AB??r―—5分 ,P?B??2m?nm?nn?1P?B?P(AB)2rnm?n P?BA????rnm1P(B)P(AB)?P(B)P(AB)?1??r2n?mm?nm?n2

三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。现在每次从中任取

一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。在检验时,一件正品被误判为次品的概率为0.05,而一件次品被误判为正品的概率为0.01。(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。

解 设 A表示“任取一件产品被检验为正品”, B表示“任取一件产品是正品”,则

P?B??964,P?B??,P?A|B??0.95,P?A|B??0.01 100100(1)由全概率公式得

P?A??P?B?P?A|B??P?B?P?A|B??0.9124

(2)这批产品被检验为合格品的概率为

3p??PA?0.9124?0.7596 ?????3四、在电报通讯中不断发出信号‘0’和‘1’,统计资料表明,发出‘0’和‘1’的概

率分别为0.6和0.4,由于存在干扰,发出‘0’时,分别以概率0.7和0.1接收到‘0’和‘1’,以0.2的概率收为模糊信号‘x’;发出‘1’时,分别以概率0.85和0.05收到‘1’和‘0’,以概率0.1收到模糊信号‘x’。

(1)求收到模糊信号‘x’的概率;

(2)当收到模糊信号‘x’时,以译成哪个信号为好?为什么?

解 设Ai=“发出信号i”(i?0,1), Bi=“收到信号i”(i?0,1,x)。由题意知

P(A0)?0.6, P(A1)?0.4, P(Bx|A0)?0.2, P(Bx|A1)?0.1。

(1)由全概率公式得

P(Bx)?P(Bx|A0)P(A0)?P(Bx|A1)P(A1)(2)由贝叶斯公式得

4分

?0.2?0.6?0.1?0.4?0.16。 2分

P(Bx|A0)P(A0)0.2?0.6??0.75, 3分

P(Bx)0.16

3分

P(A0|Bx)?P(A1|Bx)?1?P(A0|Bx)?1?0.75?0.25

二、随机变量函数的分布及其边缘密度及其独立性的判断 记住如下知识点: 常见分布律和概率密度:

一般正态分布的计算转化为标准正态分布去做:

连续随机变量X:

二维随机变量的分布函数:

联合密度:

掌握如下解决随机变量函数分布的解题方法:

对于二维随机变量函数的概率密度,注意:除了求随机变量 Z=X+Y 的密度函数用公式:

????fZ(z)????f(x,z?x)dx????f(z?y,y)dy

注意:

先写出联合密度:

f(x,y),根据联合密度写出

f(x,z?x)或者f(z?y,y),

f(x,z?x)在平面x0z或者y0z上画出被积函数不为零的区

域,然后穿线通过区域确定x的上下限。

他的函数Z = g ( X , Y )的概率密度,只能使用分布函数法 其步骤如下:

第一步 求联合密度:

f(x,y),根据联合密度写出

f(x,z?x)或者f(z?y,y)

第二步 求z的分布函数:

FZ(z)?P{Z?z}?P{2X?Y?z}?g(x,y)?z??f(x,y)dxdy

难点是画出二重积分的积分区域,然后把二重积分化为二次积分定上下限,

画图:先画出被积函数也就是联合密度非零的区域,再确定区域

g(x,y)?z与密度非零区域的重合区域就是二重积分的积分区域,

穿线定积分限:然后左右穿或者上下穿个积分区域定内限,求出分布函数

求密度函数:fZ(z)?FZ?z( )第三步 分析:

一、设总体X服从(0,1)上的均匀分布,X1,X2,序统计量X(n)?max(X1,X2,?,Xn), 1.求随机变量X(n)的概率密度;

,Xn是来自总体X的一个样本,最大顺

?0,x?0?1,0?x?1?解:X~f(x)??,其分布函数为F(x)??x,0?x?1

?0,其它?1,x?1?而X(n)?max(X1,X2,?,Xn)的分布函数为

FX(n)(z)?P{X(n)?z}?P{max(X1,X2,?,Xn)?z)??P{X1?z,X2?z,?,Xn?z)??[F(z)]n

?(n)?z??n?F?z??n?1f?z??nzn?1,(0?z?1) fX(n)?z??FX二、(10分)设二维随机变量?X,Y?的概率密度为

?Ae?y,0?x?yf?x,y???

其它?0,(1)求常数A的值;(2)求X与Y的协方差Cov?X,Y?。

解 (1)由1?(2)E?X??????????f?x,y?dxdy??dy?Ae?ydx?A,得A?1

00?y??????????xf?x,y?dxdy??dy?xe?ydx??00?y?012?yyedy?1 2

E?XY??????y?13????????xyf?x,y?dxdy??dy?0xye?y0dx??02yeydy?3 E?Y?????????y?????yf?x,y?dxdy??0dy?0ye?ydx??0y2e?ydy?2

Cov?X,Y??E?X?E?Y??3?2?1

三(16分)设二维随机变量(X,Y)的概率密度为

?e?(x?y) f(x,y)??,x?0,y?0?0,其它

(1) 求边缘密度函数fX(x),fY(y); (2) 求边缘分布函数FX(x),FY(y); (3) 判断X与Y是否相互独立; (4) 求P(X?Y?1)。 (1) fX(x)??????f(x,y)dy,

当x≤0时,f(x,y)=0,于是fX(x)=0

当x>0时,fX(x) =???yxe?dy?e?x,

所以Xf(x)=??e?x,x?0X?0,x?0

Y的边缘概率密度 f(y)????Y??f(x,y)dx

当y≤0时, fY(y)=0

y)=??e?y当y>0时 f,y?0Y(?0,y?0 4(2) F(y)???1?e?y,0?y?0,

其他??1?e?xF(x)?,0?x 4?0,其他(3)独立 4(3)P(X?Y?1)?x???f(x,y)dxdy?2y?1e 4分

分 分

四(10分)设随机变量(X,Y)的概率密度为

?2e?(x?2y),x?0,y?0 f(x,y)??

其他?0,求随机变量Z?X?2Y的分布函数。

FZ(z)?P{X?2Y?z}?当z?0时,FZ(z)?0 当z?0时,FZ(z)?x?2y?z??f(x,y)dxdy

z?x20?z0dx?2e?(x?2y)dy?1?e?z?ze?z

所以Z?X?2Y的分布函数为

z?0?0, FZ(z)?? ?z?z1?e?ze,z?0?3.中心极限定理的问题:用正态分布近似计算

共两类:

一类是二项分布的近似计算问题

X~b(n,p)

近似N(np,np(1?p)) ,即

X?np~N(0,1)np(1?p),

b?npa?np)??()P{a?X?b}??(npqnpq

这个公式给出了n 较大时二项分布的概率计算方法。

另一类是除二项分布之外的其他分布的独立变量连加和的计算问题,

设X1,X2,,Xn,独立同分布,E?X???D?X???2?0k?1,2,,n.kk 近似有连加和服从正态分布:

n?Xi?1i~N(n?,n?)

2一、 (14分) 设粮仓内老鼠的数目是一个服从泊松分布的随机变量,且仓内无鼠的概率为

e?2。

(1)写出随机变量的分布律;

(2)试用中心极限定理计算,在200个同类粮仓内老鼠总数超过350只的概率。 解 (1)X~?(2); 5分 (2)X表示任意老鼠个数,由中心极限定理

3分 P(X?350)?P???X?200?2?200?2?350?200?2??? 3分

200?2??350?200?2??1?????? 3分

200?2??

二、(10分)某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以X表示在随意抽查的100个索赔户中因被盗而向保险公司索赔的数。

(1)写出X的概率分布;

(2)求被盗索赔户不少于14户且不多于30户的概率的近似值。 [解] (1)X~b(100,0.2),

kP{X?k}?C1000.2k0.8100?k,k?0,1,2,?,100

(2)E(X)?100?0.2?20,D(X)?100?0.2?(1?0.2)?16 根据棣莫佛—拉普拉斯中心极限定理

??14?20X?E(X)30?20??P{14?X?30}?P????

44D(X)??????X?E(X)???P??1.5??2.5???(2.5)??(?1.5)

D(X)??????(2.5)??(1.5)?1?0.994?0.933?1?0.927

三(10分)某银行的柜台替每一位顾客的服务时间(单位:分钟)服从参数??

1

的指数2

分布,且各位顾客的服务时间是相互独立的,试用中心极限定理计算,对100位顾客的总服务时间不超过240分钟的概率。

解 设X1,,X100分别表示每一位顾客的服务时间,则它们相互独立相同分布,且

E(Xi)?2,D(Xi)?4 ------------------------------- 5分

?100?X?100?2??i100240?100?2?i?1???(2)?0.9772 P(?Xi?240)?P??100?4100?4??i?1????

点估计的问题:矩估计和似然估计

似然函数的构造:

例题分析:

一、设总体X的概率密度为

?e?(x??),x??,f(x)??

?0,其它.?是未知参数,X1,X2,?,Xn是来自X的样本,

1.求?的矩估计量?1;

??矩估计法:EX?xe???(x??)dx???1,令EX???1?X, => ??1?X?1

2.求?的最大似然估计量?2; 3.判断?1,?2是否为无偏估计

解:最大似然估计法:设x1,x2?,xn为样本的观察值,则 似然函数为L(?)?????i?1ne?(xi??)n???e?xii?1nxi??,i?1,n,即minxi??,

1?i?n

?按似然估计的思想,当 似然函数关于 是增函数,故

??minx?2i。

?=minX。?的最大似然估计量为?2i

二(10分)设X1,X2,?,Xn为样本,总体X的概率密度为

(lnx??)?1?2e,x?0,?f(x,?)??x2?

?0,x?0.?2求参数?的最大似然估计量;问它是否为?的无偏估计量

解设x1,x2,?,xn是X1,X2,?,Xn相应的样本值,则似然函数为

L(?)??(i?1n12?xie(lnxi??)2?2)=(2?)(?xi?1)ei?1n?2n??(lnxi??)22i?1n

nn(lnxi??)2nlnL??ln(2?)??lnxi??22i?1i?1

1ndlnL???lnxi ?0??令

ni?1d?

???y1n?)??Elnxi??E(?e??ni?12?(y??)22dy?? 为无偏估计量

三、设X1,X2,?,Xn是总体X的样本, X的概率密度为

???1?x?,x??,?ef(x;?,?)???

?0,x??.?其中??0.求?和?的最大似然估计量。

设x1,x2,?,xn是X1,X2,?,Xn的样本值, 则似然函数

L??f(xi;?,?)??e?ni?1n?1??(xi??)i?1n,xi??,i?1,2,?,n,

(x??i?1当xi??(i?1,2,?,n)时, lnL??nln??1ni??), 令

n??lnL1n?(x??)??0,i?2?????? ??lnLni?1???0.??????和??. 由于显然, 第二个等式是矛盾等式, 所以由上述似然方程求不出??lnLn??0, ???这表明L是?的严格递增函数, 注意到??xi(i?1,2,?,n), 因此当

??min{x1,x2,?,xn}时L最大. 于是?和?的最大似然估计值

1n???min{x1,x2,?,xn}, ???(xi???)?x?min{x1,x2,?,xn}, ?ni?1于是?和?的最大似然估计量为

??X?min{X,X,?,X}. ??min{X1,X2,?,Xn}, ??12n四、(10分)设总体X的概率密度为

x1??f?x??e,???x??

2?其中?>0是未知参数。设X1,X2,,Xn为总体X的样本。

?;?是否为?的无偏估计量。 (1)求参数?的最大似然估计量?(2)判断?解 (1)设x1,x2,nx,xn是X1,X2,n?1n,Xn的观测值, 则似然函数为

xi1???1???i?1e?? L??, ?e2?2???i?1 lnL??nln2?nln??x??i?11ni。

?n1dlnL?2令 ?0,得

??d??i?1n1n???xi xi?0,解得?ni?11n???Xi ?的最大似然估计量为 ?ni?11n????E?Xi???,??是?的无偏估计量。 (2)由于E??ni?1

五(10分)设电池的寿命服从指数分布,其概率密度为

x?1_??f(x)???e??0x?0 x?0 其中??0为未知参数,今随机抽取5只,测得寿命如下: 1150,1190,1310,1380,1420

求电池的平均寿命?的最大似然估计值。 解 似然函数L(?)?1_?ne1xi??i?11n, 3分

lnL(?)??nln??x??i?1ni 3分

dn1lnL(?)???2令dx???xi?1ni?0得 2分

??x?(1150?1190?1310?1380?1420)?1290 2分 ?六、设总体X的概率密度为

??????1?x,0?x?1 f?x???其它??0,15其中?>?1是未知参数.设X1,X2,?,Xn为总体X的样本.求参数?的矩估计量 和最大似然估计量.

解 矩估计

?1?E(X)??x(??1)x?dx?(??1)?x??1dx?0011??1 ??21n且 A1??Xi?X,令

ni?1A1??1,则

??1?X

??2从而?的矩估计量

???最大似然估计

2X?1.

1?X设x1,x2,?,xn是X1,X2,?,Xn的样本观测值, 则似然函数为

?n??L?????1?xi????1???xi?.

i?1?i?1?nn?取对数得lnL?nln???1????lnx,

ii?1nnndlnL?????lnxi?0,解得 ?令?0,得

??1i?1d?n?lnxi?1n?1,

i???所以, ?的最大似然估计量为 ?n?lnXi?1n?1.

i

七、.设总体X的分布律为

P?X?1???2, P?X?2??2??1???, P?X?3???1???

其中?为未知参数。现抽得一个样本:x1?1,x2?2,x3?1,求参数?的矩估计值和极大似然估计值。

解 E?X????4??1????3?1????3?2?,x?

2224

3

由E?X??x,即3?2??

4??5 ,得参数?的矩估计值为?63

统计量的分布判断问题: 主要利用性质:

独立正态分布的线性组合还是正态分布 三大分布的定义:

例题分析:

一 、设X1,X2,1.试问

,Xn是正态总体X~N(?,?2)的样本,

1?2?(Xi?1ni??)2服从什么分布(指明自由度)?

Xi???~N(0,1)且独立,

1?2?(Xi??)??(2i?1i?1nnXi???)2~?2(n)

(X1?X2)22.假定??0,求的分布。 2(X1?X2)X1?X2~N(0,2?2),X1?X2~N(0,2?2)

X1?X22?~N(0,1),

X1?X22?~N(0,1)(X1?X22?)2~?(1),(X1?X22?)2~?(1)

又(X1?X22?)和(2X1?X22?(X1?X2)22?~F(1,1) )相互独立,故=2X?X(X1?X2)22(1)/12?2(X1?X2)2/1二.设X1,X2,,Xn,Xn?1是来自正态总体N?,?2的样本,分别记X,S2为??X1,X2,,Xn的样本均值和样本方差,求Y?Xn?1?XSn的分布。 n?1??2?解 Xn?1~N??,??,X~N??,?,且Xn?1与X相互独立,所以 n??2Xn?1?X?n?12?Xn?1?X~N?0,??, ~N?0,1? n????n?1?/n?n?1?S2~?2n?1由于??,且Xn?1?X与S2相互独立,因此由t分布的定义得 2?Xn?1?XY?Xn?1?XSn?n?1?n?1?/n~t?n?1?

2?n?1?Sn?1??2??1n1n22(Xi?X)2. 三、 S??(Xi??), S2??ni?1n?1i?121(1) 证明S1,S2都是?2的无偏估计量;(2)判断S1,S2中哪一个估计量更有效. 利用卡方分布:

四设X1,X2,22221,X9是来自正态总体N(?,?2)的样本,记Y1?(X1?6?X6),

2(Y1?Y2)1912的分布? Y2?(X7?X8?X9),S??(Xi?Y2)2,求统计量Z?S2i?73五、设X~N0,?2,X1,X2,???n,Xn为X的样本,求统计量??1??3?X??32i?Xi?4i?1n的分布.

2i六、.设总体X~N0,??2?,X,X12,X3,X4,X5是X的样本,统计量

2Y?a?X1?X2??b?X3?X4?X5?,(ab?0)

服从?分布,求参数a,b的值和Y的分布的自由度。

解 由X~N0,?22?2?,得

X3?X4?X5~N?0,3?2?

X1?X2~N?0,2?2?,且相互独立,即

X1?X2~N?0,1?,2?且相互独立。于是

2X3?X4?X5~N?0,1?,

3?2?X1?X2?2?2~?2?1?,12?2?X3?X4?X5?3?213?2时,

~?2?1?

且相互独立。所以当a?,b?2Y?a?X1?X2??b?X3?X4?X5?~?2?2?

该分布的自由度为2。

2假设检验和区间估计的题目类型:

记住正态总体的抽样分布定理,弄懂上分位数的含义,在密

度曲线图上用分位数给出各个分布的大概率1??区域和小概率

? 区域

能够从图上用分位数标出各种分布的双侧小概率区域和单侧小概率区域

1(10分)某工厂生产铜线,根据长期积累的数据知,铜线的折断力服从正态分布,方差为

?2?16。今从某天生产的铜线中随机抽取10根,测得折断力如下:

289286285284286285285286298292,

问该天生产的铜线折断力与以往比较,其波动性有无显著变化?(??0.05)

2检验假设H0:??16H1:?2?16,

,则当H0为真时,?~?(n?1),

2222统计量??22(n?1)S2?220拒绝域为???1??(n?1)或????(n?1)。

22 现在??2(n?1)S22?0?170.4?10.65,??0.05, 1622222??(n?1)??0.025(9)?19.023,??(n?1)??0.975(9)?2.7, 2由于2.7?10.65?19.023,故接受H0,

即该天生产的铜线折断力与以往比较,其波动性无显著变化。

2(8分)在某砖厂生产的一批砖中, 随机地抽取6块, 测量其抗断强度(单位MPa)分别为

3.366 3.106 3.264 3.287 3.122 3.205 设砖的抗断强度X服从正态分布N(?,0.11), 问能否认为这批砖的平均抗断强度是3.250MPa?(显著性水平??0.01)

、解 H0:???0,H1:???0 3分

检验统计量t?2x??0?/n,拒绝域t?u?(n?1) 3分

2算得u?z0.005?2.575 2分 接受H0

3(10分)某化工厂一天中生产的化学制品产量(单位:吨)服从正态分布,今测得5天的产量分别为785,805,790,790,802。问是否可以认为日产量的均值显著小于800? (取

??0.05)

解 假设H0:??800,H1:??800

检验统计量t?x?800-----------------------5分

s/n拒绝域t??t0.05(4)

t?794.4?800??1.4527??2.1318,接受H0 --

8.6179/5,Xn是来自正态总体N??,?2?的样本,其中参数?和?2均未知,对于参数?4.X1,X2,的置信度为1??的置信区间,试问当?减少时该置信区间的长度如何变化?

答:则μ的置信度为1- α的置信区间[X?St?2(n?1)] n置信区间的长度L?2Snt?2(n?1),当样本容量给定时,减小?的值会增大t?2(n?1)的

值,相应地L?2Snt?2(n?1)变长。

5、(10分) 某灯泡生产车间为考察灯泡的寿命,从生产的一批灯泡中随机抽取25只,测得平均寿命x?1980小时,标准方差S?3600小时。假设灯泡的寿命X服从正态分布

2

(1)求总体方差?的置信水平为95%的置信区间;(2)在显著性水平??0.05N??,?2?,

2条件下能否认为这批灯泡的平均寿命为2000小时?

解 (1)??0.05,n?25,?1??/2?n?1??12.401,??/2?n?1??39.364。

22?2的置信水平为95%的置信区间为

??n?1?S2n?1?S2??25?360025?3600??,?? ??2?n?1?,?2?n?1?????12.401?1??/2??/2??39.364??2194.8989,6967.1801?

(2)在检验水平为5%的条件下检验假设 H0:??2000,H1:??2000

选取检验统计量 t?问题的拒绝域为

X?2000X?2000~t?n?1?;该假设检验,当原假设H0时,t?S/nS/nt?X?2000?t?/2?n?1?

S/n由条件得 t?/2?n?1??t0.025?24??2.0639

t?X?20001980?20005?????1.6667

3S/n60/25由于t?1.6667?2.0639?t?/2?n?1?,因此接受原假设H0:??2000,即在检验水平为5%的条件下可以认为这批灯泡的平均寿命为2000小时。

6. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X得到两组数据,经对其作相应运算得

x1?0.190,s12?0.006, x2?0.238,2s2?0.008

假设测定结果服从正态分布X~?i,?i2???i?1,2?,

221.在显著性水平??0.10下,能否认为?1??2?

2.求?1??2的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。

22解 (1) 检验假设H0:?1??2,2H1:?12??2

S12S12拒绝域为 F?2?F?/2?n1?1,n2?1?或F?2?F1??/2?n1?1,n2?1?S2S2由条件知

n1?8,n2?9,查表得 F?/22F?S12S2?0.006/0.008?0.75,??1?0.9?0.1

?n1?1,, 0 n2?17?,8?3.5??F0?.05F1??/2?n1?1,n2?1??F0.95?7,8??11?

F0.05?8,7?3.73显然 F,n2?1??F?0.75?F?/2?n1?1,n2?1? 1??/2?n1?12222接受原假设H0:?1??2,故可认为?1??2,即认为两总体方差相等,也就是两厂生产的

产品的指标X的方差无显著性差异.

22(2) 求?1??2的置信区间。 由(1)知?1??2,但其值未知,故?1??2的1??置信

区间为

?11X?X?tn?n?2S????2?/212w?1nn21?22n?1S?n?1S????1122计算 S2?w? ???

n1?n2?2?0.0071

查表 t?/2?n1?n2?2??t0.05?15??1.7531 故?1??2的90%置信区间为

?11X?X?tn?n?2S?w??2?/2?12?1n1n2?=?0.190?0.238?1.7531?0.0071?

??? ????11??????0.120,0.024?

?89?数字特征: 概念清楚:

均值(期望)的概念:

重点掌握均值、方差、协方差的性质结合常见分布的均值和方差计算其他数字特征:

??1??C? 1.设随机变量X,Y的协方差矩阵为??,求D?aX?bY?。

???2?

设二维随机变量(X,Y)~N(1,2;4,9;0.5),求二维随机变量(2X?Y,X?2Y)的协方差矩阵.

解 D?X???1,D?Y???2,Cov?X,Y???

22 D?aX?bY??aD?X??bD?Y??2abCov?X,Y?

?a2?1?b2?2?2ab?

一些填空和选择常用的知识点

本文来源:https://www.bwwdw.com/article/ua2r.html

Top