第四章 理论分布和抽样分布

更新时间:2023-05-17 21:20:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第四章 理论分布和抽样分布第一节 事件、概率和随机变量 第二节 二项式分布 第三节 正态分布 第四节 抽样分布

第一节 事件、概率和随机变量一、事件和事件发生的概率必然事件:在特定情况下必定发生的事件1、事件:自然界中每一件事物的每一种可能出现的情况 不可能事件:在特定情况下不可能发生的事件 随机事件:在特定情况下可能发生也可能不发生的事件 2、概率:每一个事件出现的可能性

随机事件常用大写英文字母表示,例如A、B、C…等等 某事件出现的概率用P( )表示;例如P(A)、 P(B)等。 概率的有效范围为0~1,即0≤P(A)≤1。 必然事件记为 ,其概率为1,即 P( ) = 1。 不可能事件记为 ,其概率为0,即 P( ) = 0。 随机事件的概率在0~1之间,即0<P(A)<1。

第一节 事件、概率和随机变量二、事件间的关系1、和事件: 事件A和事件B至少有一件发生的事件。记作A+B,读作 “或A发生,或B 发生” 2、积事件: 事件A和B同时发生的事件。记作AB,读作“A和B同 时发生” 两件不可能同时发生的事件。记作A· B=V 3、互斥事件: 两件不可能同时发生,两者中必定有一件发生的事件。 4、对立事件: 例如:AB= 同时A+B= 5、完全事件系:各事件的和事件为必然事件的事件系。 记为A1+A2+…+An= 6、事件的独立性: 若事件A发生与否不影响事件B发生的可能性, 则称事件A和事件B相互独立。

第一节 事件、概率和随机变量三、计算事件概率的法则1、互斥事件的加法定律假定两互斥事件A和B的概率分别为P(A)和P(B),则事件A与B的和 事件的概率等于事件A的概率与事件B的概率之和。 即:P(A+B)=P(A)+P(B) 2、独立事件的乘法定律 假定P(A)和P(B)是两独立事件A和B各自出现的概率,则事件A与B

同时出现的概率等于事件A的概率与事件B的概率之乘积即:P(AB)=P(A)· P(B) 3、对立事件的概率 若事件A的概率为P(Α),则其对立事件 A 的概率为P(A) 1 - P(A)

第一节 事件、概率和随机变量4、完全事件系的概率 完全事件系的概率之和为1,即: P( Ai)=15、非独立事件的乘法 假定事件A与B是非独立的,那么,事件A和B同时出现的概率等于 事件A的概率乘以在事件A发生的情况下事件B发生的概率 即:P(AB)=P(A)· P(BlA)

第二节 二项式分布一、二项总体和二项式分布1、二项总体:由非此即彼的对立事件构成的总体例如:种子发芽和不发芽;大豆子叶叶色为黄色和青色;调查棉 田盲椿象为害分为受害株和不受害株等等 2、二项式分布:从二项总体中抽取n个个体,将有n+1种取值,这n+1 种取值各有其概率,这些概率构成的分布就是二项式分布

例如:每穴播种3粒种子,观察出苗结果将有4种事件,即不出苗, 出一棵苗,出二棵苗,出三棵苗。每一个事件均有一个概率,这些 概率的分布就是二项式分布。

每一种事件的概率如何计算呢?

第二节 二项式分布二、二项式分布的概率计算方法p( y) Cn p qy y (n y )

Cn

y

n! y !( n y ) !

说明:n表示抽样单位数;y表示某种事件发生的次数 p(y)表示变量y发生的概率;p表示此事件发生概率 q表示彼事件发生的概率 例:现有一批种子,出苗率为85%,若每穴播3粒种子,试计算每穴 不出苗,出一棵苗,出二棵苗,出三棵苗的概率。 解:已知n=3, p=0.85 则 q=1-p=1-0.85=0.15不出苗的概率: p ( 0 ) C n y p y q ( n y ) C 3 0 0 .8 5 0 0 .1 5 3 0 . 0 0 3 4 出1棵苗的概率:p (1) C n p qy y (n y)

C 3 0 .8 5 0 .1 51 1

2

0 .0 5 7 4

出2棵苗的概率:p ( 2 ) C n p qy y

(n y )

C 3 0 .8 5 0 .1 5 0 . 3 2 5 12 2 1

出3棵苗的概率:p ( 3 ) C n p qy y

(n y)

C 3 0 .8 5 0 .1 53 3

0

0 .6 1 4 1

第二节 二项式分布三、二项总体的参数和二项式分布的形状1、二项总体的参数

np

2

npq

npq

2、二项式分布的形状小麦出苗概率分布图p(y)p(y)

小麦出苗概率分布图

0.4 0.3 0.2 0.1 0 0 1 2 3出苗数

0.8 0.6 0.4 0.2 0 0 1出苗数

2

3

P=q=0.5

P=0.85 q=0.15

第三节 正态分布一、正态分布1、正态分布的概率密度函数: f N ( y )

1 2

( y ) 2 2

2

ey

2、正态分布的概率分布函数为:3、标准正态分布

F ( y)

1 2

( y ) 2 2

2

e

dy

(1) 正态分布转化成标准正态分布的方法

y

u

y

(2) 标准正态分布方程: (u ) (3) 标准正态分布的参数: 0

1 2

e

1 2 u 2

2

1

因此标准正态分布可记作:N(0,1)

第三节 正态分布二、正态分布的特性1、正态分布曲线是以平均数为对称轴,向左右两侧作对称分布 2、正态分布曲线以参数 和 的不同而表现为一系列曲线 3、正态分布资料的次数多集 中在平均数附近 4、正态曲线在 y 拐点 1

f(y)

面积占68.27% 面积占95.45%

处有 -2 -3 - + +2 +3

x

5、正态曲线与横轴之间的面积 等于1

第三节 正态分布三、正态分布曲线区间概率的计算方法

计算步骤: 1、将 y 值转换成 u 值2、查附表2得u值所对应的累积概率值 例:现有一正态总体,其平均数为30,标准差为5,试计算小于26, 大于40,及介于26和40之间的概率。 解: 1、当 y=26 时,u y

26 30 5

0 .8

查附表2得,当 u=-0.8 时,P (

y 2 6 ) 0 .2 1 1 9 2、当 y=40 时,u y

查附表2得,当 u=2.0 时, P ( y 4 0 ) 0 .9 7 7 3 则:P ( y 4 0 ) 1 P ( y 4 0 ) 1 0 .9 7 7 3 0 .0 2 2 7 3、 P ( 2 6 y 4 0 ) P ( y 4 0 ) P ( y 2 6 ) 0 .9 7 7 3 0 .2 1 1 9 0 .7 6 5 4

40 30 5

2 .0

第四节 抽样分布抽样分布:从总体中随机抽样得

到样本,计算出样本的统计数,统计数的分布称为抽样分布 抽样分布的种类: 样本平均数的抽样分布 y1 样本总和数的抽样分布 两个独立样本平均数差数的抽样分布 y2 F分布 卡平方分布 衍生总体 参数: y

母总体

参数:

2

y7 y5 y6

y3

y4

统计推断

2 y

总 体

样 本

第四节 抽样分布一、统计数的抽样及其分布参数一)样本平均数的抽样及其分布参数衍生总体参数与母总体参数的关系各种不同样本容量的样本平均数的抽样分布

n=1y2

n=2y2

n=4y2.0

n=8y

f1

f1

f1

f1 8 36 112 266 504 784 1016 1107 1016 184 504 266 112 36 8 1

y

2

y

n2

2

S

y

nS n4

S

2 y

S

n

y

现有一总体,观察值为2、4、6,分 别以样本容量n=1,n=2,n=4,n=8从总 体中进行复置抽样,试分析衍生总 体参数与母总体参数之间的关系

N

6

2.00 2.25 2.5 4 2.50 我们可以用样本的平均 2.75 3 2 3.0 10 数估计总体的平均数, 3.00 3.25 3.5 16 用样本的方差估计总体 3.50 3.75 1 4 3 4.0 19 的方差,为什么还要了 4.00 4.25 4.5 16 解抽样总体的参数呢? 4.50 4.75 5 2 5.0 10 5.00 5.25 5.5 4 5.50 5.75 1 6 1 6.0 1 6.00

y

2 4 6 3

4

32

9 1 2

81 1 8

65614

2

y

2

( y ) N

2

(2

2

4

6) 2

(2 4 6) 3

2

平均数 8 3

1

4

1 4

4

4

N

3

方 差 8/3

4/3

2/3

1/3

第四节 抽样分布二)两个独立随机样本平均数差数的抽样及其分布参数 1、两个独立随机样本平均数差数的抽样以 样 本 容 量 n1

总体 I : 1 1

2

以 样 本 容 量 n2

总体 II : 2

2 2

y II 7 y II 6y II 1

yI7

y I1

yI2

yI6

yI3

y II 2

yI4

yI5

y II 3

y II 4

y II 5

d1

d2

d3

d4

d5

d6

平均数差数的衍生总体

第四节 抽样分布2、样本平均数差数衍生总体参数与母总体参数之间的关系

y1 y 22 y1 y 2

1 2

1

2

2

2 2

n1 S1

n2 S22

y1 y 2

1

2

2 2

n1 S12

n2 S22

S

2 y1 y 2

S

n1

n2

y1 y 2

n1

n2

三)样本总和数衍生总体参数与母总体参数之间的关系

n y

2 y

n

2

第四节 抽样分布二、统计数抽样分布的规律一)样本平均数的抽样分布 1、若母总体呈正态分布,从

母总体中抽出的样本,不论其样本容量大 小,由样本平均数构成的衍生总体均呈正态分布 2、若母总体不呈正态分布,但只要样本容量足够大(n>30),样 本平均数构成的衍生总体也趋近于正态分布 二)平均数差数的抽样分布 1、如果两个总体都呈正态分布,无论样本容量大小,则其样本平均数 差数的分布也呈正态分布 2、若两个样本抽自同一总体,但该总体不呈正态总体,只要n1和n2相

当大时(大于30),则平均数差数的分布也趋于正态分布3、若两个样本抽自两个非正态总体,尤其 12

2 2

相差很大时,则

平均数 差数的抽样分布很难确定

第四节 抽样分布三、二项总体的抽样分布一)二项总体的两点分布参数 1、两点分布:把二项总体的“此”和“彼事件分别以数值1和0表示,那 么,

该二项总体服从两点分布 2、两点总体参数在N次试验中若”此“事件发生 n1 次,则彼事件发生 n2=N-n1次 p

f y i i

( n 1 1) ( n 2 0 ) N2

n1 N

P

N

2 P

f (y p ) i i

n 1 (1 p ) n 2 ( 0 p )2

2

P (1 P ) q p2

2

pq

N

N2 p

注:两点分布的平均数和方差分别记作 p 和 项总体参数相区别

,是为了与其它二

第四节 抽样分布二)样本平均数的抽样分布 1、样本平均数的抽样 2、衍生总体参数与母 总体参数的关系二项总体 p

2 p

0 0 1 0 1 1 0 1 0 0 0 1 1 0 1 0 1 0 0 1 0 1 1 1 0 0 1 1 0 。。。。 p8

p

p2

p2

p pq n

p

p1

n

p2

p3

p4

p5

p6

p7

p

pq n

平均数衍生总体

p

p

2

第四节 抽样分布二)样本平均数差数的抽样分布 衍生总体参数与母总体参数的关系

p

1 p2

p p p1 p 21 2

2

p

1

p

2

2 p

1

2 p

2

p1 q1 n1

p2q2 n2

n1n np2 p

n2

三)样本总和数的抽样分布 衍生总体参数与母总体参数的关系

y

2

p

y

n

npq

本章小结重点内容

1、二项分布各变量发生概率的计算方法2、正态分布区间概率的计算方法及标准正态分的参数 3、各抽样分布衍生总体参数与母总体参数的关系 思考题以样本平均数的抽样为例,说明衍生总体与母总体有何不同?又有 何关系

作业: P73页:4.7; 4.8(1,2,4); 4.10

本文来源:https://www.bwwdw.com/article/5304.html

Top