概率论与数理统计_知识点总复习

更新时间:2023-04-05 22:10:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1

随机事件和概率 第一节 基本概念

1、排列组合初步 (1)排列组合公式

)!

(!n m m P n

m -=

从m 个人中挑出n 个人进行排列的可能数。

)!

(!!

n m n m C n m

-=

从m 个人中挑出n 个人进行组合的可能数。

(2)加法原理(两种方法均能完成此事):m+n

某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。

(3)乘法原理(两个步骤分别不能完成这件事):m 3n

某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m 3n 种方法来完成。 (4)一些常见排列

① 特殊排列 相邻 彼此隔开

顺序一定和不可分辨

② 重复排列和非重复排列(有序) ③ 对立事件 ④ 顺序问题

2、随机试验、随机事件及其运算 (1)随机试验和随机事件

如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。 (2)事件的关系与运算 ①关系:

如果事件A 的组成部分也是事件B 的组成部分,(A 发生必有事件B 发生):

B A ?

如果同时有B A ?,A B ?,则称事件A 与事件B 等价,

或称A 等于B :A=B 。

A 、

B 中至少有一个发生的事件:A B ,或者A +B 。

属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可表示为A-AB 或者B A ,它表示A 发生而B 不发

生的事件。

A 、

B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可

能同时发生,称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。

Ω-A 称为事件A 的逆事件,或称A 的对立事件,记为A 。它

表示A 不发生的事件。互斥未必对立。 ②运算:

结合率:A(BC)=(AB)C A ∪(B ∪C)=(A ∪B)∪C

分配率:(AB)∪C=(A ∪C)∩(B ∪C) (A ∪B)∩C=(AC)∪(BC)

德摩根率:

=∞==1

1

i i

i i A

A

B

A B A =,

B A B A =

3、概率的定义和性质 (1)概率的公理化定义

设Ω为样本空间,A 为事件,对每一个事件

A 都有一个实

数P(A),若满足下列三个条件:

1° 0≤P(A)≤1, 2° P(Ω) =1

3° 对于两两互不相容的事件

1A ,2A ,…有

∑∞=∞==???? ??11)(i i i i A P A P

常称为可列(完全)可加性。 则称P(A)为事件A 的概率。

(2)古典概型(等可能概型)

1° {}n ωωω 21,=Ω

2° n

P P P n 1

)()()(21=

==ωωω 。 设任一事件

A ,它是由m ωωω 21,组成的,则有

P(A)=

{})()()(21m ωωω

=)()()(21m P P P ωωω+++

n

m =

基本事件总数所包含的基本事件数A =

4、五大公式(加法、减法、乘法、全概、贝叶斯) (1)加法公式

P(A+B)=P(A)+P(B)-P(AB)

当P(AB)=0时,P(A+B)=P(A)+P(B) (2)减法公式 P(A-B)=P(A)-P(AB)

当B ?A 时,P(A-B)=P(A)-P(B)

2

当A=Ω时,P(B )=1- P(B) (3)条件概率和乘法公式

定义 设A 、B 是两个事件,且P(A)>0,则称)

()

(A P AB P 为事件A

发生条件下,事件B 发生的条件概率,记为

=

)/(A B P )

()

(A P AB P 。 条件概率是概率的一种,所有概率的性质都适合于条件概率。 例如P(Ω/B)=1?P(B /A)=1-P(B/A) 乘法公式:)/()()

(A B P A P AB P =

更一般地,对事件A 1,A 2,…A n ,若P(A 1A 2…A n-1)>0,则有

21(A A P …

)n A )|()|()(213121A A A P A A P A P =……21|(A A A P n …)1-n A 。

(4)全概公式

设事件n B B B ,,,21 满足

1°n B B B ,,,21 两两互不相容,),,2,1(0)(n i B P i =>,

n

i i

B A 1

=?,

则有 )

|()()|()()|()()(2211n n B A P B P B A P B P B A P B P A P +++= 。

此公式即为全概率公式。 (5)贝叶斯公式

设事件1B ,2B ,…,n B 及A 满足

1° 1B ,2B ,…,n B 两两互不相容,)(Bi P >0,=i 1,

2,…,n ,

2° n

i i

B A 1

=?,0)

(>A P ,

∑==

n

j j j

i i i B A P B

P B A P B P A B P 1

)

/()()

/()()/(,i=1,2,…n 。

此公式即为贝叶斯公式。

)(i B P ,(1=i ,2,…,n ),通常叫先验概率。)/(A B P i ,

(1=i ,2,…,n ),通常称为后验概率。如果我们把A 当作观察的“结果”,而1B ,2B ,…,n B 理解为“原因”,则贝

叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。

5、事件的独立性和伯努利试验 (1)两个事件的独立性

设事件

A 、

B 满足)()()(B P A P AB P =,则称事件A 、

B 是相互独立的(这个性质不是想当然成立的)。

若事件

A 、

B 相互独立,且0)(>A P ,则有

)

()()

()()()()|(B P A P B P A P A P AB P A B P ===

所以这与我们所理解的独立性是一致的。 若事件

A 、

B 相互独立,则可得到A 与B 、A 与B 、A

与B 也都相互独立。(证明)

由定义,我们可知必然事件Ω和不可能事件?与任何事件都相互独立。(证明)

同时,?与任何事件都互斥。 (2)多个事件的独立性

设ABC 是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A 、B 、C 相互独立。 对于n 个事件类似。 两两互斥→互相互斥。 两两独立→互相独立? (3)伯努利试验

定义 我们作了n 次试验,且满足 ◆ 每次试验只有两种可能结果,A 发生或A 不发生;

◆ n 次试验是重复进行的,即A 发生的概率每次均一

样;

每次试验是独立的,即每次试验A 发生与否与其他次

试验

A 发生与否是互不影响的。

这种试验称为伯努利概型,或称为n 重伯努利试验。

p

表示每次试验

A 发生的概率,则A

发生的概率为

q

p =-1,用

)

(k P n 表示

n

重伯努利试验中

A

出现

)0(n k k ≤≤次的概率, k

n k k

n n q p k P C -=)(,n k ,,2,1,0 =。

随机变量及其分布 第一节 基本概念

在许多试验中,观察的对象常常是一个随同取值的量。例如掷一颗骰子出现的点数,它本身就是一个数值,因此P(A)这个函数可以看作是普通函数(定义域和值域都是数字,数字到数字)。但是观察硬币出现正面还是反面,就不能简单理解为普通函数。但我们可以通过下面的方法使它与数值联系起来。当出现正面时,规定其对应数为“1”;而出现反面时,规定其对应数为“0”。于是

3

==)(ωX X ??

?,当反面出现

,当正面出现01

X

为随机变量。又由于

X

是随着试验结果(基本事件ω)

不同而变化的,所以

X

实际上是基本事件ω的函数,即

X=X(ω)。同时事件A 包含了一定量的ω(例如古典概型中A 包含了ω1,ω2,…ωm ,共m 个基本事件),于是P(A)可以由P(X(ω))来计算,这是一个普通函数。

定义 设试验的样本空间为Ω,如果对Ω中每个事件ω都有唯一的实数值X=X(ω)与之对应,则称X=X(ω)为随机变量,简记为X

有了随机变量,就可以通过它来描述随机试验中的各种事件,能全面反映试验的情况。这就使得我们对随机现象的研究,从前一章事件与事件的概率的研究,扩大到对随机变量的研究,这样数学分析的方法也可用来研究随机现象了。

一个随机变量所可能取到的值只有有限个(如掷骰子出现的点数)或可列无穷多个(如电话交换台接到的呼唤次数),则称为离散型随机变量。像弹着点到目标的距离这样的随机变量,它的取值连续地充满了一个区间,这称为连续型随机变量。 1、随机变量的分布函数 (1)离散型随机变量的分布率

设离散型随机变量X 的可能取值为X k (k=1,2,…)且取各个值的概率,即事件(X=X k )的概率为

P(X=x k )=p k ,k=1,2,…, 则称上式为离散型随机变量X

的概率分布或分布律。有时也

用分布列的形式给出:

,,,,,,,,|

)(2121k k k p p p x x x x X P X =。

显然分布律应满足下列条件: (1)

0≥k p , ,2,1=k ,

(2)

∑∞

==1

1

k k

p

(2)分布函数

对于非离散型随机变量,通常有0)(==x X P ,不可能

用分布率表达。例如日光灯管的寿命X ,0)(0==x X

P 。

所以我们考虑用

X 落在某个区间],(b a 内的概率表示。

定义 设X 为随机变量,x 是任意实数,则函数

)()(x X P x F ≤=

称为随机变量X 的分布函数。

)()()(a F b F b X a P -=≤< 可以得到

X 落入区间

],(b a 的概率。也就是说,分布函数完整地描述了随机变量X 随

机取值的统计规律性。

分布函数)(x F 是一个普通的函数,它表示随机变量落入区间(– ∞,x]内的概率。

)(x F 的图形是阶梯图形, ,,21x x 是第一类间断点,随

机变量

X

在k x 处的概率就是)(x F 在k x 处的跃度。

分布函数具有如下性质: 1° ,1)(0≤≤x F +∞<<∞-x ;

)(x F 是单调不减的函数,即

2

1x x <时,有

≤)(1x F )(2x F ;

0)(l

i m

)(==-∞-∞

→x F F x ,

1)(lim )(==+∞+∞

→x F F x ;

4° )()0(x F x F =+,即)(x F 是右连续的;

5° )0()()(--==x F x F x X P 。

(3)连续型随机变量的密度函数 定义 设

)(x F 是随机变量X

的分布函数,若存在非负函数

)(x f ,对任意实数x ,有

?∞

-=x

dx

x f x F )()(,

则称

X

为连续型随机变量。)(x f 称为X

的概率密度函数或密

度函数,简称概率密度。)(x f 的图形是一条曲线,称为密度(分

布)曲线。

由上式可知,连续型随机变量的分布函数)(x F 是连续函数。 所以,

()()()(1212121x P x X x P x X x P x X x P <

=<≤=≤<=≤≤

密度函数具有下面4个性质: 1° 0)(≥x f 。

?

+∞

-=1

)(dx x f 。

1

)()(==+∞?

+∞∞

-dx x f F 的几何意义;在横轴上面、密度曲

线下面的全部面积等于1。 如果一个函数)(x f 满足1°、2°,则它一定是某个随机变量的密

度函数。

4

)(21x X x P ≤<=)()(12x F x F -=?2

1

)(x x dx x f 。

4° 若

)(x f 在x 处连续,则有)()(x f x F ='。

dx x f dx x X x P )()(≈+≤<

它在连续型随机变量理论中所起的作用与k k p x X P ==)(在

离散型随机变量理论中所起的作用相类似。

)

(),(,独立性古典概型,五大公式,A P A E →→

Ω→ω

)()()()(x X P x F x X X ≤=→≤→ωω

对于连续型随机变量

X ,虽然有0)(==x X P ,但事件

)(x X =并非是不可能事件?。

?+=

+≤<≤=h

x x

dx x f h x X x P x X P )()()(

0→h ,则右端为零,而概率0)(≥=x X P ,故得

0)(==x X P 。

不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 2、常见分布 ①0-1分布 P(X=1)=p, P(X=0)=q ②二项分布

在n 重贝努里试验中,设事件A 发生的概率为p 。事件A 发生

的次数是随机变量,设为

X

,则

X 可能取值为n ,,2,1,0 。

k

n k k

n n q p k P k X P C -===)()(, 其中

n k p p q ,,2,1,0,10,1 =<<-=,

则称随机变量

X

服从参数为

n ,p

的二项分布。记为

),(~p n B X 。

n

k n k k n

n n n n

p q p q p npq q k X P X

C C ,,,,,,|)(2221 ---=

容易验证,满足离散型分布率的条件。 当1=n

时,k k q p k X P -==1)(,1.0=k ,这就是(0-1)

分布,所以(0-1)分布是二项分布的特例。 ③泊松分布 设随机变量

X

的分布律为

λλ-=

=e k k X P k

!

)(,0>λ, 2,1,0=k ,

则称随机变量X 服从参数为λ的泊松分布,记为

)(~λπX 或

者P(λ)。

泊松分布为二项分布的极限分布(np=λ,n →∞)。

如飞机被击中的子弹数、来到公共汽车站的乘客数、机床发生故障的次数、自动控制系统中元件损坏的个数、某商店中来到的顾客人数等,均近似地服从泊松分布。 ④超几何分布

),min(,2,1,0,)(n M l l k C C C k X P n

N

k

n M

N k M ==?==-- 随机变量X 服从参数为n,N,M 的超几何分布。 ⑤几何分布

,3,2,1,)(1===-k p q k X P k ,其中p ≥0,q=1-p 。

随机变量X 服从参数为p 的几何分布。 ⑥均匀分布

设随机变量X 的值只落在[a ,b]内,其密度函数)(x f 在[a ,

b]上为常数k ,即

??

?=,0,

)(k x f 其他,

其中k=

a

b -1

, 则称随机变量X 在[a ,b]上服从均匀分布,记为X~U(a ,b)。

分布函数为

?∞

-=

=x

dx x f x F )()(

当a ≤x 1

21,x x )内的概率为

P(

??

-==<<2

1

2

1

1

)()21x x x x a

b dx x f x X x 0, x

x -- a ≤x ≤b

1, x>b 。

a ≤x ≤b

5

a

b x x dx --=

12。

⑦指数分布

设随机变量X 的密度函数为

其中0>λ,则称随机变量X 服从参数为λ的指数分布。 X 的分布函数为

记住几个积分:

,

10=?+∞

-dx xe

x

,20

2

=?+∞

-dx e x

x

)!1(0

1-=?+∞

--n dx e x

x

n

?+∞

--=Γ0

1 )(dx e x x αα, )()1(αααΓ=+Γ

⑧正态分布 设随机变量

X

的密度函数为

22)(21

)(σ

μσ

π--

=

x e

x f , +∞<<∞-x ,

其中μ、0>σ为常数,则称随机变量X 服从参数为μ、

σ的正态分布或高斯(Gauss )分布,记为),(~2

σμN X 。

)(x f 具有如下性质:

)(x f 的图形是关于μ=x 对称的;

2° 当μ=x 时,σ

πμ21)(=

f 为最大值;

)(x f 以ox 轴为渐近线。

特别当σ固定、改变μ时,

)(x f 的图形形状不变,只是集体

沿ox 轴平行移动,所以μ又称为位置参数。当μ固定、改变σ时,

)(x f 的图形形状要发生变化,随σ变大,

)(x f 图形的形

状变得平坦,所以又称σ为形状参数。 若

),(~2σμN X ,则X

的分布函数为

dt

e

x F x

t ?

---

=

2

22)(21

)(σ

μπσ

。。

参数

0=μ、1=σ时的正态分布称为标准正态分布,记为

)1,0(~N X ,其密度函数记为

2

2

21)(x e x -=

π

?,+∞<<∞-x ,

分布函数为

dt

e

x x

t ?

--

Φ2

221)

。)(x Φ是不可求积函数,其函数值,

已编制成表可供查用。

φ(x)和Φ(x)的性质如下:

1° φ(x)是偶函数,φ(x)=φ(-x);

2° 当x=0时,φ(x)=

π

21为最大值;

3° Φ(-x)=1-Φ(x)且Φ(0)=2

1。 如果

X ~),(2σμN ,则

σ

μ

-X ~)1,0(N 。

所以我们可以通过变换将)(x F 的计算转化为)(x Φ的计算,而

)(x Φ的值是可以通过查表得到的。

??

? ??-Φ-??? ??-Φ=≤<σμσμ1221)(x x x X x P 。

分位数的定义。 3、随机变量函数的分布 随机变量

Y 是随机变量X 的函数)(X g Y =,若X 的分布函

数)(x F X 或密度函数)(x f X 知道,则如何求出)(X g Y =的

分布函数)(y F Y 或密度函数

)(y f Y 。

(1)X 是离散型随机变量 已知X 的分布列为

,,,,,,,,)(2121n n i p p p x x x x X P X

=, 显

)

(X g Y =的取值只可能是 ),(,),(),(21n x g x g x g ,若)(i x g 互不相等,则Y

的分

布列如下:

,,,,),(,),(),()(2121n n i p p p x g x g x g y Y P Y

=,

若有某些)(i x g 相等,则应将对应的i P 相加作为)(i x g 的概率。 (2)

X

是连续型随机变量

先利用X 的概率密度f X (x)写出Y 的分布函数F Y (y),再利用变上下限积分的求导公式求出f Y (y)。

=)(x f

,x e λλ- 0≥x

,

0, 0

=

)(x F ,1x e λ-- 0

≥x ,

,0 x<0。

6

二维随机变量及其分布 第一节 基本概念

1、二维随机变量的基本概念

(1)二维离散型随机变量联合概率分布及边缘分布

如果二维随机向量ξ(X ,Y )的所有可能取值为至多可列个有序对(x,y )时,则称ξ为离散型随机量。理解:(X=x,Y=y )≡(X=x ∩Y=y )

设ξ=(X ,Y )的所有可能取值为),2,1,)(,( =j i y x j i ,

且事件{ξ=),

(j i y x }的概率为p ij,,称

),2,1,()},(),{( ===j i p y x Y X P ij j i

为ξ=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:

这里p ij 具有下面两个性质: (1)p ij ≥0(i,j=1,2,…); (2)

.1=∑∑

ij i

j

p

对于随机向量(X ,Y ),称其分量X (或Y )的分布为(X ,Y )的关于X (或Y )的边缘分布。上表中的最后一列(或行)给出了X 为离散型,并且其联合分布律为

),2,1,()},(),{( ===j i p y x Y X P ij j i ,

X

),2,1,()( ====∑?j i p x X P P ij j

i i ;

Y 的边缘分

为 ),2,1,()( ====∑?j i p y Y P P ij i

i i 。

(2)二维连续型随机向量联合分布密度及边缘分布 对于二维随机向量

)

,(Y X =ξ,如果存在非负函数

),)(,(+∞<<-∞+∞<<-∞y x y x f ,

使对任意一个其邻边分别平行于坐标轴的矩形区域D ,即D={(X,Y)|a

??=∈D

dxdy y x f D Y X P ,),(}),{(

则称ξ为连续型随机向量;并称f(x,y)为ξ=(X ,Y )的分布密

度或称为X 和Y 的联合分布密度。

分布密度f(x,y)具有下面两个性质: (1) f(x,y)≥0; (2)

??

+∞∞-+∞

-=.1),(dxdy y x f

一般来说,当(X ,Y )为连续型随机向量,并且其联合分布密度为f(x,y),则X 和Y 的边缘分布密度为

.),()(),()(?

?+∞

-+∞∞

-==dx y x f y f dy y x f x f Y X ,

注意:联合概率分布→边缘分布

(3)条件分布

当(X ,Y )为离散型,并且其联合分布律为

),,2,1,()},(),{( ===j i p y x Y X P ij j i

在已知X=x i 的条件下,Y 取值的条件分布为

,)|(?

=

==i ij i j p p x X y Y P

其中p i ?, p ?j 分别为X ,Y 的边缘分布。

当(X ,Y )为连续型随机向量,并且其联合分布密度为f(x,y),则在已知Y=y 的条件下,X 的条件分布密度为

)

()

,()|(y f y x f y x f Y =

在已知X=x 的条件下,Y 的条件分布密度为

)

()

,()|(x f y x f x y f X =

其中

0)(,0)(>>y f x f Y X 分别为X ,Y 的边缘分布密度。

(4)常见的二维分布

①均匀分布

7

设随机向量(X ,Y )的分布密度函数为

???

???

?∈

=

其他

,0),(1

),(D

y x S y x f D

其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记

为(X ,Y )~U (D )。 例如图3.1、图3.2和图3.3。 图3.1 图3.2 图3.3

②正态分布

设随机向量(X ,Y )的分布密度函数为

121

),(2121211221))((2)1(21

2

????---???? ??----=

σσμμρσμρρ

σπσy x x e

y x f

其中1||,0,0,,2121<>>ρσσμμ,共5个参数,则称(X ,

Y )服从二维正态分布,

(3)连续型随机变量 f(x,y)=f X (x)f Y (y)

联合分布→边缘分布→f(x,y)=f X (x)f Y (y)

直接判断,充要条件: ①可分离变量

②正概率密度区间为矩形

例3.6:如图3.1,f(x,y)=8xy, f X (x)=4x 3

, f Y (y)=4y-4y 3

,不独立。

例3.7:f(x,y)=?

?

?≤≤≤≤其他

,010,20,2

y x Axy

(4)二维正态分布

,121

),(22121211221))((2)1(212

???

?????---???? ??----=

σσμμρσμρρ

σπσy x x e y x f ρ=0

(5)随机变量函数的独立性

若X 与Y 独立,h,g 为连续函数,则:h (X )和g (Y )独立。 例如:若X 与Y 独立,则:3X+1和5Y-2独立。

3、简单函数的分布

两个随机变量的和Z=X+Y ①离散型: ②连续型

f Z (z)=dx x z x f ?

+∞

--),(

两个独立的正态分布的和仍为正态分布(2

22121

,σσμμ++)。

3.17:设(X ,Y )的联合分布密度为

??

?

?

?≤≤≤+=.

,0,

10),(),其他x y y x C y x

) 求C ;

) 求X ,Y 的边缘分布; ) 讨论X 与Y 的独立性; ) 计算P (X+Y ≤1)。

随机变量的数字特征 第一节 基本概念

)一维随机变量及其函数的期望

X 是离散型随机变量,其分布律为P(k

x X =)=p k ,

…,n ,

∑==n

k k

k p x X 1

)

1) E(C)=C

2)

E(CX)=CE(X) 3) E(X+Y)=E(X)+E(Y)

∑∑===n

i n

i i i i i X E C X C E 1

1

)()(

4) E(XY)=E(X) E(Y),充分条件:X 和Y 独立; 充要条件:X 和Y 不相关。 5) Y=g(X)

离散:∑==n

i k

k p x g Y E 1)()

(

连续:?+∞

∞-=

dx x xf X E )()(

?+∞

-=

dx x f x g Y E )()()(

)方差

2,方差

)()X D X =,标准差

9

∑-=k

k

k p X E x X D 2)]([)(

②连续型随机变量

?+∞

--=dx x f X E x X D )()]([)(2

③方差的性质

(1) D(C)=0;E(C)=C

(2) D(aX)=a 2

D(X); E(aX)=aE(X) (3) D(aX+b)= a 2D(X); E(aX+b)=aE(X)+b (4) D(X)=E(X 2

)-E 2

(X)

(5) D(X+Y)=D(X)+D(Y),充分条件:X 和Y 独立; 充要条件:X 和Y 不相关。 D(X ±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。

E(X+Y)=E(X)+E(Y),无条件成立。

类似的,n 个相互独立的正态分布的线性组合,仍服从正态分布

),(2σμN 。

∑=i

i

i C μμ,

∑=i

i i C 222σσ

(3)常见分布的数学期望和方差

①0-1分布

E(X)=p ,D(X)=pq

②二项分布 X ~B(n,p),k n k k n n q p C k P -=)(,(k=0,1,2…n )

E(X)=np ,D(X)=npq

③泊松分布 P(λ) P(X=k)=!

k e x

k -λ,k=0,1,2…

E(X)= λ, D(X)= λ

④超几何分布 n

N

k n M

N k M C C C k X P --==)(

E(X)=N

nM

⑤几何分布 1)(-==k pq k X

P ,k=0,1,2…

E(X)=

p

1, D(X)=

2

p q

⑥均匀分布 X ~U[a,b],f(x)=

a

b -1

,[a, b ] E(X)=2

b

a +, D(X)=

12)(2a b -

10

⑦指数分布 f(x)= x

e λλ-,(x>0)

E(X)=λ

1

, D(X)=

2

1

λ

⑧正态分布 X ~N(μ,σ2

),2

22)(21)(σ

μσ

π--

=

x e

x f

E(X)= μ, D(X)= σ

2

2、二维随机变量的数字特征 (1)协方差和相关系数

对于随机变量X 与Y ,称它们的二阶混合中心矩11μ为X 与Y 的协方差或相关矩,记为),cov(Y X XY 或σ,即

))].())(([(11Y E Y X E X E XY --==μσ

与记号XY σ相对应,X 与Y 的方差D (X )与D (Y )也可分别记为XX

σ

与YY σ。

协方差有下面几个性质: (i) cov (X, Y)=cov (Y , X); (ii) cov(aX,bY)=ab cov(X,Y);

(iii) cov(X 1+X 2, Y)=cov(X 1,Y)+cov(X 2,Y); (iv)

cov(X,Y)=E(XY)-(E(X))(E(Y)).

对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称

)

()(Y D X D XY

σ

为X 与Y 的相关系数,记作XY ρ(有时可简记为ρ)。 |ρ|≤1,当|ρ|=1时,称X 与Y 安全相关:

完全相关???-==时,

负相关,当时,

正相关,当11ρρ

而当0=ρ

时,称X 与Y 不相关。

与相关系数有关的几个重要结论 (i )

若随机变量X 与Y 相互独立,则0=XY ρ;反之

不真。

(ii ) 若(X ,Y )~N (ρσσμμ,,,,222

1

21),则X 与Y

相互独立的充要条件是0=ρ

,即X 和Y 不相关。

(iii ) 以下五个命题是等价的:

①0=XY

ρ;

②cov(X,Y)=0;

③E(XY)=E(X)E(Y);

④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

(2)二维随机变量函数的期望

????

???=??∑∑∞+∞∞

+∞

--为连续型。,

为离散型;,),(),(),(),(),()],([Y X dxdy y x f y x G Y X p y x G Y X G E i j ij j i

(3)原点矩和中心矩

①对于正整数k ,称随机变量X 的k 次幂的数学期望为X 的k 阶原点矩,记为v k ,即

u k =E(X k

), k=1,2, ….

于是,我们有

??????

?=?∑∞+∞

-.

,)(续型时为连当为离散型时,

当X dx x p x X p x u k i

i

k i k

②对于正整数k ,称随机变量X 与E (X )差的k 次幂的数学期望

为X 的k 阶中心矩,记为k μ,即

.,2,1,))(( =-=k X E X E k k μ

于是,我们有

??????

?--=?∑∞+∞

-.

,)())(())((续型时为连当为离散型时,当X dx x p X E x X p X E x u k i

i

k i k

③对于随机变量X 与Y ,如果有)(l k

Y X

E 存在,则称之为X 与

Y 的k+l 阶混合原点矩,记为kl u ,即

11

))].(())([(Y E Y X E X E u k kl --=

大数定律和中心极限定理

第一节 基本概念

1、切比雪夫不等式

设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ2

,则对于任意正数ε,有下列切比雪夫不等式

2

2

)(ε

σεμ≤≥-X P

切比雪夫不等式给出了在未知X 的分布的情况下,对概率

)(εμ≥-X P

的一种估计,它在理论上有重要意义。 2、大数定律

(1)切比雪夫大数定律 (要求方差有界)

设随机变量X 1,X 2,…相互独立,均具有有限方差,且被同一常数C 所界:D (X i )

.1)(1

1lim 11=???

? ??<-∑∑==∞→εn

i i n

i i n X E n X n P 特殊情形:若X 1,X 2,…具有相同的数学期望E (X I )=μ,

则上式成为

.11lim 1=???

?

??<-∑=∞→εμn i i n X n P 或者简写成:

()

.1lim =<-∞

→εμX P n

切比雪夫大数定律指出,n 个相互独立,且具有有限的相同的数学期望与方差的随机变量,当n 很大时,它们的算术平均以很大的概率接近它们的数学期望。

(2)伯努利大数定律

设μ是n 次独立试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意的正数ε,有

.1lim =???

?

??<-∞→εμp n P n

伯努利大数定律说明,当试验次数n 很大时,事件A 发生的频率与概率有较大判别的可能性很小,即

.0lim =???

? ??≥-∞→εμp n P n 这就以严格的数学形式描述了频率的稳定性。

(3)辛钦大数定律 (不要求存在方差)

设X 1,X 2,…,X n ,…是相互独立同分布的随机变量序列,且E (X n )=μ,则对于任意的正数ε有

.11lim 1=???

?

??<-∑=∞→εμn i i n X n P

3、中心极限定理

(1)列维-林德伯格定理

设随机变量X 1,X 2,…相互独立,服从同一分布,且具有相同

),2,1(0)(,)(2 =≠==k X D X E k k σμ,则随机变量

σ

μ

n n X

Y n

k k

n ∑=-=

1

的分布函数F n (x )对任意的实数x ,有

?

∑∞

--

=∞

→∞→=???

?

???

???????≤-=x

t n k k n n n dt e

x n n X P x F .

21lim )(lim 2

12

πσμ

或者简写成:

)1,0(/N n

X n ??→?-∞

→σμ

此定理也称为独立同分布的中心极限定理。

(2)棣莫弗-拉普拉斯定理

设随机变量X 1,…X n 均为具有参数n, p(0

?

--

→=??

?

???????≤--=x

t n n dt e

x p np np X P .21)1(lim 2

2

π

例5.3:某车间有200台车床,在生产时间内由于需要检修、调换刀具、变换位置、调换工件等常需停车。设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1Kw ,问应供应该车间多少瓦电力,才能以99.9%的概率保证该车间不会因供电不足而影响生产。

12

数理统计的基本概念 第一节 基本概念

1、总体、个体和样本 (1)总体与样本

总体

在数理统计中,常把被考察对象的某一个(或多

个)指标的全体称为总体(或母体);而把总体中的每一个单元称为样品(或个体)。在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量)。

例如单正态总体X ,用

),(~2σμN X

来表示

我们把从总体中抽取的部分样品n x x x ,,,21 称为样本。

样本中所含的样品数称为样本容量,一般用n 表示。为了使抽取的样本很好地反映总体地信息,最常用的方法是“简单随机抽样”:

(1)代表性。即每一样品X i 与总体X 同分布; (2)独立性。即样品抽取互相间不影响。

此时的样本是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。

注意:在泛指任一次抽取的结果时,n x x x ,,,21 表示n 个随

机变量(样本);在具体的一次抽取之后,n x x x ,,,21 表示n 个具体的数值(样本值)。我们称之为样本的两重性。 (2)样本函数与统计量

设n x x x ,,,21 为总体的一个样本,称

??=

(n x x x ,,,21 )

为样本函数,其中?为一个连续函数。如果?中不包含任何未知参数,则称?(n x x x ,,,21 )为一个统计量。

2、统计量 (1)常用统计量 样本均值

.11

∑==n

i i x n x

样本方差

∑=--=n i i

x x n S 1

2

2.)(11 (与概率论中的方差定义不同)

样本标准差

.)(111

2∑=--=

n

i i x x n S 样本k 阶原点矩

∑===n i k

i k k x n M 1

.,2,1,1

样本k 阶中心矩

∑==-='n

i k i k

k x x n M 1

.,3,2,)(1 (

二阶中心矩

∑=-=n

i i X X n S 1

22

)(1*与概率论中的方差定义相同)

(2)统计量的期望和方差

μ=)(X E ,n

X D 2

)(σ=

22)(σ=S E ,2

21)*(σn

n S E -=

, 其中∑=-=n i i X X n S 1

2

2

)(1*,为二阶中心矩。

3、三个抽样分布(χ2

、t 、F 分布) (1)χ2

分布

设n 个随机变量n X X X ,,,21 相互独立,且服从标准正态分布,可以证明:它们的平方和

∑==n

i i X W 1

2

的分布密度为

???????<≥??? ??Γ=--.

0,

0,

0221

)(2122u u e u n u f u

n n

我们称随机变量W 服从自由度为n 的2

κ分布,记为W ~2

κ(n),

其中

.20

1

2dx e x n x n

-∞+-?=??? ??Γ 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中

13

的一个重要参数。

2κ 分布满足可加性:设

),(2i i n Y κ-

).(~211

2k k

i i n n n Y Z +++=∑= κ

注意两个结果:E(χ2)=n ,D(χ2

)=2n

(2)t 分布

设X ,Y 是两个相互独立的随机变量,且

),(~),1,0(~2n Y N X κ

可以证明:函数

n

Y X T /=

的概率密度为

2

121221)(+-???? ??+??

? ??Γ??? ??+Γ=n n t n n n t f π ).(+∞<<-∞t

我们称随机变量T 服从自由度为n 的t 分布,记为T ~t(n)。 注意两个结果:E(T)=0,D(T)=2

-n n

(n>2)

(3)F 分布 设

)(~),(~2212n Y n X κκ,且

X 与Y 独立,可以证明:

2

1

//n Y n X F =

的概率密度函数为

???

??

????<≥???

? ??+???? ????? ??Γ??? ??Γ???

??+Γ=+--.

0,

0,

0,

1222)(2

211222

121212

11

1

y y y n n y n n n n n n y f n n n n

我们称随机变量F 服从第一个自由度为n 1,第二个自由度为n 2的F 分布,记为F ~f(n 1, n 2).

正态分布αα

μμ-=-1,

)()(1n t n t αα-=-, )

,(1

),(12211n n F n n F αα=

-

4、正态总体下统计量的分布和性质

注意一个定理:X 与2

S 独立。

(1)正态分布

n

x x x ,,,21 为来自正态总体

),(2σμN 的一个样本,则样本函数

).1,0(~/N n

x u

def

σμ

-

(2)t-分布 设

n

x x x ,,,21 为来自正态总体

),(2σμN 的一个样本,则样本函数

),1(~/--n t n

S x t

def

μ

其中t(n-1)表示自由度为n-1的t 分布。

(3)2

κ 分布

n

x x x ,,,21 为来自正态总体

),(2σμN 的一个样本,则样本函数

),1(~)1(22

2

--n S n w

def

κσ

其中)1(2

-n κ

表示自由度为n-1的2κ分布。

(4)F 分布

n

x x x ,,,21 为来自正态总体

),(2σμN 的一个样本,而n y y y ,,,21 为来自正态总体

),(2

2σμN 的一个样本,则样本函数

14

),1,1(~//2122

22

2121--n n F S S F

def

σ

σ

其中

,)(1121

121

1

∑=--=n i i x x n S

;)(1121

222

2

∑=--=n i i y y n S )1,1(21--n n F 表示第一自由度为11-n ,第二自由度为12-n 的F 分布。

第七章 参数估计 第一节 基本概念

1、点估计的两种方法 (1)矩法

所谓矩法就是利用样本各阶原点矩与相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布

函数可以表成

).,,,;(21m x F θθθ 显示它的

k 阶原点矩

)

,,2,1)((m k X E v k k ==中也包含了未知参数

m

θθθ,,,21 ,即

)

,,,(21m k k v v θθθ =。又设

n x x x ,,,21 为总体X 的n 个样本值,其样本的k 阶原点矩为

∑=∧

=n i k

i

k x n v 1

1

).,,2,1(m k =

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

??????

?

?

??

?

???

?===∑∑∑=∧

∧∧=∧∧∧=∧∧

∧n i m i m m n i i m n i i m x n v x n v x n v 121122121

211.1),,,(,1),,,(,

1),,,(θθθθθθθθθ 由上面的m 个方程中,解出的m 个未知参数),,,(21∧

∧∧m θθθ 即为参数(m θθθ,,,21 )的矩估计

15

本文来源:https://www.bwwdw.com/article/jcfl.html

Top