第七章参数估计

更新时间:2023-03-09 04:47:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

七、参数估计

这一部分,“数学一”和“数学三”的考试大纲、考试内容和要求完全一致.“数学二”不考概率论与数理统计,而“数学四”只考概率论不考数理统计.

Ⅰ、 考试大纲要求

㈠ 考试内容

考试大纲规定的考试内容为:

点估计的概念 估计量和估计值 矩估计法 最大似然估计法 估计量的评选标准 区间估计的概念 单个正态总体均值的区间估计 单个正态总体方差和标准差的区间估计 两个正态总体的均值差和方差比的区间估计

㈡ 考试要求

(1) 理解参数的点估计、估计量与估计值的概念,了解评选估计量的基本标准——无偏性、有效性(最小方差性)与相合性(一致性)的概念,并会证明估计量的无偏性;会比较两个无偏估计量的方差;会利用大数定律证明估计量的相合性.

(2) 掌握求估计量的方法——矩估计法和最大似然估计法;矩估计法一般只涉及一阶和二阶矩.

(3) 掌握建立未知参数的(单侧或双侧)置信区间的一般方法,掌握正态总体的均值、方差、标准差和矩,以及与其相联系的特征的置信区间的求法.

(4) 掌握建立两个正态总体的均值差和方差比,以及与其相联系的特征的置信区间的一般求法.

Ⅱ、考试内容提要

统计推断,就是由样本推断总体,是统计学的核心内容,其两个基本问题是统计估计和统计检验.统计推断的众多分支、应用、方法及原理都是围绕着估计与检验建立和展开的.参数估计,就是根据样本来估计总体的未知参数,分为点估计和区间估计.

㈠ 评选估计量的标准

点估计是用统计量的值估计未知参数的值;作估计用的统计量称为估计量;估计量是随机变量,它所取的具体值称为估计值.例如,对于任意总体X,可以分别用样本均值X和样本方差S2?)??g?X,X,?,X(有时简记为做总体的数学期望EX和方差DX的估计量.我们用统计量??n12n?做未知参数?的估计量,其中g?X1,X2,?,Xn?是简单随机样本?X1,X2,?,Xn?的函数.

同一个未知参数?一般有多个可供选择的估计量.评选估计量的标准,是对于估计量优良性的要求,考试大纲要求掌握无偏性、有效性(最小方差性)、相合性.

—7.1—

?为未知参数?的无偏估计量,如果E??=?. 1、无偏性 称估计量??和??都是?的无偏估计量,那么如果D??比??更?,则称估计量???D?2、有效性 假设?211212有效.在未知参数?任何两个无偏估计量中,显然应该选更有效者——方差较小者.

?依概率收??g?X,X,?,X?为未知参数?的相合估计量,如果?3、相合性 称估计量?n12nn?以十分接近1的概率近似等于它所估计的未知敛于?.换句话说,当n充分大时,相合估计量?n????1.相合性一般是大数定律的推论. 参数?,即P?n

㈡ 求估计量的方法

考试大纲要求掌握最常用的两种求估计量的方法:矩估计法和最大似然估计法.

1、矩估计法 矩估计法,是用样本矩估计相应的总体矩、用样本矩的函数估计总体矩相应函数的一种估计方法.矩估计法无需知道总体的分布.总体的k阶原点矩和k阶中心矩定义分别定义为

???k?EXk 和 ?k?E?X?EX?k(k=0,1,2,?).

考试大纲只涉及一阶矩和二阶矩.矩估计法的步骤为:

?k估计k阶总体原点矩?k,用k阶样本中心矩??k估计总体的k阶中(1) 用k阶样本原点矩??1估计总体的数学期望EX??1,用二阶样心矩?k.例如,用一阶样本原点矩——样本均值X=?2?2估计总体的方差DX??2. 本中心矩——未修正样本方差Sn????f???1,??2?就是(2) 设??f??1,?2?是一阶原点矩?1和二阶原点矩?2的函数,则???f??1,?2?的矩估计量(见例7.19).

??f???2? 就(3) 设?i?fi??1,?2?(i=1,2)是一阶原点矩?1和二阶原点矩?2的函数,则?ii?1,?是?i?fi??1,?2?(i=1,2)的矩估计量(见例7.5、例7.18~7.20).

2、最大似然估计法 最大似然估计法要求事先知道总体分布的数学表达式.我们用概率函数f?x;??表示总体X的概率分布,其中?是一维参数或????1,?2?是二维参数.对于离散型总体X,其概率函数为

?P?X?x?? , 若x是X的可能值; (7.1) f?x;????0 , 若x不是X的可能值 .? 对于连续型总体X,其概率函数f?x;??就是概率密度.

(1) 似然函数 设总体X的概率函数为f?x;??,?X1,X2,?,Xn?是来自总体X的简单随机样本,则称函数

L????f?X1;??f?X2;???f?Xn;?? (7.2a)

为参数?的似然函数;称函数

lnL????lnf?X1;???lnf?X2;?????lnf?Xn;?? (7.2b)

为对数似然函数,亦简称似然函数.

(2) 最大似然估计量 对于给定的样本值?x1,x2,?,xn?,使似然函数L???或lnL???达到最大

?,称做未知参数?的最大似然估计值.对于几乎一切样本值?x,x,?,x?,使似然值的参数值?12n函数L???或lnL???达到最大值的估计量??,称做未知参数?的最大似然估计量,即最大似然估计

—7.2—

量??(以概率1)决定于条件:

??LX,X,?,X;???maxL?X,X,?,X;??. L?12n12n?????(3) 似然方程 由函数有极值的必要条件,得方程

df?Xi;??dlnL???n1dL???? ?0, (7.3) ?0 或

??d?fX;?d?d?ii?1称做参数?的似然方程;假如未知参数????1,?2?是二维的,则得似然方程(组)

???L???????0,?1 或 ?????L??0;????2??lnL????????1???lnL???????2??i?1nn?f?Xi;??1 ? 0 ,f?Xi;????1?i?1?f?Xi;??1 ? 0 .f?Xi;????2 (7.4)

在相当广泛的情形下,似然方程的解就是最大似然估计量.一般,要用微积分中判断最大值的方法来判断似然方程的解是否最大似然估计量.有时,只能用近似计算的方法求解似然方程.在有些情形下,似然函数对?的导数不存在,这时应采用其他方法求最大似然估计量(见例7.19,例7.21和例7.27).

(4) 最大似然估计量的函数 假设参数?的函数??g???有唯一反函数,而??是?的最大似然

?是??g???的最大似然估计量. ??g?估计量,则T

㈢ 参数的区间估计

???, ??),它以充未知参数?的区间估计,亦称 “置信区间”,是以统计量为端点的随机区间(?12?是统计量. 分大的概率包含未知参数?的值,其中区间的端点??1和?21、置信区间 设?是总体X的未知参数,?X1,X2,?,Xn?是来自总体X的简单随机样本,

??1,??2是两个统计量,满足

???????1??, (7.5) P?12?, ??)为参数?的置信度为1??的区间估计或置信区间,简称为?的1??置信区则称随机区间(?12???,??分别称做置信下限和置信上限.对于具体的样本值间;区间的端点——统计量?12?, ??)是直线上一个普通的区间,称做置信区间的一个实现. (x1,x2,?,xn),(?12?, ??) “包含”或“覆盖”未知参数?的值的概率.置信度一般选充分置信度是随机区间(?12?, ??)估计参数接近1的数,例如1??=0.95.直观上,如果多次使用置信度为0.95的置信区间(?12?,则该区间平均有95%的实现包含?的值,不包含?值的情形大致只有5%左右.

?, b)和(a, ??)都是参数?的1??置信区间,其中a和b是已知常数或2、单侧置信区间 设(??, b)称做下置信区间,而(a, ??)——上置信区间. 无穷大,则(?3、置信区间的求法 设?是总体X的未知参数,X=?X1,X2,?,Xn?是来自总体X的简单随机样本.建立未知参数?的1??置信区间的一般步骤为(见例7.26和例7.27):

(1) 选择一个包含参数?的样本的函数T?f?X;??,但是其分布不依赖于参数?;假设

??g?X;T?是T?f?X;??的反函数;

(2) 对于给定的置信度1??,根据T的概率分布选两个常数(分位数)?1,?2使之满足条件

P??1?T??2??1??; (7.11)

—7.3—

(3) 利用??g?X;T?和T?f?X;??之间的反函数关系,由(7.11)式可得

??????, 1???P??1?T??2??P?12??g?X;??,???g?X;??;若T?f?X;??是?的其中,若T?f?X;??是?的增函数,则?1122???, ??. ??g?X;??,???g?X;??;由此得参数?的1??置信区间?减函数,则?112212注 式(7.11)中?1,?2的选择有一定任意性,因此具有相同置信度的置信区间并不惟一.对于对称分布(如正态分布、t分布)以及偏度不大的分布(如?2分布和F分布),通常按如下原则选取?1,?2:

??P?T??1??P?T??2??

㈣ 正态总体参数的区间估计

?2. (7.12)

正态总体参数的置信区间,主要是一个正态总体均值和方差的置信区间,以及两个正态总体均值差和方差比的置信区间.

1、一个正态总体参数的区间估计 假设总体X~N2??, ??,?X,X212,?,Xn2?是来自总体X的简单随机样本;X是样本均值,S是样本方差.表7-1列出了?和?的1??置信区间.

2表7-1 ?和?的1??置信区间 未知参数 1??置信区间 分 位 数 n ? 2 ?2??0?2未知 ?X?u?X?t??0Sn , X?u??0?,n?1n , X?t?,n?1S?n? 附表2 附表2 附表3 ?2 2???n?1?S2??n?1S?? , 22????1??2 , n?1?2 , n?1??222、两个正态总体参数的区间估计 假设X~Na,?x,Y~Nb,?y;?X1,X2,?,Xm?和

????2?Y1,Y2,?,Yn?分别是来自总体X和Y的简单随机样本,X,Sx,Y2,Sy是相应的样本均值和

22样本方差;Sxy是联合样本方差(见(6.16)式).a?b和?x2表7-2 均值差a?b和方差比?x2的1??置信区间列入表7-2. ?y2的1??置信区间 ?y未知参数 2 ?x,?1??置信区间 2y已知 分位数 附表2 a?b ?2σ22σ2?σxσx?yy? X?Y?u? , X?Y?u?????mnmn???? 22,?y未知 ?x22=?y ?x ??附表2 ?X?Y?t?,?Sxy1?1 , X?Y?t?,?Sxy1?1? ?mnmn?????m?n?2 2??1Sx?F?2?m?1,n?1? , F?2?Sy?2?Sx?2?n?1,m?1?2? Sy?2?x 2?y附表4

Ⅲ、 典型例题分析

〖填空题〗

例7.1(估计量) 假设总体X服从参数为?的泊松分布,X1,X2,?,Xn是来自总体X的简单

—7.4—

S2是样本方差,随机样本,X是样本均值,则对于任意实数?, E?X?(1??)S2= .分析 熟知,对于任何总体 X,样本均值X是总体数学期望的无偏估计量,样本方差S2是总体方差的无偏估计量;对于泊松分布,数学期望和方差都等于分布参数?,因此

??E?X?(1??)S2??EX?(1??)ES2????(1??)???.

例7.2(最大似然估计量) 设总体X服从参数为?的泊松分布,X1,X2,?,Xn是来自总体X的简单随机样本,则概率P?X?1?的最大似然估计量为 .

分析 熟知,样本均值是参数?的最大似然估计量,而P?X?1??1?P?X?0??1?e??是?的单调函数.根据最大似然估计量的性质,1?e?X是1?e??的最大似然估计量,即概率P?X?1?的最大似然估计量.

例7.3(最大似然估计量) 设总体X的概率密度为:

???e?(x??),若x??, f(x;?)???0,若x??;?X1,X,?,Xn?是来自总体X的简单随机样本,则未知参数?的最大似然估计量??= .

分析 参数?的似然函数为

nn?L(?)??f(X;?)??eii?1i?1?(Xi??)?e?Xi?n?i?1n.

由此可见,其似然方程无解,需要直接求其似然函数

??n??exp???Xi?n??,若X1X2,?,Xn??,L(?)???i?1 ?? 0 ,若不然,?的最大值.当X1,X2,?,Xn??时L(?)?0,而当X1,X2,?,Xn??时,即当

min?X1,X2,?,Xn???时L(?)随?的增大而增大,当??min?X1,X2,?,Xn?时L(?)取最大值.

例7.4(矩估计量) 设来自总体X的简单随机样本?X1,?,Xn?,总体X的概率分布为

2???10X~??2??1?3???,

??其中0

分析 总体X的数学期望为

EX??2??2(1?3?)?2?8?.

用样本均值X估计数学期望EX,得?的矩估计量:

??1(2?X). X??2??2(1?3?)?2?8?,?8例7.5(矩估计量) 设总体X的概率密度为

??1??? x,若0?x?1,, f(x;?)??? 0 ,若不然,?其中未知参数?>0,X1,X2,?,Xn是来自总体X的简单随机样本,则?的矩估计量为 .

—7.5—

分析 总体X的数学期望(一阶原点矩)为

?1?1?EX????xf(x;?)dx??x?dx??0???1.

?1?X估计总体X的一阶矩?1?EX,得关于未知参数?的方程,用一阶样本矩(样本均值)???X(1?X). 其解就是?的矩估计量:?例7.9(置信区间) 设正态总体X的标准差为1,由来自X的简单随机样本建立的数学期望

?的0.95置信区间,则当样本容量为25时置信区间的长度L= ;为使置信区间的长度

不大于0.5,应取样本容量n? .

??0?0??分析 正态总体的数学期望?的0.95置信区间的一般公式为?X?1.96 , X?1.96??,

nn??其中根据条件?0?1.由此可见,当样本容量为n已知时置信区间的长度

?1L?1.960?2?3.92?0.784.

n25当限定置信区间的长度不大于L时,样本容量为n应满足

??1?n??3.920??15.36642?61.4656.

L?0.5?例7.10(无偏估计量) 设总体X服从参数为?的泊松分布;(X1,X2,?,Xn)是来自X的简单随机样本,则?的无偏估计量为 .

分析 熟知EX?DX??.设X为样本均值,则

22EX2?DX??EX??2?1??????2,E?X2?X????2???2. nnnn??由此可见?2的无偏估计量为X2?〖选择题〗

1 X.n例7.12(估计量) 设?是总体X的标准差,X1,X2,?,Xn是来自总体X的简单随机样本,则样本标准差S是总体标准差?的

(A) 矩估计量. (B) 最大似然估计量.

(C) 无偏估计量. (D) 相合估计量. [ D ] 分析 应选(D).因为总体标准差?的矩估计量和最大似然估计量都是未修正的样本标准差,所以(A)和(B)不成立;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计,因此(C)也不成立;从而只有(D)正确.

例7.13 设X~N(a,?2),Y~N(b,?2),并且相互独立;基于分别来自总体X和Y容量相应

22为9和11的简单随机样本,得样本均值X和Y,样本方差Sx;记 和Sy2S12?1212222(Sx?Sy), Sxy?(8Sx?10Sy). 218由熟知的事实“服从自由度为?的?2分布的随机变量的方差等于2?”,可见?2的4个无偏估计

2222量Sx中方差最小者是 ,Sy,S12,Sxy2222(A) Sx. (B) Sy . (C) S12. (D) Sxy. [ D ]

—7.6—

分析 应选(D).利用“自由度为?的?2分布的随机变量的方差等于2?”,容易计算出4

222222个无偏估计量Sx的方差.事实上,8Sx?2和10Sy,Sy,S12,Sxy?2分别服从自由度为?1=8和

?2=10的?2分布,可见

2DSx2?8Sx?2?8?4?42?10?4?42???2D??; DSy??;2?22?458?810??

444444????1??9?164?100??22???? DS12??? ; DS??? . xy2???4?454045918?????422222于是,估计量Sx中方差最小者是Sxy. ,Sy,S12,Sxy例7.15 设?X1,X2,?,Xn?是来自正态总体X~N(?,?2)的简单随机样本,为使

2D?k??Xi?1?Xi?

i?1n?1成为总体方差?的无偏估计量,应选k=

(A)

21111. (B) . (C) . (D) . [ C ] n?1n2n2?n?1?分析 由条件知:EX2??2??2.假如统计量D是总体方差?2的无偏估计量,则

ED?k?k?E?Xi?1n?1i?1?Xi??k2?E?Xi?1n?12i?1?Xi2?2XiXi?1? k???2?i?1n?12?2?2?2?2?2k(n?1)?2??2,  ?1.

2?n?1?〖解答题〗

例7.19(最大似然估计量) 假设随机变量X在区间[a,b]上均匀分布,试求区间端点a和b最大似然估计量。

解 随机变量X的概率密度

?1,若x?[a,b],?f(x)??b?a

? 0 ,若x?[a,b],?可见未知参数a和b似然函数为

?1?1,若a?X,X,?,X?b,,若a?X12n(1)?X(n)?b,??nn L(a,b)??(b?a)??(b?a)? ? ,若不然,,若不然,?0 ?0 其中X(1)?min?X1,X2,?,Xn?和X(n)?max?X1,X2,?,Xn?。分别对a和b求偏导数并令其等于0,得a和b的似然方程组

?n??L(a,b)??0,??an?1(b?a)? ??L(a,b)n???0.n?1?(b?a)??b此方程组显然无解,因此需要直接求是似然函数达到最大值的a和b。因为当X(1)?a或X(n)?b时显然L(a,b)?0,而对于任意a和b,若a?X(1)和b?X(n),则L(a,b)?L(X(1),X(n)),所以

—7.7—

当a?X(1)和b?X(n)时L(a,b)达到最大值。因此a?X(1)和b?X(n)是a和b最大似然估计量。

例7.21(最大似然估计量) 假设随机变量X在数集{0,1,2,?,N}上等可能分布,求N的最大似然估计量.

解 这里N是所要估计的未知参数.随机变量X的概率函数为

f?xN??参数N的似然函数为

1N?1?x?0,1,?,N?.

?1 ,若max{X1,X2,?,Xn}?N ,?n. L?N??f?XiN????N?1?i?1? , 若max{X1,X2,?,Xn}?N .?0 由于要不能对N求导,需直接求L(N)的最大值.而且L(N)随着N的减小而增大.记

??max?X,X,?,X?; N?n12n?时L(N)=0,?时L(N)达到最大值,??时L(N)?L(N?),因为当N?N而当N?N所以当N?N即N就是参数N的最大似然估计量.

例7.22 设来自总体X的简单随机样本?X1,X2,?,Xn?,总体X的概率分布为

23??1X~???22?(1??)(1??)2??,

??其中0

(1) 未知参数?的最大似然估计量; (2) 未知参数?的矩估计量;

(3) 当样本值为(1,1,2,1,3,2)时的最大似然估计值和矩估计值.

解 (1) 求参数?的最大似然估计量.样本 ?X1,X2,?,Xn? 中1,2和3出现的次数分别为

?1,?2和n??1??2,则似然函数和似然方程为

L(?)??2?1?2?(1??)?2(1??)2(n??1??2)?2?2?2?1??2(1??)2n?2?1??2,?lnL(?)?2?2?(2?1??2)ln??(2n?2?1??2)ln(1??),dlnL(?)2?1??22n?2?1??2???0.d??1??似然方程的惟一解就是参数?的最大似然估计量:

??2?1??2. ?2n(2) 求参数?的矩估计量.总体X的数学期望为

EX??2?4?(1??)?3(1??)2.

在上式中用样本均值X估计数学期望EX,可得?的矩估计量:

??(3?X). ?(3) 对于样本值(1,1,2,1,3,2),由上面得到的一般公式,可得最大似然估计值

12???矩估计值

2?1??22?3?22 ??;2n12312352??. 263??(3?X)??—7.8—

例7.25(最大似然估计量) 假设一批产品的不合格品数与合格品数之比R(未知常数).现在按还原抽样方式随意抽取的n件中发现k件不合格品.试求R的最大似然估计值.

解 设a是这批产品中不合格品的件数,则b是合格品的件数.从而,a?Rb,合格品率为

p?abRR??. a?b(1?R)b1?R设X是随意抽取的一件产品中不合格品的件数,则X服从参数为p的0-1分布.对于来自总体X的简单随机样本 X1,X2,?,Xn,记?n?X1?X2???Xn,则的似然函数和似然方程为

L(R)?p(1?p)?nn??nn?R??1??????1?R1?R?????n??nR?n ?,(1?R)ndlnL(R)?nn lnL(R)??nlnR?nln(1?R), ???0.dRR1?R由条件知?n?X1?X2???Xn?k,于是似然方程的惟一解

??k, Rn?k就是R的最大似然估计值.

例7.27(置信区间) 假设总体X在区间?0,??上服从均匀分布,X1,X2,?,Xn是来自X的简单随机样本,试求

(1) 端点?的最大似然估计量; (2) 端点?的0.95置信区间.

解 记X(n)?max?X1,X2,?,Xn?.由总体X的分布函数F?x??x??0?x???和例3.25知,

X?n?的分布函数为F(n)?x???x??n?0?x???.

(1) 总体X的概率密度函数为

?1?,若0?x?? ; f(x;?)????? 0 ,若不然 .未知参数?的似然函数为

L(?)??i?1n?1?,若0?X1,X2,?,Xn?? ;f(Xi;?)???n

? 0 ,若不然.?由于似然函数L(?)无驻点,需要直接求L(?)的最大值点,记X(n)?max?X1,X2,?,Xn?;由于当

??X时L(?)达到最大值,故X(n)??时L(?)=0;当X(n)??时L(?)随?减小而增大,所以当?(n)??X就是未知参数?的最大似然估计量. ?(n)??X的无偏性.为此,首先求???X的概率分布.总体X的分布函数为 现在讨论估计量?(n)(n)? 0 ,若x?0 ,??xF(x)??,若 0?x?? ,

???? 1 ,若 x?? .??X的分布函数为 由于X1,X2,?,Xn独立同分布,可见?(n)—7.9—

F(n)(x)?P{X(n)?x}?P{X1?x,?,Xn?x}? 0 ,若x?0,?n ?x??n,若0?x??,?θ? 1 ?,若x??;?P{X1?x}?P{Xn?x}??F(x)?n?nxn?1,若0?x?? ,d?n?1f(n)(x)?F(n)(x)?n?F(x)?f(x)???n

dx? 0 ,若不然 .???0EX(n)????xf(n)(x)dx??xnxn?1?ndx?n?. n?1??X是?的有偏估计量.显然,?的无偏估计量为 这样,?(n)n?1X(n). n(2) 求端点?的0.95置信区间.选统计量T?X?n??.利用X(n)的分布函数F(n)(x),确定两个常数?1和?2,使之满足下列关系式:

?21?n?P?T??1??PX(n)??1??F(n)(?1?)??1, ?1?n???2 ;?2?P?T??1??PX(n)??1??F(n)(?1?)??n ?2?n1?2,???2 ,

?2?P?T??2??PX(n)??2? ;???X(n)??X(n)?P??????P{?1?T??2}?1?? .n1??2n?2????从而,端点?的1??置信区间为

?X?n?X?n????. , ?n1??2n?2???例7.28(置信区间) 为观察某药对高胆固醇血症的疗效,测定了五名患者服药前和服药一个疗程后的血清胆固醇含量,得如下数据:

患 者 № 服 药 前 服 药 后 1 313 301 2 255 250 3 290 271 4 328 320 5 281 271

假设化验结果服从正态分布律.试建立服药前后血清胆固醇含量的均值差的0.95置信区间,并对所得结果作出解释.

解 分别以X和Y表示五名患者服药前和服药一个疗程后的血清胆固醇含量,设

Z?X?Y.这样,分别来自总体X,Y和Z的容量为5的三个样本相应为

服 药 前 X 服 药 后 Y 313 301 255 250 290 271 —7.10—

328 320 281 271

本文来源:https://www.bwwdw.com/article/5ixp.html

微信扫码分享

《第七章参数估计.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档
下载全文
范文搜索
下载文档
Top