第6章 参数估计基础 (NXPowerLite)

更新时间:2023-08-16 07:15:01 阅读量: 教学研究 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章

参数估计基础

中山大学医学统计与流行病学系张晋昕 2008.09.232013-11-21 1

第一节 抽样分布与抽样误差抽样研究的目的就是要用样本信息来推断相应总体 的特征,这一过程称为统计推断。 统计推断包括两方面的内容:参数估计和假设检验

抽样误差:样本统计量与总体参数之差;抽样误差也 表现为样本统计量之间的不同。

1.系统误差:由于受试对象、研究者、仪器设备、研 究方法、非实验因素影响等确定性原因造成,有一定

倾向性或规律性的误差。可以避免。2.随机误差:由于多种无法控制的偶然因素引起,对

同一样品多次测量数据的不一致。无倾向性,不可避免。

3.抽样误差:产生的根本原因是个体变异、产生的直接原因是抽样。

一、样本均数的抽样分布与抽样误差均数的抽样误差:由个体变异产生的、由于抽样而造成的样

本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差。

抽样实验:(a)

样本均数的分布特点:1. 各样本均数未必等于总体均数; 2. 样本均数之间存在差异;

3. 样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也 服从正态分布。

标准误的概念

用于表示均数抽样误差的指标叫样本

均数的标准差,根据其实际意义,常称作样本均数的标准误(standard error)。

2013-11-21

实验5-2 图5-1(a)是一个正偏峰的分布,用电 脑从中随机抽取样本含量分别为5,10,30和 50的样本各1000次,计算样本均数并绘制4个 直方图。PERCENT 30

(a) 原始数据

0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0

2013-11-21

x MIDPOINT

n= 5 PERCENT 30PERCENT 30

n=10

(b)n=5

(c)n=10

0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 mm MIDP OINT

0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 mm MIDP OINT

n=30 PERCENT 30

n=50 PERCENT 30

(d) n=30

(e) n=50

其他总体0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0

0

2013-11-21

0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0

mm MIDP OINT

9

mm MIDPOINT

数理统计推理和中心极限定理表明:1)从正态总体N(µ,σ2)中,随机抽取例数为n的多个 样本,样本均数 分布。 2)从均数为µ ,标准差为σ的正态或偏态总体中抽取 例数为n的样本,样本均数的标准差即标准误为 。 服从正态分布;即使是从偏态总体 也近似正态 中随机抽样,当n足够大时(如n>30),

X / n

表5-2(b) 100个样本均数的频数表与标准误的计算表身高组段152.6~ 153.2~ 153.8~ 154.4~ 155.0~ 155.6~ 156.2~ 156.8 ~ 157.4 ~ 158.0 ~

频数1 4 4 22 25 21 17 3 2 1

组中值152.9 153.5 154.1 154.7 155.3 155.9 156.5 157.1 157.7 158.3

fiXi

fiXi2

合计

100

(标准误的理论值)标准误的大小与σ的大小成正比,与n的平方根成反 比,而σ为定值,说明可以通过增加样本例数来减少标

准误,以降低抽样误差。

σ未知,用样本标准差S来估计总体标准差σ。

SX S / n用

(标准误的估计值)

来表示均数抽样误差的大小。

例5-1 2000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标

准差为15g/L 。试估计该样本均数的抽样误差。

二 、样本频率的抽样分布与抽样误差从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率及各样本率之间都存在差异,这种差

异是由于抽样引起的,称为频率的抽样误差。表示频率的抽样误差大小的指标叫频率的标准误。

据数理统计的原理,率的标准误用 P 1 n

表示

π :总体率,n:样本例数。

当π未知时,p p和1-p不太小) 公式为:

π(为样本含量足够大,且

SP

p 1 p n

:率的标准误的估计值,p:样本率。

例5-2 某市随机调查了50岁以上的中老年妇女 776人,其中患有骨质疏松症者322人,患病率为 41.5%,试计算该样本频率的抽样误差。

第二节

t 分布

2013-11-21

一、t 分布的概念在统计应用中,可以把任何一个均数为µ , 标准差为σ的正态分布N(µ,σ2)转变为µ =0,σ=1的 标准正态分布,即将正态变量值X用 来代替。 由于 服从正态分布,故 X Z XZ X

服从标准正态分布N (0,1)。

实际资料的分析中,由于 σ 往往未 知,故标准化转换

演变为:

服从ν=n-1的t分布,即:

二、t 分布的图形和 t 分布表t 分布曲线特点: 1) t 分布曲线是单峰分布,它以0为中心,左 右对称。 2)t 分布的形状与样本例数n有关。自由度越

小,则则偏高。

越大,t 值越分散,曲线的峰部越矮,尾部3) 当 n→∞时,则S逼近σ,t 分布逼近标准

正态分布。 t 分布不是一条曲线,而是一簇曲线。

本文来源:https://www.bwwdw.com/article/8swj.html

Top