第六章教育统计学

更新时间:2023-03-16 21:01:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章 抽样分布及总体平均数的推断

教学目的:

通过本章学习,同学们应理解抽样分布、小概率事件、显著性水平、统计推断的两类错误等基本概念,并熟练掌握总体参数估计和总体平均数的显著性检验的方法。

第一节 抽样分布

一、抽样分布的基本概念

三种不同性质的分布:

1.总体分布:总体内数据的频数分布; 2.样本分布:样本内数据的频数分布;

3.抽样分布:某种统计量的概率分布。平均数的抽样分布:从某一总体中抽出的,容量为n的一切可能样本平均数的分布。

【如】:样本平均数的抽样分布、相关系数的抽样分布。

二、平均数抽样分布的几个定理

1.从总体中随机抽出容量为n的一切可能样本平均数之平均数等于总体平均数。

E(X)??E表示平均的符号.

(6.1)2.容量为n的样本平均数在其抽样分布上的标准差,与总体标准差成正比,与样本容量n的方根成反比。

?x??n(6.2)

。 ?x:是平均数抽样分布上的标准差(一般称作平均数的标准误)

3.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。

4.虽然总体不是正态分布,如果样本容量n很大,平均数的抽样分布也近似

1

正态分布。

※:标准误越小,表明统计量与参数值越接近。 三、样本平均数与总体平均数离差统计量的形态

1.总体为正态分布,总体标准差?已知时,平均数的离差统计量呈标准正态分布。可写作

Z?X???n (6.3)2.总体为正态分布,但总体?未知,平均数的离差统计量呈t分布。 (1)总体标准差的估计量:

S?n??xn?1(6.4)

n :为贝塞尔氏校正系数.。n?1(2)平均数的标准误的估计量:

SX?Sn??xn??x/n?n?1n?1(6.5)

(3)平均数的离差统计量:

t?X??X????xSXn?1(6.6)

注:t随着X和?x而变化。

(4)t分布的特点

① 单峰对称,曲线与基线永不相交; ② t值有正有负,也可为零;

③ t分布是随df=n-1而变化的一簇分布; 参看教材86页。 图例6.1和表6.1

图6.1 自由度为1,2,5, t 分布曲线与正态曲线比较图

2

表6.1 中央面积为0.95不同自由度t的临界值

自由度 t 值

中央面积不变,df不同,t的临界值不同。 df无限大时t分布与正态分布重合。

※ 自由度:公式(6.6)中的n-1统计学中称为自由度(用df 表示,即df =

n-1)。

自由度:是指总体参数估计量中变量值能独立自由变化的个数。 【例如】:

2 ±4.30 4 ±2.78 6 ±2.45 20 ±2.09 30 ±2.04 ∞ ±1.96 S?n??x?n?1n?n?1?(x?x)n2??(x?x)n?12 中,因受到 ?(x?x)?0的限制,只有n?1个(x?x)可以自由变化。

推断统计有两种形式:参数估计和假设检验。 一、总体平均数估计的基本原理

1.点估计

点估计:用一个样本统计量的值估计出一个具体的总体参数值,就称作点估

3

计。如把样本平均数当作总体平均数。

点估计的评价标准:

(1)无偏性:一切可能样本统计量与总体参数的离差和为零。 【如】:

?(x??)?0,该统计量就为总体参数的无偏估计量。

x:为无偏估计量,?x:为有偏估计量。所以s?n??x n?1(2)有效性:当总体参数不止有一种无偏估计量时,某一统计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。

【如】:x的有效性高, M0、Md的有效性低。

(3)一致性:当n无限增大时,估计量的值越来越接近它所估计的总体参数值,则这种估计量是总体参数的一致性估计量。

注:点估计既不能指明估计误差大小,也不能说明正确估计的概率大小。

2、区间估计

(1)区间估计:是指以统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计出总体参数值的所在范围。

(2)平均数区间的估计原理:

当总体?已知时,根据平均数抽样分布定理,在95%的置信度上估计:

P(?1.96?x???n?1.96)?0.95(6.7)

将括号内的不等式整理可得:

P(X?1.96X?1.96?n???X?1.96?n?n)?0.95(6.8)

?n为置信下限,X?1.96为置信上限。

4

二、?已知条件下总体平均数的区间估计

?已知,总体为正态分布(或总体不呈正态,但n较大)时,可按标准正态分布处理。

【例】:某区高一学生的英语统考成绩的标准差为6分,从此次考试的试卷中随机抽出100份试卷,算得平均分为71分。试求全区平均成绩的95%和99%的置信区间:

解:∵

总体为正态,?已知,且n?100?30,所以可按标准整态分布估计

1.95%的置信区间为:

P(X?1.96?n???X?1.966?n)?0.956100P(71?1.96?100???71?1.96?)?0.95

P(69.82???72.18)?0.952. 99%的置信区间为:

P(X?2.58?n???X?2.58?n)?0.99

(Z分布下中央面积为0.99时临界值为?2.58).P(71?2.58?P(69.45?6100???71?2.58?6100)?0.99

??72.55)?0.99※:置信度越高,置信区间就越大。 三、?未知条件下总体平均数的区间估计

1.基本原理

当?已知时,用Z估计;当?未知时,其原理与?已知时基本相同,只是临

5

本文来源:https://www.bwwdw.com/article/e8uv.html

Top