教育统计学考核要点

更新时间:2024-04-10 13:41:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

教育统计学考核知识点

第一章 绪论

1、统计规律

2、统计方法的宗旨

3、教育统计学的主要内容 4、计数数据与测量数据

5、数据测量的四种量化水平 6、总体、个体与样本 7、总体参数与样本统计量 8、抽样的原则 9、统计分类的原则 10、次数分布表 11、次数分布图

第二章 集中量数与差异量数

1、算数平均数

2、算术平均数的性质 3、几何平均数 4、调和平均数

5、中位数

6、标准差与方差

7、作为总体标准差估计值的样本标准差 8、百分位数与百分位差

第三章 概率分布与统计推断

1、随机事件

2、事件之和与事件之积 3、互不相容与相互独立 4、概率与频率

5、概率的基本性质

6、概率的加法与概率的乘法 7、概率分布 8、二项分布 9、正态分布

10、标准分z与正态分布表 11、抽样分布与标准误

12、关于样本平均数X抽样分布的几点结论 13、总体参数的点估计

14、置信区间及其置信度

15、统计检验的研究假设与虚无假设 16、统计假设检验的基本思路

17、显著性水平

18、统假设检验的两类错误

第四章 总体平均数的推断

1、统计量的自由度 2、统计量t与t分布表 3、总体平均数的区间估计 4、样本容量n与置信区间的长度 5、样本平均数X的显著性检验 6、双侧检验与单侧检验 7、相关样本与独立样本

8、关于样本平均数之差X1?X2的抽样分布的几点结论 9、相关样本平均数之差X1?X2的显著性检验

10、方差齐性假定下的独立样本平均数之差X1?X2的显著性检验 11、方差齐性假定及方差齐性检验

12、不能假定方差齐性时独立样本均数差异X1?X2的校正t?检验

第五章 总体比率的统计推断

1、关于样本比率p抽样分布的的几点结论 2、总体比率p的区间估计 3、样本比率p的显著性检验

4、相关样本比率差异p1?p2的显著性检验

5、关于独立样本比率之差p1?p2的抽样分布的几点结论 6、独立样本比率差异p1?p2的显著性检验

第六章

2?2检验

1、适合性检验与独立性检验 2、?的基本形式及其基本特性 3、?分布及?分布表 4、一般适合性检验 5、正太适合性检验 6、独立性检验

22第七章 相关分析

1、散点图

2、正相关与负相关、高相关与低相关 3、相关系数的统计意义 4、积差相关

5、一元线性回归 6、等级相关 7、点二列相关 8、二列相关 9、品质相关 10、偏相关

第八章 方差分析

1、完全随机化设计

2、完全随机化设计离差平方和的分解

3、完全随机化设计的方差分析(全局检验机器之后的逐对检验) 4、随机区组设计

5、随机区组设计离差平方和的分解 6、随机区组设计的方差分析 7、拉丁方设计

8、拉丁方设计离差平方和的分解 9、拉丁方设计的方差分析 10、析因设计

11、析因设计离差平方和的分解 12、析因设计的方差分析

第九章 非参数检验方法

1、符号检验方法

2、大样本资料符号检验的正态近似方法 3、符号秩次检验方法

4、大样本资料符号秩次检验的正态近似方法 5、秩和检验方法

6、大样本资料秩和检验的正态近似方法

教育统计学考核知识点整理

第一章 绪论

1、统计规律

随机现象在大数量观察结果中所表现出来的规律性,称为统计规律。 2、统计方法的宗旨

由个别到一般,由对局部的观察去推断无法直接把握的未知总体,是一切统计方法的宗旨。

3、教育统计学的主要内容

教育统计学的研究内容,从不同角度来分,可以分成不同的类别。从功能来分,包括三个方面:

①描述统计,它研究如何整理、简缩数据。包括用统计图、表形象而直观地展示,或者是用统计量数(譬如说平均数、标准差、相关系数,等等)来概括数据的分布特征。 ②推断统计,它是统计学方法的核心内容。推断统计研究如何由对局部的观察结果去把握总体的真实情况,推断统计又包括参数(总体的数量特征)估计和假设检验两个方面。

③实验设计,它研究如何抽取、如何配置被试,如何控制实验条件,如何有效地获取、分析实验数据,以及实验研究的步骤。

4、计数数据与测量数据

计数数据:是通过点计个数得到的。测量数据:是依据一定的法则指派给观察对象的。 5、数据测量的四种量化水平

由低到高:(1)类别数据(2)顺序数据(3)等距数据(4)比率数据

6、总体、个体与样本

总体(又称为母体)由具有研究所关心的某种特征的全部对象构成,总体是相对于具体的研究任务而言的。个体是指总体当中的每一个基本的观察单元。样本是由总体中的部分个体构成。

7、总体参数与样本统计量

总体的数量特征我们称之为总体参数,简称参数。样本的数量特征称为样本统计量,简称统计量。 8、抽样原则

(1)随机化原则是指总体中每一个个体都独立地具有相等的被抽中的机会。 (2)抽样的类型:返回抽样与不返回抽样

(3)抽样方法:简单随机抽样、系统抽样、分层抽样、整群抽样与阶段抽样。 9、统计分类的原则

(1)由研究的目的确定分类的依据,具体来说就是由研究的问题来规定分类的标志; (2)每一个分类标志都是“单向”的。分类标志的单向性是指每一个分类标志都是建立在对象的某一种特征上的。分类标志的单向性的两个必要条件:①每一个分类标志下的类别都是周延的;②每一个分类标志下的类别都是互斥的。

10、次数分布表

次数分布表又称频数分布表,是一种常用的统计表。编制简单次数分布表的一般步骤:(1)求全距;(2)根据全距确定组数、组距和组限;(3)登记次数;(4)登记频率。 11、次数分布图

次数分布图是最常用的统计图。常见类型:(1)条形图(分类标志是类别或顺序即离散变量时采用);(2)直方图(分类标志是等距或比率即连续变量时采用);(3)折线图。

第二章 集中量数与差异量数

1、算数平均数

算术平均数等于该群数据量的总和除以其次数的总和所得的商,简称为平均数或均数。 算术平均数的计算:(1)原始数据俱在时X?2、算术平均数的性质

算术平均数是一群数据的“重心”,样本算术平均数X具有如下一些基本性质: (1) 数据量的总和一定等于其算术平均数与数据数目的乘积,即?X?X?n。

(2) 某一数据与其所属样本的算术平均数之差X?X称作为离均差,样本中离均差之和一定等于零,即?(X?X)?0。

(3) 样本中的每一个数据都加上一个常数之后,它们的平均数就等于原来的平均数加上这一个常数,即

?nX;(2)数据已分组时X??Xfn。

?(Xn?C)?X?C。

(4) 样本中的每一个数据都乘以一个常数之后,它们的平均数就等于原来的平均数乘以这一个常数,即

?(Xn?C)?X?C。

(5) 如果k个部分的容量分别是n1,n2,?,nk,而它们的平均数分别是X1,X2,?,Xk,那么由这k个部分合并而成的样本总的平均数X?n1X1,n2X2,?,nkXkn1?n2???nk。

(6) 样本平均数的数学期望就等于其所来自总体的平均数,即E(X)??。 3、几何平均数

几何平均数一般用符号MG表示,它是n个数据连乘积的n次方根,即MG?nX1?X2???Xn。几何平均数又称作为对数平均数。

4、调和平均数

调和平均数一般用符号MH表示,它表示数据的倒数的算术平均数的倒数,即

MH?1(1n?1X)。调和平均数又称倒数平均数。

5、中位数

中位数又称为中数,一般用符号Md表示。它也是一种常用的集中量数,中位数的意义

(4)统计决断

当P??时,否定虚无假设H0,从而认为两者存在(极其)显著的差异。反之,则只能保留虚无假设H0,从而认为两者不存在显著的差异。

6、双侧检验与单侧检验

(1)所谓双侧检验,是将“小概率”面积?,分作为相等的两个部分,分别放置于概率曲线的两段,各有?2。

(2) 所谓单侧检验,是将“小概率”面积?仅仅放置于概率曲线的两段,将?放置于概率曲线右端时称作为右侧检验;将?放置于概率曲线左端时称作为左侧检验。 7、相关样本与独立样本

(1)如果一个样本的抽取就决定了另一个样本的抽取,具体地说,两个样本的容量相等

n1?n2,并且两个样本的两组数据之间存在着一一成对的关系,那么,这样的两个样本称

作为相关样本。

(2)如果一个样本的抽取与另一个样本的抽取毫无关系,即是说,两个样本是个各自独立地从总体中抽取出来的,这样的两个样本称作为独立样本。两个独立样本的容量n1与n2可能相等,但是它们的两组数据之间并不存在一一对应的关系。 8、关于样本平均数之差X1?X2的抽样分布的几点结论

(1)渐近正态。即是说只要样本容量足够大,就可以把均数之差的抽样分布近似地当作是正态的。

(2)平均数之差X1?X2抽样分布中的平均数,就等于样本所来自的两个总体的平均数之差。即?X1?X2??1??2。

?(3)平均数之差在抽样分布中的标准误,就等于?X1?X2?X??X?2??X?X121222。其中

?X,?X分别表示两个样本平均数抽样分布的标准误,?是两总体(变量)的相关系数。

129、相关样本平均数之差X1?X2的显著性检验 (1)提出假设:H0:?1??2, H1:?1??;2 (2)计算检验统计量的值

总体标准差?1,?2和相关系数?未知但样本的情况已知时,

T?D?D2nn(n?1)?(?D)2,其中D?X1?X2。

(3)把握观察到的显著性水平

dfdfdf计算自由度df?n?1,查t值表得t?,将t与t?比较大小。若t>t?便可得观察到

df的显著性水平P??;若t

(4)统计决断

当P??时,否定虚无假设H0,从而认为两者存在(极其)显著的差异。反之,则只能保留虚无假设H0,从而认为两者不存在显著的差异。

10、方差齐性假定下的独立样本平均数之差X1?X2的显著性检验 (1)提出假设:H0:?1??2, H1:?1??; 2(2)计算检验统计量的值

总体标准差?1,?2和相关系数?未知但样本的情况已知时, T?X1?X2(n1?1)S?(n2?1)Sn1?n2?22122,

?(1n1?1n2)特别地,当n1?n2?n时,T?X1?X2S?Sn2122。

(3)把握观察到的显著性水平

计算自由度df?n1?n2?2(或df?2n?2),查t值表得t?,将t与t?比较大小。

dfdf若t>t?便可得观察到的显著性水平P??;若t

dfdf(4)统计决断

当P??时,否定虚无假设H0,从而认为两者存在(极其)显著的差异。反之,则只能保留虚无假设H0,从而认为两者不存在显著的差异。

11、方差齐性假定及方差齐性检验

所谓方差齐性的假定,是假定两个独立样本所来自的两个总体的方差相等。

所谓方差齐性检验,是对?12??22是否成立进行检验,方差齐性检验的检验统计量是

F?SmaxSmin2222,其中Sm,Smin分别表示两个样本的方差中较大的和较小的。 ax方差齐性检验:

(1)提出假设:H0:?12??22, H1:?12??22; (2)计算检验统计量的值

F?SmaxSmin22

(3)把握观察到的显著性水平

计算自由度df1?n1?1,df2?n2?1,查F检验的临界值表得F?比较大小。若F>F?(df1,df2)(df1,df2),将F与F?1,df2(df1,df2)(df便可得观察到的显著性水平P?2?;若F

到的显著性水平P?2?。 (4)统计决断

当P?2?时,否定虚无假设H0,从而认为方差非齐性。反之,则只能保留虚无假设H0,从而认为方差是齐性的。

12、不能假定方差齐性时独立样本均数平均数差异的校正t?检验 (1)提出假设:H0:?1??2, H1:?1??; 2(2)计算检验统计量及校正自由度的值

S1T??X1?X2S212,自由度df??1k2?1(1?k)n22,并取整。其中k?n1S12n1?S22n2n1n1?S22。

n2(3)把握观察到的显著性水平

df?dfdf查t值表得t?,将t?与t?比较大小。若t>t?便可得观察到的显著性水平P??;

df若t

(4)统计决断

当P??时,否定虚无假设H0,从而认为两者存在(极其)显著的差异。反之,则只能保留虚无假设H0,从而认为两者不存在显著的差异。

第五章 总体比率的统计推断

1、关于样本比率P抽样分布的的几点结论

(1) 从比率为P的总体中随机地抽取容量为n的样本,样本比率P存在着抽样误差。纯随机抽样的样本比率,其概率分布是二项分布。二项分布是离散的,即是说它的分布曲线不是“连续光滑”的;如果总体比率不是1/2,其二项分布的形态也不会是完全对称的。但是在“总体比率偏离1/2不很远,样本容量n又足够大”时,近似地利用正态分布,可以相当好的把握样本比率的抽样误差。

(2) 样本比率在抽样分布上的平均数,就等于样本所来自的总体比率,即?p?P。 (3) 样本比率抽样分布的标准误,就等于样本所来自的总体标准差除以样本容量的算术平方根,即??P(1?P)np。

2、总体比率P的区间估计

当“样本中两类个案的数目都大于等于10”的条件满足时,我们就可以近似地利用正态z分布,由样本比率p推断未知总体比率P的置信区间。

总体比率P的置信度为1??的置信区间为(p?z??3、样本比率p的显著性检验 (1)提出假设

研究假设H1:P?P0,其意思是:实际观察的样本并不是已知总体的一个随机样本,样本比率p与已知总体比率P0之间的差异不是抽样的随机误差。

虚无假设H0:P?P0,其意思是:实际观察的样本是已知总体的一个随机样本,样本比率p与已知总体比率P0之间的差异只是抽样的随机误差。 (2) 计算检验统计量 z?p?P0P0(1?P0)np?qn,p?z??p?qn)

(3)把握显著性水平

同样本平均数的显著性检验(?已知的情况) (4)统计决断

同样本平均数的显著性检验(?已知的情况) 4、相关样本比率差异p1?p2的显著性检验 (1)提出假设

研究假设H1:P1?P2,其意思是:样本所来自的两个总体比率不一样。

虚无假设H0:P1?P2,其意思是:样本来自于总体比率相同的两个总体,或者说,两个样本来自于同一个总体,样本比率不一样仅仅是由于抽样的随机误差。 或虚无假设H0:P?P0?(2)计算检验统计量 z?b?cb?c12,其意思是所有“不和谐”个案构成的子总体的比率为

12。

,其中b,c是观察样本中(X1?0,X2?1)与(X1?1,X2?0)两类“不和谐”个

案的数目。

(3)把握显著性水平

同样本平均数的显著性检验(?已知的情况) (4)统计决断

同样本平均数的显著性检验(?已知的情况)

5、关于独立样本比率之差p1?p2的抽样分布的几点结论

(1)只要样本容量足够大,总体比率偏离1/2不很远,就可以把样本比率之差p1?p2的抽样分布近似地当作是正态的。

(2)样本比率之差p1?p2在抽样分布中的平均数,就等于样本所来自的两个总体的比率之差,即?p1?p2?P1?P2。

(3)样本比率之差p1?p2在抽样分布中的标准误?6、独立样本比率差异p1?p2的显著性检验 (1)提出假设

p?P1(1?P1)n1?P2(1?P2)n2。

研究假设H1:P1?P2,其意思是:样本所来自的两个总体比率不一样。 虚无假设H0:P1?P2?P,其意思是:样本所来自的两个总体比率一样。 (2)计算检验统计量

z?p1?p2pe?qe(1n1?1n2),其中pe?n1p1?n2p2n1?n2是合并样本后具有某种特征的个案在样本中

所占的比率,而qe?n1q1?n2q2n1?n2?1?pe是合并样本后另一类个案在样本中所占的比率。

(3)把握显著性水平

同样本平均数的显著性检验(?已知的情况) (4)统计决断

同样本平均数的显著性检验(?已知的情况)

第六章

?2检验

1、适合性检验与独立性检验

(1) 仅仅依据一个分类标志(变量),将观察对象划分为k个类别,考察实际观察次数fo的分布与某一种理论期待次数fe的分布是否相符的检验,称作为适合性检验。

(2) 依据一个分类标志(变量),观察对象被划分为r×c个类别,考验实际观察次数fo的分布与“两个分类标志(变量)相互独立,彼此无关”的理论期待次数fe的分布是否相符的检验,称作为独立性检验。 2、?2的基本形式及其基本特性

基本形式:无论是适合性检验,还是独立性检验,?2检验都是在检验“实际观察次数与理论期待次数是否相符”。?2检验的虚无假设都可以记作为:H0:fo?fe。?2检验的 检验统计量:??基本特性:

(1) 任何一个类别的实际观察次数fo无论是大于还是小于该类别的理论期待次数fe,它对?的贡献都是一个正数。检验统计量?永不为负数。

2(2) 只有当各个类别的实际观察次数fo都恰巧等于其理论期待次数fe时,检验统计量?才222?(fo?fe)fe2。

2等于0。实际观察次数fo与理论期待次数fe相差越大,检验统计量?的数值就越大。

(3) ?是各个类别的

2(fo?fe)fe2之和,观察对象的分类数目增多,检验统计量?有增大的

2趋势。?的自由度是由资料的分类数目决定的,它等于可以自由取值的类别数目,而与样本容量n无关。 3、?分布及?分布表

如果虚无假设H0:fo?fe成立,观察次数与期待次数的差异仅仅是由于抽样的随机误差,则?的概率分布为左端起始于0,右端无限延伸的正偏态分布。随其自由度不同,?22222

分布的形态又不尽相同,形成一簇理论曲线。

2(df)2(df)2(1)2表示P(?2???)??,例如?0.05?3.84,则 ?分布表中的数据??P(??3.84)?0.05。

24、一般适合性检验

适合性检验是对一维(单变量)分组资料的“实际观察次数fo是否与理论期待次数fe相符”的假设检验。检验的研究假设是H1:fo?fe,而虚无假设是H0:fo?fe,检验统计量??2?(fo?fe)fe2。

根据检验统计量的数值及其自由度,查阅?2分布表,就可以把握样本资料所反映出来的“实际观察次数fo是否与理论期待次数fe差异”的显著性水平。

一般的适合性检验还剩两个需要解决的问题:

(1)如何确定各个类别的理论期待次数fe。实际观察次数fo是观察的结果,实际观察的结果是多少,各个类别的fo就是多少。理论期待次数fe是“如果不存在抽样误差,在某一理论或假设成立的情况下各个类别应该出现的次数”。值得提醒注意的是,理论期待次数fe是由待检验的虚无假设决定的,而并非就是总次数除以类别数目的平均次数。

(2)如何确定?2检验统计量的自由度。适合性检验的检验统计量?2是k组次数资料的

(fo?fe)fe2之和。对于一般的适合性检验而言,由于k组资料的实际观察次数之和必须等于

理论期待次数之和,即?fo??fe?n。所以k个组的观察次数在抽样波动中其实只有

2(k-1)个组的次数是“自由”的。因此一般适合性检验的检验统计量?的自由度df?k?1。 一般适合性检验:

(1)提出假设

研究假设H1:fo?fe, 虚无假设是H0:fo?fe; (2)计算检验统计量 ??2?(fo?fe)fe2

(3)把握显著性水平

2(df)2(df)由df?k?1算出自由度,再查?2分布表得??。若统计量的值?2???,则观

察到的显著性水平P??。反之,则P??。 (4)统计决断

在?的水平上否定或保留虚无假设。 自由度df?1的?2适合性检验:

(1)与样本比率显著性检验的关系:如果就某一变量而言,观察对象仅仅被划分为两个类别,那么该变量就是一个“二分变量”。

(2) 与相关样本比率差异显著性检验的关系:由于“相关样本比率差异显著性检验”问题,可以转化为对“个案行为发生了变化的子总体的样本比率的显著性检验”问题,检验的虚无假设是H0:P?P0?12,即行为发生了变化的两类个案的树木一样多,各占1/2 。

2(1)2?(z?),所以样(3) 对于二分变量资料,总有?2?z2,且在各种显著性水平上都有??本比率的显著性z检验与df?1的?2适合性检验的结论一定是一样的。同理相关样本比率差异的显著性z检验与df?1的?2适合性检验的结论也是一样的。 5、正态适合性检验

(1)正态适合性检验是指对“等距连续变量X的观察结果是否满足正态分布”的假设检验。(2)实施?2正态适合性检验,首先要将由观察所获得的等距连续数据转换为分组的计数数据fo,即等距连续变量X在各个组段的实际观察次数。

(3)?2正态适合性检验,各个组的理论期待次数fe是由“满足正态分布”的假设决定的。即:如果等距连续变量的观察结果严格地遵循正态分布,那么等距连续变量X在各个组段

所理应出现的次数。

(4)为减小误差,采用并组的方法以保证各组的理论期待次数都不小于5。

(5)正态适合性检验与一般的适合性检验不同,检验统计量?的抽样波动,除了受“观察次数等于期待次数总和”的制约外,还要受到另外两条制约,即“观察次数决定的等距连续变量X的平均数必须等于由期待次数决定的等距连续变量X的平均数”和“观察次数决定的等距连续变量X的标准差必须等于由期待次数决定的等距连续变量X的标准差”。用等式表示如下:

2?fo??fe?nXo?XeSo?Se

正态适合性检验: (1)提出假设

H1:样本所来自的总体不是正态分布;

H0:样本所来自的总体是正态分布。

(2)计算检验统计量

(ⅰ)将等距连续变量X数据进行分组,得在各个组段的实际观察次数fo; (ⅱ)计算各组组下限的标准分;

(ⅲ)查正态分布表,得各组限与平均数之间所夹的正态曲线下的面积P; (ⅳ)确定各组的组内面积P?; (ⅴ)确定各组的理论期待次数fe; (ⅵ)将fo、fe的值代入??(3)把握显著性水平

2(df)自由度df?k??3,其中k?表示并组后的实际组数。再查?2分布表得??,下面的判断

2?(fo?fe)fe2。

与一般适合性检验相同。 (4)统计决断 同一般适合性检验 6、独立性检验

二维分组资料的实际观察次数与理论期待次数是否相符的?2检验,我们称之为?2独立性检验。独立性检验的虚无假设是“二分组变量相互独立,彼此无关”。那么,余下有待解决的问题是:如何确定?2独立性检验的理论期待次数fe;以及如何确定检验统计量?2的自由度df。

(1) 确定理论期待次数fe:?2独立性检验中,理论期待次数fe是在“二个分组变量彼此独立”的假设成立的条件下,各个类别理应出现的次数。

(2) 确定自由度df:因为每一行的实际观察次数之和都必须等于该行的理论期待次数之后,同样的,每一列的实际观察次数之和也都必须等于该列的理论期待次数之和。即是说,任何一行都必须满足?fo?2?fe?nr;任何一列也必须满足?fo??fe?nc。那么在用来

计算检验统计量?的r?c组数据中,只有(r?1)?(c?1)个类别的数据可以自由取值。所以,独立性检验检验统计量?的自由度df?(r?1)?(c?1)。 ?独立性检验:

22(1)提出假设

研究假设H1:fo?fe,

虚无假设是H0:fo?fe; (2)计算检验统计量 ??2?(fo?fe)fe2,其中fe?nr?ncN;或??N(?2fo2nr?nc?1)。

(3)把握显著性水平

2(df)2(df)由df?(r?1)(c?1)算出自由度,再查?2分布表得??。若统计量的值?2???,则

观察到的显著性水平P??。反之,则P??。 (4)统计决断

在?的水平上否定或保留虚无假设。 自由度df?1的?2独立性检验

2(1)2?(z?),所以独对于二分变量资料,总有?2?z2,且在各种显著性水平上都有??立样本比率差异的显著性z检验与df?1的?2独立性检验的结论也是一样的。

2df?1的?独立性检验的检验统计量可简记为?2?N(ad?bc)2(a?b)(a?c)(b?d)(c?d)。

第七章 相关分析

1、散点图

如果对n名观察对象实施了两项检测,就可以得到一一成对的两列数据。如果分别以两项测试的数据为横坐标和纵坐标,那么n名对象的观察结果就可以标记为二维直角坐标系中的n个点(X,Y)。

2、正相关与负相关、高相关与低相关

(1)正相关与负相关(是关于“两个变量变化的方向是否一致”的概念)

随着一个变量的增加,另一个变量也有明显增加的趋势,即两个变量的变化在整体上方向一致,那么,我们说这两个变量之间存在着正相关的关系。如果用散点图来标示正相关的两列数据,那么,n个散点将会汇集在一条自左下方至右上方的直线附近。

随着一个变量的增加,另一个变量却有明显减小的趋势,即两个变量的变化在整体上方向相反,那么,我们说这两个变量之间存在着负相关的关系。如果用散点图来标示负相关的两列数据,那么,n个散点将会汇集在一条自左上方至右下方的直线附近。

(2)高相关与低相关(是关于“相关强弱程度”的概念。高相关又称为强相关,低相关又称为弱相关。) 如果随着一个变量的增加,另一个变量增加(正相关)或减小(负相关)的趋势十分明显,那么,我们说这两个变量之间的相关是高相关。高相关的两列数据,散点图上n个散点向一条直线汇集的趋势十分明显。

如果随着一个变量的增加,另一个变量增加(正相关)或减小(负相关)的趋势并不明显,那么,我们说这两个变量之间的相关是低相关。低相关的两列数据,散点图上n个散点

向一条直线汇集的趋势就不明显。

3、相关系数的统计意义

统计学中用来表述变量之间相互关系的概括性量数,称之为相关系数。两两变量之间的相关系数,又称之为简单相关系数。一般情况下,未做特别说明的相关系数是指两两变量之间的简单相关系数。样本相关系数r的统计意义不仅与它的数值大小有关,而且还与它的自由度df?n?2有关,也就是和观察样本的容量n有关。

4、积差相关

两列数据都是等距连续变量的观测数据,并且都是来自于正态分布的数据总体,那么描述这样两列数据之间的相互关系就可以采用积差相关系数。

积差相关系数r??(X?X)(Y?Y)n?SX?SY??XY?n(?X)(?Y)(?X)(?Y)?X?n??Y?n2222

样本相关系数r的显著性检验: (1)提出假设

研究假设H1:??0, 虚无假设是H0:??0; (2)计算检验统计量 t?rn?21?r2

(3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验

5、一元线性回归

只要变量X与变量Y之间存在着显著的线性相关,那么以随机抽取的n个对象的观测结果为坐标的n个散点就会汇集在一条直线附近。一元线性回归分析就是要:(1)建立关于这样一条直线的方程——一元回归方程;(2)检验回归的显著性;(3)利用回归方程,由一个变量(假定的自变量X)去预测另一个变量(假定的因变量Y)。

?a?Y?bX??XY?n(?X)(?Y)。由于样本平均数(X,Y)满??a?bX,其中?回归方程Y?b?2(?X)?2?X?n??(df)。若t?t?(df),则观察到的显著性水平P??。

足回归方程,且回归直线的斜率b?r回归显著性检验:

SYSX??r,故回归方程也可以表示为YSYSX(X?X)?Y

(1)提出假设

研究假设H1:B?0,其意思是总体中的回归系数不等于零,即总体中变量X与变量Y的相关系数??0;

虚无假设是H0:B?0,其意思是总体中的回归系数等于零,即总体中变量X与变量Y的相关系数??0; (2)计算检验统计量 t?rn?21?r2

(3)把握显著性水平

(df)计算自由度df?n?2,再查t分布表得t?。若t?t?(df),则观察到的显著性水平P??。

反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验

??与每一个Xi对应因变量Y的置信度为1??的置信区间为(Y?z??SYXi,Y?z??SYXi),

nn?22其中SYXi?6、等级相关

SY1?r,当n充分大时SYX?SY1?r。 i2只要两列数据都是“顺序”的,就可以采用等级相关的方法来分析变量之间的相互关系。在两列数据都是等距的情况下,我们可以将等距数据转换为顺序数据(等级),再求变量之间的等级相关系数。

等级相关系数的计算公式

rR?1?6?D22n(n?1),其中D?RX?RY。

等级相关显著性检验: (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量

t?rRn?21?rR2 (3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?(df)。若t?t?(df),则观察到的显著性水平P??。

反之,则P??。 (4)统计决断

同样本平均数差异的显著性检验 7、点二列相关

如果两列数据中,有一列是“真正的二分变量”的数据,而另一列是满足正态分布的等距连续变量的数据,那么,描述这样两个变量之间的线性关系应该采用点二列相关系数。

点二列相关系数的计算公式

rpb?Xp?XqStpq,

其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差。 点二列相关系数的显著性检验 (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量 t?rpbn?22

1?rpb(3)把握显著性水平

计算自由度df?n?2,再查t分布表得t?P??。反之,则P??。

(df)。若t?t?(df),则观察到的显著性水平

(4)统计决断

同样本平均数差异的显著性检验 8、二列相关

两列数据中一列是正态分布的等距连续数据,另一列原本也应该是正态分布的等距连续数据,但是,却被人为地划分成“二值”数据。分析这样两个变量之间的线性关系应该采用二列相关方法。

二列相关系数的计算公式

rb?Xp?XqSt?p?qY或rb?Xp?XtSt?pY,

其中Xp是二分变量取值为某一类的对象在等距连续变量上的平均数,而p是该类对象在样本中所占的比率;Xq是二分变量取值为另一类的对象在等距连续变量上的平均数,而q是该类对象在样本中所占的比率;St是等距连续变量的样本(合并两类对象)标准差,Xt是

等距连续变量的样本(合并两类对象)平均数;Y是正态分布曲线被划分为p与q两部分之处的曲线高度。

二列相关系数的显著性检验 (1)提出假设

H1:??0,H0:??0;

(2)计算检验统计量 z?rb?Y?np?q

(3)把握显著性水平

同样本平均数的显著性检验 (4)统计决断

同样本平均数的显著性检验

9、品质相关

如果两列数据都是类别(定性)的,根据这样的资料来分析两个变量之间的相互关系,就应该采用品质相关的方法。

品质相关系数的计算公式

当df?1时,???2N?ad?bc(a?b)(a?c)(b?c)(c?d);

当df?1时,品质相关系数也称为列联相关系数或接触系数,??品质相关系数的显著性检验 ①当df?1时 (1)提出假设

H1:??0,H0:??0;?22??N。

(2)计算检验统计量

??2N(ad?bc)2(a?b)(a?c)(b?c)(c?d)

(3)把握显著性水平

同自由度df?1的?独立性检验 (4)统计决断

同自由度df?1的?独立性检验 ②当df?1时

22

同?2独立性检验 10、偏相关

不涉及任何其他变量,仅由两列数据(譬如?1与?2)直接计算得到的相关系数(记作

r12),称作为这两个变量的简单相关系数。

在剔除了一个其他变量(譬如?3)的影响之后,变量?1与?2之间所余下的相关称作为一阶偏相关,而把这样的一阶偏相关系数记作r12,3。

如果是剔除了二个其他变量(譬如?3和?4)的影响,那么变量?1与?2之间所余下的相关称作为二阶偏相关,并且把这样的二阶偏相关系数记作r12,34。

不难理解,在剔除了k个其他变量的影响之后,原来两个变量之间所余下的相关称作为k阶偏相关;而两个变量的简单相关又被称作为零阶偏相关。 一阶偏相关系数r12,3?r12?r13?r231?r213,

2231?r二阶偏相关系数r12,34?r12,3?r14,3?r24,31?r214,31?r224,3。

本文来源:https://www.bwwdw.com/article/7yur.html

Top