统计学名词解释

更新时间:2024-06-16 20:46:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1. 中文名称:显著性水平

英文名称:significance level定义:

通常以α表示,是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。α越小,犯拒绝“假设”的错误可能性越小。

概念:估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示

1-α 为置信度或置信水平,其表明了区间估计的可靠性 统计假设检验也称为显著性检验,即指样本统计量和假设的总体参数之间的显著性差异。显著性是对差异的程度而言的,程度不同说明引起变动的原因也有不同:一类是条件差异,一类是随机差异。显著性差异就是实际样本统计量的取值和假设的总体参数的差异超过了通常的偶然因素的作用范围,说明还有系统性的因素发生作用,因而就可以否定某种条件不起作用的假设。假设检验时提出的假设称为原假设或无效假设,就是假定样本统计量与总体参数的差异都是由随机因素引起,不存在条件变动因素。

假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假设;大于这个标准则接受原假设。这样显著性水平把概率分布分为两个区间:拒绝区间,接受区间。

显著性水平不是一个固定不变的数字,其越大,则原假设被拒绝的可能性愈大,原假设为真而被否定的风险也愈大。显著性水平应根据所研究的的性质和我们对结论准确性所持的要求而定。

2. 显著性检验

显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。

抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。

显著性检验的含义

显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。 常把一个要检验的假设记作H0,称为原假设(或零假设) (null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis) 。

⑴ 在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α,α称为显著性水平; ⑵ 在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。

通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验,概率α称为显著性水平。

最常用的α值为0.01、0.05、0.10等。一般情况下,根据研究的问题,如果放弃真错误损失大,为减少这类错误,α取值小些 ,反之,α取值大些。

显著性检验的原理

“无效假设”

显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。 “无效假设”成立的机率水平

检验“无效假设”成立的机率水平一般定为5%(常写为p≤0.05),其含义是将同一实验重复100次,两者结果间的差异有5次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p>0.05。若两者结果间的差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为p≤0.05。如果p≤0.01,则认为两组间的差异为非常显著。

显著性检验的基本思想

显著性检验的基本思想可以用小概率原理来解释。 1、小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件事实上发生了,那只能认为事件不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。

2、观察到的显著水平:由样本资料计算出来的检验统

计量观察值所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。 3、检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。

4、在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。大于这个标准时,拒绝原假设的证据不足,认为样本数据不足以表明真实差异存在。

5、检验的操作可以用稍许简便一点的作法:根据所提出的显著水平查表得到相应的值,称作临界值,直接用检验统计量的观察值与临界值作比较,观察值落在临界值所划定的尾部内,便拒绝原假设;观察值落在临界值所划定的尾部之外,则认为拒绝原假设的证据不足。

3. 显著性检验的步骤

显著性检验的一般步骤或格式,如下: 1、提出假设 H0:______ H1:______

同时,与备择假设相应,指出所作检验为双尾检验还是左单尾或右单尾检验。

2、构造检验统计量,收集样本数据,计算检验统计量的样本观察值。

3、根据所提出的显著水平 ,确定临界值和拒绝域。 4、作出检验决策。

把检验统计量的样本观察值和临界值比较,或者把观察到的显著水平与显著水平标准比较;最后按检验规则作出检验决策。当样本值落入拒绝域时,表述成:“拒绝原假设”,“显著表明真实的差异存在”;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假设”,“没有充足的理由表明真实的差异存在”。另外,在表述结论之后应当注明所用的显著水平。

4. 常用显著性检验

1.t检验

适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。 2.t'检验

应用条件与t检验大致相同,但t′检验用于两组间方差

不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。 3.U检验

应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。 4.方差分析

用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。 5.X2检验

是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况:四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。 6.零反应检验

用于计数资料。是当实验组或对照组中出现概率为0或100%时,X2检验的一种特殊形式。属于直接概率计算法。 7.符号检验、秩和检验和Ridit检验

三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所

以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。 8.Hotelling检验

用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。

5. 显著性差异

显著性差异(significance level),是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的,如比-西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。

显著性差异是一种有量度的或然性评价。比如,我们说A、B两数据在0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%,两个数据所代表的样本

还有5%的可能性是没有差异的,这5%的差异是由于随机误差造成的。

通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了差异显著或是极显著。在作结论时,应确实描述方向性(例如显著大于或显著小于)。sig值通常用 P>0.05 表示差异性不显著;0.01

如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。

6. P值

它的含义是概率(Probability),简单地说就是随机事件发生的可能性的大小。概率用从0到1之间的小数表示,也可表示为百分数。统计学通常认为如果P值小于0.05,则该事件可视为小概率事件,即一次抽样中几乎不可能发生的事件。如果P值小于0.01,同样也是小概率事件,只是进一步表明发生的概率更小。

在我们的单页宣传资料中,当统计图表上注明P值时,

大多数情形下它表示的是对照组与控制组试验数据的均数相比较的假设检验的结果。如果P<0.05或0.01,即可认为两组数据不是来自同一总体,它们之间均数的差异具有显著性。这样,就用数据说明了我们所销售的药品与对照药品相比,其疗效的改善是有意义的,这也是作为一个新药所必须具备的条件。当然,这并不意味着在任何情形下我们的药都优于对照药,因为统计学上的所有结论都是概率性结论。但我们可以说,在大多数情况下,或者说起码有95%的可能性,这两种药疗效的差异存在显著性。

借助统计学手段来解决医学问题已经被越来越多的专家接受,特别是在涉及到大样本的临床试验数据时,整个试验过程,从试验方案的设计到试验报告的完成,都已被统计学家们精确控制。所以当你携带药品宣传资料拜访医师时,你可以充满自信地说:\所有的结论,都是无隙可击的。\

离差平方和

离差平方和是各项与平均项之差的平方的总和。

残差平方和

为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每

个残差的平方后加起来 称为残差平方和,它表示随机误差的效应。

回归平方和

反映自变量与因变量之间的相关程度的偏差平方和。

本文来源:https://www.bwwdw.com/article/q303.html

Top