统计复习题 - 图文

更新时间:2023-11-05 17:27:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一 名词解释(每题2分,共10分) 总体:指根据研究目的而确定的,符合指定条件的全部观察对象的集合。 样本:总体中所抽取的一部分个体 方差:将所有观察值的离均差平方和除以观察值个数,反映了观察值的变化情况。 标准差:表示总体或样本变量分散程度的一个度量,用离均差平方和除以N或n-1 再开根号。(可同时或只写出计算公式) 标准误:各测量值误差的平方和的平均值的平方根 变异系数:标准差与平均数的比值,记为C.V.,无单位。 抽样:总体中取一部分个体进行观察的方法。 总体参数:是指总体中对某变量的概括性描述。比如说总体的均值、方差等等都是总体参数。 样本统计量:用来描述样本特性的一些特征数,是总体参数的估计值。 正态分布:若随机变量服从一个位置参数为、尺度参数为的概率分布,且其概率密度函数为称为正态分布,记作则这个随机变量就称为正态随机变量,正态随机变量服从的分布就 假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断 方差分析:是用于两个及两个以上样本均数差别的显著性检验。 小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,称为小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 决定系数:相关系数的平方,表示两个变量相互影响的百分比。 随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ; σ)中,如果σ相等而μ不等,则曲线平移, ( √ ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米 品种是来自同一总体。( ) 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自 不同总体.(×) 4小概率原理是指小概率事件在一次试验中可以认为不可能发生(√ ) 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种子,此试验称为三处理五重复试验( ) 6.系统误差是不可避免的,并且可以用来计算试验精度。( ) 7.精确度就是指观察值与真值之间的差异。( ) 8. 实验设计的三个基本原则是重复、随机、局部控制。( ) 第 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。( ) 一2 10.如果回归方程Y=3+1.5X的R=0.64,则表明Y的总变异80%是X造成。( ) 页

三. 简答题(每题5分共20分)

1. 完全随机试验设计与随机区组试验设计有什么不同?

答:完全随机设计就是对所有试验单位随机地安排不同的处理(2分);而随即区组设计是根据试验环境条件的差异性把试验单位分为不同的区组,在每个区组内都安排一套或多套重复,区组内部则把不同处理随机安排到不同的试验单位(2分)。完全随机设计中所有处理都是随机安排在各个试验空间或时间内,而随机区组试验设计则在每个区组内安排全部处理,而各个处理在区组内的位置是随机安排的(3分)。随机区组可以把区组的效应从误差中分离出来,能够更精确地确定处理的效应。(3分)

2. 什么是小概率原理?在统计推断中有何作用? 答:一个事件如果发生的概率很小的话,那么它在多次重复试验中几乎是必然发生,但在一次试验中是几乎不可能发生,数学上称之小概率原理。(2分) 统计学中,一般认为等于或小于0.05或0.01的概率为小概率。(1分)在统计推断中,假定从总体抽取一个样本,计算出某一统计量如T值,F值如超过临界值,则认为发生了一个小概率事件,从而可以推翻假设H0,否定样本是来自该总体,即具有显著差异。(3分)

3. 什么是多重比较中的FISHER氏保护测验?

答:多重比较中,如果各个处理平均值之间两两进行差异性T检验,则总体上发生I类判断错误的概率将增大。(2分)而FISHER氏测验是把所有处理作为从一个相同总体抽样得到的样本,根据各样本的方差与误差方差之比确定各个处理平均数是否有显著差异,然后在此基础上再进行两两差异性检验,就减少了犯I类判断错误的可能性。(3分)

4. 样本的方差计算中,为什么要离均差平方和除以n-1而不是除以n?

答:方差是实际值与期望值之差平方的期望值,而标准差是方差平方根。 在实际计算中,我们用以下公式计算方差。 方差是各个数据与平均数之差的平方的平均数,即 s^2=(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2] ,其中,x_表示样本的平均数,n表示样本的数量,^2表示平方,xn表示个体,而s^2就表示方差。 而当用(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]作为总体X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的(n-1)/n倍,[1/(n-1)][(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]的数学期望才是X的方差,用它作为X的方差的估计具有“无偏性”,所以用[1/(n-1)]∑(Xi-X~)^2来估计X的方差,并且把它叫做“样本方差”。

5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 答:不是(1分)。相关系数是否达到显著水平,要经过显著性检验(2分)。利用公式 t= r/Sr,如果t》t0.05 或者P《0.05则表示具有显著相关性,否则表示相关不显著。(2分)

6. 单尾测验与双尾测验有何异同?

答:单尾检验与双尾检验采用的概率标准都是一样的0.05或者0.01(4分);但是单尾检验只考虑一边,所以达到显著性的临界值(绝对值)就比双尾的小,同样的统计量值就有可能超过单尾的临界值却未能超过双尾的临界值,因此有时采用双尾检验无显著差异, 而改用单尾检验却有显著差异。(6分

7. 决定系数r2反映了什么?.

答:相关系数的平方即为决定系数。决定系数:在Y的总平方和中,由X引起的平方和所占的比例,记为r2决定系数的大小决定了相关的密切程度。当R2越接近1时,表示相关的方程式参考价值越高;相反,越接近0时,表示参考价值越低。8. 试述随机区组设计有什么优点? 答:(1)设计简单,容易掌握;(2)富于伸缩性,单因素、多因素以及综合性的实验都可应用;(3)能提供无偏的误差估计,并有效的减少单向的肥力差异,降低误差;(4)对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。不足之处在于这种设计不允许处理数太多,一般不超过20个。因为处理多,区组必然增大,局部控制的效率降低,而且只能控制一个方向的土壤差异。9. 请问试验设计的三个基本原则是什么,各有什么作用? 答:随机、重复、局部控制。(2分) 随机、重复、局部控制的定义。(2分) 随机、重复、局部控制的作用。(2分)

10. 假设对一对平均数进行T检验犯一类错误的概率是0.05,则对4对平均数进行T检验时,至少有一对会犯一类错误的概率是多少? 11. 假设一个具有n个观察值的样本的方差是S2,则样本平均数的方差是多少? 12. 为什么有时采用双尾检验无显著差异, 而改用单尾检验却有显著差异? 答:因为检验的概率标准都是一样的0.05或者0.01(2分); 但是单尾检验只考虑一边,所以达到显著性的临界值就比双尾的小,同样的统计量值就有可能超过单尾的临界值却未能超过双尾的临界值,因此有时采用双尾检验无显著差异, 而改用单尾检验却有显著差异。(4分)

13. 实验设计中为什么要设立对照?

答:每个实验的变量有很多,研究的那个变量叫自变量,其他可引起因变量变化的原因叫无关变量。设立对照组,是为了证明该实验现象出现的变化(也就是因变量的变化)是自变量引起的,而不是无关变量引起的。

14. 系统误差与随机误差有何区别?

系统误差指多次测量中大小和方向不变的误差; 随机误差指多次测量中大小和方向不确定的误差;

通常把只进行一次的测量中所发生的误差看做是随机误差;而将只进行一次校验所确定的仪表误差看做是系统误差。

15. 统计推断的本质是什么?

统计推断根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。统计推断是从总体中抽取部分样本,通过对抽取部分所得到的带有随机性的数据进行合理的分析,进而对总体作

出科学的判断,它是伴随着一定概率的推测,特点是:由样本推断总体,统计推断是数理统计的核心部分,统计推断的基本问题可以分为两大类:一类是参数估计问题;另一类是假设检验问题。 16. 做实验时设置重复有什么作用?

重复的作用有二,一是降低试验误差,扩大试验的代表性;二是估计试验误差的大小,判断试验可靠程度。

17. 比较两个平均数大小时,为什么需要用到标准差? 两个大小不是一目了然么. 因为标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。例如,两组数的集合 {0,5,9,14} 和 {5,6,8,9} 其平均值都是 7 ,但第二个集合具有较小的标准差。

18. 变异系数这个统计数有什么用?

变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为C·V

19. 平均数有两个什么特点?

第一,它是对数量标志在总体各单位之间差异的抽象化;第二,它是一个代表性的数值,说明被研究总体的一般水平。

20. 方差齐性检验有什么作用?

可以比较两组数据的分布是否一致,通俗的来说就是两者是否适合比较。

21. 为什么根据一个样本的平均数和标准差就能判断它是否来自某个总体?

四. 计算题 (每题10分)

1. 某样本含有4个观察值1,2,3,4, 求该样本的平均值,方差,标准差,平均值的标准误,变异系数(10分) 解:平均值 = 2.5

方差 = 1.67 标准差 = 1.29

平均值的标准误 = 0.645 变异系数CV = 51.6%

(还差公式)

2.利用SPSS统计软件对单因素、两因素、正交试验数据的方差分析基本操作步骤。

答:单因素方差分析:分析-----比较均值------单因素ANOVA ——设置好因变量和因子——确定

两因素方差分析:分析-----一般线性模型---- 单变量——设置好因变量、固定因子、随机因子、协变量、权重——确定(5分) 正交试验数据的方差分析:数据——正交设计——生成——设置因素水平——生产正交表——增加变量,输入检查结果——分析——一般线性模型——选择单因变量多因素方差分析——导入因素和结果到相应对话框中——点选项将因素导入显示平均值对话框——模型设置自定义对话框的模型——确定

3.正交试验数据的直观分析方法。

根据正交表进行试验,可以得到就某 水 因 一(单指标,也有多指标)考察指标的试A B C D 结果 素 平 试 验结果,通过直观分析或方差分析,就可验 (指标) 以得出最佳的实验方案。 1 直观分析试验结果的步骤(以四因素2 三水平为例)如下,见表-2,根据实验数

3 据分别计算出:

4 ① 分别对每次实验各因素的一水平

5 的实验结果求和,即Ij:

6 再对每次实验各因素的二水平结果求

7 和,即IIj:

8 对每次试验各因子的三水平的结果求

和,即IIIj: 9 ② 分别求出各因素各水平结果的平Ij 均值:即Ij/3,IIj/3,IIIj/3,并填入Ⅱj 正交表中; IIIj ③ 分别求出各因素的平均值的差值

Ij/3 (也叫极差),如果是三个以上水平则要找

IIj/3 出平均值最大值或最小值之间的差值Rj。

IIIj/3 根据极差数Rj的大小,可以判断各因

素对实验结果的影响大小。 Rj R1 R2 R3 R4 判断原则是:极差愈大,所对应的因素愈重要;由此可以确定出主、次要因素的排列顺序。

根据各因素各水平所对应指标结果的平均值的大小可以确定各因素取什么水平好。 确定的原则是:如果要求指标愈小愈好,则取最小的平均值所对应的那个水平;如果要求指标愈大愈好,则取最大的平均值所对应的那个水平;如果要求指标适中(固定值),则取适中的平均值所对应的那个水平。

需要说明的是,最优的水平组合并不一定就在由正交实验设计所指定的实验当中。 所以,根据试验指标的数值要求所确定的各因素的最优水平组合,就可以筛选出最佳的试验方案条件、以及较好的试验方案条件。

对试验结果的直观分析法,除了极差分析外。为了更形象直观的得出试验分析结果,我

们还可以采用画趋势图(效应曲线图)的方法,得出正确的综合分析结论。

效应曲线图(因素指标分析)就是要画出各因素水平与指标的关系图,它是一种座标图,它的横座标用各因素的不同水平表示;纵座标同为试验指标。其实它就是根据极差分析数据所绘出来的,可以一目了然看出各因素的哪个水平为最优(根据指标的具体数值要求)。

本文来源:https://www.bwwdw.com/article/y382.html

Top