2013年东北农业大学田间试验与统计作业试题

更新时间:2023-12-25 06:42:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

田间试验与统计方法网上作业题

作业题一

一、名词解释

1、随机样本:指由总体中随机抽取的个体组成的样本。

2、水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。

3、随机试验:满足下述三个条件的试验称为随机试验,试验可在相同条件下重复进行;试验的所有可能结果是明确可知的,并且不止一个;每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。

4、χ2适合性检验:即根据χ2分布的概率值来判断实际次数与预期理论次数是否符合的假设检验。 5、概率:用于度量事件发生可能性大小的数值称作事件的概率。 二、判断,请在括号内打√或×

1、两因素间互作称为二级互作,三因素间的互作为三级互作。(×)

2、由8个小麦新品系和2个对照品种组成3次重复的品比试验,属于单因素试验。(√) 3、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。(×)

4、实施一个试验在安排区组时原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。(√) 5、将一块环境条件相近的试验田划分成30个面积相同的小区,不再做其他处理,观测某品种小区产量是一个随机试验。(√)

6、若无效假设为H0:μ1=μ2,那么备择假设为HA:μ1≠μ2。(√)

7、进行小麦品种比较试验,6个品种,每品种得到4个产量观察值,则该试验具有品种间自由度为3,误差自由度为20。(×)

8、方差分析中,F检验后就进行平均数的多重比较。(×) 9、相关系数(r)和回归系数(b)都是带有单位的。(×)

10、某样本观察值为17,13,21,10,19,9,11,8,则该样本的中数为14.5。(×) 三、填空

1、农业科学试验的基本任务是研究各种农业科学理论和技术,考察研究结果的实际表现,客观地评价其推广价值和应用范围,主要包括(品种)试验、(丰产)试验、(耕作 )试验、(植保 )试验和(土肥 )试验。

2、在田间试验过程引起差异的外界因素中,(土壤)差异是最主要的,必须加以适当的控制。

3、设一样本有5个观察值,6、8、9、12、13,则x=(9.6),s=(2.88),sx=(1.29),CV=(30%)。 4、已知甲,乙两批水稻品种种子的发芽率分别为0.9和0.8, 甲,乙种子各取一粒,做发芽试验,试问有两粒发芽的概率为(0.72 ),至少有一粒发芽的概率为(0.98),两粒都不发芽的概率为(0.02 ) 。 5、反映资料集中性的特征数是(平均数),反映资料离散性的特征数是(变异数)。 四、单项选择

1、根据研究目的拟定的进行比较的一组处理,在相同试验条件下试验,所得各处理平均数值与试验总平均值之差,称为(C )。

A. 离差 B. 误差 C. 处理效应 D. 每组内离差 2、农业试验中应用最多的平均数是( A)。

A. 算术平均数 B. 几何平均数 C. 调和平均数 D. 中数和众数

1

3、比较番茄的单果重量(g)和体积大小(cm3)的变异程度,适宜的统计数是( D)。 A. 极差 B. 方差 C. 标准差 D. 变异系数 4、下列描述不属于正态分布特征的是(D)。

A. 左右对称 B. 单峰分布 C. 中间大两头小 D. 概率处处相等

5、对一批棉花种子做发芽试验,抽样1000粒,得发芽种子890粒,若规定发芽率达90%为合格,这批种子的检验结果与合格种子发芽率90%的差异为(A )。 A. 不显著 B. 显著 C. 极显著 D. 不好确定

6、对金鱼草花色进行遗传研究,以红花亲本和白花亲本杂交,F1为粉红色,F2群体有3种表现型:红花196株,粉红花419株,白花218株。检验F2分离比例是否符合1:2:1的理论比例的分析方法是(D)。 A. 方差的同质性检验 B. F检验 C. 独立性检验 D. 适合性检验 7、在多因素试验中,每一个(A )是一个处理。 A. 水平组合 B. 水平 C. 处理 D. 组合

8、根据某地区1985-2005年间小麦单位面积产量及秋季降雨量的关系,计算得r = -0.632,这一结果表明( B)。(r 0.01,18=0.561,r0.01,19 =0.549) A. 小麦单位面积产量与秋季降雨量无关

B. 小麦单位面积产量随秋季降雨量的增加极显著地减少 C. 小麦单位面积产量随秋季降雨量的增加而增加 D. 小麦单位面积产量随秋季降雨量的减少而增加 9、属于算术平均数重要特性的是(A )。 A. ?(x?x)?0 B.?(x?x)?0

2222C.?(x?x)??(x?a) D.?(x?x)??(x?a) 10、决定系数r2的取值范围为(A)。

A. [ 0,1 ] B.( 0,1 ) C. [ -1,1 ] D. ( -1,1 ) 五、简答

1、试验方案的设计要点 答:(1)明确试验目的 (2)确定合理的试验方案 (3)确定合理的水平数和水平间距 (4)贯彻唯一差异原则 (5)设置对照

(6)正确处理试验因素及试验条件间交互作用 2、何谓定量资料、定性资料?各有何特点?

答:定量资料指对数量性状进行测量或称量得出的数据,如重量、长度等。特点:定量资料一般呈连续的变异分布。

定性资料指对质量性状记数或分组记数得出的数据,如发芽和不发芽粒数、害虫头数等。特点:定性资料一般呈不连续的间断分布。

3、以随机区组试验设计为例说明方差分析中为何将总变异进行分解?为何将自由度和平方和进行分解? 答:随机区组试验设计中总变异由区组间变异、处理间变异和误差三项组成,将总变异进行分解能够发现各项变异对方差的贡献大小,进而能够发现起重要作用的变异因素。 方差的概念是用观察值的数目来除平方和,s2

(x?x)??n?12

2?SS,式中,(n?1)为自由度,SS为平n?1

方和,为获得各项变异来源的方差,需要将各项变异来源的自由度和平方和进行分解。 六、计算

1、选面积相同的玉米小区10个,各分成两半,一半去雄另一般不去雄,产量结果见下表,试测验两种处理产量的差异显著性。(t0.05,9=2.262)

玉米去雄与不去雄成队产量数据表 区号 1 2 3 4 5 6 7 8 9 10

答:解:数据整理

区号 1 2 3 4 5 6 7 8 9 10

去雄(x1i) 14.0 16.0 15.0 18.5 17.0 17.0 15.0 14.0 17.0 16.0

不去雄(x2i) 13.0 15.0 15.0 17.0 16.0 12.5 15.5 12.5 16.0 14.0

d ≠0;

去雄(x1i) 14.0 16.0 15.0 18.5 17.0 17.0 15.0 14.0 17.0 16.0 不去雄(x2i) 13.0 15.0 15.0 17.0 16.0 12.5 15.5 12.5 16.0 14.0

di(x2i—x1i) +1 +1 0 +1.5 +1 +4.5 -0.5 +1.5 +1 +2

(1)假设。H0:μd =0;对HA:μ (2)显著水平α=0.05; (3)计算

d?d?in

=1.3(1分) ? x1?x2sd??(di?d)2n?1??d2i?(?di)2nn?1=1.338 d ?SSn?1sd?2sdSS ?=0.423 d?nn(n?1)?d2inn(n?1)?(?di)2t?d =3.07 Sd3

(4)推断。实得| t |=3.07,t0.05,9=2.262,所以| t |>t0.05(1分)。否定H0,即玉米去雄与不去雄产量差异显

著。

2、有一橡胶品比试验,有A、B、C、D、E、F、G,7个品种,其中B为对照,采用随机区组设计,3次重复,小区计产面积600m2,根据产量结果进行方差分析。请回答以下问题。 (1)补充方差分析表 变异来源 区组间 处理间 误差 总变异

df ( ) ( ) ( ) ( )

SS 14.8751 367.9047 ( ) 414.5714

S2 ( ) ( ) ( )

F ( ) ( )( )

F0.05 3.89 3.00

F0.01 6.93 4.82

(2)根据方差分析表,请说明处理间由F检验得到的结论。

(3)多重比较(SSR法) ①计算小区平均数比较的sx ?se2n4 3.31 4.62 () ()

5 3.37 4.71 () ()

6 3.41 4.77 () ()

7 3.44 4.82 () ()

②橡胶品比试验产量平均数的LSR值表 p SSR0.05 SSR0.01 LSR0.05 LSR0.01

2 3.08 4.32 () ()

3 3.22 4.50 () ()

③橡胶品比试验品种平均产量比较表

品种 A G F D E B(CK) C

④试验结论 答:(1)补充方差分析表

变异来源 区组间 处理间 误差 总变异

df (2) (6) (12) (20)

SS 14.8751 367.9047 (31.8096) 414.5714

S2 (7.4286) (61.3175) (2.6508)

F (2.802) (23.131)(**)

F0.05 3.89 3.00

F0.01 6.93 4.82

小区平均产量

49.7

48.7 45.3 45.0 41.0 39.0 38.3

差异显著性

0.05 () () () () () () ()

0.01 () () () () () () ()

(2)根据方差分析表,请说明处理间由F检验得到的结论。

品种间F> F0.01,故在α=0.01的水平上接受HA,说明7个品种的平均数有极显著的差异。 (3)多重比较(SSR法)

4

①计算小区平均数比较的sx ?se2nsx?se2=0.94(1分) np

2 3.08 4.32 2.90 4.06

3 3.22 4.50 3.03 4.23

4 3.31 4.62 3.11 4.34

5 3.37 4.71 3.17 4.43

6 3.41 4.77 3.21 4.48

7 3.44 4.82 3.23 4.53

②橡胶品比试验产量平均数的LSR值表 SSR0.05 SSR0.01 LSR0.05(2分) LSR0.01(2分)

③橡胶品比试验品种平均产量比较表

品种 A

G F D E B(CK) C

小区平均产量

49.7 48.7 45.3 45.0 41.0 39.0 38.3

a a b b c c c

差异显著性

0.05(2分)

0.01(2分)

A AB BC C CD D D

④试验结论

A品种与G品种平均产量无显著差异,A和B的产量显著高于F、D、E、C和B品种,A品种极显著高于其他品种,F、D品种显著高于B、C品种,而其他品种产量间差异均不显著。

5

作业题四

一、名词解释

1、完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。 2、处理效应:试验处理对试验指标所起的增加或减少的作用称为处理效应。

3、显著水平:是统计假设检验中,用来检验假设正确与否的概率标准,一般选用0.05或0.01,记作?。 4、χ2独立性检验:这种根据次数资料判断两类因素彼此相关或相互独立的假设检验就是独立性检验,亦称列联表分析。

5、方差分析:是从方差的角度分析试验数据,将总变异的自由度和平方和分解为各个变异来源的相应部分,从而获得不同变异来源总体方差估计值,并以方差作为衡量各因素作用大小的尺度,通过方差的显著性检验——F检验,揭示各个因素在总变异中的重要程度,进而对各样本总体平均数差异显著性作出统计推断。

二、判断,请在括号内打√或×

1、田间试验在同一重复区内土壤肥力应尽量一致。(√)

2、将供试处理按一定的顺序排列,每隔几个处理设置一对照作为比较的标准,称为随机排列试验。(×) 3、试验设计三项原则,其中重复和局部控制的作用是无偏地估计试验误差。(×) 4、在边际效应明显的试验中,狭长形小区是有利的。(×)

5、若事件A与事件B至少一个发生某事件就发生,则某事件称作A与B的和事件。(√)

k(O?E)2i6、次数资料的? 检验,当df=1时,? 检验的公式为???i。(×)

Eii2

2

27、有严重斑块差异的地块不宜用作试验地。(√)

8、某样本观察值为17,13,21,10,19,9,11,8,则该样本的中数为14.5。(×)

9、单因素随机区组试验设计进行方差分析,总变异可以分解为处理间变异和误差两项。(×)

??a?bx ,其中x是自变量,y?是与x的量相对应的依变量y的点估计值;a10、直线回归方程通式为y叫回归截距,b叫回归系数。(√) 三、填空

1、试验设计的目标是避免(系统)误差,缩小(随机)误差,以保证试验的(准确)度和(精确)度。

?=1.9904+0.8432x,则其中回归截距为(1.9904 )2、有一直线回归方程y,回归系数为(0.8432 )。

3、有一小麦品种氮肥肥效试验,其处理有:O(不施氮肥);N(施氮肥);产量分别为350kg和450kg。则:氮的简单效应等于(100 )kg。

4、统计学上进行假设检验的依据是(小概率事件实际上不可能性原理)。 5、在直线相关分析中,r为相关系数,r为(决定系数)。 6、常用的顺序排列试验设计有(对比设计)和(间比设计)。

7、用来表明资料中的观察值相对集中的中心位置的特征数是(平均数)。 8、统计假设测验中直接测验的是(无效)假设,它与(备择)假设成对立关系。 9、观察值与算术平均数的差数称为(离均差),其总和为(零(0))。 10、正态分布曲线共有(2个拐点。

11、已知SSx?64,SSy?9,SP?16,则有b?(0.25),r?(0.6667)。

12、方差分析中各处理与对照相比较时,适宜采用的多重比较方法是(最小显著差数法(DLSD)法)。

16

2

四、单项选择

1、有一两因素的田间试验,A因素有4个水平,B因素有5个水平,则该试验有(C个水平组合(处理)。

A. 4 B. 5 C. 20 D. 0

2、描述一个小麦品种穗长的分布特征时,适宜采用的统计图为(A)。 A.方柱形图 B.多边形图 C.条形图 D.饼图 3、如果事件A1和A2不能同时发生,则A1和A2称为(D)。 A、和事件 B、积事件 C、对立事件 D、互斥事件

4、一样本有如下5个观测值:5.0,6.0,6.5,5.5,7.0,则该样本的平均数为(C)。

A.5 B.6.5 C. 6.0 D.5.5

5、如果样本有10个观测值,则该样本的样本容量和自由度分别为(B).

A.10和0 B.10和9 C.0和10 D.0和9 6、正态分布曲线与横轴之间所包围图形的面积等于(D). A、次数总和n B、次数总和n+1 C、0.95 D、1.00 7、相关系数r的取值范围是(C)。

A. [0,1] B. [-1,0] C. [-1,1] D. (-1,1) 8、若一资料相关系数r=0.9,则说明(B)。

A. x和Y的变异可以相互以线性关系说明的部分占90% B. x和Y的变异可以相互以线性关系说明的部分占81% C. x和Y的变异可以相互以线性关系说明的部分占10% D. x和Y的变异可以相互以线性关系说明的部分占1?r=19%

9、统计推断某参数在区间[L1,L2]内的置信度为95%,则其显著水平是( B).

A.0.01 B.0.05 C.0.90 D.0.95

10、选面积为20m的玉米小区3个,各分成两半,一半抽雄辅助授粉,另一半不抽雄不辅助授粉,若要检验两处理产量的差异显著性,应采用(C)处理方法进行比较。

A成组数据 B. 百分数 C.成对数据 D. 二项资料 五、简答

1、有一小麦栽培试验,供试品种为甲、乙、丙三个,播期为9月30日和10月10日,试写出该试验的各处理名称。

答:①甲品种,9月30日播;②甲品种,10月10日播;③乙品种,9月30日播;④乙品种,10月10日播;⑤ 丙品种,9月30日播;⑥ 丙品种,10月10日播。 2、什么是平均数?

答:平均数是反映资料集中性的特征数。 3、平均数在统计上有什么用途?

17

2

2

答:(1)指出一个资料中观察值的中心位置;

(2)作为一个资料的代表数与另一资料进行比较,以明确它们之间的差异。 4、常用的平均数有哪些类型?

答:常用的平均数有算术平均数、几何平均数、中数、众数及调和平均数。 六、计算

1、调查某果园18年龄苹果梨树的树体情况,得结果如下表,试比较东西冠径、南北冠径、树高及干周的整齐度。

苹果梨树体情况调查表

株号

1

2 480 454 510 48

3 480 600 507 61

4 666 665 544 60

5 598 527 468 76

6 620 549 544 74

7 554 559 554 77

8 591 593 644 73

9 507 638 646 58

10 494 575 539 54

东西冠径(cm) 530 南北冠径(cm) 504 树高(cm) 干周(cm)

472 49

答: 苹果梨树体情况计算结果

调查性状 东西冠径 南北冠径 树高 干周

平均数(x)(cm) 标准差(s)(cm) 变异系数(CV)(%)

552(1分) 566.4(1分) 542.8(1分) 63(1分)

64.55(1分) 62.54(1分) 61.46(1分) 11.19(1分)

11.69(1分) 11.04(1分) 11.32(1分) 17.76(1分)

以变异系数进行比较,以干周的变异程度最大,其次是东西冠径、树高,南北冠径的变异程度最小。 2、 甘肃天水连续9年测定3月下旬至4月中旬平均温度累积值(x,旬.度)和甘蓝小菜蛾盛发期(y)的关系共如下表所示,请建立x依y的直线回归方程。

累积温(x,旬.度)和甘蓝小菜蛾盛发期(y)的数据表

数据 SSx 144.63 SSy 249.56 SP -159.04 x 37.08 y 7.78 SP2 25293.72 SSx 12.03 答:2、b ? SP/SSx ? ?159.04/144.63 ? ?1.10(d/旬.度)

a?y?bx= 7.78?(?1.10×37.08) = 48.57(d)

即直线回归方程为:?= 48.57?1.10 x

3、利用相关系数法对上题(2题)建立的直线回归方程进行显著性测验(r0.01,8=0.765,r0.05,8=0.632,r0.01,7=0.798, r0.05,7=0.666)。 答:计算相关系数r

18

r?SPSSx?SSy?159.04??0.837

144.63*249.56相关系数r结果说明,甘肃天水甘蓝小菜蛾盛发期与3月下旬至4月中旬平均温度累积值呈负相关,即3月下旬至4月中旬平均温度累积值愈高,甘蓝小菜蛾盛发期愈提早。 推断:因为| r | =0.837>r0.01,7=0.798(2分),所以r在α = 0.01水平上极显著。因此,建立的直线回归方程有意义。

19

作业题五

一、名词解释

1、区组:将一个重复的全部小区分配于具有相对同质的一小块土地上,称为一个区组。 2、总体:由统计研究的目的而确定的同类事物或现象的全体。

3、唯一差异原则:在进行处理间比较时,除要比较的差异外,其它条件应当完全一致。

4、连续性矫正:χ2是连续分布,而次数资料是间断性的,由χ2检验的基本公式计算的χ2值均有不同程度偏大的趋势,尤其在df = 1时偏差较大。为此,需对χ2进行连续性矫正使之符合χ2的理论分布。

5、统计假设检验:就是运用抽样分布等概率原理,利用样本资料检验这些样本所在总体(即处理)的参数有无差异,并对检验的可靠程度做出分析的过程。 二、判断,请在括号内打√或×

1、随机区组设计遵循试验设计原则的重复、随机排列和局部控制三项原则。(√) 2、试验设计三项原则,其中重复和随机排列的作用是有效地降低试验误差。(×) 3、变异系数能用来直接比较两个单位不同或平均数相距较远的样本。(√) 4、在边际效应明显的试验中,方形小区是有利的。(√)

5、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。(×)

6、单因素完全随机试验设计进行方差分析,总变异可以分解为处理间变异、区组间变异和误差三项。(×) 7、马铃薯直径(x)和马铃薯单个块茎重 (y)的相关系数r = 0.8,表明马铃薯单个块茎重的变异平方和有64%是马铃薯直径的不同所造成。(√)

??a?bx ,其中x是自变量,y?是与x的量相对应的依变量y的点估计值;a叫8、直线回归方程通式为y回归系数,b叫回归截距。(×)

9、中数与样本内的每个值都有关,它的大小受到每个值的影响。(×)

10、若事件A与事件B同时发生某事件才发生,则称某事件为A与B的和事件。(×) 三、填空

1、次数分布表中各组的最大值与最小值称为(组限),其中,数值小的称为(下限),数值大的称为(上限),每一组上限与下限的平均数称为该组的(组中点值)。

2、方差分析的三个基本假定是(效应的可加性)、(分布的正态性)和(方差的同质性)。 3、对于样本2,3,3,4,有

4、已知SSx?64,SSy?9,SP?16。则回归系数b=(0.25)。 5、直线相关分析中,相关系数r的取值区间是([-1,1])。 6、用来测验假设的概率标准称为(显著水平)。 7、4个处理加1个对照的拉丁方试验应重复(5)次。

8、相关系数r= 0.9382和r= - 0.9382表示变量X和Y相关的(密切程度)是一致的。 9、某随机变量x~N(25,9),则μ=(25 ),σ=(3 )。

10、(平均数)的种类主要有算术平均数、中数、(众数)、几何平均数和调和平均数。 11、自由度的统计意义是指在计算(离均差平方和)时,能够自由变动的离均差的个数。 12、(对照)是比较的基准,任何试验都不能缺少,否则就不能显示出试验的处理效果。

13、统计学上采用(回归分析)研究呈因果关系的相关变量间的关系;采用相关分析研究呈平行关系的相关变量间的关系。

20

?(x?3)2 (<)

?(x?0)2。(填>、<或=)

4、随机抽取20株小麦,其株高(cm)分别为82,79,85,84,86,84,83,82,83,83,84,81,80,8l,82,81,82,82,82,80,则小麦的平均株高为(x?34.67 ),标准差为(s=3.33 )。 5、统计推断包括(假设检验)和(参数估计)两个方面。

12(O?E?)iik(O?E)k222222??6、次数资料的?测验中,??=( ),当自由度为1时,?c?=()。 ??C1i?1EEi27、若无效假设为H0:?1??2,那么备择假设为(HA:?1??2)。 8、将两尾t值表变为一尾t值表的方法是将其概率值(除以2)。

9、在参数区间估计中,保证参数在某一区间内的概率1??称为(置信概率)。

10、t检验法是检验(10 )个平均数之间的差异,而(方差分析)是对3个以上平均数间的差异进行显著性检验。

11、测验若干个处理平均数间的差异显著性的多重比较一般用(SSR ),测验若干个处理平均数与某一“对照”平均数的差异显著性的多重比较一般用(DLSD )。

四、单项选择

1、算术平均数的离均差平方的总和为(B )。 A.最大 B.最小 C.1 D.0 2、资料中最大观察值与最小观察值的差数称为(B)。 A.标准差 B.极差 C.方差 D.相差

3、方差分析的基本假定中除可加性、正态性外,还有(C)假定。 A.无偏性 B.代表性 C.同质性 D.重演性 4、对于大样本平均数的假设测验,可使用(A )。

A.u测验 B.t测验 C.?2测验 D.F测验

5、一玉米试验,设有A1、A2、A3、A4 4个品种,B1、B2、B3 3种密度,分两期播种,该试验的试验因素为(D)。

A.品种、密度 B.品种、播种期 C.密度、播种期 D.品种、密度、播种期 6、下列4种试验设计中,可以将区组分散设置在不同地段的是(A)。

A.随机区组设计 B.拉丁方设计 C.完全随机设计 D.裂区设计 7、反映资料离散性的特征数是(C)。

A.参数 B.平均数 C.变异数 D.代表数

8、根据遗传学原理,豌豆的红花纯合基因型和白花纯合基因型杂交后,在F2代红花植株出现的概率为0.75,白花植株出现的概率为0.25。若每次观察5株,得3株红花2株白花的概率为(C)。 A.3×0.753×0.252 B.5×0.753×0.252 C.10×0.753×0.252 D.10×0.752×0.253

26

9、一小麦施肥的盆栽试验,设有8个处理,每处理种植4盆,采用完全随机设计。则在方差分析时该试验的变异来源为(A)。

A.处理间变异,处理内盆间变异 B.处理间变异,处理内盆间变异,组间变异 C.处理间变异,处理内盆间变异,总变异 D.处理内盆间变异,组间变异,总变异 10、下列相关系数中表示两变量间关系最密切的是(A)。 A.r= ?0.8999 B.r=0.8478 C.r=0.8665 D.r= ?0.8805 五、简答

1、为什么顺序排列试验结果采用百分比法进行统计分析?

答:由于这类试验设计仅遵循了试验设计的局部控制和重复二大基本原则,没有遵循随机原则,因此不能正确地估计出无偏的试验误差。试验资料难以进行统计假设检验和统计推断,不宜用方差分析方法进行统计分析。一般采用百分比法进行统计分析。 2、简述方差分析的基本步骤 答:(1)自由度和平方和的分解 (2)F检验 (3)多重比较

4、 简述方差分析的基本假定 答:(1)效应的“可加性”

(2)误差的“正态性” (3)误差方差的“同质性”

5、决定系数和相关系数的区别是什么?

答:决定系数和相关系数的区别在于:首先,除| r | = 1和0的情况外,r2总是小于 | r |,这可以防止对相关系数所表示的相关程度作夸张的解释。其次,r可正可负,而r2则一律取正值。所以,r2一般不表示相关性质,只表示相关程度。

六、计算

1、为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A病毒,另半叶接种B病毒,以叶面出现枯斑数的多少作为致病力强弱的指标,得结果于下表,试测验两种病毒致病力的差异显著性。(t0.05,7?2.365,t0.01,7?3.499) 株号 病毒A

1 9

2 17

3 31

4 18

5 7

6 8

7 20

8 10

病毒B 10 11 18 14 6 7 17 5

解:1、该资料属成对数据,因两种病毒致病力的差异并未明确,故用两尾检验。 d1= -1 d2=6 d3=13 d4=4 d5=1 d6=1 d7=3 d8=5 H0:?d?0, HA:?d≠0

d? d???0.05

?

32?4

n8(d)2322?2222 SSd??d??(?1)?6???5??130.0327

22nd)8d?(?130.0327???1.52 Sd?n(n?1)8?7d4 t? ??2.632Sd1.5227

∵|t|>t0.05 , ∴否定H0

推断:两种病毒的致病力差异显著。

2、一小麦品种比较试验,参试品种5个,采用随机区组设计,重复3次。由该试验结果算得下表中的部分平方和。试完成表中剩余项目的计算,并作F测验(计算结果填入表内,测验结果用 “*” 号表示。保留二位小数)。 变异来源 区组间 品种间 误差 总变异 解: DF ( ) ( ) ( ) ( ) SS 0.68 87.04 ( ) 93.05 MS ( ) ( ) ( ) F ( ) ( ) F0.05 3.84 F0.01 7.01 变异来源

区组间

DF (2)

SS 0.68

MS (0.34) (21.76

F (0.51) (32.48**)

F0.05

F0.01

品种间 (4) 87.04

3.84 7.01

误差 总变异

(8) (14)

(5.33) 93.05

(0.67)

3、许多害虫的发生都和气象条件有一定关系。某地测定1964~1973年间7月下旬的温雨系数(x,雨量mm/平均温度℃)和大豆第二代造桥虫发生量(y,每百株大豆上的虫数)的关系,已经算得一级数据如下,试计算二级数据。

?x?49.76 2x??394.4644 ?y?10902y??153348

?xy?3351.64 n?10

(49.76)2SSx?394.4644??146.858610(1090)2SSy?153348??3453810

28

49.76?1090SP?3351.64???2072.210

x?4.976

y?109

4、利用3题数据建立y依x变化的线性回归方程并解释回归方程的意义。 解:

b?

?2072.2??14.11146.8586a?109?(?14.11?4.976)?179.21 ??179.21?14.11x y温雨系数x的值越小越有利于二代造桥虫的发生,即7月下旬高温低湿的气象条件有利于二代造桥虫的发生。

29

作业题七

一、名词解释

1、总体:由统计研究的目的而确定的同类事物或现象的全体。

2、唯一差异原则:在进行处理间比较时,除要比较的差异外,其它条件应当完全一致。 3、统计数:由样本的全部观察值估算的、描述样本的特征数。 4、互作:在多因素试验中,因素内简单效应间的平均差异。

5、水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。 二、判断,请在括号内打√或×

1、偶然误差又称为随机误差,是由试验中一些未知或无法控制的因素所引起。(√) 2、变异系数的计算公式为,CV(%) =

x×100(%)。(×) s3、算术平均数的重要特性之一是离均差之和为最小。(×) 4、当u = 1.96时,统计假设检验的右尾概率为0.01。(×)

5、一个试验资料的方差分析数学模型的确定,是在获取试验结果之前就已确定。(√) 6、回归模型双变量资料中,当x取某一定值时,只有唯一确定的y值与之相对应。(√) 7、 正态分布总体N(5,16)的平均数是5,标准差是16。(×) 8、在单因素试验中,每一个水平就是一个处理。(√)

9、系统误差影响数据的准确性,而偶然误差影响数据的精确性。(√) 10、用样本的全体观察值计算的、描述样本的特征数称为参数。(×) 三、填空

1、平均数的种类主要有(算术平均数)、(中数)、(众数)、(几何平均数)和调和平均数。 2、描述一组资料中各观察值(变异程度)的统计数主要有极差、标准差和变异系数。 3、(对照)是比较的基准,任何试验都不能缺少,否则就不能显示出试验的处理效果。 4、在成对数据的比较中,t值具有的自由度为??(n-1 )。 5、k (k≥3)个样本平均数的假设测验用(方差分析)。

6、相关系数可表明两个变量相关的(性质),决定系数可表明两个变量相关的(密切程度)。 7、田间试验中引起误差的最主要且难以控制的外界因素是(土壤差异)。

8、5个处理4次重复的完全随机设计的统计分析,其处理自由度为(4 ),误差自由度为(15 )。 9、在边际效应明显的试验中,适合的小区形状为(方)形。

10、某样本观察值为12,14,15,15,16,17,18,15,则该样本的算术平均数为(15.25),中数为 (15),众数为(15)。

11、某水稻品种株高的观察值为13,15,16,16,17,17,19,16,则该样本的标准差s =(1.73 ),样本均数标准差sx=(0.61 ),该水稻株高的总体平均数的置信度为95%的置信区间为([ 14.68,17.57] )。 四、单项选择

30

1、有一甜玉米品种比较试验,顺序排列。要判断某品种的生产力确优于对照,其相对生产力一般至少应超过对照(D)以上。

A.1% B. 5% C. 15 % D. 10%

2、(B)试验设计是指每一供试单位都有同等机会(等概率)接受所有可能处理的试验设计,但要求在尽可能一致的环境中进行试验。

A.拉丁方 B. 完全随机 C. 随机区组 D.裂区

3、 选面积为40m2的马铃薯小区10个,各分成两半,一半去花另一半不去花,若要检验两处理块茎产量的差异显著性,应采用(C )的处理方法进行比较。

A. 成组数据 B. 卡平方检验 C.成对数据 D. u检验 4、以下四种试验设计中只可用于多因素试验的设计是(C )。

A. 间比法设计 B. 随机区组设计 C. 裂区设计 D.拉丁方设计 5、(D)是度量实际观察次数与理论次数偏离程度的一个统计数。

A. F B. t C. u D. ?2

6、?2检验时,当df≥2时,不需矫正,但要求各组内理论次数不小于(D)。

A.10 B. 2 C. 1 D.5 7、(B )是描述两个相关变量x与y线性相关程度和性质的统计数。

A. 决定系数 B. 相关系数 C. 回归系数 D. 回归截距 8、样本容量为n的样本方差的自由度为(B )。

A.n B.n?1 C.n?2 D.2n?1

??a?bx中,当a?0时,表示(C )9、在线性回归方程y。

A.回归直线在x轴上方交于y轴 B.回归直线在x轴下方交于y轴 C.回归直线通过原点 D.变量X与Y之间不存在线性回归关系 10、方差分析的基本假定中除可加性、正态性外,还有(C )假定 A.无偏性 B.代表性 C.同质性 D.重演性 五、简答

1、简述田间试验误差的来源

答:(1)试验材料固有的差异

(2)试验过程中操作质量不一致所引起的差异 (3)进行试验的外界条件的差异 2、简述控制田间试验误差的途径 答:(1)选择同质、一致的试验材料

31

(2)改进试验操作和管理技术,使之标准化 (3)控制引起差异的外界主要因素 3、列举3个描述样本资料变异程度的统计数

答:常用的描述一个样本变异程度的统计数有:极差、方差、标准差和变异系数。 4、 写出3个变异数的数学表达式

答:(1)方差 S?2??xi?1ni?x?2n?1

2(2)标准差 s???x?x?n?1

(3)变异系数 CV?s?100% x5、 何谓重复?在试验中为什么要设置重复?

答:重复是指试验中将同一试验处理设置在两个或两个以上的试验单元上,即同一试验处理所设置的试验单元数称为重复数。

因为试验误差是客观存在的,但只能由同一试验处理的几个重复间的差异估计,即重复具有估计试验误差作用。其次,数理统计学已证明,样本平均数的标准误Sx与样本观察值的标准差S和样本容量n之间的关系为:Sx?S/n,即平均数抽样误差的大小与重复次数的平方根成反比。适当增加重复次数可以降低试验误差,提高试验的精确度。另外,重复、随机排列和局部控制是田间试验设计中必须遵循的三个原则。采用这三个基本原则进行田间试验设计,配合适当的统计分析方法,既能准确地估计试验处理效应,又能获得试验误差估计,因而对于所要进行的各处理间的比较作出可靠的结论。因此,在试验中要设置重复。

6、 何谓“小概率事件的实际不可能性原理”?在农业试验中常用的两个小概率标准是多少?

答:小概率事件实际上不可能性原理:概率很小的事件,在一次试验中几乎不可能发生或可认为不可能发生。

农业试验中常用的两个小概率标准是0.05(5%)水平和0.01(1%)水平。 六、计算

1、紫花大豆和白花大豆杂交,F2代花色分离理论比例为3:1,在F2代出现如下表所示的分离株数,请补充表中数据。

大豆杂交F2代花色分离数据表

32

花色 紫花 白花 总和 解:

实际株数(O) 理论株数(E)

208

81 289

() ()

O-E ( ) ( ) 0

-–1/2

(-2

–1/2)/E

8.25 8.25 / 0.314 0.942 1.256 (?O-E?–1/2)

2

/E

0.314 0.942 1.256

花色 实际株数(O) 理论株数(E) 紫花 白花 总和

208 81 289

(216.75) (72.25)

O-E ?O-E ?–1/2?

(–8.75) 8.25 (+8.75) 8.25 0 /

2、问上题(1题)资料的实际观察比例是否符合3:1的理论比例?(?20.05(1)=3.84)。 解:?检验

1)提出假设Ho:大豆花色F2代符合3:1的理论比例;HA:大豆花色F2代不符合3:1的理论比例。 2)显著水平?=0.05

3)计算统计数:?2c =?(?O-E?–1/2)2/E=1.2560

4)因?2c??20.05(1),故应接受Ho,说明大豆花色这对性状是符合3:1比率,即符合一对等位基因的表型分离比例。

3、假设某一试验资料结果分析已经计算出了多重比较的最小极显著极差值—LSR?表,试用标记字母法将多重比较的结果表示出来。

2

P 2 3 4 5

LSR0.05 3.90 4.10 4.22 4.29

LSR0.01 5.41 5.67 5.84 5.94

差异显著性检验表

处理

平均数

差异显著性 0.05

D C A B E

131.5 128.5 127.0 124.5 120.0

() () () () ()

0.01 () () () () ()

该资料各处理平均数的差异显著性 解:

处理

平均数

差异显著性 0.05

D C A B E

0.01 (A) (AB) (AB) (BC) (C)

33

131.5 128.5 127.0 124.5 120.0

(a) (ab) (b) (b) (c)

作业题八

一、名词解释

1、置信区间:在一定概率保证下,估计出总体参数所在的范围或区间,这个范围或区间叫置信区间。 2、重复:是指在一个试验中同一处理设置两个以上的试验单位。 3、试验指标:试验中用来衡量试验效果的量或指示性状。 4、统计数:由样本全部观察值而算得的特征数。

5、随机事件:随机试验的每一个可能结果称为基本事件或简单事件,若干个基本事件组合而成的事件称作复合事件或复杂事件。基本事件和复合事件统称为随机事件。 二、判断,请在括号内打√或×

1、重复在试验设计中的作用在于降低试验误差和估计试验误差。(√) 2、试验设计只是获得统计资料的一个途径,可以不考虑其合理性。(×)

3、在统计学上常常用极差(或范围)度量样本中每个数与平均数之间的关系。(√)

4、计算某小麦品种A和B株高的平均数和标准差分别为A=120±5.0,B=78±4.0,故可知 A比B整齐。(×) 5、决定系数(r2)既可表示相关的程度,又可表示相关的性质。(×)

6、若检验几种处理间的效应,则其F值求算公式为:F=处理内的均方/试验误差均方。(×) 7、方差分析中,若F<1,则不必查F表,即可确定P>0.05,应接受H0。(√)

8、4个豌豆品种比较试验的产量结果分析时,若无效假设H0:μ1=μ2=μ3=μ4,则对应的备择假设HA:μ1≠μ2≠μ3≠μ4。(×)

9、概率为0的事件为不可能事件。(×)

10、样本方差或标准差随样本容量的增大而减小。(×) 三、填空

1、在(单因素)试验中处理数与因素的水平数相等。

2、若无效假设为H0:?1??2,那么备择假设为(HA:?1??2)。 3、土壤差异的表现形式通常有(趋向式)和(斑块式)两种。 4、试验中同一性状的重复观察值彼此接近的程度,称为(精确度)。

5、大样本平均数的假设测验用(u)测验,小样本平均数的假设测验用(t)测验。 6、由统计数组成的分布称为(抽样分布)。 7、只有一个否定区域的假设测验称为(一尾检验)。

8、比较实际观察次数与理论次数是否相符的假设测验方法称为(适合性检验)。

9、有一双变数资料,已求得ssn=6,则该资料的r=(0.9925),r=(0.9851)。 y=65,sp??94,x=138,ss10、由金皇后玉米13株的株高与穗位高数据,算得相关系数r=0.8978(r0.01,11=0.684),则表明株高与穗位高呈(正)相关,它们的变异有(80.6%)可用线性关系互相说明。

11、方差分析有3个基本假定:一是处理效应与环境效应等应该具有(可加性);二是试验误差?ij应该是随机的、彼此独立的,作正态分布,即(正态性);三是所有试验处理必须具有共同的误差方差,即(同质性)。

34

2

2?12、用于测验观察的实际次数与某种理论次数是否相符合,称为(适合性测验)。根据次数资料判断两

2?独立性测验)

类因素彼此相关或相互独立的假设测验,即为(。测验多个样本所来自的总体的方差是否

2?方差同质性测验)

相等的统计分析方法,称(。

四、单项选择

1、对于小样本二项资料百分数的假设测验,可使用(B)。

A.u测验 B.连续性矫正u测验 C.?2测验 D.F测验

2、A因素有4个水平 ,B因素有2个水平, 实验重复3次, 若采用完全随机实验设计,全部实验共有(B)。 A. 8个处理

B. 24个处理 C. 12个处理

D. 9个处理

3、在一定范围内,随着小区面积的增加,试验误差的变化趋势是(B )。 A.增加 B.降低 C.不变 D.没有规律

4、有一品种和灌水量的试验,有A、B、C、D、E 5个品种,有多、中、少3种灌水量,最适宜采用的设计方法是(D )。

A.随机区组设计 B.完全随机设计 C.拉丁方设计 D.裂区设计

5、在随机区组设计中,各区组的延长方向及区组内各小区的延长方向与土壤肥力梯度的方向要分别(C )。 A.平行,平行 B.垂直,垂直 C.垂直,平行 D.平行,垂直 6、田间试验设计中,应用局部控制原则的作用是(D )。

A.估计试验误差 B.排除系统误差 C.消灭试验误差 D.降低试验误差 7、保证参数位于置信区间内的概率称为(B )。

A.显著水平 B.置信度 C.临界值 D.置信限

8、在一定的概率保证下,由样本结果估计相应总体参数的可能范围的统计方法称为(C )。

A.假设测验 B.点估计 C.区间估计 D.效应估计 9、方差分析中的“可加性”假定是(A )的保证 。

A.正确分解总变异的平方和和自由度 B.作出正确计算

C.作出正确的F测验 D.正确估计误差方差

??a?bx中,b叫做回归系数,表示(D )10、在线性回归方程y。

A.回归直线在y轴上的截距

B.x每增加一个单位时,y平均增加的单位数 C.x每增加一个单位时,y平均减少的单位数 D.x每增加一个单位时,y平均增加或减少的单位数 五、简答

1、什么是对照,在品种比较试验中如何选择对照?

答:对照是试验方案中设置的标准处理,用于衡量处理或品种的好坏,是比较试验结果的标准。在品种比较试验中应选用上级种子管理部门所规定的标准品种作为对照。

35

2、参数的区间估计与假设测验的显著性之间是什么关系?

答:参数的区间估计可提供假设检验的信息,因为置信区间是一定置信度下包含有总体参数的范围,所以,若在一定置信度下的置信区间内包含有假设的参数,则无效假设被接受;若在一定置信度下的置信区间内没有包含假设的参数,则无效假设被否定。具体讲,若在一定置信度下置信区间内不包含零值,即两个置信限同号(同为正号或同为异号),则否定无效假设,接受备择假设;若在一定置信度下置信区间内包含有零值,即两个置信限异号,则接受无效假设,否定备择假设。 3、 简述方差分析的基本思路。

答:方差分析是将k(k ≥3)个样本的观察值作为一个整体加以考虑,首先计算出整体的总变异自由度和平方和,将总变异的自由度和平方和分解为各个变异来源的相应部分,计算出各变异来源的均方值,从而获得不同变异来源总体方差的估计值,并以方差作为衡量各因素作用大小的标准,计算这些均方的适当的F值,通过F检验揭示各个因素在总变异中的重要程度,就能检验假设H0:?1??2????k,对各处理总体平均数的差异显著性做出统计推断。

4.连续性变异资料建立次数分布表的步骤 答:(1)求极差; (2)确定组数和组距; (3)确定组限和组中点值;

(4)观察值入组,统计各组次数,作出次数分布表。 六、计算

1、在某地区进行马铃薯播种期试验,从3月20日开始每隔半月播种一次,共播4次,采用随机区组设计,重复4次。方差分析时已算得部分变异来源的平方和列入下表。试完成表中剩余项目的计算,并作F测验(测验结果用 “*” 号表示,保留两位小数); 变异来源 区组间 处理间 误差 总变异 解: 变异来源 区组间 处理间 误差 总变异

DF ( ) ( ) ( ) ( )

SS 109.55 148.69 ( ) 280.76

MS ( ) ( ) ( )

F ( ) ( )

F0.05 3.86 3.86

F0.01 6.99 6.99

DF (3) (3) (9) (15)

SS 109.55 148.69 (22.52) 280.76

MS (36.52) (49.56) (2.50)

36

F (14. 61**) (19.82**)

F0.05 3.86 3.86

F0.01 6.99 6.99

2、1题处理间是否需要作多重比较?说明理由

答:、处理间F检验显著,表明不同播种期的产量存在差异,为了明确其具体的差异显著性,需要作多重比较。

3、有一观察对数n = 11的双变数资料, 已求得SP=48, SSx=40, SSy=90, x=10, y=14, 计算该资料的直线回归并对其方程进行显著性检验 。(r0.05,9?0.602) 解:b?SP48??1.2, SSx40a?y?b?x?14?1.2?10?2,

??2?1.2x (1分) yr?SPSSxSSy?4840?90?0.8

r?0.8?r0.05?0.602,(1分)所以直线方程真实存在。

37

作业题九

一、名词解释

1、区间估计:在一定置信概率下,估计出总体参数所在范围或区间的方法就叫区间估计。 2、随机排列:是指试验中每一处理都有相等机会实施并安排在任何一个试验单位上。

3、间比法设计:每两个对照之间都均匀、等数目的安排3个或3个以上处理,各重复区的第一个和最后一个小区一定是对照。

4、完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。 5、积事件:若干个事件都发生某事件才发生,则称某事件为这若干个事件的积事件。

二、判断,请在括号内打√或×

1、在统计学上常常用极差(或范围)度量样本中每个数与平均数之间的关系。(×) 2、随机区组设计的精确度高于拉丁方设计的精确度。(×) 3、计算某小麦品种A和B株高的平均数和标准差分别为A=120±5.0,B=78±4.0,故可知 A比B整齐。(×) 4、某一事件概率的大小是由频率决定的。(×)

5、正态分布是随着自由度的不同而表现出一组对称分布。(×)

6、显著性检验是根据小概率实际不可能性原理建立起来的检验方法。(√) 7、多个平均数间差异分析可以采用单因素方差分析。(√)

8、对A因素有3个水平,B因素有4个水平交叉分组资料方差分析时,若A因素F测验达显著,则A因素必需要作均数间多重比较。(√)

9、方差是资料中最大观察值与最小观察值的差数。(×) 10、一个良好的实验设计必须遵循重复、随机和局部控制三个基本原则。设置重复、处理随机排列可以降低实验误差,局部控制可以无偏估计实验误差。(×) 三、填空,

1、随机区组试验设计遵循的原则为(重复)、(随机排列)、(局部控制)。

2、用一定的概率保证来给出总体参数所在区间的分析方法称为(区间估计),保证概率称为(置信度)。 3、二项资料百分数的假设测验一般用(u)测验,但小样本需进行(连续性矫正)矫正。

4、若t0.05?t?t0.01,那么无效假设正确的概率为(0.01~0.05),而备择假设正确的概率为(0.95~0.99)。 5、有一玉米品种和肥料量的2 ? 2试验,每一处理重复3次,得各处理平均产量(kg/ha)列入下表,试求品种的主效为(2587.5kg/ha);肥量的主效为(1912.5kg/ha);品种与肥量互作为(正)互作,互作效应值等于(225kg/ha)。

施肥量

品种 常规品种

不施肥 施肥

6000 7800

新品种 8475 10500

6、5个处理4次重复的完全随机设计的统计分析,其误差自由度为(15)。

7、试验方案中的各处理间应遵循(、唯一差异)原则才能正确地进行处理效应的比较。

y?y)占y总平方8、相关系数的平方称为(决定系数),它反映了由x不同而引起的y的平方和U??(?和SSy

2??(y??y)的比例。

238

9、比较实际观察次数与理论次数(是否相符)的假设测验方法称为适合性测验。 10、样本标准差s s= ?

?(x?x)n?12,样本均数标准差ss=?(xxs1.7244)。 ??0.5453n1011、试验中观察所得的数据因性状、特性不同,一般为(数量性状)资料和(质量性状)资料两大类。 四、单项选择

1、对于两个样本方差的假设测验,可使用( D )。

A.u测验 B.t测验 C.?2测验 D.F测验 2、 根据如下两个小麦品种的主茎高度的测量结果,可以判断(B) 品种 甲 乙

算术平均数(cm)

95.0 75.0

标准差(cm)

9.02 9.02

变异系数 9.5 12.03

极差(cm) 15.3 9.8

A. 甲品种比乙品种变异大。 B. 甲品种比乙品种变异小。

C. 因为他们的算数平均数不相等,无法判断那个品种变异大。 D. 根据表中,S甲=S乙,甲品种与乙品种变异大小相等。

3、有n个观察值的资料,制成频率分布图,该资料频率分布图的总面积必等于(D )。 A. n B. n/f C. f/n D. 1

( 注:f 为每分组中出现的观察值次数)

4、A因素有3个水平 ,B因素有4个水平, 实验重复3次, 若采用完全随机实验设计,全部实验共有(B)。 A. 12个处理

B. 36个处理 C. 10个处理 D. 7个处理

5、已知样本离均差平方和为360,样本容量为10,标准差(A)。 A. 6.3 B. 6 C. 36 D. 9 6、当F?F0.05(?1,?2)意味着(C)。

A. H0错误的 B. H0错误的概率小于0.05

C. H0正确的概率小于0.05 D. H0正确时,观察到现在的差异或更大差异的概率小于0.05 7、在两个样本平均数比较的t检验中,无效假设是(D )。

A.两个样本平均数不等 B.两个样本平均数相等 C.两个总体平均数不等 D.两个总体平均数相等 8、在t 检验中,P< 0.05统计上可以认为 (C )。

A. 两个样本平均数不等 B. 两个样本平均数相等 C. 两个总体平均数不等 D. 两个总体平均数相等 9、下列统计数不属于平均数的是(C)

A.中数 B.众数 C.变异系数 D.几何平均数 10、总体平均数95%置信区间表示为(C )。

A. x?1.96s

B. x?t0.01,?sx

39

C. x?t0.05,?sx 五、简答

D. x?1.96?

1、什么叫回归分析?直线回归方程中的回归截距、回归系数的统计意义是什么?

答:回归分析是研究变量之间联系形式的统计方法。该联系形式用回归方程表示,并将此回归方程用于对依变量作预测估计。回归分析按自变量个数可分为一元回归和多元回归;按方程的次数又可分为

??a?bx来揭示两线性相关线性回归和非线性回归。一元线性回归(直线回归)是一种用直线方程y变量的关系的回归分析。

?,即回归直线在y轴上的截在直线回归方程中,回归截距a是自变量x=0时依变量的回归估计值y距。它在专业上是否有实际意义,取决于两点:①所研究的自变量能否取0值。若不能取0值,则不具有专业意义。例如,在某小麦每667㎡基本苗数x与对应的有效穗数y两相关变量的回归分析中,x不可能取0值,故a无实际意义。②建立方程的自变量数据中是否含有0值,或者自变量最小值xmin是否接近0值。若建立方程的自变量数据中没有包含有0值,或xmin远离0值,则a是否符合方程

??a?bx的变化规律还有待实践检验,故不能确定其专业意义(2分)。回归系数b是回归直线的斜y率,其统计意义是自变量改变一个单位,而引起依变量平均改变的单位数。其符号反映了两变量的相关性质,b>0时,两变量为正相关,即同向改变;b<0时,两变量为负相关,即反向变化。 2、什么叫相关分析?相关系数和决定系数各具有什么意义?

答:2、相关分析是研究两相关变量联系程度和联系性质的统计方法。回答两变量是否有关,关系密切与否,且是正相关,还是负相关的问题。这些问题都由计算的相关系数r来回答。

相关系数的符号表示变量的相关性质,r>0时,表明两变量呈正相关,即一个变量增加(或减少),另一变量随之增加(或减少);r<0时,为负相关,即一个变量增加(或减少),另一变量受其影响反而减少(或增加)。相关系数的绝对值揭示两变量的联系程度,|r|愈接近于0,说明两变量关系愈不密切;|r|愈接近于1,说明两变量关系愈密切。

相关系数的平方是决定系数r2,它表示在两变量各自的总变异中由它们之间的线性关系而引起的变异部分所占比例。也可用来反映两变量的联系程度,r2愈接近于1,表示关系愈密切;r2愈接近于0,关系就愈不密切。在表示两变量的联系程度上,决定系数比相关系数有更确切的含义。 3、 F检验应具备什么条件?

答:① 对试验所考察性状有影响的各变异来源的效应(如环境效应)应具有“可加性”(additivity);②试验误差?ij应该是随机的、彼此独立的,具有平均数为零且作正态分布,即“正态性”(normality);③ 所有试验处理必须具有共同的误差方差,即误差方差的“同质性”(homogeneity)。

40

4、 什么是小概率事件不可能性原理?它有什么用途?

答:一次随机试验概率很小的事件被当作不可能事件处理,称作小概率事件不可能性原理,一般认为概率小于0.05或小于0.01的事件为小概率事件。(3分)小概率事件原理用于统计假设检验中的推断或决策过程,是统计分析的推断规则或决策准则,是统计学的核心逻辑。 六、综合

使用某激素进行大豆浸种试验, 设有5种浓度(A 1、A 2 、A 3 、A 4、A 5及3 种 处理时间(T 1、T 2、T 3,单位:分钟)处理后播种,出苗后20天,每处理随机抽取1株测定干物质重量(克)。试根据该资料回答以下问题: 1、完成该资料的方差分析表 变异来源 浓度间 时间间 误 差 总变异 解:

变 异 来 源 浓 度 间 时 间 间 误 差 总变异

DF (4) (2) (8) (14)

SS 289.06 (1.73) 4.94 295.73

MS (72.265) (0.865) (0.6175)

F (117.02*) (1.4)

F 0.05 3.69 19.30

DF ( ) ( ) ( ) ( )

SS 289.06 () 4.94 295.73

MS () () ()

F () ()

F 0.05 3.69 19.30

2、上述方差分析说明什么问题?

答:不同浓度间检验差异显著,时间间差异不显著。

3、 若欲对浓度间干物质重平均数采用SSR法作多重比较,计算所用平均数标准误值。 答:平 均 数 标 准 误 值 为0.454

4、根据下列的LSR0.05值表,试用SSR法对浓度间干物质平均重比较,用字母标记法完成其5%差异显著性比较表

P LSR0.05

处理 A1 A2 A3

2 1.479

3 1.543

4 1.579

5 1.597

平均数x 13.67 12.33 11.00

41

5% 差 异 显 著 性

( ) ( ) ( )

A4 A5

解:

处 理 A1 A2 A3 A4 A5

10.85 9.43

( ) ( )

平 均 数x 13.67 12.33 11.00 10.85 9.43

5% 差 异 显 著 性(5分)

a ab b bc c

42

作业题十

一、名词解释

1、局部控制:就是分范围、分地段地控制非试验因素(试验条件),使各处理所受的影响趋于最大程度的一致。

2、对比法设计:每一处理的一侧(左侧或右侧)都设置一个作为对照的设计。

3、对立事件:对于两事件A与B,若一个发生则另一个就不发生,则A与B互为对立事件,两事件的发生非此即彼。

4、二项资料百分数:由二项次数转换成的百分数,其总体服从二项分布,故称为二项资料百分数。 5、复合事件:由若干个基本事件组合而成的事件,称复合事件。 二、判断,请在括号内打√或×

1. 标准差能用来直接比较两个单位不同或平均数相距较远的样本。(×) 2.任意样本的离均差的算术平均数应当等于零。(√)

3.从株高变化在100厘米至120厘米某小麦品种群体中准确地测得某一株的标准高度为105厘米的概率等于零。(√)

4.单因素完全随机试验设计进行方差分析,总变异可以分解为处理间变异、区组间变异和误差三项。(×) 5.显著水平是接受零假设(或无效假设)所使用的概率。(×)

(|Oi?Ei|?0.5)26.次数资料的? 检验,当df >1时,χ公式为???。(×)

Ei2

2

2c7.对于即可作相关又可作回归分析的同一组数据,计算出的b与r正负号是一致的。(√)

8.一个试验在安排区组时,原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。(√) 9.试验设计三项原则,其中重复和随机排列的作用是有效地降低试验误差。(×) 10.采用成对数据分析还是成组数据分析是由试验方案所决定的。(√) 三、填空

1.田间试验中引起误差的最主要且难以控制的外界因素是(土壤差异)。 2.随机排列在田间试验设计中的作用是(无偏估计试验误差)。 3.反映资料集中性的特征数称为(平均数)。

4.5个处理4次重复的完全随机设计的统计分析,其误差自由度为(15)。 5.一个样本中包含的个体数目称为(样本容量)。 6.统计假设测验中直接测验的是(无效)假设。 7.具有两个否定区域的假设测验称为(两尾检验)。

8. 某样本观察值为13,8,9,9,13,15,12,13,7,则该样本的算术平均数为 (11),中数为 (12 ),众数为(13)。

9.如果两个样本相关系数r1和r2的绝对值相等但符号相反,则表明这两个样本资料的关系是(相关程度相同,相关性质不同)。

43

10. 对单因素随机区组试验设计进行方差分析,总变异可以分解为(区组间)、(处理间)和(误差)三项。 11. 研究栽培密度和纯氮施用量对糯玉米产量的影响。栽培密度(株/666.7m2)2个水平分别为A1:3500,A2:4000;纯氮施用量(kg/666.7m2)2个水平分别为B1:20,B2:16,。这个试验方案包含(2 )个因素,如果设计成一完全试验方案,4个处理组合分别为(A1 B1)、(A1B2 )、(A2B1)、(A2B2)。 12、(备择)假设与无效假设成对立关系。 四、单项选择

1、对于小样本平均数的假设测验,可使用( B )。

A.u测验 B.t测验 C.?2测验 D.F测验 2、两个平均数相比较的假设测验用( D )。

A.u测验 B.t测验 C.F测验 D.u测验或t测验 3、样本容量是组成样本的个体的数目,样本容量(A)为大样本。 A. n≥30 B. n ≤ 30 C. n>30 D. n<30 4、下列统计数不属于变异数的是(B)

A.极差 B.众数 C.变异系数 D.标准差

5、比较富士苹果的单果重量(g)和体积大小(cm3)的变异程度,适宜的统计数是(D) A.极差 B.方差 C.标准差 D.变异系数

6、圆桃与蟠桃(扁桃)杂交,所得F1代自交,培育出F2杂种实生苗174株,其中果实为圆形的126株,扁平形的48株,检验桃果形遗传是否符合3:1的分离规律的分析方法是(D) A.方差的同质性检验 B.F检验 C.独立性检验 D.适合性检验

7、用标记字母法表示的多重比较结果中,如果两个平均数的后面标有不同小写英文字母,则它们之间差异(A)。

A. 在0.05水平上显著 B. 在0.05水平上不显著 C. 在0.01水平上显著 D. 在0.01水平上不显著

?x)(y?y)x)?(y?y)22?8、

SPSSx?SSy是(A)。

A.相关系数 B.决定系数 C.回归系数 D.回归平方和

9、进行玉米品种比较试验,7个品种,每品种得到3个产量观察值,则该试验误差自由度为(A) A.14 B.18 C.6 D.2 10、用于反映资料离散性的特征数是(B)

A.变异系数 B.变异数 C.方差 D.标准差 五、简答

1、统计假设检验的基本步骤

答:(1)对研究的总体提出假设

(2)确定假设的检验方法和显著水平 (3)计算统计数和无效假设真实的概率 (4)做出检验结论 2、何谓试验因素和水平?

答:试验因素是指在试验中能够变动并设有待比较的一组处理的因子,简称因素或因子。

44

试验因素的量的不同级别或质的不同状态称为水平。 3、 并各举一例质量水平和数量水平。

答:试验因素水平可以是定性的,也可以是定量的,如供试的不同品种,具有质的区别,属质量水平;生长素的不同浓度具有量的差异,属数量水平。 4.简述提高试验精确度和灵敏度的试验控制方法

答:为提高试验的精确度和灵敏度。必须严格控制试验条件的均匀性,使各处理处于尽可能一致的试验条件下。这一做法在统计上叫做试验控制。 5.简述提高试验精确度和灵敏度的统计控制方法。

答:试验控制在某些情况下不一定能实施。例如,许多试验都希望各小区的种植密度完全一样,这就不容易达到;又如,研究水稻的结实率或棉花的蕾铃脱落率,要求各处理在单位面积上有相同的颖花数或蕾铃数,这就更难达到。在这些情况下,如果那个没有很好控制的因素x可以量测(如上述的株数、蕾铃数、颖花数等),而又和试验结果y存在着回归关系,那就可以利用回归,将各个y都矫正到x在同样水平(x?x)时的结果。这一做法在统计上叫做统计控制。

六、计算

1、已知某小麦良种的千粒重?0?34g,现自外地引入一新品种,在8个小区种植,得其千粒重为(g):35,37,33,35,33,36,40,39。试测验新引入品种的千粒重是否显著高于当地良种的千粒重?(t0.1,7?1.895,

t0.05,7?2.365)

解:因为总体方差?未知,n?8为小样本,所以用t检验;又因为要检验新引入品种的千粒重是否显著高于当地良种的千粒重,所以需作一尾检验。

2H0:???0,HA:???0,

??0.05(1分)

x?(35?37???39)/8?36

352?372???392?(288)2/8s??2.5635

8?1sx?sn?2.56358?0.9063

t?x??036?34??2.21 sx0.9063(2分),∵实得 t >t0.05 , ∴ p<0.05 t0.05,7?1.895(一尾)

45

推断:否定无效假设H0:???0,即新引入品种的千粒重显著高于当地品种的千粒重。

2、某地连续7年测定≤25℃的始日(x)与粘虫幼虫暴食高峰期(y)的关系(x和y皆以8月31日为0),已经算得二级数据如下,试计算≤25℃的始日和粘虫幼虫暴食高峰期的相关系数和决定系数。

SSx?539.7143 SSy?422.8571 SP?402.142 9.428 6 x?18.5714 y?47解:r?SPSSx?SSy2?402.4286539.7143?422.8571?0.8424

(SP)2(402.4286)2r???0.7096

SSx?SSy539.71?422.85713、根据2题数据测验相关系数的显著性。(r0.05, 5=0.754)

解:∵r?0.8424

|r|>r0.05(2分)., ∴ p<0.05

推断: r在??0.05水平上显著。

46

本文来源:https://www.bwwdw.com/article/wiyx.html

Top