统计学期末复习试题9套部分含答案 - 图文

更新时间:2023-10-09 16:44:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一、 简答题(共10题,每题6分)

1. 计量资料的集中趋势和离散趋势的指标有哪些?

计量资料集中趋势的指标有:均数、几何均数、中位数;计量资料离散趋势的指标有:极差与四分位数间距、方差与标准差、变异系数。 2. 实验设计的基本要素和基本原则分别是什么?

基本要素:受试对象、处理因素、实验效应;基本原则:对照原则、随机化原则、重复原则。

3. 常用的统计图有哪几种?

有条图、圆图、百分比条图、线图、直方图、散点图、箱式图、统计地图 4. 线性回归模型的前提条件是什么?

一是线性,反应变量与自变量呈线性变化趋势;二是独立性,任意两个观察值相互独立,一个个体的取值不受其他个体的影响;三是正态性,在给定值X时,Y的取值服从正态分布;四是方差齐性,对于不同的X值,Y值的总体变异相同

5. 某年级一班、二班各有学生50人。从两个半各抽取10人测量身高,并求其平均身高。

如果一班的平均身高高于二班,能否推论一班学生的平均身高高于二班?为什么? 不能进行此推论,理由如下。

从一、二班分别抽取的10人,测量其身高,得到的分别是一、二班的一个样本。 样本的平均身高只是一、二班所有同学平均身高的一个点估计值。既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数高低的判断,而应通过统计分析,进行统计推断,才能作出判断。

6. 某地区某疾病连续3年患病率分别为6.0%、9.0%、12.0%,则该病3年总的患病率为:

(6.0+9.0+12.0)/3=9.00%。此算法是否正确?为什么? 不正确,理由如下。

对于分组资料计算合计率时,不能简单地把各组率取平均数,而应分别将分子和分母合计,再求出合计率。

7. 某研究探讨体身高与体重的关系,得到r=0.67,同时算得b=-1.8,该分析结果是否正

确?为什么?

不正确,理由如下。

r??(X?X)(Y?Y)?(X?X)(Y?Y)22?lXYlXXlYY,b??(X?X)(Y?Y)?ll?(X?X)2XYXX

r/b=÷,所以r/b>0,而题中求得r/b<0,所以结果不正

确。

8. 为了解某地区9岁女孩血红蛋白含量的平均水平,某医疗机构随机抽取该地9岁女孩

200名,获得去血红蛋白含量平均数为139.2g/L,标准差为2.5g/L,因而估计该地9岁女孩血红蛋白含量的平均水平为134.3~139.55g/L。试问该估计是否正确(α=0.05)? 不正确,理由自己写,不想写。最终答案为138、73~139、67g/L。

9. 在对某月交通事故的数据分析后发现,在发生交通事故的车辆中,高速行驶的占31%,

中速行驶的占56%,低速行驶的占13%。因此认为,中速行驶的车辆最容易发生交通

事故。这个说法对吗?为什么?

不正确。因为题中所计算的指标是构成比,只能说明某月交通事故中,3种行驶速度造成的交通事故所占的比重,不能说明3种交通事故发生的频率或强度,这是犯了以构成比代替率的错误。

10. 对同一资料,又出于同一研究目的,用参数统计和非参数统计所得结果不一致时,应以

何种结果为准?

应该以资料满足的条件为准。若资料满足参数检验的条件,应以参数检验的结果为准,此时非参数检验的检验效能低于参数检验。若资料不服从正态分布,或者分布情况未知,不能用参数法进行推断,宜采用非参数法对总体的分布位置进行假设检验。

二、计算分析题(3小题,共40分)

1.有12例志愿者接受降胆固醇试验,受试者在试验前后各测量一次血清胆固醇(mmol/L),测定结果如表1所示。

表1 血清胆固醇(nmol/L)

例数 试验前 试验后

1

2

3

4

5

6

7

8

9

10

11

12

6.1 6.8 6.5 7.6 6.4 6.9 9.2 7.3 6.9 7.7 8.2 6.6 6.0 6.8 6.4 7.3 6.3 6.6 8.4 7.0 6.6 7.2 6.6 6.2

问: (1) 该资料属于哪种类型?(2分) 定量资料。 (2) 该研究属于什么设计类型?(2分) 配对设计资料。

(3) 试判断试验前后血清胆固醇有无差别?请写出统计分析的基本步骤,不必计算。(8分) ①,建立检验假设,确定检验水准。

H0:μd=o,实验前后血清胆固醇没有差别。 H1: μd≠0,实验前后血清胆固醇有差别。 α=0.05

②,计算检验统计量。

首先计算差值d以及d2,再计算∑d,∑d2,d^,Sd,以及标准误(实在是打不出

来了,~~o(>_<)o ~~),最终求得t

③,确定P值,作出统计推断

若P>0.05,按α=0.05,不拒绝H0,差异没有统计学意义,说明实验前后血清胆

固醇没有变化。

若P<0.05,按α=0.05,拒绝H0,接受H1,差异有统计学意义,说明实验前后血

清胆固醇有变化。

2.有45份血清样品,每份样品一分为二,用甲、乙两种不同的免疫学检测方法检验类风湿因子,用甲法检测出阳性16例,用乙法检测出阳性28例,两种方法检测结果都为阳性的共

12例。

问:(1) 该资料属于哪种类型?(2分)分类资料or定性资料or计数资料

(2) 该研究属于什么设计类型?(2分)配对设计资料 (3) 请整理出相应表格。(4分)

甲培养基 + + — 合计

(4) 问甲、乙两种培养基的培养效果有无差异?(χ①,建立检验假设,确定检验水准。 H0:B=C,即两种培养基的培养效果相同。 H1:B≠C,即两种培养基的培养效果不同。 α=0.05

②,计算χ2和自由度。本题中b+c<40,故用下式计算χ2:

2

0.05,1=3.84

乙培养基 — 4 13 17 合计 12 16 28 16 29 45 )(6分)

(|b?c|?1)2??=6.05

b?c2c③,确定P值作出统计推断 查表得P>0.05,按照α=0.05水准,不拒绝H0,差异没有有统计学意义,尚不能认为两种培养基效果不同。

3. SPSS结果分析题

为研究铅作业与工人尿铅含量的关系,随机抽查了3种作业工人的尿铅结果如表3所示。问3种工人的尿铅含量是否不同?(已知资料符合独立性、正态性,请写出主要分析步骤和结果)(14分)

表3 3种铅作业工人的尿铅含量(mg/L)测定结果

铅作业组

0.01 0.16 0.24 0.18 0.28 0.14 调离铅作业组

0.11 0.23 0.18 0.14 0.20 0.12 非铅作业组

0.06 0.02 0.05 0.02 0.01 0.10

0.40 0.15

SPSS结果如下

x Test of Homogeneity of Variances

0.13 0.00 0.04 0.14

Levene Statistic 1.741 x Between Groups Within Groups Total df1 2 df2 21 Sig. .200 ANOVA

Sum of Squares .075 .141 .216 df Mean Square 2 .038 21 .007 23 F 5.571 Sig. .011 Post Hoc Tests Homogeneous Subsets

x

Student-Newman-Keuls N Subset for alpha = .05 zb 1 2 1 3 8 .0588 2 8 .1388 .1388 1 8 .1950 Sig. .065 .185 Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = 8.000.

解:

一, 按照完全随机设计资料的方差分析分析3个总体均数是否相等。

1, 建立检验假设,确定检验水准。

H0:3个总体均数相等,即3种铅作业工人的尿铅含量相等。

H1:3个总体均数不全等,即3种铅作业工人的尿铅含量不全等。 α=0.05

2, 计算检验统计量。

由spss结果得: 变异来源 组间变异 组内变异 总变异 Sum of Squares .075 .141 .216 df 2 21 23 Mean Square .038 .007 F 5.571 Sig. .011

3, 确定P值,作出统计推断 根据spss结果,得P<0.05,拒绝H0,差异有统计学意义,

可认为3种工人的尿铅含量不都相同。

二, 根据SNK法对3组总体均数进行两两比较。

1, 建立检验假设,确定检验水准。

H0:任意两对比组的总体均数相等。 H1,任意两对比组的总体均数不等。 α=0.05

2, 计算检验统计量。 如图

N

zb 3 2 1 Sig.

1

8 8 8 Subset for alpha = .05

2

.0588 .1388

.065

1 .1388 .1950 .185

3, 确定P值,作出统计推断 经过多个样本均数间两两比较的SNK检验,按照α=0.05水

准,可认为第一组和第三组尿铅含量有差别,第一组含量大于第三组。尚不能认为第三组与第二组、第二组与第一组之间尿铅含量有差别

一、 简答题(每题6分,共60分)

1、 配对比较的假设检验,符合参数检验条件,能否出现t检验结果P>0.05;而非参数检验P<0.05的结果?如果出现上述情况,此时应该怎样解释检验结果?

有可能,因为非参数检验检验效能低(具体自己she)

2、某市为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的坏境监测积累资料,对238名留住该市一年以上,无汞作业接触史,无明显肝、肾疾病的居民进行了调查,结果见表1:

表1:238名居民发汞含量(μmol/kg)

1.5

发汞含量 人 数

~ 20

3.5~ 66

5.5~ 60

7.5~ 48

9.5~ 18

11.5~ 16

13.5~ 6

15.5~ 1

17.5~ 0

19.5~21.

5 3

(1) 说明此频数分布的特征;选用何中指标描述其集中趋势和离散趋势较好? 分布特征:正偏态分布。

描述集中趋势的指标:几何均数;or中位数?(不确定) 描述离散趋势的指标:四分位数间距

(2) 计算该地居民发汞值的95%正常值范围(只写公式,不必计算)。 因为资料呈负偏态分布,故应使用百分位数法计算参数范围,因为发汞过高为异常,应制定单侧95%参考范围。用公式: Px=LX+i*(n x% —∑fx)/fx

3、标淮差与标准误之间的联系与区别是什么? 具体答案详见教材75页。

本文来源:https://www.bwwdw.com/article/139f.html

Top