思考与练习参考答案

更新时间：2023-11-30 16:57:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

思考与训练参考答案推荐度：
相关推荐

第1章绪论思考与练习参考答案

一、最佳选择题

1. 研究中的基本单位是指 ( D )。

A．样本 B. 全部对象 C．影响因素 D. 个体 E. 总体 2. 从总体中抽取样本的目的是（ B ）。

A．研究样本统计量 B. 由样本统计量推断总体参数

C．研究典型案例 D. 研究总体统计量Ｅ. 计算统计指标 3. 参数是指（ B ）。

A．参与个体数 B. 描述总体特征的统计指标

C．描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是（ E ）。 A．白细胞计数 B．住院天数

C．门急诊就诊人数 D．患者的病情分级 E. ABO血型 5．关于随机误差下列不正确的是（ C ）。

A．受测量精密度限制 B．无方向性 C. 也称为偏倚Ｄ．不可避免 E. 增加样本含量可降低其大小

二、名称解释（答案略）

1. 变量与随机变量 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 随机事件 7. 频率与概率

三、思考题

1. 生物统计学与其他统计学有什么区别和联系？

答：统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等，都是关于数据的学问，是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学，与医学统计学和卫生统计学很相似，其

不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法，而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。

2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高，并求其平均身高。如果甲班的平均身高大于乙班，能否推论甲班所有同学的平均身高大于乙班？为什么？

答：不能。因为，从甲、乙两班分别抽取的10人，测量其身高，得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样，由于存在抽样误差，样本均数与总体均数一般很难恰好相等。因此，不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断，而应通过统计分析，进行统计推断，才能作出判断。

3. 某地区有10万个7岁发育正常的男孩，为了研究这些7岁发育正常男孩的身高和体重，在该人群中随机抽取200个7岁发育正常的男孩，测量他们的身高和体重，请回答下列问题。

(1) 该研究中的总体是什么？

答：某地区10万个7岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么？

答：身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么？

答：体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系？答：总体均数是反映总体的统计学特征的指标。（5）该研究中的样本是什么？

答：该研究中的样本是：随机抽取的200个7岁发育正常的男孩。

（宇传华方积乾）

第2章统计描述

思考与练习参考答案

一、最佳选择题

1. 编制频数表时错误的作法是（ E ）。

A. 用最大值减去最小值求全距 B. 组距常取等组距，一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值

E. 写组段，如“1.5~3，3~5， 5~6.5，?”

2. 描述一组负偏峰分布资料的平均水平时，适宜的统计量是（ A ）。

A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较5年级小学生瞳距和他们坐高的变异程度，宜采用（ A ）。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数P2.5与P97.5的间距 4. 均数X和标准差S的关系是（ A ）。 A. S越小，X对样本中其他个体的代表性越好 B. S越大，X对样本中其他个体的代表性越好 C. X越小，S越大 D. X越大，S越小 E. S必小于X

5. 计算乙肝疫苗接种后血清抗-HBs的阳转率，分母为（ B ）。

A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数

6. 某医院的院内感染率为5.2人/千人日，则这个相对数指标属于（ C ）。

A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从0开始的图形为（ D ）。

A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可

二、简答题

1. 对定量资料进行统计描述时，如何选择适宜的指标？

答：详见教材表2-18。

教材表2-18 定量资料统计描述常用的统计指标及其适用场合描述内容指标平均水平

意义

适用场合

均数个体的平均值几何均数平均倍数

对称分布

取对数后对称分布

①非对称分布；②半定量资料；③末端开

中位数位次居中的观察值

口资料；④分布不明

众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料

变异度全距观察值取值范围不拘分布形式，概略分析

标准差观察值平均离开均数的

对称分布，特别是正态分布资料

（方差）程度四分位数①非对称分布；②半定量资料；③末端开

居中半数观察值的全距

间距口资料；④分布不明

①不同量纲的变量间比较；②量纲相同但

变异系数标准差与均数的相对比

数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。

答：2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况，被调查者150人，分别有30人病情稳定，66人处于进展状态，54人死亡。

当研究兴趣只是了解死亡发生的情况，则只需计算死亡率54/150=36%，属于频率指标。当研究者关心患者所有可能的结局时，则可以算出反映3种结局的频率分别为20%、44%、36%，它们共同构成所有可能结局的频率分布，是若干阳性率的组合。

两者均为“阳性率”，都是基于样本信息对总体特征进行估计的指标。不同的是：频率只是一种结局发生的频率，计算公式的分子是某一具体结局的发生数；频率分布则由诸结局发生的频率组合而成，计算公式的分子分别是各种可能结局的发生数，而分母则与频率的计算公式中分母相同，是样本中被观察的单位数之和。 3. 应用相对数时应注意哪些问题？

答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。

（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。 4. 常用统计图有哪些？分别适用于什么分析目的？答：详见教材表2-20。

教材表2-20 常用统计图的适用资料及实施方法图形条图直方图百分条图饼图线图半对数线图散点图

适用资料组间数量对比定量资料的分布构成比构成比

定量资料数值变动定量资料发展速度双变量间的关联

实施方法

用直条高度表示数量大小

用直条的面积表示各组段的频数或频率

用直条分段的长度表示全体中各部分的构成比用圆饼的扇形面积表示全体中各部分的构成比线条位于横、纵坐标均为算术尺度的坐标系

线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系点的密集程度和形成的趋势，表示两现象间的相关关系

箱式图茎叶图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数

三、计算题

1. 某内科医生调查得到100名40~50岁健康男子总胆固醇（mg/dl），结果如下 227 199 235 235 246 163 207

190 155 220 167 209 273 208

224 208 190 210 202 178 231

259 203 203 171 186 190 234

225 199 197 248 217 207 226

238 253 149 201 206 259 174

180 181 175 266 200 186 199

193 196 236 189 203 194 278

214 224 202 222 197 246 277

195 210 209 199 161 172 181

213 220 174 197 247 234

193 255 184 214 138 232

209 257 174 199 186 189

172 216 185 198 156 172

244 249 167 230 195 235

（1）编制频数表，绘制直方图，讨论其分布特征。

答：频数表见练习表2-1。根据直方图（练习图2-1），可认为资料为基本对称分布，其包络线见练习图2-2。

练习表2-1 某地100名40～50岁健康男子总胆因醇/（mg·dl）

Valid Percent

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

Cumulative Percent

1.0 4.0 15.0 27.0 52.0 67.0 80.0 91.0 96.0 100.0

-1

Frequency Percent

Valid 130~

145~ 160~ 175~ 190~ 205~ 220~ 235~ 250~ 265~280

Total

1 3 11 12 25 15 13 11 5 4 100

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

100.0 100.0

2520Frequency151050140160180200220240260280Mean = 207.41Std. Dev. = 29.82N = 100 总胆固醇练习图2-1 直方图

2520Frequency151050140160180200220240260280Mean = 207.41Std. Dev. = 29.82N = 100 总胆固醇练习图2-2 包络线图

（2）根据（1）的讨论结果，计算恰当的统计指标描述资料的平均水平和变异度。答：利用原始数据，求出算术均数X?207.4 mg/dl 和标准差S?29.8mg/dl。（3）计算P25,P75和P95。

答：利用原始数据，求出P25=186.8 mg/dl，P75=229.3 mg/dl，P95=259.0 mg/dl。 2. 某地对120名微丝蚴血症患者治疗3个疗程后，用IFA间接荧光抗体试验测得抗体滴度如下，求抗体滴度的平均水平。抗体滴度例数

1:5 5

1:10 16

1:20 27

1:40 34

1:80 22

1:160 13

1:320 3

利用上述频数表，得平均滴度为1:36.3。

3. 某地1975－1980年出血热发病和死亡资料如教材表2-21，设该地人口数在此6年间基本保持不变。

教材表2-21 某地6年间出血热的发病与死亡情况

年份 1975 1976 1977 1978 1979 1980

试分析：

（1）粗略判断发病率的变化情况怎样。

答：该地人口数在此6年间基本保持不变，发病人数在1979年前逐年上升，1980年略有下降。可以认为发病率大致呈上升趋势，1980年略有下降。

（2）病死率的变化情况怎样？

答：病死率由各年度病死数除以发病数获得，病死率依次为12.5%、8.9%、7.4%、5.4%、3.0%和1.8%，呈逐年下降趋势。

（3）上述分析内容可用什么统计图绘制出来？

答：由于没有给出该地人口数，故不能计算发病率，可用普通线图表示发病数变化情况。病死率的下降情况可以用普通线图表示，下降速度则可以用半对数线图表示。

（4）评述该地区出血热防治工作的效果。

发病数

32 56 162 241 330 274

病死数

4 5 12 13 10 5

答：随着时间的推移，预防工作做得不好，治疗水平则逐年提高（体现在病死率下降）。

（张晋昕）

第3章概率分布思考与练习参考答案

一、最佳选择题

1. 某资料的观察值呈正态分布，理论上有（ C ）的观察值落在X?1.96S范围内。

A. 68.27% B. 90% C. 95% D. 99% E. 45% 2. 正态曲线下，从均数?到??1.64?的面积为（ A ）。

A. 45% B. 90% C. 95% D. 47.5% E. 99%

3. 若正常人的血铅含量X近似服从对数正态分布，则制定X的95%参考值范围，最好采用（其中 Y?lgX， SY为Y的标准差）（ C ）。

A.X?1.96S B.P2.5~P97.5 C.lg?1(Y?1.64SY)

D.lg?1(Y?1.96SY) E.P5~P95

4. 在样本例数不变的情况下，若（ D ），则二项分布越接近对称分布。 A. 总体率?越大 B. 样本率p越大 C. 总体率?越小

D. 总体率?越接近0.5 E. 总体率?接近0.1或0.5

5. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从（ D ）。

A. 二项分布 B. 正态分布 C. 偏态分布 D. Poisson分布 E. 对称分布

6. Poisson分布的均数?与标准差?的关系是（ E ）。

A. ??? B. ??? C. ??? D. ??? E. ???2

二、思考题

1. 服从二项分布及Poisson分布的条件分别是什么？

简答：二项分布成立的条件：①每次试验只能是互斥的两个结果之一；②每次试验的条件不变；③各次试验独立。Poisson分布成立的条件：除二项分布成立的三个条件外，还要求试验次数n很大，而所关心的事件发生的概率?很小。 2. 二项分布、Poisson分布分别在何种条件下近似正态分布？

简答：二项分布的正态近似：当n较大，π不接近0也不接近1时，二项分布B（n,

π）近似正态分布N（n?,

n?(1??)）。

Poisson分布的正态近似：Poisson分布?(?)，当?相当大时（≥20），其分布近似于正态分布。

三、计算题

1. 已知某种非传染性疾病常规疗法的有效率为80%，现对10名该疾病患者用常规疗法治疗，问至少有9人治愈的概率是多少？

解：对10名该疾病患者用常规疗法治疗，各人间对药物的反应具有独立性，且每人服药后治愈的概率均可视为0.80，这相当于作10次独立重复试验，即?=0.80，n=10的贝努利试验，因而治愈的人数X服从二项分布B(10, 0.80)。至少有9人治愈的概率为：

kP(X?9)?1?P(X?9?1)＝1??C100.8k(1?0.8)10?kk?08 ?1?0.6242?0.3758＝37.58 %至少有9人治愈的概率是37.58%。或者

P(X?9)?P(X?9)?P(X?10)

9?C100.89(1?0.8)1?C10810(1?0.8)0 100.?0.3785

2. 据以往的统计资料，某地新生儿染色体异常率为1%，问100名新生儿中染色体异常不少于2名的概率是多少？

解：

P(X?2)?1?P(X?2?1)?1?P(X?0)?P(X?1)

10?111?1e?e＝1?0.3679?0.3679＝0.2642＝26.42% =1?0!1!3. 调查某市2000年110名20岁男性青年的身高（cm）资料如下：

173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5 168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2 170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5 166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5 181.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1 176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8 178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2

168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0 175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6 175.8 164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6 173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2

（1）试估计当年该市20岁男性青年中，身高在175.0~178.0（cm）内的占多大比例？（2）估计当年该市95%以及99%的20岁男青年身高范围。

（3）若当年由该市随机抽查1名20岁男青年，试估计其身高超过180 cm的概率。解：用SPSS计算本题。数据文件：data3-n.sav。

数据格式：数据库2列110行，变量n为男性青年序号，x表示身高。操作步骤：

操作

Analyze

Descriptive Statistics

Descriptives Options

√ Mean √ Std. Deviation Continue Variable[s]: x OK Transform Compute

Target Variable P Numeric Expression：

CDF.NORMAL(178.0,174.766,4.1509)-CDF. NORMAL(175.0,174.766,4.1509) OK

Target Variable x1 Numeric Expression：

174.766-1.96*4.1509 OK

Target Variable x2 Numeric Expression：

174.766+1.96*4.1509 OK

Target Variable x3 Numeric Expression：

174.766-2.58*4.1509 OK

Target Variable x4 Numeric Expression：

174.766+2.58*4.1509 OK

该市95%以及99%的20岁男青年身高范围间的比例调用“变量计算(Compute Variable)”对话框定义目标变量“P”

当年该市20岁男性青年中，身高在175.0~178.0 cm内的比例

调用Descriptives过程

计算得均数=174.766，标准差=4.150 9

说明

误的概率（?）和犯Ⅱ类错误的概率（?）成反比。如果把Ⅰ类错误的概率定得很小，势必增加犯Ⅱ类错误的概率，从而降低检验效能；反之，如果把Ⅱ类错误的概率定得很小，势必增加犯Ⅰ类错误的概率，从而降低了置信度。为了同时减小?和?，只有通过增加样本含量，减少抽样误差大小来实现。 5．试述检验功效的概念和主要影响因素。

答：拒绝不正确的H0的概率，在统计学中称为检验功效(power of test)，记为1??。检验功效的意义是：当两个总体参数间存在差异时(如备择假设H1：???0成立时)，所使用的统计检验能够发现这种差异(拒绝零假设H0：???0)的概率，一般情况下要求检验功效应在0.8以上。

影响检验功效的四要素为总体参数的差异?、总体标准差?、检验水准?及犯Ⅱ类错误的概率?。

6．简述假设检验的基本思想。

答：假设检验是在H0成立的前提下，从样本数据中寻找证据来拒绝H0、接受H1的一种“反证”方法。如果从样本数据中得到的证据不足，则只能不拒绝H0，暂且认为H0成立（因为拒绝的证据不足），即样本与总体间的差异仅仅是由于抽样误差所引起。拒绝H0是根据某个界值，即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端（即绝对值更大）的概率较小，比如小于等于0.05（各种科研杂志习惯上采用这一概率值），则认为零假设的事件在某一次抽样研究中不会发生，此时有充分理由拒绝H0，即有足够证据推断差异具有统计学意义。

三、计算题

1. 一般正常成年男子血红蛋白的平均值为140 g/L，某研究者随机抽取25名高原地区成年男子进行检查，得到血红蛋白均数为155 g/L，标准差25 g/L。问：高原地区成年男子的血红蛋白是否比一般正常成年男子的高？解：H0：???0 H1：???0

??0.0（单侧）5t?X??0=3.00 S/nt=3，0.005?P?0.01，可认为高原地区居民的血红蛋白比一般正常成年男子的高。 2. 一般而言，对某疾病采用常规治疗，其治愈率约为45%。现改用新的治疗方法，并随机抽取180名该疾病患者进行了新疗法的治疗，治愈117人。问新治疗方法与常规疗法的效果是否有差别？

解：H0：?＝?0，H1：???0，??0.05

＝5.41

Z?p??0?p?p??0?0(1??0)/nZ=5.41，P?0.001，可认为新治疗方法与常规疗法的效果不同，新疗法优于常规疗

法。

（林爱华宇传华）

第6章两样本定量资料的比较

思考与练习参考答案

一、最佳选择题

1. 正态性检验，按α =0.10检验水准，认为其总体服从正态分布，此时若推断有错，其错误的概率为（ D ）。

A. 大于0.10 B. 等于0.10 C. 小于0.10 D. 等于β,而β未知 E. 等于1-β，而β未知

2. 甲、乙两人分别从同一随机数字表抽取30个（各取两位数字）随机数字作为两个样本，求得X1和S1、X2和S2，则理论上（ C ）。 A. X1?X2 B. S1?S2

C. 由甲、乙两样本均数之差求出的总体均数95%可信区间，很可能包括0 D. 作两样本均数比较的t检验，必然得出无统计学意义的结论 E. 作两样本方差比较的F检验，必然方差齐

3. 两样本均数比较时，能用来说明两组总体均数间差别大小的是（ D ）。

2222 A. t值 B. P值

C. F值 D. 两总体均数之差的95%置信区间 E. 上述答案均不正确

4. 两小样本均数比较，方差不齐时，下列说法不正确的是（ C ）。 A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 5. 两样本秩和检验的H0是（ B ）。

A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等

6. 在统计检验中是否选用非参数统计方法（ A ）。 A. 要根据研究目的和数据特征作决定

B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小

E. 既然非参数统计对资料没有严格的要求，在任何情况下均能直接使用 7. 配对样本差值的Wilcoxon符号秩和检验，确定P值的方法是（ D ）。

A. T越大，P值越小 B. T越大，P值越大

C. T值在界值范围内，P值小于相应的α D. T值＞界值，P值大于相应的α值 E. T值在界值范围上，P值大于相应的α

8. 成组设计两样本比较的秩和检验，其检验统计量T是（ C ）。

A. 为了查T界值表方便，一般以秩和较小者为T B. 为了查T界值表方便，一般以秩和较大者为T C. 为了查T界值表方便，一般以例数较小者秩和为T D. 为了查T界值表方便，一般以例数较大者秩和为T

E. 当两样本例数不等时，任取一样本的秩和为T都可以查T界值表

二、思考题

1．假设检验中，P值和α的含义是什么？两者有什么关系？

答：P是指H0成立时出现目前样本情形的概率最多是多大, α是事先确定的检验水准。但P值的大小和α没有必然关系。

2. 既然假设检验的结论有可能有错，为什么还要进行假设检验？

答：假设检验中，无论拒绝不拒绝H0，都可能会犯错误，表现为拒绝H0时，会犯Ⅰ类错误，不拒绝H0时，会犯Ⅱ类错误，但这并不能否认假设检验的作用。只要涉及到抽样，就会有抽样误差的存在，因此就需要进行假设检验。只是要注意，假设检验的结论只是个概率性的结论，它的理论基础是“小概率事件不可能原理”。

3. 配对设计资料能否用完全随机设计资料的统计检验方法？为什么？

答：不能。采用完全随机设计资料的t检验会使检验效能降低，从而可能会使应有的差别检验不出来。

4. 对于完全随机设计两样本定量资料的比较，如何选择统计方法？

答：完全随机设计两样本定量资料比较统计方法的选择最关键的是看是否满足正态性（样本量较大时不必进行正态性检验）和方差齐性。如果资料来自正态总体且总体方差齐，采用t 检验；如果满足正态性但总体方差不齐，采用t′检验；当两者都不满足时，才考虑选用秩和检验。当然，我们也可采用变量变换的方法使其满足t或t′检验的条件。 5. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”，而同一组的相同数据不必计算“平均秩次”？

答：秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”，而同一组的相同数据不必计算“平均秩次”，是因为取不取“平均秩次”对该组的总的秩和没有影响。

三、计算题

1. 某单位研究饲料中维生素E缺乏对肝中维生素A含量的影响，将同种属、同年龄、同性别、同体重的大白鼠配成8对，并将每对动物随机分配到正常饲料组和缺乏维生素E的饲料组，定期将大白鼠杀死，测定其肝中维生素A的含量（教材表6-12），问饲料中维生素E缺乏对肝中维生素A的平均含量有无影响？

教材表6-12 正常饲料组与维生素E缺乏组大白鼠肝中维生素A含量/

（U·mg1)

大白鼠对别 1 2 3 4 5 6 7 8

正常饲料组 3.55 2.60 2.40

3.00 1.80

3.95 3.20

3.80 3.25

3.75 2.70

3.45 2.40

3.05 1.75

维生素E缺乏组 2.45

解：此题是个配对设计的资料，差值的正态性检验结果表明：差值来自正态总体（W检验：P=0.268），所以采用配对t检验。结果为：t=6.837，?=7，P＜0.001，拒绝H0，可以认为维生素E缺乏对肝中维生素A含量有影响。

2. 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效，以生存日数作为观察指标。实验结果如下，请比较两组的平均生存日数有无差别。

实验组对照组

10 2

12 3

14 6

15 7

15 8

17 9

18 10

20 12

26 12

80 13

解：此题是个完全随机设计的资料。两组资料的正态性检验结果表明，差值来自正态总体(W检验：P1＜0.001，P2=0.011)，所以采用两样本比较的秩和检验。结果为：T1=150.5， T2=80.5，本例中n1＝10，n2－n1＝1，对应双侧0.05的界值为81～139，故在α＝0.05的水平上拒绝H0,认为两组小鼠生存日数不同。

（施学忠杨永利赵耐青）

第7章多组定量资料的比较

思考与练习参考答案

一、最佳选择题

1. 完全随机设计资料的方差分析中，必然有（ C ）。

A. SS组间>SS组内 B. MS总?MS组间?MS组内 C. D. MS组间?MS组内 E. ?组内??组间 2. 定量资料两样本均数的比较，可采用（ D ）。

A. t检验 B.F检验 C. Bonferroni检验 D. t检验与F检验均可 E. LSD检验

3. 当组数等于2时，对于同一资料，方差分析结果与t检验结果相比，（ C ）。

ss总=

SS组间+SS组内

A. t检验结果更为准确 B. 方差分析结果更为准确 C. 完全等价且t?D. 完全等价且F?F

t E. 两者结果可能出现矛盾

4. 若单因素方差分析结果为F?F0.01(?1,?2),则统计推断是（ D ）。

A. 各样本均数都不相等 B. 各样本均数不全相等 C. 各总体均数都不相等 D. 各总体均数不全相等 E. 各总体均数全相等 5. 完全随机设计资料的方差分析中，组间均方表示（ C ）。

A. 抽样误差的大小 B. 处理效应的大小 C. 处理效应和抽样误差综合结果

D. N个数据的离散程度 E. 随机因素的效应大小 6. 多样本定量资料比较，当分布类型不清时应选择（ D ）。

A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 7. 多组样本比较的Kruskal-Wallis检验中，当相同秩次较多时，如果用H值而不用校正后的Hc值，则会（ C ）。

A．提高检验的灵敏度 B．把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D．Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对

二、思考题

1. 方差分析的基本思想和应用条件是什么？

答：方差分析的基本思想是，对于不同设计的方差分析，其思想都一样，即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲，根据试验设计的类型和研究目的，将全部观测值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的变异可由某个因素的作用加以解释，通过比较不同变异来源的均方，借助F分布作出统计推断，从而推论各种研究因素对试验结果有无影响。

其应用条件是，① 各样本是相互独立的随机样本，均服从正态分布；② 各样本的总体方差相等，即方差齐性。

2. 多组定量资料比较时，统计处理的基本流程是什么？

答：多组定量资料比较时首先应考虑用方差分析，对其应用条件进行检验，即方差齐性及各样本的正态性检验。若方差齐性，且各样本均服从正态分布，选单因素方差分析。若方差不齐，或某样本不服从正态分布，选Kruskal-Wallis秩和检验，或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义，则需选择合适的方法（如Bonferonni、LSD法等）进行两两比较。

三、计算题：

1. 根据教材表7-11资料，大白鼠感染脊髓灰质炎病毒后，再作伤寒或百日咳接种是否影响生存日数？若结论为“有影响”，请作多重比较（与对照组比）。

教材表7-11 各组大鼠接种后生存日数/天伤寒 5 7 8 9 9 10 10 11 11 12

百日咳 6 6 7 8 8 9 9 10 10 11

对照 8 9 10 10 10 11 12 12 14 16

解：本题资料可考虑用完全随机设计的单因素方差分析进行统计处理。（1）建立检验假设，确定检验水准。

H0：大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗生存日数相等。

H1：大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗生存日数不等或不全相

等，?=0.05。

（2）方差分析应用前提条件的检验首先进行正态性及方差齐性检验，三组均服从正态分布（P1＝0.684，P2＝0.591，P3＝0.507），三个总体的方差齐（P＝0.715），符合单因素方差分析的条件，可行方差分析。

（3）各组可分别采用均数和标准差描述其集中趋势和离散趋势，各组的统计描述及总

体均数的置信区间如下：

表1三组大鼠接种后生存日数的描述性统计量/天

95%置信区间

伤寒百日咳对照合计

N 10 10 10 30

均数 9.20 8.40 11.2 9.60

标准差

下限

2.10 1.71 2.39 2.34

7.70 7.17 9.49 8.73

上限 10.70 9.63 12.91 10.47

（4）资料的方差分析见方差分析表方差分析结果F?4.776，P?0.017，即大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗生存日数不等或不全相等。

表2三组大鼠接种后生存日数差别有无统计学意义的方差分析表变异来源组间组内合计

SS 41.6 117.6 159.2

df 2 27 29

MS 20.800 4.356

F 4.776

P 0.017

进一步行多重比较(LSD检验)，结果两实验组均与对照组有统计学差异。认为大白鼠感染脊髓灰质炎病毒后，再接种伤寒或百日咳菌苗对生存日数有影响，生存日数减少。

表3三组大鼠接种后生存日数两两比较的结果

对比组

XA?XB

SXA?XB

P 均数差值的95％置信区间下限

上限 -0.09 -0.89

伤寒组与对照组百日咳组与对照组

2.0 2.8

0.9333 0.9333

0.041 0.006

-3.92 -4.72

2. 将18名乙脑患者随机分为三组，分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗，观察指标为治疗后的退热时间，结果见教材表7-12。问三组治疗结果的差异是否具有统计学意义？教材表7-12 三组乙脑患者的退热时间/天

治疗分组单克隆抗体组胸腺肽组

0 32

2 13

退热时间 0 6

0 7

5 10

9 2

利巴韦林组 0 11 15 11 3 1

解：从专业上考虑，退热时间一般不服从正态分布，可采用Kraskal－Wallis检验分析三组乙脑患者的退热时间差异有无统计学意义。

（1）各组可分别采用四份位数描述其集中趋势和离散趋势，各组的统计描述如下：

表1三组乙脑患者退热时间的描述性统计量/天

组别单克隆抗体组胸腺肽组利巴韦林组

N 6 6 6

P25 0.00 5.00 0.75

P50 1.00 8.50 7.00

P75 6.00 17.75 12.00

（2）建立检验假设，确定检验水准。

H0：三组乙脑患者的退热时间相等，

H1：三组乙脑患者的退热时间不等或不全相等，

?=0.05。

（3）Kraskal－Wallis检验结果，?＝4.799，?＝2，P=0.091>0.05。结论为，在α=0.05的水平上尚不能认为三组治疗结果的差异具有统计学意义。

（王玖徐天和高永石德文）

2第8章定性资料的比较思考与练习参考答案

一、最佳选择题

1. 定性资料的统计推断常用（ D ）。

A. t检验 B. 正态检验 C. F检验 D. ?检验 E. t′检验 2. 两组二分类资料发生率比较，样本总例数100，则?检验自由度为（ A ）。

A. 1 B. 4 C. 95 D. 99 E. 100 3. 四格表?检验中，?

A. 两总体率不同 B. 不能认为两总体率不同 C. 两样本率不同 D. 不能认为两样本率不同

E. 以上都不对

4.等级资料比较宜采用（ E ）。

A. t检验 B. ?检验 C. F检验 D. 正态检验 E. 秩和检验 5. 为比较治疗某病的新疗法与常规方法，试验者将100名患者按性别、年龄等情况配成对子，分别接受两疗法治疗。观察得到有28对患者同时有效，5对患者同时无效，11对患者新药有效常规治疗无效。欲比较两种疗法的有效率是否相同，应选择的统计分析方法为（ D ）。

A. 独立的两组二分类资料比较?检验 B. 独立的两组二分类资料比较校正?检验

C. 配对的两组二分类资料比较?检验 D. 配对的两组二分类资料比较校正?检验

E. Fisher确切概率法

22222二、思考题

1. 简述?检验适用的数据类型。

答：提示：卡方检验是应用较广的一种定性资料的假设检验方法，常用于检验两个或多个样本率（或构成比）之间有无差别。

2. 两组二分类资料的设计类型有几类？其相应的检验方法是什么？

答：提示：两组二分类资料的设计类型主要有2类，即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。完全随机设计资料应用公式（8-1）或（8-4），配对设计资料应用公式（8-7）或（8-8）。 3. 什么资料适合用秩和检验进行检验？简述秩和检验步骤。

答：提示：进行有序资料的比较时宜采用秩和检验。秩和检验步骤为：① 建立假设

2H0和H1，并确定检验水准?；② 根据不同的设计类型对资料进行编秩并计算秩和；③ 根

据计算的秩和直接查表或计算相应的统计量再查表，确定P值下结论。进行有序资料的比较时宜采用秩和检验。

4. 试证明对于R×C式（8-11）与式（8-1）等价。