生物医学研究的统计学方法 - 课后习题答案 - 2014 - 主编 - 方积

更新时间:2024-03-13 10:27:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

思考与练习参考答案

第一章 绪论

一、选择题

1. 研究中的基本单位是指 ( D )。

A.样本 B. 全部对象 C.影响因素 D. 个体 E. 总体 2. 从总体中抽取样本的目的是( B )。

A.研究样本统计量 B. 由样本统计量推断总体参数

C.研究典型案例 D. 研究总体统计量 E. 计算统计指标 3. 参数是指( B )。

A.参与个体数 B. 描述总体特征的统计指标

C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是( E )。 A.白细胞计数 B.住院天数

C.门急诊就诊人数 D.患者的病情分级 E. ABO血型 5.关于随机误差下列不正确的是( C )。

A.受测量精密度限制 B.无方向性 C. 也称为偏倚 D.不可避免 E. 增加样本含量可降低其大小

二、名称解释(答案略)

1. 变量与随机变量 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 随机事件 7. 频率与概率

三、思考题

1. 生物统计学与其他统计学有什么区别和联系?

答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其

不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。

2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?

答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。

3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。

(1) 该研究中的总体是什么?

答:某地区10万个7岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么?

答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么?

答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。 (5)该研究中的样本是什么?

答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩。

(宇传华 方积乾)

第2章 统计描述

思考与练习参考答案

一、最佳选择题

1. 编制频数表时错误的作法是( E )。

A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值

E. 写组段,如“1.5~3,3~5, 5~6.5,…”

2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是( A )。

A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用( A )。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数P2.5与P97.5的间距 4. 均数X和标准差S的关系是( A )。 A. S越小,X对样本中其他个体的代表性越好 B. S越大,X对样本中其他个体的代表性越好 C. X越小,S越大 D. X越大,S越小 E. S必小于X

5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为( B )。

A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数

6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于( C )。

A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从0开始的图形为( D )。

A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可

二、简答题

1. 对定量资料进行统计描述时,如何选择适宜的指标?

答:详见教材表2-18。

教材表2-18 定量资料统计描述常用的统计指标及其适用场合 描述内容 指 标 平均水平

意 义

适 用 场 合

均 数 个体的平均值 几何均数 平均倍数

对称分布

取对数后对称分布

①非对称分布;②半定量资料;③末端开

中 位 数 位次居中的观察值

口资料;④分布不明

众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料

变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析

标 准 差 观察值平均离开均数的

对称分布,特别是正态分布资料

(方 差) 程度 四分位数①非对称分布;②半定量资料;③末端开

居中半数观察值的全距

间距 口资料;④分布不明

①不同量纲的变量间比较;②量纲相同但

变异系数 标准差与均数的相对比

数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。

答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。

当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。

两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。 3. 应用相对数时应注意哪些问题?

答:(1)防止概念混淆 相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。

(2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表2-20。

教材表2-20 常用统计图的适用资料及实施方法 图 形 条 图 直 方 图 百分条图 饼 图 线 图 半对数线图 散 点 图

适 用 资 料 组间数量对比 定量资料的分布 构成比 构成比

定量资料数值变动 定量资料发展速度 双变量间的关联

实 施 方 法

用直条高度表示数量大小

用直条的面积表示各组段的频数或频率

用直条分段的长度表示全体中各部分的构成比 用圆饼的扇形面积表示全体中各部分的构成比 线条位于横、纵坐标均为算术尺度的坐标系

线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 点的密集程度和形成的趋势,表示两现象间的相关关系

箱 式 图 茎 叶 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数

三、计算题

1. 某内科医生调查得到100名40~50岁健康男子总胆固醇(mg/dl),结果如下 227 199 235 235 246 163 207

190 155 220 167 209 273 208

224 208 190 210 202 178 231

259 203 203 171 186 190 234

225 199 197 248 217 207 226

238 253 149 201 206 259 174

180 181 175 266 200 186 199

193 196 236 189 203 194 278

214 224 202 222 197 246 277

195 210 209 199 161 172 181

213 220 174 197 247 234

193 255 184 214 138 232

209 257 174 199 186 189

172 216 185 198 156 172

244 249 167 230 195 235

(1)编制频数表,绘制直方图,讨论其分布特征。

答:频数表见练习表2-1。根据直方图(练习图2-1),可认为资料为基本对称分布,其包络线见练习图2-2。

练习表2-1 某地100名40~50岁健康男子总胆因醇/(mg·dl)

Valid Percent

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

Cumulative Percent

1.0 4.0 15.0 27.0 52.0 67.0 80.0 91.0 96.0 100.0

-1

Frequency Percent

Valid 130~

145~ 160~ 175~ 190~ 205~ 220~ 235~ 250~ 265~280

Total

1 3 11 12 25 15 13 11 5 4 100

1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0

100.0 100.0

A. t检验结果更为准确 B. 方差分析结果更为准确 C. 完全等价且t?D. 完全等价且F?F

t E. 两者结果可能出现矛盾

4. 若单因素方差分析结果为F?F0.01(?1,?2),则统计推断是( D )。

A. 各样本均数都不相等 B. 各样本均数不全相等 C. 各总体均数都不相等 D. 各总体均数不全相等 E. 各总体均数全相等 5. 完全随机设计资料的方差分析中,组间均方表示( C )。

A. 抽样误差的大小 B. 处理效应的大小 C. 处理效应和抽样误差综合结果

D. N个数据的离散程度 E. 随机因素的效应大小 6. 多样本定量资料比较,当分布类型不清时应选择( D )。

A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 7. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后的Hc值,则会( C )。

A. 提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对

二、思考题

1. 方差分析的基本思想和应用条件是什么?

答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲, 根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。

其应用条件是,① 各样本是相互独立的随机样本,均服从正态分布;② 各样本的总体方差相等,即方差齐性。

2. 多组定量资料比较时,统计处理的基本流程是什么?

答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。

三、计算题:

1. 根据教材表7-11资料,大白鼠感染脊髓灰质炎病毒后,再作伤寒或百日咳接种是否影响生存日数?若结论为“有影响”,请作多重比较(与对照组比)。

教材表7-11 各组大鼠接种后生存日数/天 伤寒 5 7 8 9 9 10 10 11 11 12

百日咳 6 6 7 8 8 9 9 10 10 11

对照 8 9 10 10 10 11 12 12 14 16

解:本题资料可考虑用完全随机设计的单因素方差分析进行统计处理。 (1)建立检验假设,确定检验水准。

H0:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。 H1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相

等,?=0.05。

(2)方差分析应用前提条件的检验 首先进行正态性及方差齐性检验,三组均服从正态分布(P1=0.684,P2=0.591,P3=0.507),三个总体的方差齐(P=0.715),符合单因素方差分析的条件,可行方差分析。

(3)各组可分别采用均数和标准差描述其集中趋势和离散趋势,各组的统计描述及总

体均数的置信区间如下:

表1三组大鼠接种后生存日数的描述性统计量/天

95%置信区间

伤寒 百日咳 对照 合计

N 10 10 10 30

均数 9.20 8.40 11.2 9.60

标准差

下限

2.10 1.71 2.39 2.34

7.70 7.17 9.49 8.73

上限 10.70 9.63 12.91 10.47

(4)资料的方差分析见方差分析表 方差分析结果F?4.776,P?0.017,即大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等。

表2三组大鼠接种后生存日数差别有无统计学意义的方差分析表 变异来源 组间 组内 合计

SS 41.6 117.6 159.2

df 2 27 29

MS 20.800 4.356

F 4.776

P 0.017

进一步行多重比较(LSD检验),结果两实验组均与对照组有统计学差异。认为大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响,生存日数减少。

表3三组大鼠接种后生存日数两两比较的结果

对比组

XA?XB

2.0 2.8

SXA?XB

P 均数差值的95%置信区间 下限

上限 -0.09 -0.89

伤寒组与对照组 百日咳组与对照组

0.9333 0.9333

0.041 0.006

-3.92 -4.72

2. 将18名乙脑患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗,观察指标为治疗后的退热时间,结果见教材表7-12。问三组治疗结果的差异是否具有统计学意义? 教材表7-12 三组乙脑患者的退热时间/天

治疗分组 单克隆抗体组 胸腺肽组

0 32

2 13

退热时间 0 6

0 7

5 10

9 2

利巴韦林组 0 11 15 11 3 1

解:从专业上考虑,退热时间一般不服从正态分布,可采用Kraskal-Wallis检验分析三组乙脑患者的退热时间差异有无统计学意义。

(1) 各组可分别采用四份位数描述其集中趋势和离散趋势,各组的统计描述如下:

表1三组乙脑患者退热时间的描述性统计量/天

组别 单克隆抗体组 胸腺肽组 利巴韦林组

N 6 6 6

P25 0.00 5.00 0.75

P50 1.00 8.50 7.00

P75 6.00 17.75 12.00

(2)建立检验假设,确定检验水准。

H0:三组乙脑患者的退热时间相等,

H1:三组乙脑患者的退热时间不等或不全相等,

?=0.05。

(3)Kraskal-Wallis检验结果,?=4.799,?=2,P=0.091>0.05。结论为,在α=0.05的水平上尚不能认为三组治疗结果的差异具有统计学意义。

(王 玖 徐天和 高 永 石德文)

2第8章 定性资料的比较 思考与练习参考答案

一、最佳选择题

1. 定性资料的统计推断常用( D )。

A. t检验 B. 正态检验 C. F检验 D. ?检验 E. t′检验 2. 两组二分类资料发生率比较,样本总例数100,则?检验自由度为( A )。

A. 1 B. 4 C. 95 D. 99 E. 100 3. 四格表?检验中,?

A. 两总体率不同 B. 不能认为两总体率不同 C. 两样本率不同 D. 不能认为两样本率不同

E. 以上都不对

4.等级资料比较宜采用( E )。

A. t检验 B. ?2检验 C. F检验 D. 正态检验 E. 秩和检验 5. 为比较治疗某病的新疗法与常规方法,试验者将100名患者按性别、年龄等情况配成对子,分别接受两疗法治疗。观察得到有28对患者同时有效,5对患者同时无效,11对患者新药有效常规治疗无效。欲比较两种疗法的有效率是否相同,应选择的统计分析方法为( D )。

A. 独立的两组二分类资料比较?2检验 B. 独立的两组二分类资料比较校正?2检验

C. 配对的两组二分类资料比较?检验 D. 配对的两组二分类资料比较校正?检验

E. Fisher确切概率法

22二、思考题

1. 简述?检验适用的数据类型。

答:提示:卡方检验是应用较广的一种定性资料的假设检验方法,常用于检验两个或多个样本率(或构成比)之间有无差别。

2. 两组二分类资料的设计类型有几类?其相应的检验方法是什么?

答:提示:两组二分类资料的设计类型主要有2类,即完全随机设计和配对设计。完全随机设计和配对设计资料在假设检验方法上均采用卡方检验。完全随机设计资料应用公式(8-1)或(8-4),配对设计资料应用公式(8-7)或(8-8)。 3. 什么资料适合用秩和检验进行检验?简述秩和检验步骤。

答:提示:进行有序资料的比较时宜采用秩和检验。秩和检验步骤为:① 建立假设

2H0和H1,并确定检验水准?;② 根据不同的设计类型对资料进行编秩并计算秩和;③ 根

据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。进行有序资料的比较时宜采用秩和检验。

4. 试证明对于R×C式(8-11)与式(8-1)等价。

本文来源:https://www.bwwdw.com/article/o7n8.html

Top