卫生统计学复习题及参考答案

更新时间:2023-03-10 03:02:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中南大学网络教育课程考试复习题及参考答案

一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.变异 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布

15.标准正态分布 16.统计推断 17.抽样误差 18.标准误

19.可信区间 20.参数估计

21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数 28.标准化法 29.构成比 30.Yates校正 31.非参数统计 32.直线回归 33.相关系数 34.统计图 35.回归系数

二、单项选择题:

1.观察单位为研究中的( )。

A.样本 B.全部对象 C.2.总体是由( )。

A.个体组成 B.研究对象组成3.抽样的目的是( )。

卫生统计学

影响因素 D.个体 同质个体组成 D.研究指标组成 第1页共7页

C.A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体统计量 4.参数是指( )。

A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 5.关于随机抽样,下列那一项说法是正确的( )。

A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体

D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( )。

A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( )。

A.变异系数 B.方差 C.极差 D.标准差 8.以下指标中( )可用来描述计量资料的离散程度。( )

A.算术均数 B.几何均数 C.中位数 D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是( )。 A.算术平均数 B.中位数 C.几何均数 D.平均数 10.两样本均数的比较,可用( )。

A.方差分析 B.t 检验 C.两者均可 D.方差齐性检验 11.配伍组设计的方差分析中,?配伍等于( )。

A.?总-?误差 B.?总-?处理 C.?总-?处理+?误差D.?总-?处理-?误差

12.在均数为?,标准差为?的正态总体中随机抽样,|X??|?( )的概率为5%。( ) A.1.96? B.1.96?X C.t0.052,?s D.t0.052,?SX 13.完全随机设计方差分析的检验假设是( )。

A.各处理组样本均数相等 B.各处理组总体均数相等

C.各处理组样本均数不相等 D.各处理组总体均数不全相等

14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,

而乙乡男多于女,适当的比较方法是( )。

2

A.分别进行比较 B.两个率比较的χ检验

C.不具备可比性,不能比较 D.对性别进行标准化后再比较 15.率的标准误的计算公式是( )。

A.

p(1?p) B.

p(1?p)n C.

pn?1 D.

p(1?p)n

16.非参数统计应用条件是( )。

A.总体是正态分布 B.若两组比较,要求两组的总体方差相等 C.不依赖于总体分布 D.要求样本例数很大 17.下述哪些不是非参数统计的特点( )。

A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握 C.适用于等级资料 D.检验效能总是低于参数检验 18.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( )。

A.把X1与X2的差数绝对值从小到大编秩 B.把X1和X2综合从小到大编秩 C.把X1和X2综合按绝对值从小到大编秩 D.把X1与X2的差数从小到大编秩 19.秩和检验和t检验相比,其优点是( )。

A.计算简便,不受分布限制 B.公式更为合理 C.检验效能高 D.抽样误差小 20.对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用( )。

A.t 检验 B.u 检验 C.秩和检验 D.F检验

第2页共7页

21.等级资料的比较宜用( )。

A.t 检验 B.秩和检验 C.F 检验 D.四格表X2检验 22.两个小样本比较的假设检验,应首先考虑( )。

A.t 检验 B.秩和检验

C.任选一种检验方法 D.资料符合哪种检验的条件 23.对于配对比较的秩和检验,其检验假设为( )。

A.样本的差数应来自均数为0的正态总体 B.样本的差数应来自均数为0的非正态总体 C.样本的差数来自中位数为0的总体 D.样本的差数来自方差齐性和正态分布的总体 24.用最小二乘法确定直线回归方程的原则是各观察点( )。

A.距直线的纵向距离相等 B.距直线的纵向距离的平方和最小 C.与直线的垂直距离相等 D.与直线的垂直距离的平方和最小 25.实验设计的三个基本要素是( )。

A.受试对象、实验效应、观察指标 B.随机化、重复、设置对照

C.齐同对比、均衡性、随机化 D.处理因素、受试对象、实验效应 26.实验设计的基本原则( )。

A.随机化、盲法、设置对照 B.重复、随机化、配对

C.随机化、盲法、配对 D.随机化、重复、设置对照 27.实验设计和调查设计的根本区别是( )。

A.实验设计以动物为对象 B.调查设计以人为对象

C.实验设计可随机分组 D.实验设计可人为设置处理因素 28.标准正态分布的均数与标准差分别为( )。

A.0与1 B.1与0 C.0与0 D.1与1

29.正态分布有两个参数?与?,( )相应的正态曲线的形状越扁平。( )

A.? 越大 B.? 越小 C.?越大 D.?越小

30.若X服从以?,?为均数和标准差的正态分布,则X的第95百分位数等于( )。

A.??1.64? B.??1.64? C.??1.96? D.??2.58? 31.计算某地某年麻疹发病率,其分母为 ( )

A.该地体检人数 B.该地年平均就诊人数 C.该地年平均人口数

D.该地平均患者人数 E.该地易感人群人数

32.两个独立小样本计量资料比较的假设检验,首先应考虑( )

A.用t 检验 B.用u检验 C.用Wilcoxon秩和检验

D.检验或Wilcoxon秩和检验均可 E.资料符合t检验还是Wilcoxon秩和检验条件 33.若决定系数为0.04,则下列说法错误的是 ..

A.散点图中所有的实测点都排列在一条回归线上

B.决定系数即是r2 C.y的总变异中有4%可以由x的变化来解释 D.相关系数r=0.2 E.回归贡献相对较小 34.老年人口系数下降,可使 ( )

A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对 35.标准化以后的总死亡率( )

A.标化后的率比原来的率低 B.标化后的率比原来的率高

C.反映了实际水平 D.反映了相对水平,仅作为比较的基础 E.不随标准选择的变化而变化

36.配对样本差值的Wilcoxon符号秩检验,确定P值的方法为( )

A.T越大,P越大 B.T越大,P越小

第3页共7页

C.T值在界值范围内,P小于相应的? D.T值在界值范围内,P大于相应的? E.T值即u值,查u界值表

37.关于回归系数的描述,下列说法错误的是( )

A.b?0,表示回归直线与y轴交点在原点上方

B.b?0,回归直线与x轴平 C.b越大,则回归直线越陡

D.b一般有单位 E.b?0表示回归直线从左上方走向右下方 38.实验设计和调查设计的根本区别是( )

A.实验设计以动物为对象 B.调查设计以人为对象

C.实验设计可随机分组 D.实验设计可人为设置处理因素 E.两者无区别 39.少年儿童人口系数下降,可使( )

A.粗死亡率上升 B.粗死亡率下降 C.出生率上升 D.出生率下降 E.生育率下降 40.以下对于标准化法的描述错误的是 ( )

A.标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性 B.样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需做假设检验

C.标准化率代表真实的死亡(或患病、发病)率水平

D.一般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率

E.当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法 41.多样本计量资料的比较,当分布类型不清时选择( )

A.t 检验 B.x2 检验 C.μ 检验 D.H 检验 E.F检验 42.回归系数的假设检验,其无效假设H0是( )

A.β=1 B.β≠0 C.β>0 D.β<0 E.β=0

43.估计样本含量时,所定第Ⅱ类误差愈小,则( )

A.所要的样本含量愈大 B.所要的样本含量愈小 C.不影响样本含量 D.所定的样本含量愈准确 E.所定的样本含量愈粗糙 44.欲计算某年新生儿死亡率,则应选用作为分母的是( )

A.某年新生儿总数 B.某年活产总数 C.当年怀孕的妇女数 D.妊娠28周以上的妇女数 E.妊娠28周以上出生并存活的新生儿 45.用以说明某现象发生的频率或强度的指标为 ( )

A.率 B.构成比 C.相对比 D.绝对数 E.均数 46.当四个样本率比较,得到?>?220.05,3

,则可以认为 ( )

A.四个样本率都不相同 B.四个总体率都不相同

C.四个样本率不同或不全相同 D.四个总体率不同或不全相同 E.以上都不对 47.成组设计两样本比较的秩和检验,其检验统计量T是( )

A.以秩和较小者为T B.以秩和较大者为T

C.以例数较小者秩和为T D.以例数较大者秩和为T E.当两样本例数不等时,可任取一样本的秩

48.直线回归分析中,有直线回归方程Y?=0.004+0.0488X ,代入两点描出回归线。下面选项哪项正确( )

A.所有实测点都应在回归线上 B.所绘回归直线必过点(X,Y)

第4页共7页

C.原点是回归直线与Y轴的交点 D.回归直线X的取值范围为(-1,1)

E.实测值与估计值差的平方和必小于零

49.研究A药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌A药;2周后

检测体内存活的肿瘤细胞数。这种对照在实验设计中称为 ( )

A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照 50.行×列表中,对于理论频数太小的情形,最好采用( )

A.增大样本容量,以达到增大理论频数的目的 B.删去理论频数太小的格子所对应的行或列

C.理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并

D.性质不同的行或列中的实际频数合并 E.使用连续性校正公式 51.直线相关分析中,对相关系数作假设检验,其目的是 ( )

A.检验相关系数r 是否等于0 B.推断两变量间是否存在直线相关关系

C.检验两总体相关系数是否相等 D.推断两变量间相关方向 E.推断两变量间密切程度 52.用最小二乘法确定直线回归方程的原则是( )

A.各观测点距直线的纵向距离相等 B.各观测点距直线的纵向距离平方和最小

C.各观测点距直线的垂直距离相等 D.各观测点距直线的垂直距离平方和最小 E.各观测点距直线的纵向距离最小

53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎和胃溃疡病人,随机

分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏冲剂”。这种对照在实验设计中称为 ( ) A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照

54.某研究欲调查某市中学生对艾滋病的认识,从全市40所中学随机抽取4所,对该4所学校的全部学生

实施问卷调查。该种抽样方法属于( )

A.整群抽样 B.分层抽样 C.系统抽样 D.简单随机抽样 E.多阶段抽样

三、简答题:

1.对于一组近似正态分布的资料,除样本含量n外,还可计算X,S和X?1.96S,问各说明什么? 2.说明频数分布表的用途。

3.试述正态分布的面积分布规律。

4.均数的可信区间与参考值范围有何不同? 5.假设检验中?和P的区别何在?

6.假设检验时,当P?0.05,则拒绝H0,理论依据是什么? 7.怎样正确选用单侧检验和双侧检验?

8.为什么假设检验的结论不能绝对化?

9.为什么不能以构成比代率?请联系实际加以说明。 10.方差分析的基本思想和应用条件是什么?

11.为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法? 12.对于四格表资料,如何正确选用检验方法? 13.什么叫做非参数检验?它和参数检验有什么区别? 14.简述直线相关与秩相关的区别与联系。

15.统计表有哪些要素构成?制表的注意事项有哪些? 16.试述x2检验的基本思想

17.非参数统计的特点和适用范围.

第5页共7页

18.两组或多组等级资料的比较,为什么不能用x检验,而用秩转换的非参数检验?

19.普通线图和半对数线图的主要区别是什么?

20.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准? 21.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?

四、分析计算题:

1.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对共2组,随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见下表第(1)、(2)、(3)栏。试比较两组猪脑组织钙泵的含量有无差别。

两组乳猪脑组织钙泵含量(? g/g)

乳猪号 (1) 1 2 3 4 5 6 7 合计

对照组 (2) 0.3550 0.2000 0.3130 0.3630 0.3544 0.3450 0.3050

试验组 (3) 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870

差值d (4)=(2)-(3) 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180 0.3086

2

2.某医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:①该资料属何种资料?实验设计属何种设计?②欲比较3种疗法的疗效的差别,宜选用何种假设检验方法?③写出该种检验方法的H0与H1;④若求得的检验统计量为8.143,相应于??0.05的检验统计量的临界值为5.99,你如何做出结论?⑤根据你的结论,你可能犯哪一类统计错误?

3.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。

4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1)如何将病人分组?(2)如何对结果进行统计分析处理? 5.试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。

甲、乙两医院乳腺癌手术后的5年生存率(%)

腋下淋巴结 转 移 无 有 合计

病例数 45 710 755

12甲 医 院 生存数 35 450 485

生存率 77.77 68.38 64.24

病例数 300 83 383

乙 医 院 生存数 215 42 257

生存率 71.67 50.60 67.10

6.假定正常成年女性红细胞数(?10/L)近似服从均值为4.18,标准差为0.29的正态分布。令X代表随

机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围。

7.为了解某中药治疗原发性高血压的疗效,将44名高血压患者随机分为两组。实验组用该药加辅助治疗,

第6页共7页

对照组用安慰剂加辅助治疗,观察结果如下表,问:该药治疗原发性高血压是否有效?

两种疗法治疗原发性高血压的疗效

分组 实验组 对照组

例数 23 21

有效 21 5

有效率/% 91.30 23.81

8.某研究者采用配对设计进行实验,比较2种抗癌药物对小白鼠肉瘤抑瘤效果,先将10只染有肉瘤小白鼠按体重大小配成5个对子,每个对子内2只小白鼠随机接受两种抗癌药物,以肉瘤的重量为指标,实验结果见下表。问2种不同的药物的抑瘤效果有无差别?

表2 不同药物作用后小白鼠肉瘤重量(g) 编号 (1) 1 2 3 4 5

有无差别?

甲、乙两法检测痰标本中的抗酸杆菌结果 甲 法 + - 合 计

乙 法 + 49 21 70

- 25 107 132

合 计 74 128 202

A药 (2) 0.82 0.73 0.43 0.41 0.68

B药 (3) 0.65 0.54 0.34 0.21 0.43

9.某胸科医院,同时用甲、乙两法测定202份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率

10.某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如下表,估计尿肌酐含量(Y)对其年龄(X)的回归方程。

8名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h)※ 编 号 年龄X

1 13

2 11 3.01

3 9

4 6

5 8 2.56

6 10 3.36

7 12 3.18

8 7 2.65

尿肌酐含量Y 3.54 3.09 2.48

※表1中:X?9.5 Y?2.9838 lXX?42 lYY?1.0462 lXY?5.8450

11.某地随机抽样调查了部分健康成人的血红蛋白量,结果见下表。问:该地健康成年男、女血红蛋白含量有无差别?

某年某地健康成年男、女血红蛋白含量(g·L) 性别 男 女

例数 360 255

均数 134.5 117.6

标准差 7.1 10.2

-1

第7页共7页

参考答案

一、名词解释:

1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量。 4.总体:总体指特定研究对象中所有观察单位的测量值。

5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 6.变异:同质个体间研究因素的差异。

7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。

8.算术均数:描述一组数据在数量上的平均水平。总体均数用?表示,样本均数用X表示。 9.中位数:将一组观察值由小到大排列,位次居中的那个数。

10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14.正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号

N(?,?)表示均数为?,标准差为?的正态分布。

215.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为N(0,12)。 16.统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。 17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。 18.标准误:通常将样本统计量的标准差称为标准误。

19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

20.参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。

21.假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

22.Ⅰ型和Ⅱ型错误:Ⅰ型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其概率大

小用?表示;Ⅱ型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误,其概率大小用?表示。

23.检验效能:1-?称为检验效能,它是指当两总体确有差别,按规定的检验水准?所能发现该差异的能力。 24.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称

为检验水准,记为?。 25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分

解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。

26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相

第1页共11页

同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

27.相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、

相对比。

28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一

个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

29.构成比(proportion)表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明

各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为

构成比?某一组成部分的观察单位数同一事物各组成部分的观察单位总数?100% (5.2)

30.Yates校正:英国统计学家Yates F认为,由于?2分布理论上是一连续性分布,而分类资料是间断性

的,由此计算出的?2值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对?2值作连续性校正(correction of continuity),这一校正即所谓的Yates校正(Yates’ correction)。 31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未

知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形

式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。

32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平

方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。

33.相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形

式直观的表示事物间的数量关系。

b?0 35.回归系数b:是直线的斜率(slope),其统计意义是当X变化一个单位时Y的平均改变的估计值。

时直线从左下方走向右上方,Y随X的增大而增大;b?0时直线从左上方走向右下方,Y随X的增

大而减小;b?0时直线与X轴平行,Y与X无直线关系。b的计算公式为

b?lXYlXX??(X?X)(Y?Y)

(X?X)?2二、单项选择题:

1.D 2.C 3.B 4.B 5.A 6.B 7.A 8.D 9.C 10.C 11.D 12.B 13.D 14.D 15.D 16.C 17.D 18.A 19.A 20.C 21.B 22.D 23.B 24.B 25.D 26.D 27.D 28.A 29.C 30.B 31.E 32.E 33.A 34.B 35.D 36.D 37.A 38.D 39.A 40.C 41.D 42.E 43.A 44.B 45.A 46.D 47.C 48.B 49.B 50.A 51.B 52.B 53.D 54.A 四、简答题:

1.答:三个指标分别说明:

(1)X为算术均数,说明正态分布或近似正态分布资料的集中趋势;

第2页共11页

(2)S为标准差,说明正态分布或近似正态分布资料的离散趋势;

(3)X?1.96S可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。 2.答:频数分布表的用途是: (1) 描述频数分布的类型; (2) (3)

描述频数分布的特征;

便于发现一些特大或特小的可疑值;

(4) 便于进一步做统计分析和处理。 3.答:正态分布的面积分布规律是:

(1)X轴与正态曲线所夹面积恒等于1或100%;

(2)区间???的面积为68.27%,区间??1.96?的面积为95.00%,区间??2.58?的面积为99.00%。 4.答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表

所示。

区别点 意 义 计算 公式

均数的可信区间

按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当?=0.05时为95%)的可能性包含了总体均数。

参考值范围 “正常人”的解剖、生理、生化某项指标的波动范围。

?未知:X?t?/2,?Sn*

**

正态分布:X?u?/2S

偏态分布:PX~P100?X

**?已知:X?u?/2?n

?未知但n>60: X?u?/2用途

估计总体均数

Sn**

判断观察对象的某项指标正常与否

* t?/2,?也可用t?,?(对应于单尾概率时) **u?/2也可用u?(对应于单尾概率时)

5.答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若

P≤?,则拒绝H0,接受H1,有统计学意义,可以认为??不同或不等;否则,若P>?,则不拒绝H0,无

统计学意义,还不能认为??不同或不等。

6.答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

第3页共11页

7.答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。

8.答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。。

9.答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

10.答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。

方差分析的应用条件:①各样本是相互独立的随机样本,均服从正态分布;②相互比较的各样本的总体方差相等,即具有方差齐性。

11.答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。 12.答:

(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的?2计算公

2式:①当n?40且所有的T?5时,用?检验的基本公式??2?(A?T)T2或四格表资料?检验的专

2用公式??2(ad?bc)n(a?b)(c?d)(a?c)(b?d)2;②当n?40 但有1?T?5时,用四格表资料?检验的校

2正公式??2c?(A?T?0.5)T2或?c=2(|ad-bc|-n)n2(a+b)(c+d)(a+c)(b+d)2,或改用四格表资料的Fisher确

切概率法;③当n?40,或T?1时,用四格表资料的Fisher确切概率法。 若资料满足两样本率u检验的条件,也可用u检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当(b?c)?40时,

?2c??2(b?c)b?c2?(b?c?1)b?c2;②当(b?c)?40时,。

第4页共11页

13.答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

14.答:二者的联系:

(1)两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。 (2)两个相关系数都没有单位,取值范围都在-1~1之间。 (3)计算上,用秩次作积差相关,得到的就是秩相关系数。

二者的区别:

(1)资料要求不同。积差相关要求X、Y服从双变量正态分布,秩相关可以是任意分布。

(2)由于对资料要求不同,二者分属于参数统计与非参数统计方法,所以符合双变量正态分布条件时,

积差相关的效率高于秩相关。 (3)二者假设检验方法不同。

15.答:一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事

项: (1)标题概括表的内容,写于表的上方,通常需注明时间与地点。 (2)标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。

(3)线条不宜过多,通常采用三条半线表示,即顶线、底线、纵标目下的横隔线及合计上的半条线。 (4)表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。 (5)备注不要列于表内,如有必要,可在表内用“ * ”号标记,并在表外加以说明。

16.答:?2检验的基本思想是以?2值的大小来反映理论频数T与实际频数A的吻合程度。在零假设H0(比如H0:?1??2)成立的条件下,实际频数与理论频数相差不应该很大,即?2值不应该很大,若实际计算出的?2值较大,超过了设定的检验水准所对应的界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1(比如H1:?1??2)。 17.答:

特点:

(1)对样本所来自的总体的分布形式不作要求,分布未知都能适用。 (2)收集资料方便,可用“等级”或“符号”来评定观察结果。

(3)多数非参数方法比较简便,易于理解和掌握。

(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。 适用范围:

(1)等级资料。

(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到

正态或近似正态分布时,宜用非参数检验。 (3)各组离散程度相差悬殊,即方差明显不齐,且通过变换亦不能达到齐性。 (4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。 (5)分布类型不明。 (6)资料初步分析。

18.答:若选行×列表资料的?检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。

19.答:从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线

第5页共11页

2图的纵坐标为对数尺度。从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。

20.答:参数检验和非参数检验各有适用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验为佳。以t检验为例,如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。

21.答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。 四、分析计算题:

1.解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。 (1)建立检验假设,确定检验水准 H0:?d=0

H1:?d≠0

? =0.05。

(2)计算检验统计量

n=7,d??dd2n?0.30867?0.0441(?g/g)

Sd??d???d?2nn?1?0.05716(?g/g)

t?Sd?n0.04410.057167?2.0412

(3)确定P值,作出推断结论 按?= n-1=7-1=6查t界值表,得t0.025,6=2.447,t0.05,按? =0.05水准不拒绝H0,差别无统计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。 2.解:①该资料属计数资料?实验设计属完全随机设计;

②宜选用R×C表的?检验方法;

③H0:3种疗法的总体有效率相等 H1:3种疗法的总体有效率不全相等

2④在??0.05的水准上,拒绝H0,接受H1,差别有统计学意义,可认为3种疗法的总体有效率不全相等,即3种疗法对慢性胃炎病人的疗效有差别。 ⑤可能犯I型错误。

3.解:人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。 4.解:

(1) 根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比如第8行,舍去10~20,将随机数排列如下,规定逢单数者每对中的第1号试验对象进入胃舒氨组(A),第2号对象进入西米替丁组(B),逢双数

第6页共11页

者则相反。分组情况如下所示:

病 人 号

随机数字 入组情况

1.1 1.2 3 A

2.1 2.2 2 B

3.1 3.2 6 B

4.1 4.2 1 A

5.1 5.2 8 B

6.1 6.2 0 B

7.1 7.2 9 A

8.1 8.2 5 A

9.1 9.2 4 B

10.1 10.2 7 A

B A A B A A B B A B

(2) 首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表21)。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别,故选用配对四格表的McNemar检验(McNemar’s test for correlated proportions)进行统计分析。 表2 20位患者治疗情况

西米替丁 有效 无效 合 计

胃舒氨 有效

无效

合计

a c a+c b d b+d a+b c+d N 5.解:两医院乳腺癌患者的病情构成不同,比较两医院的标准化率,计算过程见表3。 表3 甲、乙两医院乳腺癌手术后的5年生存率的标化(以甲乙两医院合计为标准)

腋下淋巴标准 结转移 病例数 ⑴ 无 有 合计

甲 医 院 原生存率

预期生存人数

乙 医 院 原生存率 Pi ⑸ 71.67 50.60 67.10

预期生存人数

Ni

⑵ 345 793

pi

⑶ 77.77 68.38

Nipi

⑷=⑵⑶ 268 503

771(∑Nipi)

Nipi

⑹=⑵⑸ 247 401

648(∑Nipi)

1138(∑Ni) 64.24

甲医院乳腺癌手术后的5年生存率的标化生存率:

771?NiPi' N1138乙医院乳腺癌手术后的五年生存率标化生存率:

p??100%??100%?67.75% ?NiPi?100%?648?100%?56.94%'p? N1138因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的5年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。 6.解:

(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X进行标准化变换后,借助标准正态分布表求其面积,具体做法如下:

4.00?4.18X??4.50?4.18??) P(4.00?X?4.50)?P(0.29?0.29 ?P(?0.62?u?1.10) ?1??(?1.10)??(?0.62) ?1?0.1357?0.2676 ?0.5967

变量X落在区间(4.00,4.50)内的概率为0.5967。

第7页共11页

(2)因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该资料过高、过低都不正常,所以应求双侧参考值范围,具体做法如下: 下限为:X?1.96??4.18?1.96(0.29)?3.61(?1012/L) 上限为:X?1.96??4.18?1.96(0.29)?4.75(?1012/L) 95%的正常成年女性红细胞数所在的范围是3.61~4.75(?1012/L)。 7.解:本题为完全随机设计两样本率的比较。整理表格见下表。 两种疗法治疗原发性高血压的疗效

分 组 实验组 对照组 合计

(1) 建立检验假设,确定检验水准

?1??2,即该药治疗原发性高血压无效 H0: ?1??2,即该药治疗原发性高血压有效 H1:??0.05

(2) 计算检验统计量

Tmin?21?1844?8.59?5

2有效

21 5 26

无效

2 16 18

合计 23 21 44

有效率/% 91.30 23.81 59.09

??2(ad?bc)n(a?b)(c?d)(a?c)(b?d)?(21?16?2?5)?4423?21?26?182?20.69

?=(2-1)(2-1)=1

(3) 确定P值,作出统计推断

2查?界值表得P<0.005,按??0.05水准拒绝H0,接受H1,差别有统计学意义,可以认为该药治疗原

发性高血压有效。

8.解:解:本例为异源配对设计。计算A药、B药肉瘤重量差值的结果见下表第(4)栏。用配对样本均数的t 检验。

(1)建立检验假设,确定检验水准(5分)

H0:?d?0,即2种不同的药物的抑瘤效果相同。 H1:?d?0,即2种不同的药物的抑瘤效果不相同。

??0.05

(2)计算检验统计量(5分)

本例n=5,?d=0.90,?d2=0.18,d??d/n?0.90/5?0.18。

(?d)n2?d?Sd?20.18??(0.90)52n?15?1?0.058

第8页共11页

t?0.180.0585?6.903, ??5?1?4

(3)确定P值,做出推断结论(5分)

查t界值表,得双尾概率0.002

不同药物作用后小白鼠肉瘤重量(g)

编号 (1)

1 2 3 4 5

A药 (2) 0.82 0.73 0.43 0.41 0.68

B药 (3) 0.65 0.54 0.34 0.21 0.43

2差值

(4)=(2)-(3) 0.17 0.19 0.09 0.20 0.25

9.解:本题是配对四格表资料(3分),用配对四格表资料的?检验(3分)。

甲、乙两法检测痰标本中的抗酸杆菌结果 甲 法 +

- 合 计

H0乙 法 +

49 21 70

25 107 132

合 计

74 128 202

:B?C,即甲、乙两法的总体检出率相同 :B?C,即甲、乙两法的总体检出率不同

H1??0.05 (3分)

b?c?25?21?46?40,用公式?2?(b?c)计算检验统计量值

b?c22???2(25?21)25?212?0.35 ??1

界值表得0.500 < P < 0.750,(3分)按??0.05水准,不拒绝H0,还不能认为两种方法的检出

率不同。(3分)

10.解:由原始数据及散点图(图1)的观察,两变量间呈直线趋势,故作下列计算: (1)求直线回归方程

①计算X、Y的均数X、Y,离均差平方和lXX、lYY与离均差积和lXY

X??Xn?768?9.5 YY??n?23.878?2.9838

第9页共11页

lXX??X2?(?X)n2?764?(76)82?42

lYY??Y2?(?Y)n2?72.2683?(23.87)82?1.0462

lXY??XY?(?X)(?Y)n?232.61?(76)(23.87)8?5.8450

②求回归系数b和截距a b=5.8450/42=0.1392

a=2.9838-(0.1392)(9.5)=1.6617 ③列出直线回归方程(回归直线绘制见图1)

??1.6617?0.1392X Y

(2)回归方程的假设检验 ①方差分析

H0: ??0,即尿肌酐含量与年龄之间无直线关系

H1: ??0,即尿肌酐含量与年龄之间有直线关系

?=0.05

22按公式 SS回?lXYlXX?5.845/42?0.8134

按公式 SS残?SS总?SS回?1.0462?0.8134?0.2328 列出方差分析表如表1。

第10页共11页

表1 方差分析表

变异来源 自由度 SS MS F P 总 变 异 7 1.0462

回 归 1 0.8134 0.8134 20.97 <残 差 6 0.2328 0.0388

0.01

?1?1、?2?6,查F界值表,得P?0.01。按?=0.05水准,拒绝H0,接受H1,可认为尿肌酐含量

与年龄之间有直线关系。 或

②t检验

H0、H1 及?同上

本例n?8,SS残=0.2328,lXX=42,b=0.1392 按公式 SY?X?0.23288?2?0.1970

Sb?0.197042?0.0304

t?0.13920.0304?4.579

??6,查t界值表,得0.002?P?0.005。按?=0.05水准,拒绝H0,接受H1,结论同上。

11.解:两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准(5分)

H0:?1??2,即该地健康成年男、女血红蛋白含量均数无差别 H1:?1??2,即该地健康成年男、女血红蛋白含量均数有差别

??0.05

2) 计算检验统计量(5分)

u?X1?XS21222?134.5?117.67.12n1?Sn2360?10.22552?22.829

3) 确定P值,作出统计推断(5分)

查t界值表(ν=∞时)得P<0.001,按??0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。

第11页共11页

本文来源:https://www.bwwdw.com/article/p0ra.html

Top