《医学统计学》习题册

更新时间:2024-04-06 04:43:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

上海交通大学网络教育学院医学院分院

医学统计学 课程练习册

第一章 绪论

一、单选题

1. 小概率事件是指P ( ) B.P<0.05

2. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A总体中个体值存在差别

3. 调查中国放射科医生接触射线情况,全国放射科医生的全部组成为 A.研究总体

4. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:B. 分类资料 5. 下列属于统计量的指标是 C 样本标准差

6. 调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是: C 定量资料 7. 下列属于参数的指标是 D总体标准差

8. 用样本做统计推断,样本应是 B. 总体中有代表性一部分 9. 统计推断的内容为 D. A和B均是

10. 随机调查社区2000人,得到平均体重为60公斤,则该资料属于 A. 计量资料 二、名词解释

1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。

2.总体:根据研究目的性质相同的观察单位的全体。

3. 分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。

4. 数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。

三、问答题

1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?

在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这

1

类资料一般有度量衡单位。

计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。

2.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。

第二章 定量数据的统计描述

一、单选题

1. 若资料为偏态分布,最好计算下列哪个指标来衡量集中程度 D 中位数

2. 若资料为正态分布,最好计算下列哪个指标来衡量集中程度 B 算术均数 3. 对数正态分布资料计算集中趋势应该用 A 几何均数 4. 抗体滴度资料通常使用哪个集中趋势指标 B 几何均数 5. 平均数指标体系中不包括 A 全距

6. 抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算 C 算术均数

7. 样本标准差的的取值情况是 A 大于或等于零

8. 若资料为正态分布,最好计算下列哪个指标来衡量离散程度 C 标准差 9. 若资料为偏态分布,最好计算下列哪个指标来衡量离散程度 ( ) B 四分位间距

10. 若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度( ) D 四分位间距

11. 一组资料的例数等于25,方差等于16,标准差等于 A 4

12 一组资料的标准差等于5,变异系数等于10%,样本均数等于 B 50 13. 标准差与算术均数的使用条件 ( ) B 相同

14. 比较两组正态分布数据离散度大小的指标,如果单位不同该用 ( ) B 变异系数

2

15 可以反映个体离散程度的指标不包括 ( ) C 标准误

16 . ?表示 ( ) A 总体方差

17. 一组资料的例数等于25,均数为20,标准差等于5,则方差等于 ( ) B 25

18. 四分位间距的使用条件与哪个指标是一致的 ( ) A 中位数

19. 四分位间距是指 ( ) D P25-P75 二、名词解释

1.几何均数:常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。

2.中位数:一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。

3.变异系数:变异系数(coefficient of variance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。

4.四分位间距:第75百分位数(P75)称为上四分位数QU, 第25百分位数(P25)称为下四分位数QL,则四分位数间距(quartile interval)Q=QU-QL。四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。

三、计算题

1. 10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均数。

1.

X?X?n?125.5?126?...?122.5?140?132.1102. 6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数

2.

?lg2?lg4?lg8?lg8?lg16?lg32??1 ??8G?lg?1???lg?0.9031

?6?3. 某医院调查30个乙肝表面抗原阳性患者抗体水平,求平均抗体水平 抗体水平分布

抗体水平 1:10 1:100 1:1000 1:10000 1:100000

3

人数 4 5 10 9 2

3.

G?lg?1(?lg?1(?flgX)?flg10?4?lg100?5?lg1000?10?lg10000?9?lg100000?2)?100030平均抗体水平为1:1000

4. 107名正常人尿铅含量分布,求平均尿铅含量 尿铅(mg/l) 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 例数f 14 22 29 18 15 6 1 2 累计频数ΣfL 14 36 65 83 98 104 105 107 累计频率(%) 13.1 33.6 60.7 77.6 91.6 97.1 98.1 100.0 4. i?nM?L??? f?2?4?107??fL??8???36??10.41(mg/L)29?2??

四、问答题

1.均数、几何均数和中位数的适用范围是什么?

(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。 2. 标准差用于计量资料中正态或者近似正态分布的统计描述 标准差的应用有四个方面:(1)表示个体变异的大小(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误

3. 变异系数与标准差的联系和区别是什么?

4

联系:变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100%得到。

区别:在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。而变异系数可以用在以上两个条件任意一个不能满足的情况。

第三章 正态分布与医学参考值范围 一、单选题

1. 正态分布条件理论上 D算术均数、中位数是一致的

2. 中位数特别适用于 D 严重偏态分布资料

3. 频数分布中,如果集中位置趋向于数据较小的一端,叫做 C 正偏态分布

4. 一组数据呈正态分布,其中大于X?1.96S的变量有: D 97.5%

5. 一组数据呈正态分布,其中大于X?1.96S的变量有: B 2.5%

6. 一组数据呈偏态分布,其双侧95%的参考值范围为: B P2..5-P97.5

7. 正态分布曲线的形态参数应该是 B 方差

8. 对于临床上计算尿铅的95%正常值可用哪个百分位数表示 A P0 — P95

9. 标准正态分布曲线下(-1,1)之间的面积约为: ( ) B 68.27%

10. 偏态资料的医学参考值范围估计方法是 B 百分位法

11.一组身高资料和一组体重资料比较其离散度大小应该用哪个指标D 变异系数

5

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

12. 标准差表示: ( ) B个体变异

13. 正态分布曲线下在均数加减一个标准差之间的面积大约占 ( ) B 68%

14. 标准正态分布曲线的位置参数和形态参数分别是 ( ) A 0和1

15. 评价一个个体指标是否正常可以用 ( ) A 医学参考值范围

二、名词解释

1.医学参考值范围:医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。

三、问答题

1. 正态分布的特征是什么? 正态分布有如下特征:①正态分布曲线在在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布上有两个参数:均数μ和标准差σ,均数μ是位置参数,决定正态曲线的中心位置,μ越大,曲线越向右移动;μ越小,曲线越向左移动,标准差σ是形状参数,决定正态分布曲线的陡峭或扁平程度,σ越小,表示数据越集中,曲线越陡峭,σ越大,表示数据越分散,曲线越扁平;④正态分布曲线下的面积分布有一定的规律。

2.四分位数间距、标准差、变异系数各有何特点?

(1)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度。

(2)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度.

(3)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

3.制定医学参考值范围的一般原则是什么? (1)抽取样本含量足够大的“正常人”。一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选用恰当的方法估计参考值范围。

四、计算题

1. 已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其

6

体温为36.8摄氏度,标准差为0.2摄氏度,问 如果该地有一女子自述体温异常就医,测得其体温为37.5摄氏度,请问该女子的体温水平是否正常?

1.

x?1.96s?36.8?1.96?0.2?(36.408,37.192)故体温收入的95%参考值范围为36.408-37.192摄氏度,该女子体温偏高

2. 调查某医院护士的年龄分布和收入状况,假设该人群的年龄和收入水平都呈正态分布。共调查了100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。

(1)请比较该医院护士年龄和收入水平的离散程度。

(2)如某护士年收入为1.8万元,请评价该收入水平是否属于正常范围。

2. (1) 3.61CV??100%?14.69%CV??100%?27.8%

24.53.6

故收入的变异大于年龄 (2)

x?1.96s?3.6?1.96?1?(1.64,4.56)95%参考值范围为 故护士收入的1.64-4.56万,该护士收入属于正常范围

3. 某地20岁男子100人,其身高均数为166.06cm,标准差为4.95cm,其体 均数为53.72kg,标准差为4.96kg。请比较何者变异度较大。

3.

CV?

4.95?100%?2.986.06CV?4.96?100%?9.23S.724.调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2 (g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。

4.

x?1.96s?117.4?1.96?10.2?(97.41,137.39)

故该地健康女性血红蛋白的95%参考值范围为97.41-137.39g/L第四章 定性数据的统计描述

一、单选题

1.已知男性的肝癌发病率高于女性,今欲比较甲、乙地的肝癌发病率,但甲地中

7

女性多于男性,而乙地中男性多于女性,适当的比较方法是 ( ) D 对性别进行标准化后再比较

2.n足够大,样本率不接近于1或0,估计总体率95%的可信区间用( ) A p?1.96Sp

3.若仅知道样本率,估计率的抽样误差用哪个指标表示。 ( ) D S p

4.反映某一事物发生强度的指标应选 ( ) B 率

5.发病率和患病率中会超过100%的是 ( ) C 发病率

6.甲地老年人口比重比乙地大,标准化后的食管癌死亡率甲、乙两地相等, 那么 ( ) A 原食管癌死亡率是甲地高于乙地

7.下列指标不属于相对数的是 ( ) D百分位数

16. 某医师用新药治疗一组高血压病人23例,21例好转,估计该疗法好转率95%的可信区间,用 A p?1.96Sp

9.比较两地某疾病的严重程度,可用哪个指标。 ( ) D 发病率

二、名词解释

1. 相对比:相对比又称为对比指标,是指两个有关指标之比,通常以倍数或百分数表示。 2. 率:率又称为频率指标,它是用来说明某现象在一定条件下发生的频率大小或强度。通常是某现象实际发生的例数与可能发生某现象的总数之比。

3. 构成比:构成比又称为构成指标,它表示事物内部某组成部分占其全部的比重或分布,通常以100%作为比例基数,以百分比的形式表示。

三、问答题

1. 应用相对数的注意事项

应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性 (4)当比较两个总率时,若其内部构成不同,需要进行率的标准化。(5)两样本率比较时应进

8

行假设检验

2.简述率的标准化法的基本思想

当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。

3.率的标准化应注意的问题

(1)当各比较组内部构成(如年龄、性别、职业、民族等)不同,并足以影响总率的比较时,应对率进行标准化,然后再作比较。

(2)率的标准化的目的是采用统一的标准,消除混杂因素的影响,使其具有可比性。根据选用的标准不同,所计算的标准化率也不同。标准化率只表明各标化组率的相对水平,而不代表其实际水平。

(3)各年龄组对应的率出现明显交叉,如低年龄组死亡率甲地高于乙地,而高年龄组则甲地低于乙地,此时宜分别比较各年龄组死亡率,而不用标准化进行比较。 (4)如是抽样研究,两样本标准化率的比较也应作假设检验。

四、计算题

1. 请完成以下空白并进行描述性分析。 年龄

人口数

(岁) 0- 20- 40- 60- 合计

恶性肿

死亡总数 瘤死亡

恶性肿瘤死亡占总死亡的%

恶性肿瘤死亡率(1/10万)

年龄别死亡率(?)

82920 (138) 4 2.90 ( 46638 ) 63 ( 12 ) 19.05 28161 172 42 ( 24.42 ) ( 9371) ( 342 ) 32 ( 9.36 ) 167090

715

90

12.59

( 4.8 ) ( 1.66 )

25.73 ( 1.35 ) ( 149.4 ) ( 6.11 ) ( 341.5 ) ( 36.5 ) ( 53.86 )

( 4.28 )

第五章 统计表与统计图

一、单选题

1. 某病随着事件推移疾病发病率的变化可以作 ( ) B 线图

2. 比较某地两种疾病发病率差别可以作 ( ) C 直条图

3 连续性频数分布资料该作 ( )

9

A 直方图

4. 散点图通常用于 ( ) B 双变量资料

5. 统计表中线条要求只能有 ( ) A 横线

6. 关于统计表中说法错误的是: ( ) B 一都要有备注

7. 下列关于统计图表的说法,不正确的是: ( ) D 统计表均有备注附在表的下方

8. 用统计图表示某地三种死因别死亡率,可选用 ( ) C 直条图

9.流行性乙型脑炎发病率的高低与年龄有关,据调查,3—8岁儿童是发病的高峰。为反映患者年龄的频数分布规律,统计图应选用: ( ) B 直方图

10.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制

( )

D 半对数线图

11.拟以图示某市1990—1994年三种传染病发病率随时间的变化,宜采用( ) A 普通线图 二、问答题

1.统计表的基本结构要求是什么?

(1)标题 标题是统计表的总名称,应简明扼要说明内容,必要时注明资料的时间、地点。列在表的上端中央

(2)标目 标目是表格内的项目,分为横标目和纵标目。纵横标目的排列要得当,顺序应按时间顺序、事物的重要性、数字的大小等有规律地排列,并注明单位。一般横标目列在表的左侧,表示表中研究对象,纵标目列在表的上端,说明研究对象的各个统计指标。

(3)线条 力求简洁,主要有3条线:上面的顶线,下面的底线以及隔开纵标目与数字的横线。部分表格可用横线隔开合计,或用短横线分割多重纵标目。其他竖线和斜线均可省去。 (4)数字 表内数字必须准确,用阿拉伯数字表示。位数对齐,小数的位数要一致,不留空格,是“0”则填“0”,暂缺或未记录可用“-”或“?”表示。 (5)说明 文字不列入表内,特殊情况须用备注说明时,可用“*”号标出,写在表的下面。

2.统计图的制图通则是什么?

(1)根据资料性质和分析目的选用适当的图形。

10

本文来源:https://www.bwwdw.com/article/u9wr.html

Top