《医学统计学》习题册

更新时间:2023-10-21 11:35:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

上海交通大学网络教育学院医学院分院

医学统计学课程练习册

第一章绪论

一、单选题

1.小概率事件是指P() ?B.P<0.05

2.从一个数值变量资料的总体中抽样,产生抽样误差的原因是? A总体中个体值存在差别??????

3.调查中国放射科医生接触射线情况,全国放射科医生的全部组成为 A.研究总体

4.若以舒张压90mmHg、收缩压130mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:B.分类资料 5.下列属于统计量的指标是C样本标准差

6.调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:C定量资料 7.下列属于参数的指标是D总体标准差

8.用样本做统计推断,样本应是B.总体中有代表性一部分 9.统计推断的内容为?D.A和B均是

10.随机调查社区2000人,得到平均体重为60公斤,则该资料属于 A.计量资料 二、名词解释

1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。

2.总体:根据研究目的性质相同的观察单位的全体。

3.分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。

4.数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。

三、问答题

1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?

在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这类资料一般有度量衡单位。

计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。 2.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某

项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。

第二章定量数据的统计描述

一、单选题

1.若资料为偏态分布,最好计算下列哪个指标来衡量集中程度D中位数 2.若资料为正态分布,最好计算下列哪个指标来衡量集中程度B算术均数 3.对数正态分布资料计算集中趋势应该用A几何均数 4.抗体滴度资料通常使用哪个集中趋势指标B几何均数 5.平均数指标体系中不包括A全距

6.抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算C算术均数 7.样本标准差的的取值情况是A大于或等于零

8.若资料为正态分布,最好计算下列哪个指标来衡量离散程度C标准差 9.若资料为偏态分布,最好计算下列哪个指标来衡量离散程度() B四分位间距

10.若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度() D四分位间距

11.一组资料的例数等于25,方差等于16,标准差等于A4

12一组资料的标准差等于5,变异系数等于10%,样本均数等于B50 13.标准差与算术均数的使用条件() B相同

14.比较两组正态分布数据离散度大小的指标,如果单位不同该用() B变异系数

15可以反映个体离散程度的指标不包括() C标准误 16.?表示() A总体方差

17.一组资料的例数等于25,均数为20,标准差等于5,则方差等于()

B25

18.四分位间距的使用条件与哪个指标是一致的() A 中位数

19.四分位间距是指() DP25-P75 二、名词解释

1.几何均数:常用符号G表示,适用于原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料。医学上的血清抗体滴度和血清凝集效价等适宜用几何均数描述其集中趋势。 2.中位数:一组观察值由小到大顺序排列,位次居中的数值,适用于偏态分布和分布末端无确切值的资料。

3.变异系数:变异系数(coefficientofvariance)为标准差与均数之比,用百分数表示,CV越大,表示观察值的离散程度越大;CV越小,表示观察值的离散程度越小。

4.四分位间距:第75百分位数(P75)称为上四分位数QU,第25百分位数(P25)称为下四分位数QL,则四分位数间距(quartileinterval)Q=QU-QL。四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距。

三、计算题

1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均数。

125.5?126?...?122.5?140?132.1n102.6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数

1. X??X?2. ?lg2?lg4?lg8?lg8?lg16?lg32?G?lg?1?lg?1?0.9031??8??6??3.某医院调查30个乙肝表面抗原阳性患者抗体水平,求平均抗体水平

抗体水平分布

抗体水平1:101:1001:10001:100001:100000 人数451092

3.

G?lg?1flgX?()f?lg10?4?lg100?5?lg1000?10?lg10000?9?lg100000?2)?100030平均抗体水平为1:1000 ?lg?1(4.107名正常人尿铅含量分布,求平均尿铅含量 尿铅(mg/l) 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 例数f 14 22 29 18 15 6 1 2 14 36 65 83 98 104 105 107 累计频数ΣfL 累计频率(%) 13.1 33.6 60.7 77.6 91.6 97.1 98.1 100.0 4.

四、问答题

1.均数、几何均数和中位数的适用范围是什么?

(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或

负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

2.标准差用于计量资料中正态或者近似正态分布的统计描述 标准差的应用有四个方面:(1)表示个体变异的大小(2)用来结合均数计算医学参考值范围(3)计算变异系数(4)计算标准误

3.变异系数与标准差的联系和区别是什么?

联系:变异系数与标准差都是用于正态分布资料的离散程度的指标,变异系数等于标准差除以均数后乘以100%得到。

区别:在比较离散程度大小时,用标准差一定要满足均数相近,单位一致的条件。而变异系数可以用在以上两个条件任意一个不能满足的情况。

第三章正态分布与医学参考值范围

一、单选题

1.正态分布条件理论上() D算术均数、中位数是一致的 2.中位数特别适用于() D严重偏态分布资料

3.频数分布中,如果集中位置趋向于数据较小的一端,叫做() C正偏态分布

4.一组数据呈正态分布,其中大于X?1.96S的变量有:() D97.5%

5.一组数据呈正态分布,其中大于X?1.96S的变量有:() B2.5%

6.一组数据呈偏态分布,其双侧95%的参考值范围为:() BP2..5-P97.5

7.正态分布曲线的形态参数应该是() B方差

8.对于临床上计算尿铅的95%正常值可用哪个百分位数表示() AP0—P95

9.标准正态分布曲线下(-1,1)之间的面积约为:() B68.27%

10.偏态资料的医学参考值范围估计方法是() B百分位法

11.一组身高资料和一组体重资料比较其离散度大小应该用哪个指标() D变异系数

12.标准差表示:() B个体变异

13.正态分布曲线下在均数加减一个标准差之间的面积大约占() B68%

14.标准正态分布曲线的位置参数和形态参数分别是() A0和1

15.评价一个个体指标是否正常可以用() A医学参考值范围 二、名词解释

1.医学参考值范围:医学参考值是指正常人(或动物)的人体形态、机能和代谢产物等的各种生理及生化常数。由于个体指标的变异使其常数不仅因人而异,而且同一个体还会随机体内外环境的改变而改变,因此需要确定其波动的范围,即医学参考值范围。

三、问答题

1.正态分布的特征是什么?

正态分布有如下特征:①正态分布曲线在在横轴上方均数处最

高;②正态分布以均数为中心,左右对称;③正态分布上有两个参数:均数μ和标准差σ,均数μ是位置参数,决定正态曲线的中心位置,μ越大,曲线越向右移动;μ越小,曲线越向左移动,标准差σ是形状参数,决定正态分布曲线的陡峭或扁平程度,σ越小,表示数据越集中,曲线越陡峭,σ越大,表示数据越分散,曲线越扁平;④正态分布曲线下的面积分布有一定的规律。 2.四分位数间距、标准差、变异系数各有何特点?

(1)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度。

(2)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度.

(3)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

3.制定医学参考值范围的一般原则是什么?

(1)抽取样本含量足够大的“正常人”。一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。(2)对抽取的正常人进行准确而统一的测定,控制测量误差。(3)判断是否需要分组制定参考值范围。(4)决定参考值范围的单侧或双侧界值。(5)选择适当的百分界值。(6)根据资料的分布类型选

用恰当的方法估计参考值范围。

四、计算题

1.已知正常人的体温水平符合正态分布,在某地调查了100名成年女子测得其体温为36.8摄氏度,标准差为0.2摄氏度,问如果该地有一女子自述体温异常就医,测得其体温为37.5摄氏度,请问该女子的体温水平是否正常?

37.192)1. x?1.96s?36.8?1.96?0.2?(36.408,故体温收入的95%参考值范围为2.调查某医院护士的年龄分布和收入状况,假设该人群的年龄和收入水平都呈正

36.408-37.192摄氏度,该女子体温偏高态分布。共调查了100名护士,平均年龄为24.5岁,标准差为3.6岁,平均年收入为3.6万元,标准差为1.0万元。

(1)请比较该医院护士年龄和收入水平的离散程度。

(2)如某护士年收入为1.8万元,请评价该收入水平是否属于正常范围。

2.

(1) ?3.6?100%?14.69%CV24.5CV?1?100%?27.8%3.6故收入的变异大于年龄 () s?3.6?1.96?1?(1.64,4.56)x2?1.9695100%参考值范围为3.故护士收入的某地20岁男子人,其身高均数为166.06cm,标准差为4.95cm,其体 1.64-4.56万,该护士收入属于正常范围均数为53.72kg,标准差为4.96kg。请比较何者变异度较大。

3. CV?4.95?100%?2.98%4.96?100%?9.236.0653.724.调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其

CV?血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。

4. x?1.96s?117.4?1.96?10.2?(97.41,137.39)故该地健康女性血红蛋白的95%参考值范围为97.41-137.39g/L一、单选题

1.已知男性的肝癌发病率高于女性,今欲比较甲、乙地的肝癌发病率,但甲地中女性多于男性,而乙地中男性多于女性,适当的比较方法是()

第四章定性数据的统计描述

D对性别进行标准化后再比较

2.n足够大,样本率不接近于1或0,估计总体率95%的可信区间用() Ap?1.96Sp

3.若仅知道样本率,估计率的抽样误差用哪个指标表示。() DSp

4.反映某一事物发生强度的指标应选() B率

5.发病率和患病率中会超过100%的是() C发病率

6.甲地老年人口比重比乙地大,标准化后的食管癌死亡率甲、乙两地相等, 那么()

A原食管癌死亡率是甲地高于乙地 7.下列指标不属于相对数的是(??) ?D百分位数?

16.某医师用新药治疗一组高血压病人23例,21例好转,估计该疗法好转率95%的可信区间,用 Ap?1.96Sp

9.比较两地某疾病的严重程度,可用哪个指标。() D发病率 二、名词解释

1.相对比:相对比又称为对比指标,是指两个有关指标之比,通常以倍数或百分数表示。

2.率:率又称为频率指标,它是用来说明某现象在一定条件下发生的频率大小或强度。通常是某现象实际发生的例数与可能发生某现象的总数之比。

3.构成比:构成比又称为构成指标,它表示事物内部某组成部分占其全部的比重或分布,通常以100%作为比例基数,以百分比

第十一章线性回归与相关

一、选择题

答题说明:每个考题下面都有A,B,C,D四个备选答案,答题时只许从中选出一个最合适的答案,把这个答案前的编号字母圈出。

1.进行直线相关分析时,如r?r0.05(n?2)时,可认为两变量X与Y间。 B.有直线相关关系 2.已知r?1,则一定有。 C.Sy.x?0

3.已知两样本,r1?r2,那么。 D.两样本的决定系数相等

4.对直线相关系数的假设检验,其无效假设H0是。 B.?=0

5.若r1=r2,下列表述正确的是。D D.tb1=tr1

6.用样本求得R=0.9,则同一资料b值应。 A.b>0 7.SY,X表示。

?D.Y对Y的离散程度

8.用最小二乘法确定直线回归方程的原则是各观察点距直线的。 B.纵向距离的平方和最小 9.计算直线相关系数要求。 B.两变量均要求服从正态分布

10.直线回归系数的假设检验,其自由度为。 C.n-2

11.回归系数的假设检验。

A.能用同一资料的r的检验代替B.能用t检验 C.能用F检验*D.三者均可

12.关于直线相关系数与回归系数的关系描述错误的是。 A.r大,则b也一定大

13.对直线回归系数的假设检验,其无效假设H0是。 D.?=0

14.两组资料中,回归系数较大的一组。 D.则r可能大也可能小 15.计算直线回归系数要求。 A.只要应变量服从正态分布 二、解释下列名词:

1.直线回归系数:回归系数b即为回归直线的斜率,其统计学意义是X每增加和减少一个单位,Y平均改变b个单位。b越大表示直线变化的趋势越陡。b>0,表示Y随X呈同向直线变化;b<0,表示Y随X呈反向直线变化;b=0,表示Y与X无线性回归关系。 2.直线相关系数:两变量之间相关性的强度可用直线相关系数来描述,用r表示,相关系数r是个无单位的的数值,?1?r?1;r?0表示正相关,r?0表示负相关,r?0表示零相关;三、回答下列问题:

1.直线相关和直线回归分析有哪些区别和联系?

答:(1)区别:1)在资料要求上,回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量,一般称为I型回归;2)在应用上,说明两变量间依存变化的数量关系用回归,说明变量间双向的相互关系时用相关。(2)联系:1)对一组数据若同时计算r与b,它们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的。b为正,说明X增(减)一个单位,Y平均增(或减)b个单位。2)r和b的假设检验是等价的,即对同一样本,二者的t值相等;3)回归与相关可互相解释。 四、完成以下计算:

1.为研究中年女性体质指数和收缩压之间的关系,随机测量了某社区16名40岁以上女性的体质指数和收缩压(mmHg),结果见表11-1,试做直线相关与回归分析。

表11-116名40岁以上女性体质指数和收缩压(mmHg)的测量结果

编号 体质指数(X) 收缩压(Y)

r的大小描述双变量相关程度的大小,

r越接近于1则

相关性越好,反之接近于0,则相关性越差。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 合计

1.计算过程如下

223.62 25.87 26.19 23.16 22.01 21.45 28.33 27.72 26.88 29.01 26.27 25.70 28.94 29.15 23.53 27.21 415.04 135 142 150 132 120 126 161 164 144 152 145 157 155 170 149 158 2360

2?X=415.04,?X=10861.00,?Y=2360,?Y=351010,?XY=

61669.61,由上述公式可得:

进一步可得到体质指数和收缩压的直线相关系数为: 直线相关系数的假设检验:

H0:??0,H1:??0,??0.05

自由度v=n-2=16-2=14,查t界值表,得双侧t0.05,14=2.145,由于∣tr∣﹥

t0.05,14,故P<0.05,按??0.05水准拒绝H0,接受H1,可认为40岁以上女性体质指数和收缩压之间具有直线相关关系。

由n=16,?X=415.04,?Y=2360,可得: 因此,拟合出的直线回归方程为:

由于同一资料已进行过直线相关系数的假设检验,且tb?tr,故该直线回归方程也有统计学意义。

第十四章生存分析

一、选择题

答题说明:每个考题下面都有A,B,C,D四个备选答案,答题时只许从中选出一个最合适的答案,把这个答案前的编号字母圈出。 1.寿命表法计算生存率,下列正确的是。 C.生存率不会出现后一年高于前一年

2.若以k代表要比较的组别数,在以下何种检验中,自由度为k-1。 D.Logrank检验

3.对两组或多组生存率曲线比较,可运用。

D.Logrank检验 二、解释下列名词:

1.中位生存时间:又称为半数生存期,即当累积生存率为0.5时所对应的生存时间,表示有且只有50%的个体可以活过这个时间。要注意中位生存时间通常不等于生存时间的中位数(除非在这个时间点之前没有删失值存在)。

2.终点事件:指研究者所关心的特定结局,又称死亡事件、失效事件。 3.生存时间:指从某起点事件开始到被观测对象出现终点事件所经历的时间,用t表示。

4.死亡概率:记为q,是指在某段时间开始时存活的个体在该段时间内死亡的可能性大小。

5.生存概率:记为p,是指在某段时间开始时存活的个体至该时间结束时仍存活的可能性大小。

6.生存率:用S(tk)表示,是指病人经历tk个单位时间后仍存活的概率。 三、完成以下计算:

1.100例某肿瘤手术切除后随访状况如下,请完成表14-1并计算各年的累计生存率。

表14-1100例某肿瘤患者生存资料

生存

时间(年) 0~ 1~ 2~

死亡 失访 人数 人数 5 0 10 6 18 5

期初 校正

人数 人数 5 0 10 6 18 5

死亡概率生存概累计生存

(%) 率(%) 率(%) 100 100.0 5.00 95 92.0 10.87 79 76.5 23.53

本文来源:https://www.bwwdw.com/article/qppf.html

Top