医学统计学模拟试卷及答案

更新时间:2024-04-23 01:05:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

医学统计学

第一套试卷及参考答案 一、选择题 (40分)

1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( ) A条图 B百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 资料的特征

A 所有分布形式 B负偏态分布 C 正偏态分布 D 正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( ) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价

C用身高均数的95%或99%的可信区间来评价 D不能作评价

4、比较身高与体重两组数据变异大小宜采用( )

A 变异系数 B 方差 C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( )

A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为( )

(A)相对比 (B) 构成比 (C)定基比 (D)率 7、统计推断的内容为( )

A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( )

A两样本均数是否不同 B两总体均数是否不同

C两个总体均数是否相同 D两个样本均数是否相同

9、 有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( )

(A) n1+ n2 (B) n1+ n2–1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( )

A抽样误差的大小 B总体参数的波动大小 C重复实验准确度的高低 D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 ( ) A垂直距离的平方和最小 B垂直距离最小

C纵向距离的平方和最小 D 纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系

数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?( )

A tr>tb B tr

13、设配对资料的变量值为x1和x2,则配对资料的秩和检验( )

1

医学统计学

A分别按x1和x2从小到大编秩 B把x1和x2综合从小到大编秩 C把x1和x2综合按绝对值从小到大编秩 D把x1和x2的差数按绝对值从小到大编秩 14、四个样本率作比较,χ>χ

2

20.05,ν

可认为( )

A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同 D各样本率不同或不全相同

15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4

人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( ) A.pearson卡方检验 B.校正卡方检验 C t检验 D U检验

16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方

n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着( )

A南方和北方女婴出生体重的差别无统计学意义 B南方和北方女婴出生体重差别很大

C由于P值太小,南方和北方女婴出生体重差别无意义 D南方和北方女婴出生体重差别有统计学意义但无实际意义。

17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指( ) A两个样本率的差别 B两个样本率的标准误 C两个总体率的差别 D两个总体率的标准差 18.下列指标不属于相对数的是( )

A率 B构成比 C比 D百分位数

19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效,何种方法为优:( ) 表1盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效 组别 左西替利嗪片组 西替利嗪片组 治愈 49 44 显效 8 10 进步 5 9 无效 2 3 合计 64 66 A.检验 B.成组t检验 C. u检验 D.秩和检验 20、下列哪种说法是错误的( )

A计算相对数尤其是率时应有足够的观察单位或观察次数 B分析大样本数据时可以构成比代替率 C应分别将分子和分母合计求合计率或平均率 D样本率或构成比的比较应作假设检验 二、填空题(20分)

1、现有若干名儿童健康检查一览表的部分检测指标,见表2

表2 某年某地儿童健康检查部分检测结果 编

性别 年龄(周岁) 身高(cm) 2

坐高(cm) 血型 表面抗 肝大 医学统计学

号 1 2 3 4 . . 问:

①上述变量中能形成计数资料的指标有 ②计量资料的指标有 ③等级资料的指标有

男 女 女 男 . . 7 8 10 9 . . 116.7 120.0 126.8 123.7 . . 66.3 68.3 71.5 70.0 . . A AB O A . . 原 + - - - . . ++ - + - . . ④对于身高或坐高指标,在进行统计描述时宜计算 和 表示其集中趋势和离散趋势。

⑤对于血型指标宜计算 表示各种血型的构成

⑥若要分析不同性别身高有无不同,宜选用的统计方法有 ⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10万)为 3、临床上安排试验设计时,应考虑的三个基本原则是 三、简答题(20分)

1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分) 均数: 正态或近似正态分布

几何均数:等比数列或对数正态分布资料

中位数:资料是偏态分布的;分布不明确; 一端或两端有不确定数据(开口资料)时。 2、何谓假设检验?可以举例说明。(5分)

首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该无效假设,如果概率不是小概率,则无理由拒绝该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。(5分)

由于假设检验的结论是依据小概率事件一次试验可以认为不会发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5分) 区别点 标准差 意义 计算公式 与n的关系 用途 个体差异大小 n↑ S→σ 与均数结合可制定参考值范围 标准误 抽样误差大小 n↑ →0 与均数结合可计算总体均数的可信区间 3

医学统计学

四、计算分析题10分*2=20

1、请将下列数据编制成合格的统计分析表。 试 庆大霉素(8万单位/10毫升) 总例数 感染例数 百分比 30 1 3.3% 总例数 验 新洁尔灭(0.1%) 30 3 10% 感染例数 1 3 5 8 组 生理盐水冲洗服四 环素3天 30 5 16.7% 百分比,% 3.3 10 16.7 26.7 对照组 生理盐水 冲洗 30 8 26.7% 表1四种脐带消毒方法效果比较 庆大霉素(8万单位/10毫升) 30 新洁尔灭(0.1%) 生理盐水冲洗服四环素3天 生理盐水冲洗 30 30 30

2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。

某医院门诊沙眼病人年龄构成比 年龄组(岁) 沙眼人数 0- 47 10- 198 19.3 20- 330 32.1 30- 198 19.3 40- 128 12.4 50- 80 7.8 60- 38 3.7 70- 8 0.8 计 1027 100.0 沙眼百分比(%) 4.6 问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标?

答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。

第二套试卷及参考答案 一、最佳选择题(40分)

1.均数是表示变量值__水平的指标。

(A) 平均 (B)变化范围 (C)频数分布 (D)相互间差别大小

2.原始数据同乘以一个不等于0的常数后__。

(A) 均数不变、标准差变 (B)均数、标准差均不变 (C)均数变、标准差不变 (D)均数、标准差均变

3.描述正态或近似正态分布资料特征的是______。

(A)中位数、四分位间距 (B)均数、标准差 (C)中位数、标准差 (D)几何均数、全距

4.描述偏态分布资料特征的是___。

(A)中位数、四分位间距 (B)均数、标准差

4

医学统计学

(C)中位数、标准差 (D)几何均数、全距

5.均数与标准差计算的数值 。

(A)均数可以是负数,标准差不可以 (B)均数不可以是负数,标准差可以 (C)两者都可以是负数 (D)两者都不可以是负数 6、 比较身高和体重两组资料的变异度大小宜采用______。

(A) 极差 (B)标准差 (C)变异系数 (D)四分位间距

7.说明某事物内部各组成部分所占比例应选____。

(A) 率 (B)构成比 (C)相对比 (D)标准差

8.来自同一总体的两个样本中,__小的那个样本均数估计总体均数时更精确。

(A)S (B)R (C)CV (D)

9.已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标

的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是

(A)5 (B)28 (C)29 (D)4

10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为

(A)95% (B)49.5% (C)99% (D)97%

11.两样本均数间的差别的假设检验时,查t界值表的自由度为

(A)n-1 (B)(r-1)(c-1) (C)n1+n2-2 (D)1

12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是

(A)总体中个体值存在差别 (B)样本中个体值存在差别 (C)样本只含总体的一部分 (D)总体均数不等于0

13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小

(A)α=0.05 (B)α=0.20 (C) α=0.01 (D)α=0.10

14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 。 (A)线图 (B)条图 (C)半对数线图 (D)圆图 15.构成比用来

(A) 反映某现象发生的强度 (B) 表示两个同类指标的比

(C) 反映某事物内部各部分占全部的比重 (D) 表示某一现象在时间顺序的排列

16.某医院的资料计算各种疾病所占的比例,该指标为

(A)发病率 (B)患病率 (C)相对比 (D)构成比 17.等级资料的比较宜用

(A) t检验 (B)检验 (C)秩和检验 (D)方差分析

18.四格表中,当a=20,b=60,c=15,d=5时,最小的理论频数等于

(A)T11 (B)T12 (C) T21 (D)T22

2

19.四格表校正x检验公式适用于

(A)n<40, T>5 (B)n<40, 140, T<5 (D)n>40, 1

20.同一双变量资料,进行直线相关与回归分析,有

5

医学统计学

(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b

二、填空题 12分

1、 统计资料按其性质不同,通常将资料分为 ( ) 三种类型。 2、 统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常

分为( )与( )两个阶段。

3、 计量资料,随着样本例数的增大,S逐渐趋向于( ), 逐渐趋向于( )。 4、变异系数常用于比较( )或( )情况下两组资料的变异度。 5、( )侧重于考察变量之间相关关系密切程度,( )则侧重于考察变量之间数量变化规律。

6、对某地一年级12名女大学生体重( )与肺活量( )的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:?=0.000419+0.058826X,这意味着体重每增加1kg ,肺活量平均增加( );且两者之间为( )相关。 三、名词解释13分 1.参数和统计量 2.概率 3.计数资料 4.回归系数

答案见书本相应的位置 四、简答题15分

1. 抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。

2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?

答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异

因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的

3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?

答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。 五、计算分析题

1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 年份 病例数 存活数 住院期死亡总急性期住院期急性期病死率(%) 死亡数 总病死 6

医学统计学

数 率(%) 1964 1965 1966 1967 1968 合计 17 13 15 15 12 72 9 8 8 9 8 42 8 5 7 6 4 30 7 4 6 6 4 27 47.1 38.5 46.7 40.0 33.3 41.7 41.2 30.8 40.0 40.0 33.3 37.5 修改表:某年某地1964-1968年某病住院期与急性期病死率比较 年份 病例数 住 院 期 死亡总数 1964 1965 1966 1967 1968 合计

2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可) 表1某新药临床试验部分指标 医院代性疗身高 体重 组别 码 别 效 1 1 1 1 . . .

急 性 期 病死率(%) 41.2 30.8 40.0 40.0 33.3 37.5 总病死率(%) 死亡数 47.1 38.5 46.7 40.0 33.3 41.7 7 4 6 6 4 27 17 13 15 15 12 72 8 5 7 6 4 30 1 2 1 2 2 2 175.63.000 0 157.54.000 0 178.67.000 0 165.50.000 0 162.51.000 0 156.48.000 0 62.03 2 2 3 4 2 2 0 0 1 0 0 1 1 7

1 176.医学统计学

00 . 5 5 1 1 2 0 2 2 2 0 0 1 184.72.000 0 168.65.000 0 166.46.000 0 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。两组疗效比较可用秩和检验。

第三套试卷及参考答案 一、选择题 20分

1.7人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为____ A.1:12.4 B.1:8 C.1:16 D.1:8~1:16 2.比较身高和体重两组数据变异度大小宜采用______

A.变异系数 B.方差 C.极差 D.标准差 3.下列关于个体变异说法不正确的是____

A.个体变异是生物体固有的。 B.个体变异是有规律的。 C.增加样本含量,可以减小个体变异。 D.指标的分布类型反映的是个体的分布规律。

4.实验设计的原则是_____

A.对照、随机、均衡 B.随机、重复、均衡 C.对照、重复、随机 D.随机、重复、齐同 5.说明某现象发生强度的指标为______

A.平均数 B.率 C.构成比 D.相对比

6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C表后,其卡方值的自由度为___

A.8 B.1 C.3 D.跟样本含量有关 7.假设检验中的第一类错误是指___所犯的错误。

A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0 D.不拒绝实际上不成立的H0

8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高_____ A. B. C. D.

9.两样本均数的t检验对资料的要求是____

A.正态性、独立性、方差齐性 B.资料具有代表性

8

医学统计学

C.为定量资料 D.以上均对

10.四个率的比较的卡方检验,P值小于0.01,则结论为___

A.四个总体率均不相等; B.四个样本率均不相等;

C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。 二、名词解释 10分

1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率; 答案:见书上相应的地方 三、填空题 10分

1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样( ),分层抽样,整群抽样 2、统计推断的内容主要包括 和 。 3、临床观察7名某病患者,其潜伏期(天)各为:3,7,9,5,6,9,16,则其全距为 天。 4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:⑴有效⑵无效⑶有效(4)有效 ??⒇无效,这种资料属于何种类型资料 。 5、实验研究的基本要素是:

四、简答题 20分

1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?

答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。

2某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。

答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。

3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?

答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95% 表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)

4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。为什么? 答:没有这个规律。相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。

五、分析计算题40分

1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。

男婴x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 女婴x2 7.1

7.9

6.4

6.6

8.0

6.0

7.2

6.8

7.8

5.3

6.6

7.3

(1)该资料是数值变量资料还是分类资料?数值变量资料

(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t检验

(3) 经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。 答:H0:白种人男婴与女婴的出生体重是相同的即μ1=μ2 H1:μ1≠μ2 α=0.05

t=2.16 ν=22 t>t0.05/2,22=2.07 p<0.05

9

医学统计学

在α=0.05水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。 2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。 疗法 治疗人数 治愈人数 未愈人数 治愈率(%) 甲 33 26 7 78.79 乙 38 36 2 94.74 合计 71 62 9 87.32 (1)请计算最小的理论数。Tmin=9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法?四格表校正卡方检验 (3)已知检验统计量为2.92,请下结论。 因χ2=2.92<3.84, P>0.05

结论:在α=0.05水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。 3 比较缺氧条件下猫和兔的生存时间(时间:分)

生存时间

秩次

生存时间

秩次

25 5.5 14 1 34 10 15 2 38 11 16 3 40 12 18 4 41 13 25 5.5 42 14 26 7 45 15 28 8 30 9

(1)该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2)对资料进行编秩;见表

(3)该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组 39.5 (4)写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。

4.请完成以下空白并进行描述性分析。 年龄人口(岁) 数 0- 20- 40- 死亡恶性肿瘤总死亡数 数 4 ( ) 42 63 172 恶性肿瘤死亡占总死亡的% 2.90 19.05 ( ) 恶性肿瘤死亡率(1/10万) ( ) 25.73 ( ) 年龄别死亡率(?) 82920 ( ) ( ) 28161 ( ) ( ) ( ) 10

医学统计学

60- ( ) ( ) 32 合计 16709710 5 90 答案 第一套:

( ) ( ) ( ) 12.59 ( ) ( ) 11

医学统计学

选择题 1-5:B DAAA 6-10:ADCDA 11-15:CCDAA 16-20:DCDDB

填空题:1.性别、血型、表抗; 肝大 ;均数 ;标准差;构成比; 两样本均数比较的T检验; 卡方检验

2.341.48/10万 3.对照 随机 重复 简答题:

1、描述集中趋势的指标有哪些?其适用范围有何异同?(5分) 均数:正态或近似正态分布

几何均数:等比数列或对数正态分布资料

中位数:资料是偏态分布的;分布不明确; 一端或两端有不确定数据(开口资料)时。 2、何谓假设检验?可以举例说明。(5分)

首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该无效假设,如果概率不是小概率,则无理由拒绝该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。(5分)

由于假设检验的结论是依据小概率事件一次试验可以认为不会发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5分) 区别点 标准差 意义 计算公式 与n的关系 用途 计算分析题:

1、请将下列数据编制成合格的统计分析表。 总例数 感染例数 百分比

表1四种脐带消毒方法效果比较

试 庆大霉素(8万单位/10毫升) 30 1 3.3% 验 新洁尔灭(0.1%) 30 3 10% 组 生理盐水冲洗服四 环素3天 30 5 16.7% 对照组 生理盐水 冲洗 30 8 26.7% 个体差异大小 n↑ S→σ 与均数结合可制定参考值范围 标准误 抽样误差大小 n↑ →0 与均数结合可计算总体均数的可信区间 12

医学统计学

总例数 感染例数 1 3 5 8 百分比,% 3.3 10 16.7 26.7 庆大霉素(8万单位/10毫升) 30 新洁尔灭(0.1%) 生理盐水冲洗服四环素3天 生理盐水冲洗 30 30 30

2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。

某医院门诊沙眼病人年龄构成比 年龄组(岁) 沙眼人数 0- 47 10- 198 19.3 20- 330 32.1 30- 198 19.3 40- 128 12.4 50- 80 7.8 60- 38 3.7 70- 8 0.8 计 1027 100.0 沙眼百分比(%) 4.6 问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标? 答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。

第二套

选择题 :1-5 ADBAA 6-10 CBDCA 11-15 CABCC 16-20 DCCDB 填空题:1.计量、计数、等级; 2. 统计描述;统计推断; 3.σ;0 ; 4.单位不同;均数相差较大; 5.相关分析 ;回归分析 ; 6.x :单位kg ; y:单位L ; 0.058826L ; 正 简答题

1. 抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。

2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?

答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异

因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的

3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?

答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。

13

医学统计学

计算分析题:

1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 年份 病例数 存活数 住院期死亡总数 1964 1965 1966 1967 1968 合计 17 13 15 15 12 72 9 8 8 9 8 42 8 5 7 6 4 30 7 4 6 6 4 27 急性期住院期率(%) 47.1 38.5 46.7 40.0 33.3 41.7 41.2 30.8 40.0 40.0 33.3 37.5 急性期病死率(%) 死亡数 总病死 修改表:某年某地1964-1968年某病住院期与急性期病死率比较 年份 病例数 住 院 期 死亡总数 1964 1965 1966 1967 1968 合计

2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可) 表1某新药临床试验部分指标 医院代性疗身高 体重 组别 码 别 效 1 1 1 1 1 2 1 175.63.000 0 157.54.000 0 178.67.000 0 50.03 2 2 3 0 0 1 0 17 13 15 15 12 72 8 5 7 6 4 30 急 性 期 病死率(%) 41.2 30.8 40.0 40.0 33.3 37.5 总病死率(%) 死亡数 47.1 38.5 46.7 40.0 33.3 41.7 7 4 6 6 4 27 2 165. 14

医学统计学

00 . . . . 5 5 2 2 1 1 1 2 0 4 2 2 2 2 2 0 1 1 0 0 1 162.51.000 0 156.48.000 0 176.62.000 0 184.72.000 0 168.65.000 0 166.46.000 0 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。两组疗效比较可用秩和检验。 第三套

选择题 1-5:CACCB 6-10 CADDD

填空题:1.系统抽样 2.参数估计; 假设检验 3. 13 ;4. 计数资料;5.处理因素、受试对象、实验效应

简答题:

1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?

答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。

2某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。

答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。

3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?

答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95% 表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)

4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。为什么? 答:没有这个规律。相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。

计算分析题:

1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中

15

医学统计学

心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。 男婴x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 女婴x2 7.1

7.9

6.4

6.6

8.0

6.0

7.2

6.8

7.8

8.4 5.3

6.7 6.6

7.5 7.3

(1)该资料是数值变量资料还是分类资料?数值变量资料

(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t检验

(3) 经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。 答:H0:白种人男婴与女婴的出生体重是相同的即μ1=μ2 H1:μ1≠μ2 α=0.05

t=2.16 ν=22 t>t0.05/2,22=2.07 p<0.05

在α=0.05水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。 2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。 疗法 治疗人数 治愈人数 未愈人数 治愈率(%) 甲 33 26 7 78.79 乙 38 36 2 94.74 合计 71 62 9 87.32 (1)请计算最小的理论数。Tmin=9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法?四格表校正卡方检验 (3)已知检验统计量为2.92,请下结论。 因χ2=2.92<3.84, P>0.05

结论:在α=0.05水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。 3 比较缺氧条件下猫和兔的生存时间(时间:分)

生存时间

秩次

生存时间

秩次

25 5.5 14 1 34 10 15 2 38 11 16 3 40 12 18 4 41 13 25 5.5 42 14 26 7 45 15 28 8 30 9

(1)该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2)对资料进行编秩;见表

(3)该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组 39.5

16

医学统计学

(4)写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。

4.请完成以下空白并进行描述性分析。 人年龄口(岁) 数 0- 20- 40- 60- 合计 82920 ( ) 28161 ( ) 167090 死亡恶性肿瘤总数 死亡数 ( ) 63 172 ( ) 715 4 ( ) 42 32 90 恶性肿瘤死亡占总死亡的% 2.90 19.05 ( ) ( ) 12.59 恶性肿瘤死亡率(1/10万) ( ) 25.73 ( ) ( ) ( ) 年龄别死亡率(?) ( ) ( ) ( ) ( ) ( )

一、单项选择题

1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图

17

医学统计学

形种类为______.

A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条 【答案】C 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______.

A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分

C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 【答案】D

7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.

A.均数 B.几何均数 C.中位数 D.方差 E.四分位数间距 【答案】B 8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.

A.大约有95人的潜伏期小于57.8小时 B.大约有5人的潜伏期大于57.8小时 C.大约有5人的潜伏期小于57.8小时 D.大约有8人的潜伏期大于57.8小时 E.大约有8人的潜伏期小于57.8小时 【答案】D 9.以下说法中不正确的是______.

A.方差除以其自由度就是均方 B.方差分析时要求各样本来自相互独立的正态总体 C.方差分析时要求各样本所在总体的方差相等

D.完全随机设计的方差分析时,组内均方就是误差均方

E.完全随机设计的方差分析时,F=MS组间/MS组内 【答案】A

10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 【答案】A 一、单项选择题

1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.

A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.

A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.

A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一

18

医学统计学

定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______.

A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________.

A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 【答案】D

7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.

A.均数 B.几何均数 C.中位数 D.方差 E.四分位数间距 【答案】B 8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.

A.大约有95人的潜伏期小于57.8小时 B.大约有5人的潜伏期大于57.8小时 C.大约有5人的潜伏期小于57.8小时 D.大约有8人的潜伏期大于57.8小时 E.大约有8人的潜伏期小于57.8小时 【 答案】D 9..以下说法中不正确的是______. A.方差除以其自由度就是均方 B.方差分析时要求各样本来自相互独立的正态总体 C.方差分析时要求各样本所在总体的方差相等 D.完全随机设计的方差分析时,组内均

方就是误差均方 E.完全随机设计的方差分析时,F=MS组间/MS组内 【答案】A 10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 【答案】A 11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据

C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 【答案】D 12.以下属于数值变量的是______.

A.性别 B.病人白细胞计数 C.血型 D.疗效 E.某病感染人数 【答案】B 13.以下关于样本的说法,不正确的是______.

A.样本是从总体中随机抽取的 B.样本来自的总体应该是同质的 C.样本中应有足够的个体数 D.样本来自的总体中不能有变异存在 E.样本含量可以估计 【答案】D 14.以下属于分类变量的是___________.

A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 【答案】D 15.在抽样研究中,当样本例数逐渐增多时_____.

A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 【答案】D

16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____

年龄(岁):10~20~30~40~50~60~ 人数: 6 40 50 85 20 1

A.线图 B.条图 C.直方图 D.圆图 E.散点图 【答案】C 17.关于构成比,不正确的是_____.

19

医学统计学

A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小

C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 【答案】B

18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 【答案】C

19.根据下述资料,样本指标提示_____.

甲疗法 乙疗法

病情病人数治愈数治愈率(%) 病人数治愈数治愈率(%) 轻型 40 36 90 60 54 90 重型 60 42 70 40 28 70 合计 100 78 78 100 82 82

A.乙疗法优于甲疗法 B.甲疗法优于乙疗法

C.甲疗法与乙疗法疗效相等 D.此资料甲、乙疗法不能比较 E.以上都不对 【答案】C

20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.

A.药物组间瘤重不同,区组间也不同 B.不能认为药物组间瘤重不同,不能认为区组间不同

C.药物组间瘤重不同,但不能认为区组间不同 D.不能认为药物组间瘤重不同,但区组间不同

E.药物差别较大,不能认为区组间不同 【答案】C 二、多选题

1.用图表示某地区近30年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制______. A.普通线图 B.直方图 C.百分条图 D.半对数线图 E.直条图 【答案】A

2.变异系数越大说明______.

A.标准差越大 B.平均数越大 C.标准差、平均数都大 D.平均数越小 E.以均数为准变异程度大 【答案】E 3.统计量__________.

A.是统计总体数据得到的量 B.反映总体统计特征的量

C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E.是由样本数据计算出的统计指标 【答案】E

4.计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数

D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 【答案】C 5.定基比与环比指标是

A.构成比 B.平均数 C.频率 D.绝对数 E.相对比 【答案】E 6.______的均数等于方差。

A.正态分布 B.二项分布 C.对称分布 D.Poisson分布 E.以上均不对 【答案】D 7.下述______为第一类错误的定义。

A.拒绝实际上并不成立的H0 B.接受实际上并不成立的H0

20

医学统计学

C.拒绝实际上是成立的H0 D.接受实际上是成立的H0 E.拒绝实际上并不成立的H1 【答案】C 8.下列不适宜用X2检验的是______.

A.成组设计的两样本频率的比较 B.配对设计的两样本频率的比较 C.多个样本频率的比较 D.频率分布的比较 E.等级资料实验效应间的比较 【答案】E

9.某研究属于观察性研究抑或试验性研究是根据确定的。 A.研究者的工作属性 B.在现场工作,还是在实验室工作 C.研究对象所提供的信息 D.是否给予研究对象干预措施 E.是否遵循随机化原则 【答案】D 10.样本含量的估计是______.

A.经济条件允许的情况下,越多越好 B.时间允许的情况下,越多越好 C.根据实际情况,能选多少是多少 D.不必估计,调查整个总体最好 E.保证研究结论具有一定可靠性的前提下确定的最少例数 【答案】E 11.完全随机设计资料的方差分析中,有______.

A.SS总=SS组间+SS组内 B.MS总=MS组间+MS组内

C.SS组间>SS组内 D.MS组间 E.ν组间<ν组内 【答案】A 12.对两个分类变量的频数表资料作关联性分析,可用_______.

A.积差相关 B.秩相关 C.列联系数 D.线性相关 E.等级相关 【答案】C 13.多重线性回归分析中,能直接反映自变量解释因变量变异数量的指标为__________. A.复相关系数 B.简单相关系数 C.确定系数 D.偏回归系数 E.偏相关系数 【答案】C

14.对调查表考评的三个主要方面是______.

A.信度、效度、反应度 B.信度、效度、可接受性 C.效度、灵敏度、特异度 D.信度、灵敏度、特异度 E.效度、反应度、可接受性 【答案】B 简答题:

1.在一次吸烟习惯的调查中,问题1:是否吸烟?问题2:你吸烟频繁吗?(无、偶尔、有时、经常)问题3:你在昨天吸了多少支烟? 问:调查这3个问题所得的资料各属哪种统计资料类型,它们之间有什么关系?各有何优缺点?

答:1.无序分类,2.有序分类,3.定量资料同一问题从三个不同的侧面考虑得到不同类型的变量,可按定量、有序、无序次序转换,但不可逆转换,对定量资料用分类变量的方法或有序分类按无序分类的方法都将降低检验效能。

2.作两组比较的t检验,结论拒绝H0时,是否证明了两总体均数不同,为什么?

答:依现有的样本资料,可以认为两总体均数不同,因为按照小概率事件原理,在一次实验中小概率事件不可能发生。

3.甲乙两医院乳腺癌手术后的5年生存率资料如下: 伴腋下淋 甲医院 乙医院

巴结转移 病例数生存数生存率(%) 病例数生存数生存率(%) 无 45 35 77.77 300 215 71.67 有 710 450 63.38 83 42 50.60 合计 755 485 64.24 383 257 67.10 问:是否甲医院的生存率较低?为什么?可用什么统计方法进一步分析?

答:不能认为甲医院生存率较低,因为两医院患者组成的内部构成比不同,应对其进行标准

21

医学统计学

化,然后进行假设检验。

10.请指出非参数检验与参数检验相比的优、缺点。

答:参数检验,优点:能充分利用提供的信息,统计分析的效率较高;缺点:对样本所对应的总体分布有比较严格的要求,这样就限制了它的适用范围。

非参数检验,优点:(1)对总体分布未做出任何假定,因此适用于任何分布的资料。如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。(2)易于收集资料、统计分析比较简便;缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。满足参数检验要求的资料分析时应首选参数检验方法。不满足参数检验要求的资料应选非参数检验 四、计算与分析题

1.为研究国产新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见下表。 试验组和对照组空腹血糖下降值(mmol/L)

试验组X1 -0.70 -5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10 -0.50 (n1=20) 2.50 -1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 -1.40 对照组X2 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 -1.10 (n2=20) 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 -2.00 如何对该资料做统计分析?请写出详细的分析计划(不用做具体计算)。 答:此资料属成组资料t检验n1=n2=20

2.马加爵事件之后,高等学校大学生心理状况再度引起社会的普遍关注。心理量表是综合评价个体心理素质的有效工具,某医师利用获得同行认可的量表对综合性大学里攻击型人格障碍的发生情况进行研究。结果如下:

攻击型人格 学习成绩 调查数发生数 优良 800 30 中等及以下 1000 44 合计 1800 74

试回答下述问题(涉及的计算,只需列出计算式,不必算出结果): (1)按学习成绩划分的两组大学生,攻击型人格障碍的发生率各为多少? (2)该研究属于两独立样本设计,还是配对设计? (3)不同学习成绩的大学生,攻击型人格障碍的发生率水平是否相同?(要求列出四格表,写出假设检验的过程及分析步骤) 答:

1.率1=30/800*100%

率2=44/1000*100% 2.属于两独立样本设计 3.770 30 956 44

3.每个空气样品同时用两种方法测定CS2的含量(mg/m3,非正态)如下,试比较两种方法测定结果的差别(要求计算出结果,并写出完整的步骤)。 编号 1 2 3 4 5 6 7 8 9 10

甲方法 40.7 4.4 38.8 45.2 1.3 20.5 2.8 4.4 5.6 1.0 乙方法 50.0 4.4 40.0 42.2 3.3 22.5 4.8 4.4 5.0 4.0 参考界值:n=8时T0.05=3,n=10时T0.05=8 答:差:-9.3 0 -1.2 3 -2 -2 -2 0 0.6 -3 秩: -8 -26.5 -4 -4 -4 1 -6.5

22

医学统计学

T+=7.5T-=28.5T=T+>T0.05=3无差别

4.举例论述假设检验的步骤与基本思想(每一步骤的意义)。

5.“泼尼松、环磷酰胺治疗肾病综合征”的文章中有如下叙述:某医院近十年来先后用泼尼松(1965-1970)(P组)及泼尼松合并环磷酰胺(1971-1975)(P+C组)治疗肾病综合征,并进行了较长期的随访。将病例资料较完整者各15例进行总结对比。泼尼松组平均病程较长,泼尼松合并环磷酰胺组肾功能损害较多;此外两组病情无其它重要区别,见下表(摘抄)。综合比较两组疗效,P+C组缓解率比P组高,且保持时间长。 表两组病例临床资料对比

性别 平均年龄 平均病程 肾功能损害

组别 男 女 (岁) (月) (例数) P 7 8 33.2±2.8 14.5±10.8 6 P+C 13 2 29.1±2.5 5.2±5.6 11

请讨论:上述设计存在什么问题?为什么?其原因是什么?

答:在年龄和性别两方面两组的内部构成都可能不同,不具有可比性

23

本文来源:https://www.bwwdw.com/article/y3bp.html

Top