卫生统计学 医学统计学 习题
更新时间:2023-11-09 07:35:01 阅读量: 教育文库 文档下载
- 卫生统计学题库及答案详解推荐度:
- 相关推荐
第一章 绪论习题
一、选择题
1.统计工作和统计研究的全过程可分为以下步骤:
A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料
2.在统计学中,习惯上把( )的事件称为小概率事件。 A.P?0.10 3~8
A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。
4.分别用两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是( C )。 5.空腹血糖测量值,属于( C )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是( B )。
7.某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料的类型是( D )。
8. 100名18岁男生的身高数据属于( C )。 二、问答题
1.举例说明总体与样本的概念 2.举例说明同质与变异的概念
3.简要阐述统计设计与统计分析的关系 一、选择题
1.D 2.B 3.A 4. C 5.C 6.B 7.D 8.C 二、问答题
1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年
B. P?0.05或P?0.01 C. P?0.005
D.P?0.05 E. P?0.01
英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
2.同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析。
第二章
一、选择题
1.描述一组偏态分布资料的变异度,以( )指标较好。 A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E. 方差 2.各观察值均加(或减)同一数后( )。
A. 均数不变,标准差改变 B. 均数改变,标准差不变
C. 两者均不变 D. 两者均改变 E. 以上都不对 3.偏态分布宜用( )描述其分布的集中趋势。
A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 方差
4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是( )。
A.标准差 B.标准误 C.全距 D.四分位数间距 E.变异系数 5.测量了某地152人接种某疫苗后的抗体滴度,宜用( )反映其平均滴度。 A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数 6.测量了某地237人晨尿中氟含量(mg/L),结果如下:
尿氟值:0.2~ 0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~ 频 数: 75 67 30 20 16 19 6 2 1 1 宜用( )描述该资料。
A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差 7.用均数和标准差可以全面描述( )资料的特征。
A. 正偏态资料 B. 负偏态分布 C. 正态分布 D. 对称分布 E. 对数正态分布
8.比较身高和体重两组数据变异度大小宜采用( )。 A. 变异系数 B. 方差 C. 极差
统计描述习题
D. 标准差 E. 四分位数间距
9.血清学滴度资料最常用来表示其平均水平的指标是( )。 A. 算术平均数 B. 中位数 C. 几何均数
D. 变异系数 E. 标准差
10.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 几何均数
11.现有某种沙门菌食物中毒患者164例的潜伏期资料,宜用( )描述该资料。 A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差
12.测量了某地68人接种某疫苗后的抗体滴度,宜用( )反映其平均滴度。 A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数 二、分析题
1.请按照国际上对统计表的统一要求,修改下面有缺陷的统计表(不必加表头) 年龄 性别 例数 21-30 男 女 10 14 31-40 男 女 8 14 41-50 男 女 82 37 51-60 男 女 213 49 61-70 男 22 2.某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果列于表1。该医生对表中的资料进行了统计分析,认为男性肺癌的发病率高于女性,而死亡情况则完全相反。
表1 某社区不同性别人群肺癌情况
性别 男 女 合计
检查人数 1050 950 2000
有病人数
6 3 9
死亡人数 死亡率(%) 发病率(%)
3 2 5
50.0 66.7 55.6
0.57 0.32 0.45
1)该医生所选择的统计指标正确吗?
2)该医生对指标的计算方法恰当吗? 3)应该如何做适当的统计分析?
3.1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应的医院20.38,妇幼保健机构4.66,卫生院16.38,其他58.58。试说明用何种统计图表达上述资料最好。
第三章 抽样分布与参数估计习题
一、选择题
1.( )分布的资料,均数等于中位数。
A. 对数 B. 正偏态 C. 负偏态 D. 偏态 E. 正态 2. 对数正态分布的原变量X是一种( )分布。
A. 正态 B. 近似正态 C. 负偏态 D. 正偏态 E. 对称 3. 估计正常成年女性红细胞计数的95%医学参考值范围时,应用( A. )。 A.(x?1.96s,x?1.96s) B.(x?1.96sx,x?1.96sx) C.?(xlgx?1.645slgx) E.?(xlgx?1.645slgx)
4. 估计正常成年男性尿汞含量的95%医学参考值范围时,应用(E )。 A.(x?1.96s,x?1.96s) B.(x?1.96sx,x?1.96sx) C.?(xlgx?1.645slgx) E.?(xlgx?1.645slgx) 5.若某人群某疾病发生的阳性数X服从二项分布,则从该人群随机抽出n个人, 阳性数X不少于k人的概率为( )。
A. P(k)?P(k?1)???P(n) B. P(k?1)?P(k?2)???P(n) C. P(0)?P(1)???P(k) D. P(0)?P(1)???P(k?1) E. P(1)?P(2)???P(k)
6.Piosson分布的标准差?和均数?的关系是( )。
A. ??? B. ??? C. ?=?2 D. ?=? E. ?与?无固定关系
7.用计数器测得某放射性物质5分钟内发出的脉冲数为330个,据此可估计该
放射性物质平均每分钟脉冲计数的95%可信区间为( )。
A. 330?1.96330 B. 330?2.58330 C. 33?1.9633 D. 33?2.5833 E. (330?1.96330)/5 8.Piosson分布的方差和均数分别记为?2和?,当满足条件( )时,Piosson
分布近似正态分布。
A. ?接近0或1 B. ?2较小 C. ?较小 D. ?接近0.5 E. ?2?20 9.二项分布的图形取决于( )的大小。
A. ? B. n C.n与? D. ? E. ?
D.?(x?1.645s) D.?(x?1.645s)
10.( )小,表示用该样本均数估计总体均数的可靠性大。
A.CV B.S C. ?X D. R E. 四分位数间距 11.在参数未知的正态总体中随机抽样,X???( )的概率为5%。
A. 1.96? B. 1.96 C. 2.58 D. t0.05/2,?S E. t0.05/2,?SX 12.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为
74g/L,标准差为4g/L,则其总体均数的95%可信区间为( )。
A. 74?2.58?4?10 B. 74?1.96?4?10 C. 74?2.58?4 D. 74?4?4 E. 74?1.96?4
13.一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数与标准差;估计该批药剂有效成分平均含量的95%可信区间时,应用( )。
A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)
14.在某地按人口的1/20随机抽取1000人,对其检测汉坦病毒IgG抗体滴度,得肾综合征出血热阴性感染率为5.25%,估计该地人群肾综合征出血热阴性感染率的95%可信区间时,应用( )。
A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)
15.在某地采用单纯随机抽样方法抽取10万人,进行一年伤害死亡回顾调查,得伤害死亡数为60人;估计该地每10万人平均伤害死亡数的95%可信区间时,应用( )。
A.(X?t0.05/2,?sX,X?t0.05/2,?sX) B.(X?1.96?X,X?1.96?X) C. (X?t0.05/2,?s,X?t0.05/2,?s) D.(X?1.96X,X?1.96X) E. (p?1.96sp,p?1.96sp)
16.关于以0为中心的t分布,错误的是( )。
A. 相同?时,t越大,P越大 B. t分布是单峰分布
C. 当???时,t?u D. t分布以0为中心,左右对称 E. t分布是一簇曲线
二、简单题
1、标准差与标准误的区别与联系 2、二项分布的应用条件
3、正态分布、二项分布、poisson分布的区别和联系 三、计算分析题
1、如何用样本均数估计总体均数的可信区间
2、某市2002年测得120名11岁男孩的身高均数为146.8cm,标准差为7.6cm,同时测得120名11岁女孩的身高均数为148.1cm,标准差为7.1cm,试估计该地11岁男、女童身高的总体均数,并进行评价。 3、按人口的1/20在某镇随机抽取312人,做血清登革热血凝抑制抗体反应检验,得阳性率为8.81%,求该镇人群中登革热血凝抑制抗体反应阳性率的95%可信区间。
第四章 数值变量资料的假设检验习题
一、选择题
1.在样本均数与总体均数比较的t检验中,无效假设是( )。
A. 样本均数与总体均数不等 B. 样本均数与总体均数相等 C. 两总体均数不等 D. 两总体均数相等 E. 样本均数等于总体均数
2.在进行成组设计的两小样本均数比较的t检验之前时,要注意两个前提条件。一要考察各样本是否来自正态分布总体,二要:
A.核对数据 B.作方差齐性检验 C.求均数、标准差 D.求两样本的合并方差 E.作变量变换
3.两样本均数比较时,分别取以下检验水准,以( )所取第二类错误最小。
A. ??0.01 B. ??0.05 C. ??0.10 D. ??0.20 E. ??0.30
4.正态性检验,按??0.10检验水准,认为总体服从正态分布。若该推断有错,其错误的概率为( )。
A. 大于0.10 B. 小于0.10 C. 等于0.10 D. 等于?,而?未知 E. 等于1??,而?未知 5.关于假设检验,下面哪一项说法是正确的( )。
A. 单侧检验优于双侧检验
B. 若P??,则接受H0犯错误的可能性很小
C. 采用配对t检验还是两样本t检验是由实验设计方案决定的 D. 检验水准?只能取0.05
E. 用两样本u检验时,要求两总体方差齐性
6.假设一组正常人的胆固醇值和血磷值均近似服从正态分布。为从不同角度来分析该两项指标间的关系,可选用:
A.配对t检验和标准差 B.变异系数和相关回归分析 C.成组t检验和F检验 D.变异系数和u检验 E.配对t检验和相关回归分析
7.在两样本均数比较的t检验中,得到t?t0.05/2,?,P?0.05,按??0.05检验水准不拒绝无效假设。此时可能犯:
A.第Ⅰ类错误 B. 第Ⅱ类错误 C.一般错误 D.错误较严重E.严重错误 二、简答题
1.假设检验中检验水准?以及P值的意义是什么? 2.t检验的应用条件是什么?
3.比较Ⅰ型错误和Ⅱ型错误的区别和联系。 4.如何恰当地应用单侧与双侧检验? 三、计算题
1.调查显示,我国农村地区三岁男童头围均数为48.2cm,某医生记录了某乡村20名三岁男童头围,资料如下:48.29 47.03 49.10 48.12 50.04 49.85 48.97 47.96 48.19 48.25 49.06 48.56 47.85 48.37 48.21 48.72 48.88 49.11 47.86 48.61。试问该地区三岁男童头围是否大于一般三岁男童 。
2. 分别从10例乳癌患者化疗前和化疗后1天的尿样中测得尿白蛋白(ALb,mg/L)的数据如下,试分析化疗是否对ALb的含量有影响 病人编号 1 2 3 4 5 6 7 8 9 10 化疗前
3.3 11.7 9.4 6.8 2.0 3.1 5.3 3.7 21.8 17.6
ALb含量 化疗后
33.0 30.8 8.8 11.4 42.6 5.8 1.6 19.0 22.4 30.2
ALb含量 3.某医生进行一项新药临床试验,已知试验组15人,心率均数为76.90,标准差为8.40;对照组16人,心率均数为73.10,标准差为6.84.试问在给予新药治疗之前,试验组和对照组病人心率的总体均数是否相同?
4.测得某市18岁男性20人的腰围均值为76.5cm,标准差为10.6cm;女性25人的均值为69.2cm,标准差为6.5cm。根据这份数据可否认为该市18岁居民腰围有性别差异?
5欲比较甲、乙两地儿童血浆视黄醇平均水平,调查甲地3~12岁儿童150名,血浆视黄醇均数为1.21μmol/L,标准差为0.28μmol/L;乙地3~12岁儿童160名,血浆视黄醇均数为0.98μmol/L,标准差为0.34μmol/L.试问甲乙两地3~12岁儿童血浆视黄醇平均水平有无差别?
第四章 数值变量资料的假设检验(答案)
一、选择题
1. B 2. B 3. E 4. D 5. C 6. E 7.B 二、简答题
1.答 ?为判断拒绝或不拒绝无效假设H0的水准,也是允许犯Ⅰ型错误的概率。
P值是指从H0规定的总体中随机抽样时,获得等于及大于(负值时为等于及小
于)现有样本统计量的概率。
2.答 t检验的应用条件:①当样本含量较小(n?50或n?30时),要求样本来自正态分布总体;②用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。
3.答 Ⅰ型错误拒绝了实际上成立的H0,Ⅱ型错误不拒绝实际上不成立的H0。通常,当样本含量不变时,?越小,?越大;反之,?越大,?越小。 4.答 在一般情况下均采用双侧检验,只有在具有充足理由可以认为如果无效假设H0不成立,实际情况只能有一种方向的可能时才考虑采用单侧检验。 三、计算题 1.解 检验假设
H0:???0,H1:???0??0.05
这里n?20,X?48.55,S?0.70
t?X??048.55?48.2??2.241,v?n?1?20?1?19 S/n0.70/20查t临界值表,单侧t0.05,19?1.729,得P?0.05,在??0.05的水准上拒绝H0,可以认为该地区三岁男童头围大于一般三岁男童。
2.解 检验假设
H0:?d?0,H1:?d?0??0.05
这里,n?10,?d??120.9,?d2?3330.97,d??12.09
Sd?t??d2?(?d)2/nn?13330.97?(?120.9)2/10??4.56
10?1d?0?12.09??2.653,v?10?1?9
Sd/n4.56/10查表得双侧t0.05,9?2.262,t?2.262,P?0.05,按??0.05检验水准拒绝H0,可以认为化疗对乳腺癌患者ALb的含量有影响。 3.解 方差齐性检验
22H0:?12??2,H1:?12??2??0.05
S128.402 F?2??1.51,v1?15?1?14,v2?16?1?15 2S26.84查F界值表,F0.05(14,15)?2.70,知P?0.05,在??0.05水平上不能拒绝H0,可认为该
资料方差齐。
两样本均数比较的假设检验
H0:?1??2,H1:?1??2??0.052c
2(n1?1)S12?(n2?1)S2(15?1)8.402?(16?1)6.842S???58.26
n1?n2?215?16?2t?X1?X2Sc2(1/n1?1/n2)?76.90?73.10?1.385258.26(1/15?1/16)
v?n1?n2?2?15?16?2?29 查t临界值表,t0.05,29?2.045,知P?0.05,在??0.05水准上尚不能拒绝H0.所以可以认为试验组和对照组病人心率的总体均数相同。
4.解 方差齐性检验:
22H0:?12??2,H1:?12??2??0.05S1210.62F?2??2.66,v1?20?1?19,v2?25?1?24 2S26.5
查F界值表,F0.05(19,24)?1.94,知P?0.05,在??0.05水平上拒绝H0,可认为该资料
方差不齐。
两样本均数比较的假设检验
H0:?1??2,H1:?1??2??0.05
t??X1?X2SS?n1n22122?76.5?69.210.66.5?202522?2.7004?10.626.52? ?222??(Sx1?Sx2)25??20v?4??302222Sx1Sx42?10.6??6.5?????n1?1n2?1??20???25?20?125?1 查t临界值表,t0.05,30?2.042,知P?0.05,在??0.05水准上拒绝H0.所以根据这份数据可以认为该市18岁居民腰围有性别差异。
5.解 检验假设
H0:?1??2,H1:?1??22??0.05
这里,
n1?150,X1?1.21,S1?0.28n2?160,X2?0.98,S2?0.34X1?X222
u?S/n1?S/n221?1.21?0.980.28/150?0.34/16022?0.82
在这里u?0.82?1.96,检验水准尚不能拒绝H0,可以认为甲P?0.05,按??0.05乙两地3~12岁儿童血浆视黄醇平均水平没有差别。
第五章 方差分析习题
一、选择题
1.完全随机设计资料的方差分析中,必然有( )。
A. SS组间?SS组内 B.MS组间?MS组内 C. SS总=SS组间+SS组内 D.MS总?MS组间+MS组内 E. ?组间??组内
2.当组数等于2时,对于同一资料,方差分析结果与t检验结果( )。
A. 完全等价且F?t B. 方差分析结果更准确
C. t检验结果更准确 D. 完全等价且t?F E. 理论上不一致 3.在随机区组设计的方差分析中,若F处理?F0.05(?1,?2),则统计推论是( )。
A. 各处理组间的总体均数不全相等 B. 各处理组间的总体均数都不相等 C. 各处理组间的样本均数都不相等 D. 处理组的各样本均数间的差别均有显著性
E. 各处理组间的总体方差不全相等 4.随机区组设计方差分析的实例中有( )。
A. SS处理不会小于SS区组 B. MS处理不会小于MS区组
C. F处理值不会小于1 D. F区组值不会小于1 E. F值不会是负数
5.完全随机设计方差分析中的组间均方是( )的统计量。
A. 表示抽样误差大小 B. 表示某处理因素的效应作用大小 C. 表示某处理因素的效应和随机误差两者综合影响的结果。 D. 表示n个数据的离散程度 E. 表示随机因素的效应大小
6.完全随机设计资料,若满足正态性和方差齐性。要对两小样本均数的差别做 比较,可选择( )。
A.完全随机设计的方差分析 B. u检验 C. 配对t检验 D.?2检验 E. 秩和检验
7.配对设计资料,若满足正态性和方差齐性。要对两样本均数的差别做比较, 可选择( )。
A. 随机区组设计的方差分析 B. u检验 C. 成组t检验 D. ?2检验 E. 秩和检验
2P?0.058.对k个组进行多个样本的方差齐性检验(Bartlett法),得?2??0.05,?,
按??0.05检验,可认为( )。
2222A. ?12,?2全不相等 B. ?12,?2不全相等 ,?,?k,?,?kC. S1,S2,?,Sk不全相等 D. X1,X2,?,Xk不全相等 E. ?1,?2,?,?k不全相等
9.变量变换中的对数变换(x?lgX或x?lg(X?1)),适用于( ): A. 使服从Poisson分布的计数资料正态化 B. 使方差不齐的资料达到方差齐的要求 C. 使服从对数正态分布的资料正态化 D. 使轻度偏态的资料正态化
E. 使率较小(<30%)的二分类资料达到正态的要求
10.变量变换中的平方根变换(x?X或x?X?0.5),适用于( ): A. 使服从Poisson分布的计数资料或轻度偏态的资料正态化 B. 使服从对数正态分布的资料正态化 C. 使方差不齐的资料达到方差齐的要求 D. 使曲线直线化
E. 使率较大(>70%)的二分类资料达到正态的要求 二、简答题
1、方差分析的基本思想及应用条件
2、在完全随机设计资料的方差分析与随机区组设计资料的方差分析在试验设计和变异分解上有什么不同?
3、为何多个均数的比较不能直接做两两比较的t检验?
4、SNK-q检验和Dunnett-t检验都可用于均数的多重比较,它们有何不同? 三、计算题
1、某课题研究四种衣料内棉花吸附十硼氢量。每种衣料各做五次测量,所得数据如表5-1。试检验各种衣料棉花吸附十硼氢量有没有差异。
表5-1 各种衣料间棉花吸附十硼氢量
衣料1 衣料2 衣料3 衣料4 2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13 2.93 2.68 3.00 4.61 2.73 2.34 2.66 2.80 2.33 2.22 3.06 3.60
2、研究中国各地区农村3岁儿童的血浆视黄醇水平,分成三个地区:沿海、内陆、西部,数据如下表,问三个地区农村3岁儿童的血浆视黄醇水平有无差异。
地区 沿海 内陆 西部
n 20 23 19
X 1.10 0.97 0.96
S 0.37 0.29 0.30
3、将同性别、体重相近的同一配伍组的5只大鼠,分别用5种方法染尘,共有6个配伍组30只大鼠,测得的各鼠全肺湿重,见下表。问5种处理间的全肺湿重有无差别?
表5-2. 大鼠经5种方法染尘后全肺湿重
区组 第1区 第2区 第3区 第4区 第5区 第6区
对照 1.4 1.5 1.5 1.8 1.5 1.5
A组 3.3 3.6 4.3 4.1 4.2 3.3
B组 1.9 1.9 2.1 2.4 1.8 1.7
C组 1.8 2.3 2.3 2.5 1.8 2.4
D组 2.0 2.3 2.4 2.6 2.6 2.1
4、对第1题的资料进行均数间的多重比较。
第五章 方差分析(答案)
一、选择题
1.C 2.D 3.A 4.E 5.C 6.A 7.A 8.B 9.C 10.A
二、简单题
1、答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可有处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。 方差分析的应用条件:(1)各样本是相互独立的随机样本,均服从正态分布;(2)相互比较的各样本的总体方差相等,即具有方差齐性。
2、完全随机设计:采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理。在分析时,SS总?SS组间?SS组内 随机区组设计:随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在分析时,
SS总?SS处理?SS区组?SS组内
3、多个均数的比较,如果直接做两两比较的t检验,每次比较允许犯第Ⅰ类错误的概率都是α,这样做多次t检验,就增加了犯第Ⅰ类错误的概率。因此多个均数的比较应该先做方差分析,若多个总体均数不全相等,再进一步进行多个样本均数间的多重比较。
4、SNK-q检验常用于探索性的研究,适用于每两个均数的比较
Duunett-t检验多用于证实性的研究,适用于k-1个实验组与对照组均数的比较。
三、计算题
1.采用完全随机设计的方差分析,计算步骤如下: Ho:各个总体均数相等
H1:各个总体均数不相等或不全相等 α=0.05
表5-1 各种衣料间棉花吸附十硼氢量
衣料1 衣料2 衣料3 衣料4 合计
2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13
Xij 2.93 2.68 3.00 4.61
2.73 2.34 2.66 2.80 2.33 2.22 3.06 3.60
ni
5 2.4640 0.3671
5 2.4120 0.1758
5 2.9680 0.1741
5 4.0280 0.9007
20(N) 2.9680(X) 0.80990
(S)
Xi
Si
2SS总=S总*?总=0.80990 *(20-1)=12.4629,?总=20-1=19
2
SS组间??ni(Xi?X)=5(2.4640-2.9680)2+5(2.4120-2.9680)2
i2+5(2.9680-2.9680)2+5(4.0280-2.9680)2=8.4338,组间=4-1=3
?SS组间?SS总?SS组间=12.4629-8.4338=4.0292,?组内=20-4=16
MS组间?MS组内?SS组间SS组内?8.4338=2.8113
?组间3?组内?4.029216=0.2518
2.8113F==11.16 0.2518 方差分析表 变异来源 SS ν MS 总 12.4629 19 组间 8.4338 3 2.8113 组内 4.0292 16 0.2518 按?1=3,?2=16查F界值表,得F0.01(2,16)故P< 0.01。
按α=0.05水准,拒绝H0,接受H1,可以认为各种衣料中棉花吸附十硼氢量有差异。 2.
Ho:各个总体均数相等
H1:各个总体均数不相等或不全相等 α=0.0500
F 11.16
P <0.01
?7.51,F?11.16?7.51,
SS组间??ni(Xi?X)=0.2462,?组间=3-1=2
2iSS组内??(ni?1)Si=6.0713,?组内=62-3=59
2iMS组间?SS组间?0.2462=0.1231
?组间2
MS组内?SS组内?组内?6.071359=0.1029
0.1231F==1.20 0.1029
方差分析结果 变异来源 SS ν MS 总 6.3175 61 组间 0.2462 2 0.1231 组内 6.0713 59 0.1029 按?1=2,?2=59查F界值表,得F0.05(2,59)F
1.20
P > 0.05
?3.93,F?1.20?3.93,
故P> 0.05。
按α=0.05水准尚不能拒绝Ho,故可以认为各组总体均数相等。 3.
处理组间:
Ho:各个处理组的总体均数相等
H1:各个处理组的总体均数不相等或不全相等 α=0.05
区组间:
Ho:各个区组的总体均数相等
H1:各个区组的总体均数不相等或不全相等 α=0.05
表5-2. 大鼠经5种方法染尘后全肺湿重 区组 第区 第区 第区 第区 第区 第区
123456
对照 1.4 1.5 1.5 1.8 1.5 1.5
A组 3.3 3.6 4.3 4.1 4.2 3.3
B组 1.9 1.9 2.1 2.4 1.8 1.7
C组 1.8 2.3 2.3 2.5 1.8 2.4
D组 2.0 2.3 2.4 2.6 2.6 2.1
5 5 5 5 5 5
nj Xj 2.0800 2.3200 2.5200 2.6800 2.3800 2.2000
ni
6 6 6 1.9667 0.2503
6 2.1833 0.3061
6 30 (N)
Xi Si
1.5333 3.8000 0.1366 0.4561
2.3333 2.3633 (X) 0.2503 0.82816 (S)
SS总??X2?(?X)2N =19.8897,?总=30-1=29
2SS处理组??ni(Xi?X)=17.6613, ?处理组=5-1=4
iSS区组??nj(Xj?X)=1.1697, ?区组=6-1=5
j2(6-1)=20 SS误差=19.8897-17.6613-1.1697=1.0587,?误差=(5-1) 方差分析结果
变异来源 SS 总 19.8897 处理组 17.6613 区组 1.1697 误差 1.0587
ν
29 4 5 20
MS
4.4153 0.2339 0.0529
F
83.41 4.42
P
<0.01 <0.01
按?1=4,?2=20查F界值表,得F0.01(4,20)故P< 0.01。
?5.17,F?83.41?5.17,
按α=0.05水准,拒绝H0,接受H1,可以认为5种处理间的全肺湿重不全相等。 按?1=5,?2=20查F界值表,得F0.05(5,20)故P< 0.05。
按α=0.05水准,拒绝H0,接受H1,可以认为6种区组间的全肺湿重不全相等。 4、采用SNK检验进行两两比较。
Ho: ?A??B,即任两对比较组的总体均数相等 H1: ?A??B,即任两对比较组的总体均数不相等
α=0.05
将四个样本均数由小到大排列,并编组次:
均数 2.4120 2.4640 2.9680 4.0280 组别 衣料2 衣料1 衣料3 衣料4 组次 1 2 3 4
4个样本均数两两比较的q检验(Newman-Keuls法)
对比组 两均数之差 组数 Q值 P值
?3.29,F?4.42?3.29,
1与2 0.0520 1与3 0.5560 1与4 1.6160 2与3 0.5040 2与4 1.5640 3与4 1.0600 2
3 4 2 3 2 0.2317 2.4775 7.2008 2.2458 6.9691 4.7233 >0.05 >0.05 <0.01 >0.05 <0.01 <0.05
按按α=0.05水准,1与4,2与4,3与4,拒绝H0,差异有统计学意义,其他两两比较不拒绝H0,差异无统计学意义。即衣料2与衣料4,衣料1与衣料4,衣料3与衣料4的棉花吸附十硼氢量有差异,还不能认为衣料1与衣料2,衣料2与衣料3,衣料1与衣料3的棉花吸附十硼氢量有差异。
第六章 分类资料的假设检验习题
一、选择题
1.?2分布的形状( )。
A. 同正态分布 B. 同t分布 C.为对称分布 D. 与自由度?有关 E. 与样本含量n有关 2.四格表的自由度( )。
A. 不一定等于1 B. 一定等于1 C. 等于行数×列数 D. 等于样本含量-1 E. 等于格子数-1
23.5个样本率作比较,?2??0则在?=0.05的检验水准下,可认为( )。 .01,4,
A. 各总体率不全相等 B. 各总体率均不等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等
4.测得某地6094人的两种血型系统,结果如下。欲研究两种血型系统之间是否有联系,应选择的统计分析方法是( )。
某地6094人的ABO与MN血型
MN血型
M N 431 490 388 410 495 587 137 179 ABO血型
O
A B AB 验
MN 902 800 950 32 A.秩和检验 B.?2检验 C.Ridit检验 D.相关分析 E.Kappa检5.假定两种方法检测结果的假阳性率和假阴性率均很低。现有50份血样用甲法检查阳性25份,用乙法检查阳性35份,两法同为阳性和阴性的分别为23份和13份。欲比较两种方法检测结果的差别有无统计学意义,应选用( )。 A. u检验 B. t检验 C. 配对t检验
D. 配对四格表资料的?2检验 E. 四格表资料的?2检验 6.某医师欲比较两种疗法治疗2型糖尿病的有效率有无差别,每组各观察了30例,应选用( )。
A.两样本率比较的u检验 B.两样本均数比较的u检验 C. 四格表资料的?2检验 D. 配对四格表资料的?2检验 E. 四格表资料?2检验的校正公式
7.用大剂量Vit.E治疗产后缺乳,以安慰剂对照,观察结果如下:Vit.E组,有效12例,无效6例;安慰剂组有效3例,无效9例。分析该资料,应选用( )。 A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式
8.欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果如下。分析该资料,应选用( )。
两种药物治疗脑血管疾病有效率的比较
组 别 有效 无效 合计 胞磷胆碱组 46 6 52 神经节苷酯组 18 8 26 合 计 64 14 78
A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式
9.当四格表的周边合计数不变,若某格的实际频数有变化,则其理论频数( )。 A. 增大 B. 减小 C. 不变 D. 不确定 E. 随该格实际频数的增减而增减
10.对于总合计数n为500的5个样本率的资料作?2检验,其自由度为( )。
A. 499 B. 496 C. 1 D. 4 E. 9
211.3个样本率作比较,?2??0则在?=0.05的检验水准下,可认为( )。 .01,2,
A. 各总体率均不等 B. 各总体率不全相等 C. 各样本率均不等 D. 各样本率不全相等 E. 至少有两个总体率相等
12.某医院用三种方案治疗急性无黄疸性病毒肝炎254例,观察结果如下。欲比较三种方案的疗效有无差别,应选择的统计分析方法是( )。
组 别
西药组 中药组
中西医结合组 三种方案治疗肝炎的疗效结果 无 效 好 转 显 效 49 31 5 45 9 22 15 28 11 痊 愈
15 4 20 A.秩和检验 B.?2检验 C.t检验 D.u检验 E.Kappa检验 13.某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血
清中抗核抗体进行测定:乳胶法阳性13例,免疫法阳性23例,两法同为阳性和阴性的分别为11例和33例。欲比较两种方法检测结果的差别有无统计学意义,应选用( )。
A. u检验 B. t检验 C. 配对t检验 D. 配对四格表资料的?2检验 E. 四格表资料的?2检验 14.某医师欲比较两种药物治疗高血压病的有效率有无差别,每组各观察了35例,应选用( )。
A.两样本率比较的u检验 B.两样本均数比较的u检验 C.四格表资料的?2检验 D.配对四格表资料的?2检验 E. 四格表资料的?2检验校正公式
15.某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组(22例)和非预防组(11例),观察结果为:预防注射组感染率18.18%,非预防组感染率45.45%。分析该资料,应选用( )。 A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式
16.用兰芩口服液治疗慢性咽炎患者34例,有效者31例;用银黄口服液治疗慢性咽炎患者26例,有效者18例。分析该资料,应选用( )。 A. t检验 B.?2检验 C.F检验 D.Fisher精确概率法 E. 四格表资料的?2检验校正公式 二、简答题
1.列出?2检验的用途? 2.?2检验的基本思想?
3.四格表资料的?2检验的分析思路?
三、问答题
1.R×C表的分析思路 四、计算题
1.据以往经验,新生儿染色体异常率一般为1%,某院观察了当地1000名新生儿,发现有5例染色体异常,问该地新生儿染色体异常率是否低于一般?
2.现用某种新药治疗患者400例,治愈369例,同时用传统药物治疗同类患者500例,477例治愈。试问两种药物的治愈率是否相同? 3.某医院分别用单纯化疗和符合化疗的方法治疗两组病情相似的淋巴肿瘤患者,两组的缓解率如下表,问两疗法的总体缓解率是否不同?
两种疗法的缓解率的比较 效果
组别 合计 缓解率(%)
缓解 未缓解
单纯化疗 15 20 35 42.86
42 43 44 45 46 47 48 49 50
一、选择题
244.80 2.40 4.00 1.70 5.10 1.10 32.00 12.80 1.40 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 21.87 23.77 26.00 28.33 31.33 37.77 66.83 73.57 124.17 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00
第十六章 生存分析(答案)
1、D 2、E 3、C 4、B 5、D 6、E 二、问答题
1、 (1)在生存资料中,截尾值指尚未观察到研究对象出现反应时,即由于某种
原因停止了随访,这时记录到的时间信息是不完整的,这种生存资料称为截尾值。
(2)出现截尾值的原因主要有以下3种情况:①失访;②退出;③终止。 2、Cox回归模型中,偏回归系数?i的意义是,当其它协变量不变时,Xi每变化一个单位,相对危险度的自然对数变化?i个单位。
3、Cox回归模型与logistic回归模型具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。但Cox回归模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,而logistic回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。 三、计算题:
1、(1)Cox回归模型参数估计和假设检验结果见下表
表 cox回归模型计算及检验结果 (?2?33.621, P?0.000)
OR值95%可信区间 偏回归系
变量 偏回归系数 Wald P值 OR值
数标准误 下限 上限
x1 0.001 0.002 0.360 0.548 1.001 0.997 1.005 x2 0.454 0.206 4.846 0.028 1.574 1.051 2.358 x3 -1.886 0.377 25.050 0.000 0.152 0.072 0.317
由上表可见,在??0.05检验水准上,所建立的Cox回归模型成立(?2?33.621, P?0.000);入院时白细胞数(x1)的偏回归系数无统计学意义,淋巴结浸润度(x2)和缓解出院后的巩固治疗(x3)的偏回归系数均有统计学意义。Cox回归模型为:?h(t,Xi)??h0(t)exp(0.001x1?0.454x2?1.886x3)。
以上结果可解释为:淋巴结浸润度(x2)和缓解出院后的巩固治疗(x3)均对急性淋巴细胞性白血病病人的生存时间产生影响。在控制了入院时白细胞数(x1)与缓解出院后的巩固治疗(x3)的作用下,淋巴结浸润度浸润度每增加一个等级,死于白血病的危险性增加57%;在控制了入院时白细胞数(x1)与淋巴结浸润度(x2)的作用下,接受巩固治疗者(x3?1)死于白血病的危险性比不接受巩固治疗者死于白血病的危险性降低84.8%。
(2)生存曲线:根据协变量均值绘制的生存曲线见下图
图16.3 根据协变量均值绘制的生存曲线
由上图可见,多数病人的生存月数都不超过20个月,其中位生存时间大约为12个月。
复合化疗 18 5 23 78.26 合计 33 25 58 56.90
4.分别用对同一批口腔颌面部肿瘤患者定性检测唾液和血清中癌胚抗原的含量,得到结果如下表,问这两种方法的检测结果有无差别?
两种方法的检测结果
血清
唾液 合计
+ -
+ 15 10 25 - 2 13 15 合计 17 23 40
5.测得250例颅内肿瘤患者的血清IL-8与MMP-9水平,结果如下表,问两种检测指标间是否存在关联?
血清IL-8与MMP-9水平
IL-8
MMP-9 合计
Ⅰ Ⅱ Ⅲ
Ⅰ 22 5 0 27 Ⅱ 18 70 20 108 Ⅲ 0 55 60 115 合计 40 130 80 250
第六章 分类资料的假设检验(答案)
一、选择题
1.D 2.B 3.A 4.B 5.D 6.C 7.D 8.D 9.C 10.D 11.B 12.A 13.D 14.C 15.D 16.E 二、简答题
1.答:推断两个总体率间或者构成比见有无差别;多个总体率间或构成比间有无差别;多个样本率比较的的?2分割;两个分类变量之间有无关联性以及频数分布拟合优度的?2检验。
2.答:?2值反映了实际频数与理论频数的吻合程度,若检验假设H0成立,实际频数与理论频数的差值会小,则?2值也会小;反之,若检验假设H0不成立,实际频数与理论频数的差值会大,则?2值也会大。
3.答:(1)当n?40且所有的T?5时,用?2检验的基本公式或四格表资料?2检验的专用公式;当p??时,改用四格表资料的Fisher确切概率法。
(A?T)2 基本公式:???
T2(ad?bc)2n 专用公式:???
(a?b)(c?d)(a?c)(b?d)2 (2)当n?40,但有1?T?5时,用四格表资料?2检验的校正公式或改用四格表资料的Fisher确切概率法
校正公式: ?c??2(ad?bc?n2)2n(a?b)(c?d)(a?c)(b?d)
(3)当n?40,或T?1时,用四格表资料的Fisher确切概率法 三、问答题
1.答:R×C表可分为双向无序、单向有序、双向有序属性相同和双向有序属性不同四类
(1) 双向无序R×C表 R×C表中的两个分类变量皆为无序分类变量。对于
该类资料 ① 若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的?2检验; ② 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的?2检验以及Pearson列联系数进行分析。
(2) 单向有序R×C表 有两种形式:一种是R×C表的分组变量是有序的,但指标变量是无序的,其研究目的通常是多个构成比的比较,此种单向有序R×C表可用行×列表资料的?2检验;另一种情况是R×C表中的分组变量为无序的,而指标变量是有序的。其研究目的通常是多个等级资料的比较,此种单向有序R×C表资料宜用秩和检验或Ridit分析。
(3) 双向有序属性相同R×C表 R×C表中的两分类变量皆为有序且属性相同。实际上是2×2配对设计的扩展,即水平数?3的诊断试验配伍设计。其研究目的通常是分析两种检验方法的一致性,此时宜用一致性检验(或称Kappa检验)。
(4) 双向有序属性不同R×C表 R×C表中两分类变量皆为有序的,但属性不同。对于该类资料:
① 若研究目的为分析不同年龄组患者疗效间有无差别时,可把它视为单项有序R×C表资料,选用秩和检验;
②若研究目的为分析两个有序分类变量间是否存在相关关系,宜用等级相关分析或Pearson积矩相关分析;
③ 若研究目的为分析两个有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。 四、计算题 1.答:(1)建立检验假设,确定检验水准 H0:??0.01 H1:??0.01
单侧 ??0.05
(2)计算统计量u值,做出推断结论
本例?0?0.01,1??0?1?0.01?0.99,n?1000,根据题意
u?p??00.005?0.01???1.589
?0(1??0)n0.01?0.991000(3)确定P值,做出推断结论。
u??1.589,P>0.05,按??0.05的检验水准,不拒绝H0,尚不能认为该地新
生儿染色体异常率低于一般。
2.答:(1)建立检验假设,确定检验水准 H0:?1??2 H1:?1??2
单侧 ??0.05
(2)计算统计量,做出推断结论
本例?0?0.01,p1?369/400?0.9225,p2?477/500?0.954,
pc?(369?477)/(400?500)?0.94,根据题意 u?p1?p20.9225?0.954???1.9773
1111pc(1?pc)(?)0.94?0.06?(?)n1n2400500(3)确定P值,做出推断结论。
u??1.9773,P<0.05,按??0.05的检验水准,拒绝H0,接受H1,可以认为这
两种药物的治愈率不同。
3.答:(1)建立检验假设,确定检验水准 H0:?1??2 两法总体缓解率相同 H1:?1??2 两法总体缓解率不同
双侧 ??0.05
(2)计算统计量,做出推断结论
23?25?9.914?4,用四格表资料的?2检 本例n=58 ,最小理论频数TRC=58(15?5?18?20)2?58?7.094 ??1 验专用公式 ??35?23?33?252(3)确定P值,做出推断结论。
2?(0.05,1)?3.84 ,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认
为两种治疗方案的总体缓解率不同。 4.答:(1)建立检验假设,确定检验水准 H0:B?C 两种方法的检测结果相同 H1:B?C 两种方法的检测结果不同 双侧 ??0.05
(2)计算统计量,做出推断结论
本例b+c=12<40,用配对四格表资料的?2检验校正公式
2(10?2?1)?2??4.083 ??1
10?2(3)确定P值,做出推断结论。
?2?4.083,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认为
两种方法的检测结果不同。 5.答:(1)建立检验假设,确定检验水准 H0: 两种检测指标间无关联 H1: 两种检测指标间有关联 双侧 ??0.05
(2)计算统计量,做出推断结论
A2本例为双向无序R×C表,用式 ??n(??1) 求得
nRnC2??250(222227?40???????1)?129.827?130108?40108?130108?80115?130115?8052182702202552602??(3?1)?(3?1)?4
(3)确定P值,做出推断结论。
?2?129.8,P<0.05, 在??0.05的检验水准下,差异有统计学意义,可以认为
两种检测指标有关联,进一步计算Pearson列联系数,以分析其关联密切程度。
?2?0.5846,可以认为两者关系密切。 列联系数 rp?2n??第七章 非参数检验习题
一、 选择题
1.配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( )。 A.正秩和与负秩和的绝对值不会相差很大 B.正秩和与负秩和的绝对值相等
C.正秩和与负秩和的绝对值相差很大 D.不能得出结论 E.以上都不对
2.设配对资料的变量值为X1和X2,则配对资料的秩和检验是( )。 A.把X1和X2的差数从小到大排序 B.分别按X1和X2从小到大排序 C.把X1和X2综合从小到大排序 D.把X1和X2的和数从小到大排序 E.把X1和X2的差数的绝对值从小到大排序 3.下列哪项不是非参数统计的优点( )。 A.不受总体分布的限制 B.适用于等级资料 C.适用于未知分布型资料 D.适用于正态分布资料 E.适用于分布呈明显偏态的资料 4.等级资料的比较宜采用( )。
A.秩和检验 B.F检验 C.t检验 D.?2检验 E.u检验
5.在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( )。 A.两样本均数相同 B.两样本的中位数相同 C.两样本对应的总体均数相同 D.两样本对应的总体分布相同 E.两样本对应的总体均数不同
6.以下检验方法中,不属于非参数检验方法的是( )。
A.Friedman检验 B.符号检验 C.Kruskal-Wallis检验 D.Wilcoxon检验 E.t检验
7.成组设计两样本比较的秩和检验中,描述不正确的是( )。 A.将两组数据统一由小到大编秩
B.遇有相同数据,若在同一组,按顺序编秩 C.遇有相同数据,若不在同一组,按顺序编秩 D.遇有相同数据,若不在同一组,取其平均值
E.遇有相同数据,若在同一组,取平均致词 二、简答题
1.简要回答进行非参数统计检验的适用条件。 2.你学过哪些设计的秩和检验,各有什么用途? 3. 试写出非参数统计方法的主要有缺点。 三、计算题
1.对8份血清分别用HITAH7600全自动生化分析仪(仪器一)和OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH),结果见表7-1。问两种仪器所得结果有无差别?
表7-1 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较
编号 仪器一 仪器二 1 100 120
2 3 4 5 6 7 8 121 220 186 195 150 165 170 130 225 200 190 148 180 171
2. 40名被动吸烟者和38名非被动吸烟者的碳氧血红蛋白HbCO(%)含量见表7-2。问被动吸烟者的HbCO(%)含量是否高于非被动吸烟者的HbCO(%)含量?
表7-2 吸烟工人和不吸烟工人的HbCO(%)含量比较
含量 很低 低 中 偏高 高
被动吸烟者
1 8 16 10 4
非被动吸烟者
2 23 11 4 0
合计 3 31 27 14 4
3. 受试者4人,每人穿四种不同的防护服时的收缩压值如表,问四种防护服对收缩压的影响有无显著差别?四个受试者的收缩压值有无显著差别?
表7-3 四种防护服与收缩压值
受试者编
防护服A 防护服B 防护服C 防护服D
号
1 2 3 4
115 122 110
135 125 130
140 135 136
135 120 130 130
120 115 120 第七章 非参数检验(答案)
一、选择题
1.A 2.E 3.D 4.A 5.D 6.E 7.C 二、简答题 1.答:(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能。 2. 答:(1)配对设计的符号秩和检验(Wilcoxon配对法)是推断其差值是否来自中位数为零的总体的方法,可用于配对设计差值的比较和单一样本与总体中位数的比较;(2)成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)用于完全随机设计的两个样本的比较,目的是推断两样本分别代表的总体分布是否
吸纳共同。(3)成组设计多样本比较的秩和检验(Kruskal-Wallis检验),用于完全随机设计的多个样本的比较,目的是推断两样本分别代表的总体的分布有无差别。(4)随机区组设计资料的秩和检验(Friedman检验),用于配伍组设计资料的比较。 3. 答:优点:(1)适用范围广,不受总体分布的限制;(2)对数据的要求不严;(3)方法简便,易于理解和掌握。 缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。
三、 计算题 1.解:
(1)建立检验假设,确定检验水准
H0:用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即Md?0 H1:Md?0
??0.05
(2)计算检验统计量T值
①求各对的差值 见表7-4第(4)栏。 ②编秩 见表7-4第(5)栏。
③求秩和并确定统计量T。T??5.5 T??30.5 取T?5.5。
(3)确定P值,做出推断结论
本例中n?8,T?5.5,查附表T界值表,得双侧P?0.05;按照??0.05检验水准,拒绝H0,接受H1。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。
表7-4 8份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较 编号 原法 新法 差值d 秩次 (1) (2) (3) (4)=(2)—(3) (5) 1 100 120 -20 -8 2 121 130 -9 -5 3 220 225 -5 -3.5 4 186 200 -14 -6 5 195 190 5 3.5 6 150 148 2 2 7 165 180 -15 -7 8 170 171 -1 -1
T??5.5 T??30.5
2、解:
(1)建立检验假设,确定检验水准
H0:被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布相同 H1:被动吸烟者的HbCO(%)与非被动吸烟者的HbCO(%)含量总体分布不同
??0.05
(2)计算检验统计量T值
①编秩
②求秩和并检验统计量
T1?1909,T2?1237.5,n1?39,n2?40,故检验统计量T?1909,因n1?39,需要用u检验;又因等级资料的相同秩次过多,故:
u?1909?39(79?1)2?0.539?40(79?1)123j3?3.417
(33?3)?(313?31)?(273?27)?(143?14)?(43?4)C?1??(t?tj)(N?N)?1??0.894379?79
uc?uC?3.4170.894?3.614
(3)确定P值,做出推断结论
uc?3.614?1.96
P?0.05,按??0.05检验水准,拒绝H0,接受H1,认为被动吸烟者的HbCO(%)
与非被动吸烟者的HbCO(%)含量总体分布不同。
表7-5 吸烟工人和不吸烟工人的HbCO(%)含量比较
人数 秩和
秩次范平均秩
含量 被动吸烟非被动吸烟
次 被动吸烟者 非被动吸烟者 合计 围
者 者
(7)=(2)×(8)=(3)×
(1) (2) (3) (4) (5) (6)
(6) (6)
很低 1 2 3 1~3 2 2 4 低 8 23 31 4~34 19 152 437 中 16 11 27 34~61 47.5 760 522.5 偏高 10 4 14 62~75 68.5 685 274 高 4 0 4 76~79 77.5 310 0 合计 39 40 79 — — 1909 1237.5
3.解:
关于四种防护服对收缩压的影响: (1)建立检验假设,确定检验水准
H0:穿四种防护服后收缩压总体分布相同 H1:4个总体分布不同或不全相同
??0.05
(2)计算统计量M值
①编秩②求秩和并计算检验统计量
6?15?9.5?9.5?10,M?(6?10)2?(9.5?10)2?(15?10)2?(9.5?10)2?41.5
4(3)确定P值,做出推断结论 T?处理组数k?4,配伍组数b?4查表,M0.05(4,4)?52,M?41.5?52,P?0.05,按??0.05检验水准不拒绝H0,尚不能认为不同防护服对收缩压影响有差别。 受试者编号
1 2 3 4
表7-5 关于四种防护服对收缩压的影响 防护服A 防护服B 防护服C 115 122 110 120
1 2 1 2 6
135 125 135 115
2.5 3 3 1 9.5
140 135 136 126
4 4 4 3 15
防护服D 135 120 130 130
2.5 1 2 4 9.5
收缩压 秩次 收缩压 秩次 收缩压 秩次 收缩压 秩次
Ti
关于四个受试者收缩压值的差别: (1)建立检验假设,确定检验水准
H0:四个受试者的收缩压值没有差别 H1:四个受试者的收缩压值不同
??0.05
(2)计算统计量M值
①编秩②求秩和并计算检验统计量
T?13.5?9?10?7.5?10
4M?(13.5?10)2?(9?10)2?(10?10)2?(7.5?10)2?19.5 (3)确定P值,做出推断结论
处理组数k?4,配伍组数b?4查表,M0.05(4,4)?52,M?19.5?52,P?0.05,
按??0.05检验水准不拒绝H0,尚不能认为四个受试者的收缩压值有差别。
表7-6 关于四个受试者收缩压值的差别
受试者编号
1 2 3 4
第八章 直线回归与相关习题
一、选择题
1.直线回归中,如果自变量X乘以一个不为0或1的常数,则有( )。 A. 截距改变 B. 回归系数改变 C. 两者都改变 D. 两者都不改变 E. 以上情况都有可能 2.如果直线相关系数r?1,则一定有( )。
A. SS总?SS残 B. SS残=SS回 C. SS总=SS回 D. SS总?SS回 E. 以上都不正确
3.相关系数r与决定系数r2在含义上是有区别的,下面的几种表述,哪一种最正确?( )。
A. r值的大小反映了两个变量之间是否有密切的关系 B. r值接近于零,表明两变量之间没有任何关系 C. r值接近于零,表明两变量之间有曲线关系 D. r2值接近于零,表明直线回归的贡献很小
E. r2值大小反映了两个变量之间呈直线关系的密切程度和方向 4.不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下:
地 区 编 号 1 2 3 4 ?? 17
碘含量(单位) 10.0 2.0 2.5 3.5 ?? 24.5 患病率(%) 40.5 37.7 39.0 20.0 ?? 0.0
研究者欲通过碘含量来预测地方性甲状腺肿的患病率,应选用( )。 A.相关分析 B.回归分析 C.等级相关分析
防护服A 收缩
压 115 122 110 120
秩次 2 4 1 3
防护服B 收缩压 135 125 135 115
秩次 3.5 2 3.5 1
防护服C 收缩压 140 135 136 126
秩次 4 2 3 1
防护服D 收缩压 135 120 130 130
Ti
秩次 4 1 2.5 2.5
13.5 9 10 7.5
D.?2检验 E.t检验
5.直线回归中X与Y的标准差相等时,以下叙述( )正确。 A. b?a B. b?r C. b?1
D. r?1 E. 以上都不正确
6.利用直线回归估计X值所对应Y值的均数可信区间时,( )可减小区间长
度。 A. 增加样本含量 B. 令X值接近其均数 C. 减小剩余标准差
D. 减小可信度 E. 以上都可以
7.有两组适合于作直线相关分析的实验资料(按专业知识都应取双侧检验),第1组资料:n1?5,r1?0.857;第2组资料:n2?8,r2?0.712。在没有详细资料和各种统计用表的条件下,可作出的结论是( )。 A.缺少作出明确统计推断的依据 B.因n2?n1,故r2有显著性意义 C. 因r1?r2,故r1有显著性意义 D. r1、r2都有显著性意义 E. r1、r2都没有显著性意义
8.某监测站同时用极谱法和碘量法测定了水中溶解氧的含量,结果如下。若拟用极谱法替代碘量法测定水中溶解氧的含量,应选用( )。 水 样 号 1 2 3 4 5 6 7 8 9 10 极谱法(微安5.3 5.2 2.1 3.0 3.3 2.8 3.4 6.8 6.3 6.5 值)
碘量法5.85 5.80 0.33 1.96 2.77 1.58 2.32 7.79 7.56 7.98 (mg/L)
A.相关分析 B.回归分析 C.等级相关分析 D.?2检验 E.t检验
9.对两个数值变量同时进行相关和回归分析,r有统计学意义(P?0.05),则
A.b无统计学意义 B.b有统计学意义 C.不能肯定b有无统计学意义 D.以上都不是
10.某医师拟制作标准曲线,用光密度值来推测食品中亚硝酸盐的含量,应选用的统计方法是
A.t检验 B.回归分析 C.相关分析 D.?2检验 11.在直线回归分析中,回归系数b的绝对值越大
A.所绘制散点越靠近回归线 B.所绘制散点越远离回归线 C.回归线对x轴越平坦 D.回归线对x轴越陡
12.根据观测结果,已建立y关于x的回归方程y?2.0?3.0x,x变化1个单位,y变化几个单位?
A.1 B.2 C.3 D.5 13.直线回归系数假设检验t,其自由度为
A. n?2 B.n?1 C.2n?1 D.2(n?1) E.n 二、简答题
1.详述直线回归分析的用途和分析步骤。 2.直线相关与直线回归的联系和区别。
3.简述直线回归分析的含义,写出直线回归分析的一般表达式,试述该方程中各个符号的名称及意义。
4.写出直线回归分析的应用条件并进行简要的解释。 5.什么是曲线拟合?它一般分为哪两类? 三、计算题
1.某研究人员测定了12名健康妇女的年龄X(岁)和收缩压Y(KPa),测量数据见表1,
X(岁)
表8-1 12名健康妇女年龄和收缩压的测量数据
59 42 72 36 63 47 55 49 38 42 68 60 19.616.621.215.719.817.019.919.315.318.620.120.5
Y(KPa)
0 7 8 3 6 7 3 3 3 7 9 9
?X?631,?X2?34761,?Y?224.25,?Y2?4234.141,?XY?12026.77
(1)求X与Y之间的直线回归方程.
(2)用方差分析的方法检验X与Y之间的直线关系是否存在? (3)估计总体回归系数?的95%可信区间。
2.用A、B两种放射线分别局部照射家兔的某个部位,观察照射不同时间放射性
急性皮肤损伤程度(见表8-2)。问由此而得的两样本回归系数相差是否显著?
表8-2 家兔皮肤损伤程度(评分)
时间(分)X 3 6 9 12
皮肤损伤程度 A Y1 1.0 2.5 3.6 10.0
B Y2 2.3 5.0 7.6 15.2
15 18 21
15.3 25.0 32.3
18.0 27.6 40.2
3.某学校为了调查学生学习各科目之间的能力迁移问题,特抽取了15名学生的历史与语文成绩见表,请计算其相关程度并进行假设检验。
表8-3 15名学生历史与语文成绩
学生编
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
号
历史X 88 95 83 93 76 78 85 84 90 81 80 73 79 72 95 语文Y 78 85 83 90 75 80 83 85 85 82 75 80 86 75 90 4.在高血压脑出血微创外科治疗预后因素的研究中,调查了13例的术前GCS值与预后,见表,试作等级相关分析。
表8-4 高血压脑出血微创外科治疗术前GIS值与预后评测
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 术前GSC值 7.0 11.4.0 6.0 11.14.5.0 5.0 13.12.14.6.0 13.
0 0 0 0 0 0 0
预后评测分6.0 7.0 2.5 5.4 8.3 9.0 3.9 4.6 8.6 7.9 9.2 5.6 8.7
值
第八章 直线回归与相关(答案)
一、选择题
1.B 2.C 3.D 4.B 5.B 6.E 7.A 8.B 9.B 10.B 11.D 12.C 13.A 二、问答题
1. 答:用途:①定量描述两变量之间的依存关系:对回归系数b进行假设检验时,若P??,可认为两变量间存在直线回归关系。②利用回归方程进行预测:把预测因子(即自变量X)代入回归方程对预测量(即因变量Y)进行估计,即可得到个体Y值的容许区间。③利用回归方程进行统计控制:规定Y值的变化,通过控制X的范围来实现统计控制的目标。
分析步骤:①首先控制散点图:若提示有直线趋势存在,可作直线回归分析;若提示无明显线性趋势,则根据散点图分布类型,选择合适的曲线模型,经数据变换后,化为线性回归来解决。若出现一些特大特小的异常点,应及时复核检查。
??a?bX,其中:b?lXY,a?Y??bX?③对回归系数b进②求出直线回归方程YlXX行假设检验:方差分析,基本思想是将因变量Y的总变异SS总分解为SS回归和
SS剩余,然后利用F检验来判断回归方程是否成立。t
检验:基本思想是利用样本回归系数b与总体均数回归系数?进行比较来判断回归方程是否成立,实际应用中用r的检验来代替的检验。④直线回归方程的图示
??y)2SS回归(y?22⑤回归方程拟合效果评价:决定系数R?,如R?0.9说明回?2?(y?y)SS总归能解释90%,此方程较好
2
校正决定系数Radj⑥直线回归方程的区间估计:总体回归系数?的区间估计;?Y?的区间估计;个体值Y的容许区间;
2. 答:区别:(1)资料要求不同 相关要求两个变量是双变量正态分布;回归要求应变量Y服从正态分布,而自变量X是能精确测量和严格控制的变量。(2)统计意义不同 相关反映两变量间的伴随关系这种关系是相互的,对等的;不一定有因果关系;回归则反映两变量间的依存关系,有自变量与应变量之分,一般将“因”或较易测定、变异较小者定为自变量。这种依存关系可能是因果关系或从属关系。(3)分析目的不同 相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出来;回归分析的目的则是把自变量与应变量间的关系用函数公式定量表达出来
联系:(1)变量间关系的方向一致 对同一资料,其r与b的正负号一致。 (2)假设检验等价 对同一样本,tr?tb,由于tb计算较复杂,实际中常以r的假设检验代替对b的检验。(3)r与b值可相互换算 b?r相互解释。
3. 答:直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。
一般表达式:Yi????Xi??i,Xi和Yi分别为第i个体的自变量和应变量取值。?称为截矩,为回归直线或其延长线与y轴交点的纵坐标。?称为回归直线的斜率。?i为误差。
4. 答:线性回归模型的前提条件是线性、独立、正态与等方差。
(1) 线性是指任意给定的X所对应的应变量Y的总体均数与自变量X呈线性
关系。 (2) 独立是指任意两个观察单位之间相互独立。否则会使参数估计值不够准确
和精确。 (3) 正态性是指对任意给定的X值,Y均服从正态分布,该正态分布的均数
就是回归直线上与X值相对应的那个点的纵坐标。 (4) 等方差是指在自变量X的取值范围内,不论X取什么值,Y都有相同的
方差。 5. 答:曲线拟合是指选择适当的曲线类型来拟合观测数据,并用拟合的曲线方
lYY。(4)相关和回归可以lXX程分析两变量间的关系。
曲线拟合一般分为两类:曲线直线化法和直接拟合曲线方程。 三、 计算题 1. 解: (1)lXX??X?2(?X)2nn6312?34761??1580.92
12?12026.77?631?224.25?234.96 12lXY??XY?(?X)(?Y)X?52.58,Y?18.69 b?lXY234.96??0.149,a?Y?bX?18.69?0.149?52.58?10.856 lXX1580.92??10.856?0.149X。 故所求直线回归方程为Y(2)H0:??0,即认为健康妇女的年龄与收缩压之间不存在直线关系 H1:??0,即认为健康妇女的年龄与收缩压之间存在直线关系 ??0.05 SS总?lYY??Y?2(?Y)2n224.252?4234.141??43.469,v总?n?1?11 12SS回归?blXY2lXY234.962???34.920,v回归?1 lXX1580.92SS剩余?SS总?SS回归?43.469?34.920?8.549,v剩余?n?2?10 F?MS回归MS剩余?34.9201?40.85。 8.54910由v1?1,v2?10查表得P?0.01,按??0.05的水准拒绝H0,接受H1。故可认为健康妇女的年龄与收缩压之间存在直线关系。 (3)Sb?MS剩余lXX?8.549101580.92?0.023,t0.05/2,10?2.228,则总体回归系数?的95%可信区间为(0.149?2.228?0.023,0.149?2.228?0.023)?(0.098,0.200)。 2. 解: (1)分别求出X与Y1、Y2之间的回归直线
Y1~X:Y1?1.7929X?8.7,r2?0.9277(P?0.05)
已知菌丛和模型性状显著且稳定的实验动物;(3)选用解剖、生理特点符合实验目的的实验动物;(4)选用存在某些特殊反应的不同种系实验动物;(5)选用人兽共患疾病的实验动物。
2、答:此情况为单处理因素实验设计,为控制非处理因素小白鼠窝别影响,应采用随机区组设计(配伍组设计)。其方差分析表的部分内容如下: 随机区组设计的方差分析表 变异来源 总变异 处理组 区组间 误差
df
SS
MS
S
第十三章 临床试验设计概述习题
一、选择题:
1、在双盲试验中,始终处于盲态的是( ) A. 医务人员 B. 患者
C. 医务人员和患者 D. 数据分析人员 E. 以上所有人员
2、在研究药物的有效性时,研究者让对照组服入与研究药物外观、性状完全相同的淀粉片,其主要目的是( )。
A. 比较两种片剂的有效性 B. 研究淀粉片的治疗作用 C. 避免患者心理因素的影响 D. 减少选择性偏倚 E. 评价试验药物的安全性 二、问答题:
1、临床试验设计的特点是什么?
2、为确定某种治疗消化性溃疡药物的起始用药剂量,将20例新诊断的高血压患者按就诊的先后顺序依次分入低、中、高三个剂量组,经一段时间治疗后,通过比较三组患者的治疗后消化性溃疡的面积减少率来判断该药物的剂量。请根据以上描述回答:
(1)在这项研究中,研究的三要素分别是什么?
(2)请从统计学角度对此研究进行评价,并对此研究设计提出改进意见。
第十三章 临床试验设计概述(答案) 一、选择题: 1、E 2、C 二、问答题:
1、答:(1)临床试验设计不能像动物实验设计那样随意对研究对象施加干预措施,且较难达到样本完全随机化,因此,难以制定完全符合统计学要求的试验设计方案。(2)开展临床试验,医德是一个很敏感的问题,应当维护病人的权益,贯彻“知情同意”的原则;(3)疾病的发生是生物、社会、心理等诸多
因素作用的结果。因此,临床试验的观察结果除受处理因素影响外,还受许多非处理因素的影响;(4)临床试验除了随机对照试验是实验性研究外,多数是观察性研究,难以控制复杂的非处理因素。(5)临床试验往往样本含量小,个体差异大。(6)病人的依从性是临床试验成败的重要环节。(7)临床试验常采用多中心的协作研究。(8)临床试验一般按患者入院(就诊)顺序进行试验,往往存在“时间差”问题,在统计处理时应设法消除“时间差”对试验结果的影响。(9)临床试验易出现病例失访,使资料存在截尾值,分析时可用寿命表法。(10)检验效能对临床试验结果的可信度影响很大,设计时必须估算样本含量,以保证检验效能在75%以上。(11)临床试验的资料多为非正态分布,统计分析时应注意分析方法的适用条件。
2、答:(1)本研究设计的三要素:处理因素:降压药物的剂量;受试对象:高血压患者;试验效应:舒张压下降值。
(2)评价:本设计存在的缺陷为:随机化不严格,本研究中所采取的方法并非严格的随机化,可能引入其它混杂变量;样本量太少,每组3例不足以说明临床剂量问题。
改进意见:根据先期研究资料,重新计算样本量,对病例严格地按照随机化方法分配到各组。
第十四章 多元线性回归分析习题
一、选择题
1.可用来进行多元线性回归方程的配合适度检验是( )
2A . t检验 B. F检验 C. X 检验 D.u检验
2.多元线性回归分析中,反应回归平方和在应变量Y的总离均差平方和中所占比重的统计量是:( )
A.确定系数 B.复相关系数 C.回归系数 D.相关参数 二、简答题
1.试写出多元线性回归模型极其参数意义,并描述其用途。 2.多元线性回归模型应满足的条件?
第十四章 多元线性回归分析(答案)
一、选择题 1.B 2.A 二、简答题
1.多元线性回归模型:Y??0??1X1????mXm??
?0:常数项。
?1,?2,??m:待定参数,又称偏回归系数,为在其他自变量固定的条件下,自
变量Xi改变一个单位时,因变量Y的平均改变量。 多元线性回归的用途: (1)、影响因素分析 (2)、估计与预测 (3)、统计控制 (4)、回归推断
2. (1)Y与X1,X2,?Xm之间具有线性关系; (2)各观测值Y之间相互独立; (,2,?,n)jj?1(3)残差?服从均数为0、方差为?2的正态分布,它等价于任意一组自变量
X1,X2,?Xm,应变量Y均服从正态分布且方差齐。
第十五章 Logistic回归分析习题
一、选择题
1. logistic回归适用于应变量为( )
A.数值变量资料 B.分类变量资料 C.一般资料 D.正态分布资料
2.logistic回归属于( )回归
A.概率型非线性回归 B.概率型线性回归 C.非概率型非线性回归 D.非概率型线性回归 二、简单题
1.试写出logistic回归中?0,?j的流行病学意义.
2.logistic回归的用途有哪些?
第十五章 Logistic回归分析(答案)
一、选择题 1.B 2.A 二、简答题
1. 常数项?0的流行病学意义是:当各种暴露因素为0时,个体发病与不发病概率之比的自然对数值.偏回归系数?j(j=1,2,...,m)表示在其他自变量固定的条件下,第j个自变量每改变一个单位时logit(P)的该变量.它与比数比OR有对应关系.
2. (1)流行病学危险因素分析 (2)临床实验数据分析
(3)分析药物或毒物的剂量反应4,预测与判别
第十六章 生存分析习题
一、选择题:
1.研究某种死因对居民生命的影响,最优方法是:
A 计算死因别死亡率 B 计算年龄组死因死亡率 C 计算年龄组病死率 D 编制去死因寿命表 E 计算标准化死因死亡率
2. 在人口分析和人口预测时,经常需要确定人口的死亡率。但是,由于死亡率受社会、经济、文化及医疗卫生条件等诸因素的影响,存在一定的波动。同时,在一些人口资料不完整或人口数量太少的地区,也得不到有关的资料。这时,可以借助一些数理统计的方法,将世界各地的大量的寿命表汇集起来,进行分析,归纳出几种死亡模式,对各种模式按照其不同的平均预期寿命水平编制出一组寿命表,供人们参考,这种寿命表是:
A 队列寿命表 B 现时寿命表 C 简略寿命表 D 去死因寿命表 E 模型寿命表
3. 在寿命表中,用于评价居民健康水平的最优指标是:
A 生存人年总数 B 生存人年数 C 预期寿命 D 死亡概率 E 尚存人数 4. 寿命表的用途,不包括下列哪一项:
A 评价国家或地区居民健康水面 B 描述疾病的时间分布特征 C 进行人口预测 D 研究人口再生产状况 E 研究人群的生育、发育及疾病发展规律 5.生存分析中的生存时间为
A.确诊至死亡的时间 B.出院至失访的时间 C.手术至死亡的时间 D.观察开始至观察终止的时间 E. 观察开始至失访的时间
6. 关于肝癌治疗的随访资料作生存分析,可当作截尾值处理的是
A.死于肝癌 B.死于意外死亡 C.死于其它肿瘤 D.a.c都是 E. b.c都是 二、问答题:
1、生存资料中,截尾数据的含义及其出现的原因是什么? 2、Cox回归模型中,偏回归系数?i的意义是什么? 3、Cox回归模型与logistic回归模型相比有何不同? 三、计算题:
1、为研究急性淋巴细胞性白血病病人的生存时间与其预后因素的关系,某
研究者测得50例急性淋巴细胞性白血病病人的生存时间(单位)及有关预后因素资料,x1为入院时白细胞数(?109/L),x2为淋巴结浸润度(分为0、1、2三级),x3为缓解出院后的巩固治疗(有巩固治疗时x3=1,否则x3=0),随访的终点事件是死于白血病,原始数据的整理格式见下表。试对此资料作cox回归分析。
表 急性淋巴细胞性白血病病人的生存时间与其预后因素数据 编号 x1
1 2.50 2 1.20 3 173.00 4 3.50 5 119.00 6 39.70 7 10.00 8 62.40 9 502.20 10 2.40 11 4.00 12 34.70 13 14.40 14 28.40 15 2.00 16 0.90 17 40.00 18 30.60 19 6.60 20 5.80 21 21.40 22 6.10 23 2.80 24 2.70 25 2.50 26 4.70 27 6.00 28 128.00 29 3.50 30 35.00 31 62.20 32 2.00 33 10.80 34 8.50 35 21.60 36 2.00 37 2.00 38 2.00 39 3.40 40 4.30 41
5.10 x2 x3
0.00 0.00 2.00 0.00 2.00 0.00 0.00 0.00 2.00 0.00 0.00 0.00 2.00 0.00 0.00 0.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 2.00 0.00 2.00 0.00 0.00 1.00 2.00 0.00 2.00 0.00 0.00 0.00 0.00 1.00 2.00 1.00 0.00 1.00 0.00 0.00 2.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 2.00 1.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 1.00 0.00 1.00 2.00 1.00 0.00 1.00 0.00 1.00 2.00 1.00 0.00 1.00 0.00 1.00
时间 结局 3.40 1.00 3.73 1.00 3.73 1.00 3.83 1.00 4.00 1.00 4.03 1.00 4.17 1.00 4.20 1.00 4.20 1.00 5.00 1.00 5.27 1.00 5.67 1.00 7.07 1.00 7.26 1.00 7.33 1.00 7.53 1.00 7.53 1.00 7.60 1.00 7.67 1.00 7.67 1.00 8.30 1.00 8.33 1.00 8.33 1.00 8.80 1.00 9.23 1.00 11.00 1.00 11.77 1.00 11.83 1.00 11.83 1.00 11.97 1.00 13.16 1.00 14.83 1.00 15.17 1.00 18.23 1.00 18.23 1.00 19.16 0.00 20.17 0.00 20.17 0.00 20.17 0.00 20.57 1.00 21.00
1.00
正在阅读:
卫生统计学 医学统计学 习题11-09
中学教职工参加各种进修培训有关规定05-05
怎样成为一名优秀英语教师07-21
制冷与空调设备运行操作模拟考试题库含答案06-10
加氢裂化装置操作工06-05
第十三章财务管理05-08
【最新】行政办公室年度总结范文-word范文 (4页)06-08
儿童沙盘使用说明书09-09
药剂学 练习题03-27
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 统计学
- 习题
- 医学
- 卫生