广医大医学统计学题库(研一) - 图文

更新时间:2024-01-12 18:06:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

单选题:

1 下面的变量中是分类变量的是

A.身高 B.体重 C.年龄 D.血型 E.血压 2 下面的变量中是是数值变量的是

A.性别 B.年龄 C.血型 D.职业 E 疗效 3.随机事件的概率 P 为

A.P=0 B. P=1 C. P=-0.5 D. –0.5

C. 总体中随机抽取的一部分 D. 总体中按比例分配的一部分 E. 总体中信息明确的一部分

5.若以发汞含量大于 2.6ug/kg为异常,调查某地 1000 人中多少人属于异常,这资料可看作 A.计量资料 B. 计数资料 C. 等级资料 D. 实验资料 E. 以上均不对 6. 统计工作的步骤是:

A. 作假设、计算统计量、查界值表和作结论 B. 整理资料、分析资料、假设检验

C.统计设计、收集资料、整理和分析资料 D. 设立对照组、估计样本、重复试验 E. 统计描述、区间估计、假设检验

7. 反映计量资料集中趋势的指标是____ 。

A. 标准差 B. 标准误 C. 率 D. 全距 E. 均数 8. 编制频数表中错误的做法是____ 。 A. 找出最大值和最小值, 计算极差

B. 定组距, 常用等组距, 一般分 8~15 组为宜 C. 写组段时组段可重叠,如“2~4, 4~6,?” D. 用划记法计频数

E. 第一个组段应包括变量最小值,最后一个组段应包括变量最大值 9.在描述资料的变异程度时,最宽的范围是___。 A 均数?标准差 B 极差 C 四分位数间距 D 95%的参考值范围 E P5~P95 间距

10.比较 20 头河马体重和 20 只小白鼠体重两组数据变异程度大小宜采用____ A. 变异系数(CV) B.方差 C. 极差(R) D. 标准差(S) E. 四份位数间距

11. 对血清滴度资料表示平均水平的最常用统计量是:: A.均数 B.中位数 C.几何均数 D.全距 E.标准差

12.描述一组偏态分布资料的变异程度时,适宜的统计量是: A. 变异系数(CV) B. 方差 C. 极差(R) D. 标准差(S) E. 四份位数间距

13关于标准正态分布曲线下的面积,错误的是____ A. -1.96 到 1.96 间曲线下面积是 95% B. 1.96 到 2.58 间曲线下面积是 2% C. 大于 1.645 的曲线下面积是 2.5% D. -1.96 到-1.645 间曲线下面积是 2.5%

E. 大于 1.96 的曲线下面积为 2.5%

14.??1.96?范围内占正态曲线下面积的____ 。 A. 80% B. 99% C. 95% D. 5% E. 47.5%

15. 正态曲线下总面积为____ 。

A. 95% B. 99% C. 50% D. 1% E. 100%

16. 抽样误差是由

A. 计算引起 B. 测量引起 C. 抽样引起 D.采样结果不准引起E.试剂、仪器未经校正引起 17.在抽样研究中,均数的标准误。 A. 比标准差大 B. 比标准差小 C.与标准差无关 D.比均数E. 与标准差相等 18. 配对设计 t 检验的统计假设为 A. 两样本来自同一总体 B. 差数的均数来自??0的总体 C. 差数的均数来自??0的总体 D. 差数的均数来自??0的总体 E. 差数的均数来自??0的总体

19. 假设检验的步骤是

A 建立假设、选择和计算统计量、确定 P 值和判断结果 B 建立无效假设、建立备择假设、确定检验水准

C 确定单侧检验或双侧检验、选择 t 检验或 u检验、估计 I类错误和 II类错误 D 计算统计量、确定 P 值,做出推断结论 E 以上都不对

20. 在比较两样本均数的假设检验中,结果 t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。正确的结论是

A 两样本均数不同

B 两样本均数差异很大 C 两总体均数差异很大

D 两样本均数来自同一总体 E 两样本均数来自不同总体 21. 区间 X?2.58S?的含义是

X?A.99%的总体均数在此范围内 B.样本均数的 99%可信区间

C.99%的样本均数在此范围内 D.总体均数的 99%可信区间

22. 通常可采用以下那种方法来减小抽样误差。 A.减小样本标准差 B.减小样本含量 C.增大样本含量 D.以上都不对

23. 关于假设检验,下列那一项说法是正确的 A.单侧检验优于双侧检验

B.采用配对 t 检验还是成组 t 检验是由实验设计方法决定的 C.检验结果若 P值大于 0.05,则接受 H0 犯错误的可能性很小 D.用 u 检验进行两样本总体均数比较时,要求方差齐性

24. 两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小 A.??0.05 B.??0.01 C.??0.10 D.??0.20

25. 甲、 乙两人分别从随机数字表抽得 30个 (各取两位数字) 随机数字作为两个样本, 求得

2,则理论上 X1,S,X2,S22A.X1?X2,S12?S2

???21?B.作两样本 t 检验,必然得出无差别的结论 C.作两方差齐性的 F检验,必然方差齐

D.分别由甲、乙两样本求出的总体均数的 95%可信区间,很可能有重叠 26. 作两样本均数比较的 t 检验时,正确的理解是: A. 统计量 t 越大,说明两总体均数差别越大。 B. 统计量 t 越大,说明两总体均数差别越小。

C. 统计量 t 越大,越有理由认为两总体均数不相等。 D. P 值就是?? E. P 值不是?,且总是比?小。

27.将 90 名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的 差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个差值样本比较的 t 检验 B. 作三个差值样本比较的方差分析

C. 作配伍组设计资料的方差分析 D. 作两两比较的 t 检验 E. 以上都不对

28.当组数等于 2 时,对于同一资料,方差分析结果与 t 检验的结果:____. A.完全等价且 F=t. B.方差分析结果更准确 C.t 检验结果更准确.D.完全等价且 t=F

E.以上都不对 29. 方差分析中

A. F 值可能是负数 B. F 值不可能是负数

C. 组间离均差不会等于组内离均差 D. 组间离均差不会小于组内离均差 E. 组间离均差不会大于组内离均差 30.方差分析的目的:

A、 比较均分 B、比较标准差C、比较均方 D、比较离均差平方和 E、比较变异系数 31.完全随机设计的方差分析中,必然有 A、 SS 组内

C、 SS 总=SS 组内+SS 组间 D、 MS 总=MS 组内+MS 组间 E、 MS 组内

32. 在多个样本均数比较的方差分析中,获得 P>0.05 时,结论是 A. 证明各总体均数都不相等 B. 证明各总体均数不全相等

C. 可认为各总体均数不全相等 D. 可认为各总体均数相等 E. 以上都不是

33.完全随机设计、随机配伍组设计的总变异分别可分解成几个部分? A 2,2 B 2,3 C 3,3 D 3,4 E 3,2 34. 方差分析要求____ 。 A.各个总体方差相等 B.各个样本均数相等 C.各个样本来自同一总 D.各个总体均数相等 E.两样本方差相等

35. 方差分析中的组间均方表示____ 。 A. 表示全部变量值的变异大小 B. 仅仅表示抽样误差的大小 C. 仅仅表示处理作用的大小

D. 表示处理作用与抽样误差两者的大小 E. 以上都不对

36.方差分析中,对 3 个样本均数比较,获得 P<0.05 时,结论是____ 。 A.说明 3 个总体均数都不相等 B.说明 3 个总体均数不全相等 C.说明 3 个样本均数都不相等 D.说明 3 个样本均数不全相等 E.以上都不是

37.计算麻疹疫苗接种后血清检查的阳转率,分母为: A.麻疹易感儿数 B.麻疹患儿人数 C.麻疹疫苗接种人数

D.麻疹疫苗接种后阳转人数 E.阳性人数

38.已知佛山市和中山市两地肺癌各年龄别死亡率及两地总的死亡率,欲比较两地总死亡率的高低, 应正确选用的分析方法是

A.直接比较两地总的死亡率 B.分别比较各年龄别死亡率

C.计算标化率比较 D.不能进行比较 E.以上都不对

39. 欲描述疾病发生水平,适宜的指标是 A.发病率 B.死亡率 C.病死率 D.治愈率 E.2 年生存率

40. 标准化率反映了事物发生的____。 A. 实际水平 B. 相对水平 C. 绝对水平 D. 真实状态 E. 研究总体的水平 41. 标准化率适用于____ 。 A.比较两地的年龄别死亡率 B.比较两矿山年轻人的患病率 C.比较两工厂老工人的死亡率

D.欲比较两医院的总治愈率,但两医院的重病号人数比率不相同 E.欲比较两医院的粗治愈率,但两医院的医疗水平不相同 42. 对合计率进行标准化的目的是____。 A. 消除内部构成的差异,使率具有可比性

B. 将率变成实际水平

C. 使大的率变小,小的率变大 D. 使率能够在任意两组中对比 E. 以上都不对

43.已知深圳市和广州市两地胃癌各年龄别死亡率及总死亡率,欲比较两地胃癌死亡的高低,最好的 分析方法是

A.直接比较两地总死亡率 B.分别比较各年龄别死亡率

C.选用间接标化法计算标化率比较 D.选用直接标化法计算标化率比较 E.进行两地总死亡率差异的假设检验

44.经调查获知甲乙两地的冠心病粗死亡率均为 4/105,经统一年龄构成后,甲地标化率为 4.5/105,乙地为 3.8/105。因此认为:_____

A.甲地人群较乙地年轻. B.乙地人群较地年轻

C.甲地的诊断较乙地准确. D.乙地的诊断较甲地准确 E.标化率符合实际

45.某医师治疗了两例视网膜炎患者,1 例有效,下列哪项说法是错误的:_____ A. 有效率为 50%. B.最好用绝对数表示

C.必须用率表示时,应同时给出其可信区间 D.分母太小,用相对数不可靠. E.不能得知总体有效率

46、描述分类变量资料的相对数主要包括 A、构成比、率、相对比 B、百分率、千分率、万分率 C、百分比、千分比、万分比 D、发病率、患病率、感染率 E、出生率、死亡率、增加率

47.调查某地居民 1600 人,得蛔虫感染率为 50%,则其总体率的 95%可信区间为:____ A.47.55~52.45%. B.48.75~51.25%

C.45~55%. D.49.68~50.32% E.据此资料不可推知

48. B 区胃癌总死亡率高于 A 区,但标化后 A区 高于 B 区,这是因为 A , A区总人口多于 B 区所致 B , B 区总人口多于 A 区所致 C , A区老龄人构成较 B 区多所致 D , B 区老龄人构成较 A 区多所致 E ,总死亡率与年龄别人口构成无关

49.平均发展速度实质是发展速度的_____表示。 A.中位数 B.均数 C.几何均数 D.众数 E.以上都不对

50. 对分类资料作分析时,正确的是

A.一组资料内各类构成比之和为 100%,而率无此关系

E 样本是总体中精心挑选出来的一部分

142. 以下关于概率的定义中错误的是 A. 当概率小于 0.05, 则为不可能事件 B. 当概率等于 1, 则为必然事件

C. 当概率在 0 至 1之间时,为随机事件

D. 当重复实验次数足够大时, 事件发生频率接近概率 E. 当概率等于零, 则为非随机事件

143. 频数表不能

A. 反映频数分布的特征 B. 方便进一步统计分析计算 C. 便于发现异常值

D. 精确估计算术均数的值 E. 用于分类资料

144. 在描述定量资料的集中趋势时, 以下论述中错误的是 A. 均数适宜于对称分布资料

B几何均数和中位数都适宜于正偏倚分布

C. 同一正偏倚分布资料, 估计的均数值小于中位数值 D. 对称分布资料的均数值等于中位数值

E. 几何均数特别适宜于细菌学和免疫学检测指标的描述

145. 用大量来自同一总体的独立样本对总体参数作估计时,关于 95%可信区(CI),正确的说法是 A. 大约有 95%样本的 95%CI覆盖了总体参数

B. 对于每一个 95%CI而言,总体参数约有 95%的可能落在其内 C. 各个样本的 95%CI是相同的

D. 对于每一个 95%CI而言,有 95%的可能性覆盖总体参数 E. 以上说法都不对

146. 在假设检验中,关于 P 值与?值,下列说法不正确的是 A. ?值是决策者事先确定的一个可以忽略的、小的概率值

B. P 值是在 H0 成立的条件下,出现当前值以及更极端状况的概率 C. ?值并不一定要取 0.05, 根据实际需要甚至可以取到 0.15

D. 在同一次假设检验中,作单侧检验时所得 P 值比作双侧检验时所得 P 值小 E. ?值越小,所得结论越可靠

147. 当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是 A.完全等价且 F=t

B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且 t=F

E.以上都不对

148下列关于方差分析的陈述中正确的是

A. 方差分析用于比较各组的总体方差是否相等

B. 方差分析结果有统计学意义表明各样本均数来自同一总体 C. 方差分析中判断 F 值相对应的 P 值时需查双侧界值表 D. 方差分析得到的 F 值越大, 表明总体均数差别越大 E. 方差分析得到的 F 值越小, 越没有理由怀疑 H0 成立

149. 调查某疫苗在儿童中接种后的预防效果,在某地全部 1000 名易感儿童中进行接种,经一定时间后从中随机抽取 300名儿童做效果测定,得阳性人数228 名。若要研究该疫苗在该地儿童中的接种效果,则

A. 该研究的样本是 1000 名易感儿童 B. 该研究的样本是 228 名阳性儿童 C. 该研究的总体是 300 名易感儿童 D. 该研究的总体是 1000 名易感儿童 E. 该研究的总体是 228 名阳性儿童 150. Poisson分布独有的特征是

A. 离散型分布 B. 参数是总体均数

C. 方差等于均数 D. 当样本较小时是偏倚分布 E. 当样本足够大时近似正态

151.在比较两个率时,进行标准化的目的是 A.使两个率之间的差异减小

B. 使两个率更能代表二人群的实际水平 C. 使两个率更能代表二人群的相对水平 D任两个率进行比较都必须先进行标准化 E. 代替假设检验发现两个率之间的差别

152. 用 A法和 B 法分别检测 100名确诊的癌症病人,A法的阳性率为 pA,B 法的阳性率为 pB。检验 两种方法阳性率差异的方法应采用 A. 检验两样本率是否相等的 u检验 B. 检验两总体率是否相等的 u检验 C. 检验两样本率是否相等的χ2 检验 D. 检验两总体率是否相等的χ2 检验

E.两非独立样本的总体率是否相等的χ2 检验 153.两独立样本比较的秩和检验结果判定为 A. T越大,P 越大 B.T越大, P 越小

C. T值在界值范围内, P 小于相应的? D.T值在界值范围内,P 大于相应的? E.以上都不对

154. 关于基于秩次的非参数检验, 下列说法错误的是 A.符号秩和检验中,差值为零不参加编秩

B. 随机区组设计资料的秩和检验中, 各组混合编秩

C. 当符合正态假定时, 非参数检验犯 II类错误的概率较参数检验大 D. 当样本足够大时, 秩和分布近似正态

E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异

155. 为比较某地两年几种疾病的患病率, 可采用 A. 直方图 B.复式直条图 C. 线图 D. 构成比直条图 E. 圆图 156. 回归分析是研究

A. 两变量 X, Y 变化的关联性 B. 两变量 X, Y 变化的方向性

C. 因变量依赖自变量变化的数量关系 D. 两变量变化的紧密程度

E. 一个变量对另一个变量的相关比例

157. 为减少测量顺序对比较新药与常规药治疗结果的影响, 作统计设计时最好应采用以下哪项措施

A. 设对照组 B. 随机化安排

C.增加实验次数 D盲法E. 以上都不行 158. 关于寿命表, 以下正确的陈述是

A. 现时寿命表资料来自对特定人群某时点的调查

B. 定群寿命表资料来自对特定人群某时点的调查

C. 期望寿命又称平均寿命, 指所有调查对象死亡时年龄的平均值 D. 随访某特定人群的死亡情况所得资料可做现时寿命表分析

E. 因期望寿命受人群年龄构成的影响, 不能直接比较不同地区的期望寿命 159.关于随机抽样,以下论述中正确的是 A. 单纯随机抽样适合大规模的抽样调查

B. 当学生学号按入学成绩编排时, 评价学生成绩的抽样调查可采用系统抽样 C. 整群抽样的优点是抽样误差较小

D. 分层抽样可以通过分层控制非研究因素对调查结果的影响 E. 在一次抽样调查中只能采用一种抽样方法 160. 以下指标谁的分母不是用平均人口数

A.死因别死亡率 B.粗死亡率 C.某疾病发病率 D.婴儿死亡率 E.以上都不是

简答题

1. 欲研究广东省 6 岁儿童的身高情况, 在广东省随机抽取了 200 名 6 岁儿童进行调查,以此为例说 明同质、变异、总体与样本这几个概念。

答:同质体现在同为广东省、同为 6 岁儿童,变异体现在 200 名儿童的身高不同。 总体是指所有广东省 6 岁儿童,样本为 200 名 6 岁儿童。

2.卫生统计工作中的统计资料主要的来源有哪些?

答:①统计报表。②经常性工作记录。③专题调查或实验。

3.简述统计工作全过程的四个步骤。

答:研究设计、收集资料、整理资料、统计分析。

4.试举例说明常见的三种资料类型。

答:(1).计量或测量或数值资料,如身高、体重等。 (2).计数或分类资料,如性别、血型等。

(3).等级资料,如尿蛋白含量-、+、++、+++、?。

5. 统计学上的变异、变量、变量值是指什么?

答:变异:每个观察个体之间的测量指标的差异称为变异。 变量: 表示个体某种变异特征的量为变量。 变量值:对变量的测得值为变量值。

6. 简述编制频数表的步骤与要点。 答:(1)找出最大和最小值,计算极差。 (2)确定组距和列出分组计划:

第一组应包括最小值;最末组应包括最大值,并闭口。 (3)将原始数据整理后,得到各组频数。

7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况? 答:常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合:对称资料,最好是近似正态分布资料。

几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。 中位数适合:数据非对称分布、分布不清楚或开口资料的情形。

8. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?

答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合:数据分布非对称的情形。

四分位数差距适合:数据分布非对称的情形。

方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。

变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较 无可比性,适用变异系数比较。

9. 统计描述的基本方法有哪些,各自有何特点?

答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。 表:详细、精确。图:直观。指标:综合性好。

10.简述变异系数的实用时机。

答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 11. 怎样正确描述一组计量资料? 答:(1).根据分布类型选择指标。

(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料 选用中位数与四分位数间距。 12. 正态分布的主要特征有哪些? 答:(1)正态曲线在横轴上方均数处最高。 (2)正态分布以均数为中心,左右对称。

(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。 (4)正态曲线下的面积分布有一定规律。 13. 参考值范围是指什么?

答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。 “正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。

14. 简述估计参考值范围的步骤与要点。

答:设计:①样本: “正常人” ,大样本 n≥100。②单侧或双侧。③指标分布类型。

计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。

15.简述正态分布的用途。 答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。

16.简述可信区间在假设检验问题中的作用。

答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率 P 值。故将二者结合起来,才是对假设检验问题的完整分析。

17. 假设检验时,当 P≤ 0.05,则拒绝 H0,理论依据是什么?

答:P 值为 H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当 P≤0.05 时,说明在H0 成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可 能在一次试验中发生,所以拒绝 H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯 错误的概率不会大于0.05,也就是说,有了概率保证。

18. 假设检验中?与 P 的区别何在?

答:以 t 检验为例,?与 P 都可用 t 分布尾部面积大小表示,所不同的是:?值是指在统计推 断时预先设定的一个小概率值,就是说如果 H0是真的,允许它错误的被拒绝的概率。P 值是由实际 样本获得的,是指在 H0 成立的前提下,出现大于或等于现有检验统计量的概率。

19. 什么叫两型错误?作统计学假设检验为什么要加以考虑?

答:如果 H0 正确,检验结果却拒绝 H0,而接受 H1,则犯 I型错误,记为α; 如果 H0 错误,检验结果却不拒绝 H0,未能接受 H1,则犯 II型错误,记为β。

一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本

含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论 时,都要考虑到两型错误。

20. 配对比较是不是就比成组比较好?什么情况下用配对比较比较好?

答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不 是说凡是配对试验就一定比成组比较好。 实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的 个体间相似程度更高。

21. t 检验有几种?各适用于哪些情况?

答:t 检验以 t 分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种: 一是样本均数与总体均数比较的 t 检验。即将一个样本均数X与一已知的总体均数作比较; 二是配对资料的 t 检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。 三是两个样本均数比较的 t 检验;两组的样本量可以不相同。 此外尚有相关系数、回归系数的 t 检验。

22. 什么叫假设检验?医学研究中常用的假设检验有哪些?

答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤 是:①提出检验假设 0 H ,确定单双侧与检验水准α;②计算检验统计量;③确定概率 P 值;④判 断结果。 在医学研究中常用的显著性检验有 u 检验、t 检验、F 检验、 2 ? 检验及非参数秩和检验等多种,不 论那种检验均以假设成立时得到的统计量的概率来判断。

23.通过实例说明为什么假设检验的结论不能绝对化?

答:统计的结论为概率性的结论。拒绝 H0 时,可能犯Ⅰ型错误。不拒绝 H0 时,可能犯Ⅱ型错误。

24. 方差分析的检验假设(H0)是什么? 答:各总体均数相等

25. 方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?

答:总的离均差平方和等于各部分离均差平方和之和. 总的自由度等于各部分自由度之和. 完全随机设计: SS 总=SS 组内+SS 组间 V 总=V 组内+V 组间

随机区组设计: SS 总=SS 组内+SS 处理组间+SS 区组间 V 总=V 组内+V 处理组间+ V 区组间

26. 三组均数比较时,为什么不能直接作一般的两两均数比较的 t 检验? 答:增大犯第一类错误的可能性.

27. 两组均数差别的假设检验能否作方差分析,为什么?

答:可以.方差分析与 t 检验关系:k=2 时,F=t 2 , P 值相等,即两检验等价。

28. 方差分析中,组间变异是来源于那些方面的变异?

答:该变异除随机原因的影响外,有可能存在处理因素的作用。

29. 对多组均数作方差分析的主要步骤和结果有那些? 答:(1)建立检验假设和检验水准

(2)计算统计量 F 值(列出方差分析表)

(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种 类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体 的患病人群,便于开展对病人个人的防治工作。

80. 病死率和死亡率的区别。 答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:

观察期内因某病死亡的人数 某病病死率= 同期该病患者数 ×1000?

(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代 某种疾病的死亡水平。计算公式为:

观察期内因某病死亡的人数 某病死亡率= 同期平均人口数 ×1000?

81. 简述婴儿死亡率指标的实际意义

答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。

婴儿死亡率= 某年不满周岁婴儿死亡数 ×1000? /同期活产数

婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指 标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以 相互比较。

82.平均寿命与平均死亡年龄的区别?

答:平均寿命是指 0岁组预期寿命,仅取决于年龄组死亡率的高低,两地的平均寿命可直接进行比较。平均死亡年龄是指死者死亡时年龄的算术均数,不仅取决于年龄组死亡率的高低,也取决于年龄别人口构成,两地的平均死亡年龄不能直接进行比较。

83.简略去死因寿命表的作用。

答:研究某种死因对居民死亡的影响,可编制去死因寿命表。其基本思想是,假使消除了某种死因,则原死于该原因的人不死于该原因,寿命就会有所延长。显然,如果消除了对生命威胁大的死因,寿命就会延长更多。去死因寿命表的优点是:①以某死因耗损的预期寿命和尚存人数合理地说明了该死因对人群生命的影响程度。②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用。 ③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。

84. 简述寿命表中的几个主要指标。

答:寿命的各项指标 X l 、 X n d 、 X n q 、 X e , 都用来评价居民的健康水平。其中最主要的指标是平均预期寿命。 寿命表尚存人数:反映在一定年龄组死亡率基础上,一代人口的生存过程,一般用线图表示。 尚存人数随年龄增加而减少。寿命表死亡人数:反映在一定年龄组死亡基础上,一代人口的死亡过程。一般用直方图表示。横坐标为年龄,纵坐标为死亡人数。 寿命表死亡概率:取决于各年龄组死亡率,一般用半对数线图表示。 预期寿命:预期寿命是评价居民健康状况的主要指标。一般用线图表示。

85. 简述寿命表的用途。 答: 寿命表主要应用于:(1)评价国家或地区居民健康水平。(2)利用寿命表研究人口再生产情 况。(3)利用寿命表指标进行人口预测。(4)利用寿命表方法研究人群的生育、发育及疾病的发展规律。

86. 全死因寿命表可分为哪几类,哪类更常用。

答:寿命表是根据某地特定人群的年龄组死亡率编制而成的。一般可分为定群寿命表和现时寿命表。由于人的生命周期很长,用定群寿命表的方法去研究人群的生命过程,不仅随访人数要很多, 而且随访时间要数十年。因此,在编制寿命表时,一般不使用定群寿命表,而是使用现时寿命表。现时寿命表是假定同时出生的一代人(一般为 10 万),按照某年(或某一时期内)特定人群的年龄 组死亡率先后死去,直至死完为止,用寿命表方法计算出这一代人在不同年龄组的“死亡概率”、“死 亡人数” 、刚满某年龄时的“尚存人数”及其“预期寿命”等指标。这些指标

不受人群年龄构成的影 响,不同的地区可以相互比较。 根据年龄分组方法的不同,现时寿命表可分为完全寿命表及简略寿命表两种。完全寿命表年龄 分组的组距是 1 岁,而简略寿命表习惯上将年龄组距定为 5 岁。因为婴儿死亡率对寿命表的影响相 当大, 所以简略寿命表也将第 1 个 5岁年龄组拆分为组距为 1 岁的 “0~” 岁组和组距为 4 岁的 “1~” 岁组,从 5 岁开始年龄组距才为 5 岁。

87.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理? 答:当作截尾数据处理。

88. 生存分析可用于发病资料的分析吗?请举例说明。 答:可用于慢性病的发病资料分析。

89.生存时间能计算平均数、标准差吗? 答:.因为这类资料常包含截尾数据,并且常为非正态分布,所以一般不可以计算均数和标准差,应计算半数生存时间。

90.Cox 回归可估计参数,故属于参数方法? 答.属于半参数模型

91. 简述生存资料的基本要求。

答: 生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不 能太少;③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。

1描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况? 答:常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合:对称资料,最好是近似正态分布资料。

几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。 中位数适合:数据非对称分布、分布不清楚或开口资料的情形。

2描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?

答常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合:数据分布非对称的情形。 四分位数差距适合:数据分布非对称的情形。

方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。

变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较 无可比性,适用变异系数比较。 3怎样正确描述一组计量资料? 答:(1).根据分布类型选择指标。

(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料 选用中位数与四分位数间距。 4简述估计参考值范围的步骤与要点。

答:设计:①样本: “正常人” ,大样本 n≥100。②单侧或双侧。③指标分布类型。

计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。 5简述可信区间在假设检验问题中的作用。

答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能

够获得一个较为确切的概率 P 值。故将二者结合起来,才是对假设检验问题的完整分析。 6假设检验时,当 P≤ 0.05,则拒绝 H0,理论依据是什么?

答:P 值为 H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当 P≤0.05 时,说明在H0 成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可 能在一次试验中发生,所以拒绝 H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯 错误的概率不会大于0.05,也就是说,有了概率保证。

7什么叫两型错误?作统计学假设检验为什么要加以考虑?

答:如果 H0 正确,检验结果却拒绝H0,而接受 H1,则犯I型错误,记为α; 如果H0错误,检验结果却不拒绝H0,未能接受 H1,则犯II型错误,记为β。

一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论 时,都要考虑到两型错误。 8什么叫假设检验?医学研究中常用的假设检验有哪些?

答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤 是:①提出检验假设 0 H ,确定单双侧与检验水准α;②计算检验统计量;③确定概率 P 值;④判 断结果。 在医学研究中常用的显著性检验有 u 检验、t 检验、F 检验、 2 ? 检验及非参数秩和检验等多种,不 论那种检验均以假设成立时得到的统计量的概率来判断。 9直线回归及其回归方程有何用途? 答:(一)描述 Y 对 X 的依存关系。

(二)预测(forecast): 由自变量 X 估算应变量 Y。 Y 波动范围可按求个体 Y值容许区间方法计算。 (三)统计控制:控制 Y 估算 X,逆估计。通过控制自变量 X 的取值,满足应变量 Y 在一定范围内波动。 10简述作直线相关与回归分析时应注意的事项。

答:(1)回归方程要有实际意义。(2).分析前绘制散点图,考察是否有直线趋势或异常点。(3). 直线回归的适用范围一般以自变量的取值范围为限。没有充分理由 X 的取值不要外延。

11简述直线回归与直线相关的区别与联系。 答:(一)、区别

(1) 资料要求不同:回归可以有两种情况:

①Y 正态随机,X 为选定变量 ----Ⅰ型回归; ②X、Y 服从双变量正态分布 ---- Ⅱ型回归。 相关: X、Y 服从双变量正态分布。

(2) 应用不同:回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。 相关是 只说明两个变量间是否有关联。 (3) 意义不同:b 表示X 每增(减)一个单位,Y 平均改变 b 个单位;r 说明具有直线关系的两个变 量间关系的密切程度和方向。 (4) 取值范围不同:-∞<b<+∞;-1<a<+1。 (5) 回归系数有单位,相关系数无单位。 (二)、关系

(1)方向一致:对一组数据若同时计算 r 与 b,其正负号一致。 (2)假设检验等价:对同一样本,tr=tb,P值相等。

(3)用回归解释相关: 决定系数 反映 Y 的总变异中有多大可能可由 X 来解释。越接近 1,回归的效果越好。 交集4:简述做线性回归分析的基本分析步骤。

① 绘制散点图,考察是否有线性趋势及可疑的异常点;② 估计回归系数;③ 对总体回归系数或回归方程进行假设检验;④ 列出回归方程,绘制回归直线;⑤ 统计应用。

交集6:在多重回归分析中,偏回归系数与标准偏回归系数的区别和意义。

偏回归系数的含义是:在控制其他自变量的水平不变的情况下,该自变量每改变一个单位,反应变量平均改变的单位数。标准偏回归系数的含义:。区别:因为通过对偏回归系数标准化后得到标准偏回归系数,这个过程消除了各个变量的计量单位和离散程度不同对回归系数的影响,所以各个标准偏回归系数能直接比较各自变量Y变量的回绍效应的大小。

比如:去年重修备用试卷的一道题:

有人计算血糖和血胆固醇的相关系数为0.83,并进行假设检验P<0.05,于是得出结论:血糖与胆固醇呈正的直线相关关系,给出你的评述: 答案是这个结论是错的,不可以这样下结论,因为没有做散点图。

它的评分标准是:只要回答要点,做直线相关需要绘制散点图既可以得4分。 交集3:解释假设检验的第二类错误。

Ⅱ类错误(type Ⅱ error):假设检验的另一类错误称为Ⅱ类错误(type Ⅱ error),即检验假设H0原本不正确(H1正确),由样本数

据计算获得的检验统计量得出不拒绝H0(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用? 表示。

方差来源 SS 自由度 MS F P 测量条件 765.53 3 255.18 批次 3.37 误差 6 总 818.37 11

考察不同条件下甘蓝叶核黄素浓度测量结果有无差别,将三批甘蓝叶样本分别在甲、乙、丙,丁四种条件下测量,对测定数据做方差分析的部分结果如下表。 (1)此设计属于何种类型设计

(2)请将表中缺项补足,并根据表的内容下结论。 (注意:F(3.6)0.05=4.76,F(6,3)=8.94)

(3)能否据此认为甲,乙条件下测量结果不同?说明如何分析才能得出这个结论?

将病情相似的169名消化道溃疡的患者随机分成两组,分别用洛赛克和雷尼替丁两种药物治疗,4周后疗效见表。问两种药物治疗消化道溃疡的愈合率有无差别?

两种药物治疗消化道溃疡4周后疗效

处理 愈合 未愈合 合计 愈合率(%) 洛赛克 64(a) 21 (b) 85 75.29 雷尼替丁 51 (c) 33 (d) 84 60.71 合计 115 54 169 68.05 X=(ad-bc)n/(a+b)( c+d)(a+c)(b+d)

2

2

本文来源:https://www.bwwdw.com/article/peqo.html

Top