第13章思考与练习

更新时间:2023-12-05 17:57:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

习题答案网http://www.jiexi360.cn

第十三章 双变量关联性分析

【思考与习题】

一、思考题

1.两变量间的关联性是否可解释为因果关系?

2.2?2列联表的关联性分析与两样本率比较的?2检验有何不同?

3.相关系数r经假设检验有统计学意义,且得到的P值很小,是否表示两变量间一定有很强的直线关系?

4.简述Pearson积矩相关与Spearman秩相关的区别与联系。

二、案例辨析题

为研究年龄与牙齿AKP酶反应活性之间的关系,某医生在其接诊的患者中随机抽取281例,按年龄(岁)分为三组进行观测,测量各患者牙齿的AKP酶反应活性,如表13-1所示。问年龄与牙齿AKP酶反应活性之间有无关系?

表13-1 281例患者年龄与牙齿AKP酶反应活性的分布 年龄

AKP酶反应活性

+ 17 34 97 148

++ 36 54 12 102

合计 58 90 133 281

<31 31~ 51~ 合计

5 2 24 31

按照R×C表的?2检验结果,得?2=84.533,P?0.005,故按?=0.05水准,拒绝H0,可认为不同年龄患者的AKP酶反应活性不同,两者之间有关系。以上分析正确吗?

三、最佳选择题

1.Pearson积矩相关系数的假设检验,其自由度为 A.n?1 B.n?2 C.2n?1

13-1

习题答案网http://www.jiexi360.cn

D.2(n?1) E.n

2.积矩相关系数的计算公式是 A.r?B.r?lxylxylyy

lxx lxxlyylxylxxlyylyylxxlyylxylxxlyyC.r?

D.r?

E.r?

3. 直线相关分析中,若|r|?r0.05,?,则可认为两变量之间 A. 有一定关系 B. 不存在直线相关关系 C. 有直线相关关系

D. 有直线相关关系,且为正相关 E. 有直线相关关系,且为负相关 4.下列指标中可正可负的是 A.F统计量 B.?2统计量 C.lxx??(x?x)2

i?1nnD.lxy??(x?x)(y?y)

i?1nE.lyy??(y?y)2

i?15.研究18岁女大学生体重和肺活量的关系时,表达正确的无效假设是 A.体重与肺活量无关联

13-2

习题答案网http://www.jiexi360.cn

B.体重与肺活量有关联 C.体重与肺活量有直线关系 D.体重与肺活量有因果关系 E.体重与肺活量无因果关系 6.计算Pearson列联系数的公式为 A.r?lxylxxlyy

B.r??2??n2

?2?nC.r?

?2D.r?E.r??2n?1

?2?2?n7.某放射科医师收集脑外伤患者30例,观察脑出血直径和病人昏迷的程度(轻度、中度、重度),欲分析昏迷程度是否与病灶大小有关,可进行 A.Pearson相关分析 B.Spearman秩相关分析 C.两小样本比较的t检验 D.方差分析 E.?2检验

8.对两个分类变量的频数表资料作关联性分析,可用 A.积矩相关或等级相关 B.积矩相关或列联系数 C.列联系数或等级相关 D.积矩相关 E.等级相关

9.两组数据分别进行直线相关分析,对r1进行假设检验得到P<0.05,对r2进行假设检验,得到P<0.001,可以认为

13-3

习题答案网http://www.jiexi360.cn

A.第一组的两个变量关系比第二组密切 B.第二组的两个变量关系比第一组密切

C.更有理由认为第一组的两个变量之间有直线关系 D.更有理由认为第二组的两个变量之间有直线关系 E.两组变量关系同样密切

四、综合分析题

1.为研究某病成年男性患者血浆清蛋白含量与血红蛋白含量的关系,某医生测得10名患者血浆清蛋白含量(g/L)及血红蛋白含量(g/L)见表13-2所示,试分析二者是否有关联。

表13-2 10名某病成年男性患者的血浆清蛋白含量( x )及血红蛋白含量( y )

编号 1 2 3 4 5 6 7 8 9 10

血浆清蛋白含量(g/L)

36 37 39 38 36 35 34 34 35 34

血红蛋白含量(g/L)

119 121 128 127 121 119 111 109 109 105

2.某医院用两种方法对已确诊的50名乳腺癌患者进行检查,结果如表13-3所示。两种检查方法是否有关联?

表13-3 50名乳腺癌患者的两种检查结果

乙法 阳性 阴性 合计

甲法 阳性 18 8 26

阴性 9 15 24

合计 27 23 50

13-4

习题答案网http://www.jiexi360.cn

3.为探讨流行性出血热的早期分度和最后定型之间的关系,某研究对404例该病患者的病情资料进行分析,如表13-4所示。据此回答:是否早期分度越高,最后定型越重?

表13-4 404例流行性出血热患者的病情转化情况

早期分度

轻型

轻度 中度 重度 合计

98 5 1 104

最后定型 中型 20 136 2 158

重型 1 21 120 142

119 162 123 404 合计

【习题解析】

一、思考题

1.双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。 2.2?2列联表的关联性分析与两样本率比较的?2检验的数据形式非常相似,?2检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的?2检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而2?2列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。

3.P值越小,说明越有理由拒绝H0,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数??0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数?的置信区间来说明。

4.区别:①Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用

13-5

习题答案网http://www.jiexi360.cn

于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。②Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。③Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。联系:①两种相关系数的取值都介于-1和1之间,无单位,小于 0 为负相关,大于0为正相关。②用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。

二、案例辨析题

该案例是对同一样本的两个分类变量之间的关联性进行分析,?2检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP酶反应活性不同”演绎到“两变量有关系”,而应为“按?=0.05水准,拒绝H0,可认为年龄与AKP酶反应活性之间有关”。此外,可结合列联系数说明其关联强度,r??2?2?n?84.533?0.481。

84.533?281由于年龄与AKP酶反应活性都是有序分类变量,可考虑进行Spearman秩相关分析,得rs??0.487,单侧P?0.001,可认为随着年龄的增加,AKP酶反应活也降低。

三、最佳选择题

1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D

四、综合分析题 1.解:

(1) 由散点图(略)结合两个变量的正态性检验,可进行直线相关分析。 由式(13.1)分别算出

lxx??x2?(?x)2/n?27.6

lyy??y2?(?y)2/n?568.9

lxy??xy?(?x?y)/n?114.8

13-6

习题答案网http://www.jiexi360.cn

r?lxylxylyy?0.916

但需进行假设检验以推断总体上这种相关是否存在。 (2) 检验相关是否具有统计学意义 1) 建立检验假设,确定检验水准

H0:??0,即血浆清蛋白含量及血红蛋白含量之间无直线相关关系

H1:??0,即血浆清蛋白含量及血红蛋白含量之间有直线相关关系

??0.05

2) 计算检验统计量 由式(13.4)和式(13.5)得

tr?r1?rn?22?0.9161?0.91610?22?6.458

??n?2?8

3) 确定P值,作出统计推断

查t界值表(附表3),得P?0.001,按?=0.05水准,拒绝H0,接受H1,可以认为该病成年男性患者血浆清蛋白含量与血红蛋白含量呈正相关关系。

SPSS操作 数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,no表示个体编号,x表示血浆清蛋白含量,y表示血红蛋白含量;再点击Data View标签,录入数据(见图13-1,图13-2)。

图13-1 Variable View窗口内定义要输入的变量

13-7

习题答案网http://www.jiexi360.cn

图13-2 Data View窗口内录入数据

分析:

Graphs → Scatter/Dot …→ Simple Scatter Define Y Axis框:y X Axis框:x OK Analyze → Descriptive Statistics → Explore … Dependent list框:x y Plots …→ Normality plots with tests

Continue OK Analyze→Correlate→Bivariate … Variables框:x y OK

输出结果

13-8

习题答案网http://www.jiexi360.cn

130125血红蛋白含量 120115110105343536373839 血浆清蛋白含量 Tests of NormalityKolmogorov-SmirnovStatisticdfSig..17610.200*.20410.200*a血浆清蛋白(X)血红蛋白(Y)Shapiro-WilkStatisticdf.90210.92310Sig..232.384*. This is a lower bound of the true significance.a. Lilliefors Significance Correction Correlations血浆清蛋白(x)1血红蛋白(y).916**.0001010.916**1.0001010血浆清蛋白(x)血红蛋白(y)Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N**. Correlation is significant at the 0.01 level (2-tailed). (3) 结果解释

通过对血浆清蛋白和血红蛋白两变量的正态性检验可以看出:两者的P值分别为0.200,0. 200,可以认为两变量都服从正态分布,故进行Pearson积矩相关分析。两者相关系数为0.916,P?0.001,按??0.05水准拒绝H0,可以认为该病成年男性患者血浆清蛋白和血红蛋白两变量呈正相关关系。

2.解:此问题属于配对设计列联表的关联性分析。

(1) 建立检验假设,确定检验水准

H0:甲法和乙法之间互相独立

13-9

习题答案网http://www.jiexi360.cn

H1:甲法和乙法之间互相关联

??0.05

(2) 计算检验统计量

将表13-3中数据代入式(11.5)得:

(ad?bc)2n(18?15?9?8)2?50????5.059

(a?b)(c?d)(a?c)(b?d)27?23?26?242??1

(3) 确定P值,作出统计推断

查?2界值表(附表9),得0.01

H1,可以认为甲法和乙法之间互相关联。

进一步计算Pearson列联系数,r?SPSS操作 数据录入:

?2?2?n?5.059?0.303

5.059?50打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,f表示四格表每个格子的实际频数,r表示“行变量”乙法检查结果(1为阳性,0为阴性),c表示“列变量”甲法检查结果(1为阳性,0为阴性);再点击Data View标签,录入数据(见图13-3,图13-4)。

图13-3 Variable View窗口内定义要输入的变量

13-10

习题答案网http://www.jiexi360.cn

图13-4 Data View窗口内录入数据

分析:

Data → Weight Cases… Weight cases by: Frequency Variable框:f OK Analyze →Descriptive Statistics → Crosstabs Rows框:r Columns框:c Statistics: Chi-square Contingency coefficient

Nominal

Continue Cells:Counts

Observed Expected

Continue OK

输出结果

乙法 * 甲法 Crosstabulation甲法阴性乙法阴性阳性TotalCountExpected CountCountExpected CountCountExpected Count1511.0913.02424.0阳性812.01814.02626.0Total2323.02727.05050.0 13-11

习题答案网http://www.jiexi360.cn

Chi-Square TestsValue5.059b3.8625.1434.95750df1111Asymp. Sig.(2-sided).025.049.023.026Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.046.024a. Computed only for a 2x2 tableb. 0 cells (.0%) have expected count less than 5. The minimum expected count is11.04.Symmetric MeasuresValue.303.318.31850Asymp.Std. Errora.134.134Approx. TbApprox. Sig..0252.324.024c2.324.024c Nominal by NominalInterval by IntervalOrdinal by OrdinalN of Valid CasesContingency CoefficientPearson's RSpearman Correlationa. Not assuming the null hypothesis.b. Using the asymptotic standard error assuming the null hypothesis.c. Based on normal approximation.

3.解:

(1) 本题为等级资料,应采用Spearman秩相关分析,并用单侧检验。

表13-5 404例流行性出血热患者的病情转化情况

早期分度

x 轻度 中度 重度 合计 秩次范围 平均秩次qi

最后定型 y

轻型 98 5 1 104 1~104 52.5

中型 20 136 2 158 105~262 183.5

重型 1 21 120 142 263~404 333.5

合计 119 162 123 404

秩次范围 1~119 120~281 282~404

平均秩次

pi 60 200.5 343

? ? ?

? ? ?

? ?

将n对实测值xi与yi(i=1,2,3,…,n)分别从小到大编秩(相同秩次取平均值),以pi表示xi的秩次,qi表示yi的秩次,将pi、qi直接替换式(13.1)中的x和y,即用秩次作为分析变量值,直接计算Pearson积矩相关系数。

lpp??pi2?(?pi)2/n?4845143 lqq??q2?(?q)2/n?4833900

13-12

习题答案网http://www.jiexi360.cn

/? lpq??pq?(?p?q)n43136 4rs?lpqlpplqq?0.891

但需进行假设检验以推断总体上这种相关是否存在。

(2) 对总体秩相关系数?s作假设检验,本例中rs=0.891,n=404>50,采用式(13.4)和式(13.5)作t检验。

1)建立检验假设,确定检验水准

H0:?s?0,即流行性出血热的早期分度和最后定型无相关关系

H1:?s?0,即流行性出血热的早期分度和最后定型有正相关关系

单侧??0.05 2) 计算检验统计量 由式(13.4)和式(13.5)得

t?rs1?rsn?22?0.8911?0.891404?22?39.349

??n?2?402

3) 确定P值,作出统计推断

查t界值表(附表3),得P?0.001,按??0.05水准,拒绝H0,接受H1,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重。

SPSS操作 数据录入:

打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,f为每个格子实际例数,行变量r为早期分度(取值1、2、3分别表示轻度、中度、重度),列变量c为最后定型(取值1、2、3分别表示轻型、中型、重型)。再点击Data View标签,录入数据(见图13-5,图13-6)。

13-13

习题答案网http://www.jiexi360.cn

图13-5 Variable View窗口内定义要输入的变量

图13-6 Data View窗口内录入数据

分析:

Data →Weight Cases… Weight cases by: Frequency Variable框:f OK Analyze → Correlate → Bivariate … Variables框:r c

Correlation Coefficients

Test of Significance

OK Spearman

One-tailed

输出结果

13-14

习题答案网http://www.jiexi360.cn

CorrelationsSpearman's rho早期分度Correlation CoefficientSig. (1-tailed)NCorrelation CoefficientSig. (1-tailed)N早期分度最后定型1.000.891**..000404404.891**1.000.000.404404最后定型**. Correlation is significant at the 0.01 level (1-tailed). (3) 结果解释: Spearman秩相关系数rs?0.891?0,P?0.001,按??0.05水准,拒绝H0,接受H1,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重。

13-15

本文来源:https://www.bwwdw.com/article/mv8t.html

Top