第二十章生存分析实习指导(定)

更新时间:2023-09-16 02:12:01 阅读量: 高中教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二十章 生存分析

[教学要求]

了解:了解生存资料的特点和Cox模型的概念及应用。 熟悉:理解中位生存期的概念、生存曲线的特点及解释。

掌握:单因素生存曲线的K-M方法和中位生存期的计算;单因素生存曲线比较的log-rank检验及适用条件;Cox模型回归系数与RR的关系及模型适用条件。 [重点难点]

第一节 生存资料的特点

生存时间往往不服从正态分布,且资料收集过程中会出现删失值的问题,故需要一些特殊的统计分析方法。 一、起始事件与终点事件

终点事件(outcome event) 又称失效事件(failure event),它是指研究者所关心的特定结局,而起始事件是反映研究对象生存过程的起始特征的事件。这两者是相对而言的,它们都由研究目的决定,必须在设计时就明确规定,并在研究期间严格遵守而不能随意改变。 二、生存时间

生存时间(survival time)也称失效时间(failure time),它定义为终点事件与起始事件之间的时间间隔,常用符号t表示。 三、删失值

基本概念:在随访研究中,由于某种原因未能明确地观察到随访对象发生事先定义的终点事件,无法得知随访对象的确切生存时间,这种现象称为删失(censoring) 或终检,包含删失的数据称不完全数据(incomplete data)。本章着重讨论右删失(right censoring),即从时间轴上看,终点事件发生在最后一次随访观察时刻的右方。虽然删失数据的信息可以利用,但过多的删失很可能会带来分析结果的偏倚。

产生右删失的原因:1.随访对象失访或中途退出(withdraw)。2.随访结束

时对象仍存活。3.治疗措施改变等。 第二节 生存率的估计

估计生存率有两种非参数方法:用于大样本分组资料的寿命表法(life table method)和本节介绍的乘积极限法(product-limit method),也称K-M法,它既可用于小样本资料,也可用于大样本资料。 一、生存率的点估计

如数据中无删失,生存率可用下式计算:S(t)?t时刻仍存活的观察例数 ;

总观察例数如数据中有删失,则需分时段计算不同单位时间的生存概率pi(i=1,2,…,t),然后利用概率乘法原理将pi相乘得到t时刻生存率,即:S(t)?p1?p2???pt。 二、总体生存率的区间估计

总体生存率的1-?置信区间为:S(ti)?Z?/2SE[S(ti)],其中生存率的标准误为:SE[S(ti)]?S(ti)?n(nj?1jidjj?dj)

三、生存曲线及中位生存期

生存曲线:将随访时间作横坐标,不同时点生存率作纵坐标绘制生存曲线(survival curve)。随时间的增加,该曲线一般呈下降趋势,下降速度快在图形上表现为坡度大、曲线陡峭,意味着生存率较低或生存期较短;下降速度慢在图形上表现为坡度小、曲线平缓,意味着生存率较高或生存期较长。

中位生存期:中位生存期(median survival time)也称半数生存期,表示恰好有50%个体活过此时间。生存时间通常并不服从正态分布,故常用中位生存期作为某个人群生存过程的概括性描述指标。中位生存期越长,表示疾病预后越好;中位生存期越短,表示疾病预后越差。其数值可借助生存曲线进行图表法估计或用线性内插法求解。 第三节 生存曲线的比较

应用条件:该法不指定生存时间服从特定的某种分布,属于非参数方法。所

比较的是单因素设计不同组间整个生存时间的分布,而不是仅仅比较某个特定时间点的生存率。对比组的生存曲线不应有明显的交叉。常用于随机化分组后处理因素的比较,如果有重要的非处理因素在对比组间不均衡或属于未实施随机化的观察性研究,应考虑后述的多因素分析方法。

(Ak?Tk)2检验统计量: ???,??2?1。

Tkk?122第四节 Cox回归

模型形式:h(t,x)?h0(t)exp(?1x1??2x2????pxp),其中x1,x2,?,xp表示研究者认为可能影响死亡率的危险因素,也称协变量(covariates),这些变量在随访期间的取值不随时间的变化而变化;t表示生存时间;h(t,x)称为具有协变量

x1,x2,?,xp的个体在t时刻的风险函数(hazard function),表示这些个体在t时刻的瞬时危险率或死亡率;h0(t)称为基线风险函数(baseline hazard function),表示所有x1,x2,?,xp都取值为0时的个体在t时刻的瞬时危险率或死亡率,h0(t)不要求特定的形式,具有非参数的特点;参数?i(i?1,2,?,p)为总体回归系数,其估计值bi可以根据样本计算得出。

回归系数的意义:回归系数?i表示xi每增加一个单位时, 相对危险度或风险比(risk ratio)的自然对数。当回归系数大于0时,风险比大于1,相应协变量的增加将增大所研究事件发生的可能性;当回归系数小于0时,风险比小于1,相应协变量的增加将减小所研究事件发生的可能性;当回归系数等于0时,风险比等于1,相应协变量与所研究事件的发生无关。

自变量筛选:按照Cox模型的参数估计原则,当模型中增加自变量时,现有模型的部分似然函数值L将增大,而-2ln(L)将减小;在自变量个数即模型的自由度一定时,-2ln(L)取值最小的模型较好。需要强调,逐步方法只是一个计算策略,并不能保证总是得到最好的模型。必要时可以更换筛选变量的方法并调整检验水准,多数情况下总是出现在方程中的变量可能是有意义的,最终备选的模型一定要结合专业知识来判断。

PH假定条件:Cox模型中假定风险比h(t,x)/h0(t)的大小与时间t无关,称为比例风险(proportional hazards)假设,简称PH假设。如果某个协变量不同水平的风险函数曲线有明显交叉,或者协变量与时间的交互作用项在模型中有统计学意义,则不能使用本章介绍的比例风险模型。

[案例讨论参考答案]

案例20-1 首先,结果变量的选取应充分考虑专业上的要求。对于白血病等一些难以完全治愈的较为凶险的疾患,延长患者的生存时间在临床上是有现实意义的,故而结果变量应选取结局(病情是否缓解)以及出现结局的时间(缓解时间)。这样,仅以病情是否缓解为结果变量的单因素Fisher精确概率结果以及多因素logistic模型结果就不很恰当。其次,在使用生存分析方法时,应考虑到影响缓解时间的因素, 除了研究者所关心的是否存在不良染色体以外,还有其它影响因素无法通过实施随机化达到组间非研究因素的均衡性,那么单因素log-rank检验的结果就无法控制非研究因素的影响,所以应该使用多因素Cox回归分析方法并检查PH假设条件,得出正确研究结论。

[电脑实验及结果解释]

实验20-1 生存过程的统计描述

程序20-1 生存过程的统计描述实验SAS程序及说明

行号 01 02 03 04 05 06 07 08

程 序 说 明 建立SAS数据集survnoce; 设定随机数种子;

设立循环,循环变量i从1增加到100,每次加1;

产生均匀分布的随机数;

产生参数为1的指数分布生存时间t; 用指示变量cen表示此数据中无删失; 将数据写入数据集; 结束循环;

调用UNIVARIATE过程对生存时间进行单变量描述并打印出分布图;

10 12

VAR t; TIME t*CEN(0); DATA survnoce; seed=20021109; DO i=1 TO 100;

s=UNIFORM(seed); t=-LOG(s); cen=1; OUTPUT;

END;

09 PROC UNIVARIATE PLOT;

指定分析变量为t;

指定时间变量为t,cen=0表示删失值; 运行上述语句;

11 PROC LIFETEST METHOD=PL; 调用LIFETEST过程用乘积限法描述生存过程; 13 RUN;

运行结果:

Output窗口:

对生存时间t的UNIVARIATE过程分析结果:

The UNIVARIATE Procedure

Variable: t Moments

N 100 Sum Weights 100 Mean 1.03571168 Sum Observations 103.571168 Deviation 1.09864257 Variance 1.2070155 Skewness 1.90814932 Kurtosis 4.02632453 Uncorrected SS 226.764403 Corrected SS 119.494535 Coeff Variation 106.076101 Std Error Mean 0.10986426

Basic Statistical Measures

Location Variability

Mean 1.035712 Std Deviation 1.09864 Median 0.693335 Variance 1.20702 Mode . Range 5.62217 Interquartile Range 1.12603 Tests for Location: Mu0=0

Test -Statistic- -----p Value------ Student's t t 9.427194 Pr > |t| <.0001 Sign M 50 Pr >= |M| <.0001 Signed Rank S 2525 Pr >= |S| <.0001 Quantiles (Definition 5) Quantile Estimate 100% Max 5.63121347 99% 5.09585858 95% 3.49681788 90% 2.58697652 75% Q3 1.38466393 50% Median 0.69333519 25% Q1 0.25863772 10% 0.09728424 5% 0.06338161 1% 0.02039616 0% Min 0.00904492 Extreme Observations

-------Lowest------- -----Highest----- Value Obs Value Obs 0.00904492 21 3.92317 38 0.03174740 15 4.12442 47 0.05022296 86 4.33788 3 0.05054521 83 4.56050 51 0.06165469 89 5.63121 36

Stem Leaf # Boxplot 5 6 1 * 5

4 6 1 0 4 13 2 0 3 9 1 0 3 01 2 | 2 6667 4 | 2 0111 4 | 1 666777777 9 | 1 0000001122233334 16 +--+--+ 0 555566666677888888999 21 *-----* 0 001111111111111222222223333333333444444 39 +-----+

Normal Probability Plot

5.75+ * |

| * | **

| * +++ | ** +++++ | ***+++ | ++**+ | ++**** | +++***** | ++****** 0.25+* * ******************

+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+------+ -2 -1 0 +1 +2

乘积限法描述生存过程结果:

Summary Statistics for Time Variable t

Quartile Estimates

Point 95% Confidence Interval Percent Estimate [Lower Upper) 75 1.38466 1.03101 1.70025 50 0.69334 0.47203 0.93399 25 0.25864 0.20155 0.35810 Mean Standard Error 1.03571 0.10986

Summary of the Number of Censored and Uncensored Values

Percent Total Failed Censored Censored 100 100 0 0.00

实验20-2 Cox回归的参数估计

程序20-2 Cox回归的参数估计实验SAS程序及说明 行号 程 序 说 明 01 DATA cox; 02 seed=20021109; 03 DO i=1 TO 100; 04 05 06 07 08 09

s=UNIFORM(seed); x=2+RANNOR(SEED)*.5; beta=1; lamda=1;

t=-LOG(s)/lamda/2.71828**(beta*x); cen=1;

建立SAS数据集cox; 设定随机数种子;

设立循环,循环变量i从1增加到100,每次加1; 产生均匀分布的随机数;

产生服从正态分布N(2,0.5)的自变量x; 设定总体回归系数beta=1;

设定基线生存时间分布的参数lamda; 生成此模型下的生存时间t;

用指示变量cen=1表示此数据中无删失; 产生取值1到100之间随机数k;

令k>80所对应观测为删失值,造成随机删失; 将数据写入数据集; 结束循环;

调用PHREG过程进行Cox回归分析;

指定Cox模型自变量为x,cen=0表示删失值; 运行上述语句;

2

10 k=INT(100*RANUNI(seed))+1; 11 IF k>80 THEN cen=0; 12 OUTPUT; 13 END;

14 PROC PHREG;

15 MODEL t*CEN(0)=x; 16 RUN;

运行结果:

Output窗口: PHREG过程进行Cox回归分析结果

The PHREG Procedure Model Information

Data Set WORK.COX Dependent Variable t Censoring Variable cen Censoring Value(s) 0

Ties Handling BRESLOW Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 100 81 19 19.00 Convergence Status

Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics

Without With Criterion Covariates Covariates -2 LOG L 599.992 578.110

AIC 599.992 580.110 SBC 599.992 582.504 Testing Global Null Hypothesis: BETA=0

Test Chi-Square DF Pr > ChiSq Likelihood Ratio 21.8825 1 <.0001 Score 22.3606 1 <.0001 Wald 21.9726 1 <.0001 Analysis of Maximum Likelihood Estimates

Parameter Standard Hazard Variable DF Estimate Error Chi-Square Pr > ChiSq Ratio X 1 1.07178 0.22865 21.9726 <.0001 2.921

实验20-3 Cox回归与logistic回归的比较

行号 程 序 程序20-3 Cox回归与logistic回归的参数估计实验SAS程序及说明

说 明 01 DATA coxlog; 02 seed=20021109; 03 DO i=1 TO 100; 04 05 06 07 08 09 10 11 12 13 14

s=UNIFORM(seed); x=2+RANNOR(seed)*.5; beta=1;

t=-LOG(s)/2.71828**(beta*x); cen=1;

建立SAS数据集coxlog; 设定随机数种子;

设立循环,循环变量i从1增加到100,每次加1; 产生均匀分布的随机数;

产生服从正态分布N(2,0.5)的自变量x 设定总体回归系数beta=1;

设定总体回归系数为1条件下Cox模型的生存时间t;

2

用指示变量cen=1表示此数据中无删失;

k=INT(100*RANUNI(seed))+1; 产生取值1到100之间随机数k; cm=50; 设模型中删失值数目cm; IF k>cm THEN cen=0; 令k>cm所对应观测为删失值,造成随机删失; OUTPUT; 将数据写入数据集; END; 结束循环; PROC PRINT;RUN; 调用PRINT过程在Output窗口输出数据集Coxlog;

调用PHREG过程进行Cox回归分析;

指定Cox模型自变量为x,cen=0表示删失值;

调用LOGISTIC过程进行logistic回归分析;

指定结果变量为cen,自变量为x; 运行上述语句;

15 PROC PHREG; 16 MODEL t*CEN(0)=x; 17 RUN;

18 PROC LOGISTIC; 19 MODEL cen=x; 20 RUN;

运行结果: Output窗口:

PHREG过程进行Cox回归分析结果:

The PHREG Procedure Model Information

Data Set WORK.COXLOG Dependent Variable t Censoring Variable cen Censoring Value(s) 0

Ties Handling BRESLOW

Summary of the Number of Event and Censored Values Percent Total Event Censored Censored 100 44 56 56.00 Convergence Status

Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics

Without With Criterion Covariates Covariates -2 LOG L 319.815 308.495 AIC 319.815 310.495 SBC 319.815 312.279 Testing Global Null Hypothesis: BETA=0

Test Chi-Square DF Pr > ChiSq Likelihood Ratio 11.3205 1 0.0008 Score 11.5942 1 0.0007 Wald 11.3814 1 0.0007 Analysis of Maximum Likelihood Estimates

Parameter Standard Hazard Variable DF Estimate Error Chi-Square Pr > ChiSq Ratio

X 1 1.05187 0.31179 11.3814 0.0007 2.863

LOGISTIC过程进行LOGISTIC回归分析结果:

The LOGISTIC Procedure Model Information

Data Set WORK.COXLOG Response Variable cen Number of Response Levels 2 Number of Observations 100

Model binary logit Optimization Technique Fisher's scoring Response Profile

Ordered Total Value cen Frequency 1 0 56 2 1 44 Probability modeled is cen=0. Model Convergence Status

Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics

Intercept Intercept and Criterion Only Covariates AIC 139.186 141.177 SC 141.791 146.387 -2 Log L 137.186 137.177 Testing Global Null Hypothesis: BETA=0

Test Chi-Square DF Pr > ChiSq Likelihood Ratio 0.0091 1 0.9241 Score 0.0091 1 0.9241 Wald 0.0091 1 0.9241 Analysis of Maximum Likelihood Estimates Standard Wald

Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 0.1729 0.7437 0.0541 0.8161 X 1 0.0346 0.3637 0.0091 0.9241 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits X 1.035 0.507 2.112

Association of Predicted Probabilities and Observed Responses Percent Concordant 44.2 Somers' D -.002 Percent Discordant 44.4 Gamma -.002 Percent Tied 11.4 Tau-a -.001 Pairs 2464 c 0.499

[思考与练习题的参考答案]

1. 线性回归、logistic回归和Cox回归的区别(假设只有一个自变量X, 以下同)。

结果变量 模型类型 删失值处理

线性回归

连续型数值变量

参数模型 不能利用

logistic回归

离散型分类变量 参数模型 不能利用 极大似然估计

Cox回归

分类结局变量及数值时间变量

半参数模型 能利用 极大部分似然估计

参数估计方法 最小二乘估计 回归系数含义 X每变化一个单

模型形式

位Y的平均变化 Y=?X

X每变化一个单位OR的X每变化一个单位RR的自然自然对数

对数

P?1

1?exp(??X)h(t,X)?h0(t)exp(?X)

2. 假设X取值为k与k?1时的相对危险度分别为RRk与RRk+1,则

RRk?h(t,x?k)h0(t)exp(k?)??exp(k?)

h(t,x?0)h0(t)h(t,x?k?1)h0(t)exp[(k?1)?]??exp[(k?1)?]

h(t,x?0)h0(t)RRk?1?于是, ln(RRk?1)?ln(RRk)?(k?1)??k???

可以看出X的偏回归系数表示X每增加一个单位时相对于未增加时的危险度的自然对数。当回归系数大于0时,相对危险度大于1,相应协变量的增加将增大所研究事件发生的可能性;当回归系数小于0时,相对危险度小于1,相应协变量的增加将减小所研究事件发生的可能性;当回归系数等于0时,相对危险度等于1,相应协变量与所研究事件的发生无关。

3. 21例服用6-疏嘌呤白血病患者的生存率计算

死亡数 期初例数 序号 时间(周)

生存概率 pi?(ni?di)/ni

生存率

i

(1) 1 2 3

ti

(2) 6 6+ 7

di

(3) 3 0 1

ni

(4) 21 18 17

S(ti) (6)

0.8571

0.8571×1.0000=0.8571 0.8571×0.9412=0.8067

(5) 18/21=0.8571 18/18=1.0000 16/17=0.9412

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

9+ 10 10+ 11+ 13 16 17+ 19+ 20+ 22 23 25+ 32+ 34+ 35+

0 1 0 0 1 1 0 0 0 1 1 0 0 0 0

16 15 14 13 12 11 10 9 8 7 6 5 4 2 1

16/16=1.0000 14/15=0.9333 14/14=1.0000 13/13=1.0000 11/12=0.9167 10/11=0.9091 10/10=1.0000 9/9=1.0000 8/8=1.0000 6/7=0.8571 5/6=0.8333 5/5=1.0000 4/4=1.0000 2/2=1.0000 1/1=1.0000

0.8067×1.0000=0.8067 0.8067×0.9333=0.7529 0.7529×1.0000=0.7529 0.7529×1.0000=0.7529 0.7529×0.9167=0.6902 0.6902×0.9091=0.6275 0.6275×1.0000=0.6275 0.6275×1.0000=0.6275 0.6275×1.0000=0.6275 0.6275×0.8571=0.5378 0.5378×0.8333=0.4481 0.4481×0.0000=0.4481 0.4481×0.0000=0.4481 0.4481×0.0000=0.4481 0.4481×0.0000=0.4481

21例服用安慰剂白血病患者的生存率计算

死亡数 期初例数 序号 时间(周)

生存概率 pi?(ni?di)/ni

生存率

i

(1) 1 2 3 4 5 6 7 8 9 10

ti

(2) 1 2 3 4 5 8 11 12 15 17

di

(3) 2 2 1 2 2 4 2 2 1 1

ni

(4) 21 19 17 16 14 12 8 6 4 3

S(ti) (6)

0.9048

0.9048×0.8947=0.8095 0.8095×0.9412=0.7619 0.7619×0.8750=0.6667 0.6667×0.8571=0.5714 0.5714×0.6667=0.3810 0.3810×0.7500=0.2857 0.2857×0.6667=0.1905 0.1905×0.7500=0.1429 0.1429×0.6667=0.0952

(5) 19/21=0.9048 17/19=0.8947 16/17=0.9412 14/16=0.8750 12/14=0.8571 8/12=0.6667 6/8=0.7500 4/6=0.6667 3/4=0.7500 2/3=0.6667

11 12

22 23

1 1

2 1

1/2=0.5000 0/1=0.0000

0.0952×0.5000=0.0476 0.0476×0.0000=0.0000

图 两组白血病患者的生存曲线

目测其中位生存期分别为:6-疏嘌呤组23周,安慰剂组8周。

42例白血病患者两种疗法生存曲线的log-rank检验计算表

序号

时间(周)

6-疏嘌呤组

安慰剂组

合计

i

(1) 1 2 3 4 5 6 7 8

ti

(2) 1 2 3 4 5 6 7 8

n1i

(3) 21 21 21 21 21 21 17 16

d1i c1i

(4) (5) 0 0 0 0 0 3 1 0

0 0 0 0 0 1 0 0

T1i

(6) 1.0000 1.0500 0.5526 1.1351 1.2000 1.9091 0.5862 2.2857

n2i d2i(7)

(8) 2 2 1 2 2 0 0 4

c2i

(9) 0 0 0 0 0 0 0 0

T2i

(10) 1.0000 0.9500 0.4474 0.8649 0.8000 1.0909 0.4138 1.7143

Ni

(11)

Di

(12) 2 2 1 2 2 3 1 4

21 19 17 16 14 12 12 12

42 40 38 37 35 33 29 28

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 合计

9 10 11 12 13 15 16 17 19 20 22 23 25 32 34 35

16 15 13 12 12 11 11 10 9 8 7 6 5 4 2 1

0 1 0 0 1 0 1 0 0 0 1 1 0 0 0 0

1 1 1 0 0 0 0 1 1 1 0 0 1 2 1 1

0.0000 0.6522 1.2381 1.3333 0.7500 0.7333 0.7857 0.7692 0.0000 0.0000 1.5556 1.7143

8 8 8 6 4 4 3 3 2 2 2 1 0 0 0 0

0 0 2 2 0 1 0 1 0 0 1 1 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0.0000 0.3478 0.7619 0.6667 0.2500 0.2667 0.2143 0.2308

24 23 21 18 16 15 14 13 11 10 9 7 5 4 2 1

0 1 2 2 1 1 1 1 0 0 2 2 0 0 0 0

0.0000 0.0000 0.4444 0.2857

0.0000 0.0000 0.0000 0.0000

0.0000 0.0000 0.0000 0.0000

9 19.2505 21 10.7495 30

H0: 两种治疗方式白血病患者的总体生存曲线相同 H1: 两种治疗方式白血病患者的总体生存曲线不同

??0.05

从表中最后一行合计处得到A1=9,A2=21,T1=19.2505,T2=10.7495,将其代入公式

(9?19.2505)2(21?10.7495)2???=15.2328,

19.250510.74952??2?1?1

按??1查?2界值表,得到P?0.0001。按??0.05水准拒绝H0,故可以认为两种治疗方式白血病患者的总体生存曲线不同。

4.表18-15所示结果较为合理,影响此恶性肿瘤患者生存时间的影响因素为病人性别、组织学类型、治疗方式。其中男性与女性风险比为0.035;组织学类型高分化与低分化风险比为0.095;传统治疗方式与新方法治疗方式风险比为0.126,提示新方式治疗效果较差(而表18-13单因素分析却显示新方法疗效好,可以看出不考虑其它因素的干扰作用而一味采用单因素分析会得到错误结论)。

表18-13 31名恶性肿瘤患者生存资料单因素Cox回归结果

变量 自由度 回归系数b

b的标准误 ?2

P值 -2ln(L) RR

RR 95%置信区间 上限 下限 0.958 1.039 0.115 0.706 0.151 0.827 0.688 4.486 0.283 1.679

age 1 -0.00251 0.02074 0.0146 0.9037 133.893 0.997 sex 1 -1.25673 0.46349 7.3519 0.0067 125.795 0.285 type 1 -1.04060 0.43375 5.7557 0.0164 128.140 0.353 treat 1 0.56352 0.47830 1.3881 0.2387 132.406 1.757 lym 1 -0.37253 0.45450 0.6718 0.4124 133.206 0.689

表18-14 31名恶性肿瘤患者生存资料多因素Cox回归结果(-2ln(L)=104.979)

变量 自由度 回归系数b

b的标准误 ?2

P值 RR

RR 95%置信区间 上限 下限 0.974 1.069 0.005 0.181 0.007 0.211 0.029 0.711 0.816 15.816

age 1 0.01994 0.02364 0.7109 0.3992 1.020 sex 1 -3.46658 0.89535 14.9905 0.0001 0.031 type 1 -3.24466 0.86096 14.2026 0.0002 0.039 treat 1 -1.93508 0.81330 5.6610 0.0173 0.144 lym 1 1.27890 0.75620 2.8602 0.0908 3.593

表18-15 31名恶性肿瘤患者生存资料多因素Cox逐步回归结果(-2ln(L)=108.033)

变量 自由度 回归系数b

b的标准误 ?2

P值 RR

RR 95%置信区间 上限 下限 0.006 0.217 0.029 0.317 0.024 0.669

sex 1 -3.35018 0.92938 12.9942 0.0003 0.035 type 1 -2.35071 0.61346 14.6836 0.0001 0.095 treat 1 -2.07064 0.85168 5.9110 0.0150 0.126

[补充练习题]

一、选择题

(一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。

1. 下列不属于非参数统计方法的是__________。

A.秩和检验 B.F检验 C.log-rank检验 D.spearman相关 E.?2检验 2.生存分析的结果变量为__________。

A.生存时间 B. 结局变量 C. 生存时间与结局变量 D.删失值 E. 正态分布变量

3.乳腺癌化疗患者预后分析中,以下__________情况不属于删失数据。 A.死于乳腺癌 B.死于心脏病 C.失访 D.观察期结束尚存活 E.改用中药治疗 4.下列关于生存率的描述中不正确的是__________。 A.生存率指病人经历k个单位时段后仍存活的概率 B.生存率即累积生存概率

C. 5年生存率即病人至少存活5年的可能性大小 D.生存率表示年初人口往后活满一年的机会大小 E. k年生存概率通常不小于k年生存率

5.对Cox回归模型风险比的正确描述为__________。 A.与回归系数正负号相同 B. 与回归系数正负号相反

C. 基准风险乘以回归系数 D.某个常数 E.不服从正态分布 (二)A2型:题干以一个小案例出现,其下有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。

1. 16只体表接种绒癌的裸鼠随机分为2组,分别接受天花粉和对照药物注射,得到生存时间(天)如下:

注射天花粉组 注射对照药物组

6 7 9+ 13 16 17 18 22 4 5 5+ 8 8 9 11 12

适宜的统计描述与组间生存时间比较方法为____________。 A. 算术均数与t检验 B.几何均数与秩和检验

C. 中位生存期与生存曲线 D.生存曲线与log-rank检验 E. 算术均数与生存曲线

(三)A3/A4型:请根据以下案例提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。(第1~2题共用题干)

某肿瘤医院调查1993-2002年间经手术治疗的81例大肠癌患者的临床随访资料如下表:

病例号

X1(P27表达) X2(RB表达) X3(SNC6表达) X4(淋巴转移) Y(生存时间,月)

C(结局)

1 1 1 0 1 32 1 2 1 0 0 1 19 1 3 0 1 0 0 25 0 4 0 0 1 1 17 0 5 1 0 1 1 16 1 … … … … … … … 注:X =1(是),0(否);C=1(死亡),0(删失)。

1.欲研究各自变量X与患者预后之间的关系,宜选用____________。 A. 多重线性回归分析 B. logistic回归分析 C. Cox回归分析 D. log-rank检验 E.等级相关分析 2.对此数据进行Cox回归分析得到如下结果:

自变量 X1 X2 X3 X4

自由度 1 1 1 1

回归系数b0.7317 0.0184 0.9463 0.6439

b的标准误

0.4006 0.0134 0.3855 0.5338

?2

3.3379 1.8796 6.0257 1.4544

P值 0.068 0.170 0.014 0.228

SNC6基因表达者相对于非表达者的风险比为____________。

A. 2.58 B. 1.06 C. 0.39 D.0.06 E.413.93 (四)B1型:以下提供若干组题目,每组题目共用题目前列出的A、B、C、D、E五个备选答案。请从中选择一个与问题关系最密切的答案。某个备选答案可能被选择一次、多次或不被选择。(1~2题共用备选答案) A. 50%生存概率 B. 生存率 C. 中位生存期

D. 生存曲线 E. K-M估计

1.K-M曲线的纵坐标是________。

2.生存曲线纵坐标取值为0.5所对应点的横坐标为________。

二、是非题

1. log-rank检验可以处理删失值,所以生存时间的单位不必非常精确。 ( ) 2. 含有删失值的生存时间比较可以用t检验,也可以用log-rank检验。 ( ) 3. 生存曲线下降速度快意味着生存率较低或生存期较短。 ( ) 4. 生存率相乘可得到生存概率。 ( )

5. Cox回归中,若偏回归系数大于0, 则RR值大于1。 ( )

[补充练习题参考答案]

一、选择题

(一) 1. B 2. A 3. A 4. D 5. D (二) 1.D (三) 1.C 2. A (四) 1.B 2. C 二、是非题

1. ? 2. ? 3. ? 4. ? 5. ?

(王彤)

本文来源:https://www.bwwdw.com/article/7c5h.html

Top