生存分析课程设计乘积极限法拟合样本的生存模型

更新时间:2024-07-10 12:13:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

乘积极限法拟合样本的生存模型

乘积极限法拟合样本的生存模型

摘 要

随着社会的进步和医学研究要求的不断提高,生存分析的应用范围不再仅仅是字面上所理解的“生存分析”,更代表了一种处理缺失数据的基本分析思想。它的研究内容主要包括两个方面:描述生存过程以及分析影响生存过程的因素。由于生存分析在处理缺失数据上具有无法替代的作用,因此在临床试验中应用非常广泛。随着统计软件的不断发展,生存分析的理论和应用将会越来越广泛和深入,更多的符合生物医学实践的模型的建立将会越来越可行。生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。目前这方面的教材,国内还不太多,而且大多局限于生存分析的某一特定应用领域。在现有的几本教科书中,或者偏重于工程学,或者偏重于生物学和医学。本文主要通过简单的例子对成绩极限法和Nelson-Aalen进行介绍和简单的比较。

关键词:MATLAB;生存分析;乘积极限;Nelson-Aalen法

乘积极限法拟合样本的生存模型

PRODNCT-LIMITSURVIVAIMODELFITTINGSAMPLES

ABSTRACT

Along with social progress and the continuous improvement of medical research requirements, the scope of application of survival analysis is no longer just a literal understanding of \analysis\but also represents a process of fundamental analysis censored thought. Its research mainly includes two aspects: process description and analysis of the factors affecting survival process. Because survival analysis in dealing with censored data have irreplaceable, and therefore is widely used in clinical trials. With the continuous development of statistical software, the theory and application of survival analysis will be more extensive and in-depth, more in line with the practice established biomedical model will be more feasible. Survival analysis is the study of the phenomenon of survival and response time data and the statistical laws of a subject. The discipline has important applications in biology, medicine, insurance, reliability engineering, demography, sociology, and economics. Currently teaching in this area, not too much domestic and mostly confined to the survival of a specific application domain analysis. In the prior few textbooks, or emphasis on engineering, or emphasis on biology and medicine. In this paper, a simple example of a performance limit law and Nelson-Aalen introduction and a simple comparison.

Key words:MATLAB ;Survival analysis; Product limit;Nelson-Aalen method

乘积极限法拟合样本的生存模型

目录

1 问题提出 ..................................................................................................................................... 2

1.1 问题的重述....................................................................................................................... 2 1.2问题的提出........................................................................................................................ 2 2 问题分析 ..................................................................................................................................... 2

2.1相关知识简介.................................................................................................................... 2

2.1.1生存分析问题........................................................................................................ 2 2.1.3符号说明................................................................................................................ 2 2.1.3乘积极限法知识介绍 ............................................................................................ 3 2.1.4Nelson-Aalen法介绍 ........................................................................................... 4 2.1.5软件知识................................................................................................................ 5 2.2程序编写前分析................................................................................................................ 6 3 问题假设 ..................................................................................................................................... 6 4 问题的求解 ................................................................................................................................. 6

4.1 乘积极限求解................................................................................................................. 7 4.2 Nelson-Aalen法求解 ................................................................................................... 7 4.3 两种求解方法的比较..................................................................................................... 9 参考文献......................................................................................................................................... 10 附录 ................................................................................................................................................ 11

1 / 14

乘积极限法拟合样本的生存模型

1 问题提出

1.1 问题的重述

现有一个由10只实验鼠组成的样本,直到实验鼠全部死亡,以天为单位记录发生死亡的时间如下:2,3,4,5,7,8,8,9,9,12。

利用要求的方法求估计S(10);用要求的方法估计?(10);又知道S(t)?e

??(t)。

1.2问题的提出

1.运用乘积极限法估计S(10); 2.用Nelson-Aalen法估计?(10); 3.S(t)?e

??(t),由2)可得S(10)的又一估计值,与1)作比较,并说明原因。

2 问题分析

2.1相关知识简介 2.1.1生存分析问题

生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。随着社会的进步和医学研究要求的不断提高,生 存分析的应用范围不再仅仅是字面上的“生存分析”,更代表了一种处理删失数据的基本分析思想。它的研究内容主要包括两个方面:描述生存过程以及分析影响生存过程的因素。 2.1.3符号说明

djrj 为在第j 个子区间终点处同时发生死亡的人数;

为恰好在第j个死亡点之前的生存人数; 为在第j 个子区间内生存人数的死亡概率; 为生存分布函数;

2 / 14

qjS?t?

乘积极限法拟合样本的生存模型

??t? 为累计危险函数;

tm 为第m个时间点;

n 为样本含量

2.1.3乘积极限法知识介绍

乘积极限法,即kaplan-meier法。适用范围:小样本未分组资料、大样本未分组资料,可利用概率乘法定理来计算生存率。

S?t? 的估计:

假设对一个有n个对象的样本中的个体都从t?0 开始观察,并在对所有的

对象死亡之前终止研究,于是得到不同的时间t 处样本中终止的人数。

r在临床研究中,习惯上采用在每一死亡点进行分割的方法。如果j 是恰好第j个死亡点之前的风险集合(一般而言。可发生

dj 次死亡,但多数情况下令

dj?1),

qj?则由式

^djrj 求得

qj 的估计量是在终止于第j个死亡点的那个区间开始时生

存,在那个区间内死亡的概率。 因此,

m?r?d^??jjS?tm????1?qj?????j?1?j?1??rj^m????。

^可以估计出由t?0 到tm 的生存概率。对于

S?tm?t??tm,tm?1?S?t?,的估计量与相

同,因此样本在tm于t之间没有发生死亡事件,从而有

?rj?djS?t?????rj?1?j^m?,t?t?tm?1,m?1,2,?,??m?。

特别地,当t?t1 时,当tm?t?tm?1时

S?t??1^。

S?t?^的方差可以由下式近似表示

3 / 14

乘积极限法拟合样本的生存模型

^mVarS?t??rj????S?t???2?pj?1qjj?rj,

如果用

qj^ 代替

qj,

pj^ 代替

^pj,

S?t?^VarS?t??rj? 代替S(t),则得

mdj2??St??????rr?dj?1j?jj?,

j,rj?1?rj?dj,

如果不存在终止者(即完整数据的情况),则对于所有的显然

?rj?1?rm?1S?tm????????rr1j?1?j?,

^m此处r1?n 为初始样本,rm?1 为恰好在第m?1个死亡点之前的生存人数(或称为第m个死亡点之后的生存人数),的比例来确定。

2.1.4Nelson-Aalen法介绍

由累积危险函数定义?(t)???(y)dy??lnS(t)中定义S(t)?e??(t),其中

0tS?tm? 就由生存到那一时刻的生存人数与n

?(t)称为累积危险率函数。因此也可以通过首先估?(t)来估计S(t),定义

S(t)?e???(t)?

于是

?(t)??lnS(t)

??又S(tm)??(j?1^mrj?djrj)

将其带入?(t)??lnS(t) ,得

?m?rj?dj??t???ln??????j?1?rj^m??dj??ln(1?),tm?t?tm?1,m?1,2,?, ????rjj?1?????因为?ln(1?

djrj)?dj1dj?()2????,忽略二次项和更高次数的项,得 rj2rj4 / 14

乘积极限法拟合样本的生存模型

?ln(1?近似累积危险率估计量为

djrj)?djrj,

?(t)??j?1?mdjrj

于是,得到生存函数的近似

S(t)?e该近似量称作Nelson-Aalen估计量

???rjjj?1md

2.1.5软件知识

MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。

MATLAB是matrix&laboratory两个词的组合,意为矩阵工厂(矩阵实验室)。是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。

MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。

MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强

5 / 14

乘积极限法拟合样本的生存模型

大的数学软件。在新的版本中也加入了对C,FORTRAN,C++,JAVA的支持。

2.2程序编写前分析

由题意可知10只实验鼠发生死亡的时间如下:2,3,4,5,7,8,8,9,9,12。则死亡时间点为:2,3,4,5,7,8,9,12。 则得到:

d1?0,d2?1,d3?1,d4?1,d5?1,d6?0,d7?1,d8?2,d9?2,d10?0,d11?0,d12?1.r1?10,rj?1?rj?dj,j?1,2,3,?,11qj?^

djrj又可以得到

??t???j?1^mdjrj

引入新参数令

bj?1?qj,j?1,2,3,...,12

注:为了利于循环程序的编写在没有死亡的时间点j上令dj?0

3 问题假设

1、实验鼠的健康状况正常且处于同一健康水平; 2、实验鼠所处的环境相同; 3、实验鼠的死亡时间记录准确无误; 4、实验鼠的死亡没有外力和人为干扰; 5、实验鼠相互之间没有影响。

4问题的求解

6 / 14

乘积极限法拟合样本的生存模型

4.1 乘积极限求解

运行成绩极限法求解源程序(源程序见附录)得到:

由运行结果只S?10??0.1000 其中bj?1?qj,j?1,2,3,...,12

4.2 Nelson-Aalen法求解

7 / 14

乘积极限法拟合样本的生存模型

运行Nelson-Aalen法求解源程序(源程序见附录)得到:

结果如图所示:

其中B的值即为??t? 的值

S?10??0.1804

8 / 14

乘积极限法拟合样本的生存模型

4.3 两种求解方法的比较

有以上结果知Nelson-Aalen法的估计值比乘积极限法的估计值偏大。 原因如下:

乘积极限法公式如下所示,较为精确未取近似值

?rj?1?rm?1S?tm????????r1j?1?rj?,

^m而相应的Nelson-Aalen法的计算式如下 因?ln(1?djrj)?djrjdj1dj?()2????,,忽略二次项和更高次数的项,而使得 rj2rj, 估计偏小

?ln(1?djrj)?又因为近似累积危险率估计量为

?(t)??j?1?mdjrj

生存函数的近似为减函数

S(t)?e所以用此方法求的S 偏大

???rjjj?1md

9 / 14

乘积极限法拟合样本的生存模型

参 考 文 献

[1] 李晓林,孙佳美.生命表基础[M].北京:中国财政经济出版社,2006:1-133. [2] 刘国卫.MATLAB程序设计教程(第二版) [M].北京:中国水利水电出版社,2010:136-153.

[3] 张文彤,邝春伟.SPSS统计分析基础教程(第二版)[M].北京:高等教育出版社 ,2011:1-417.

[4] 姜启源,谢金星,叶俊编.数学模型(第三版)[M].北京:高等教育出版社,2005:1-202.

[5] 刘琼荪,何中市.数学实验(第一版)[M].北京:高等教育出版社,2004.01:1-247.

10 / 14

乘积极限法拟合样本的生存模型

附录

求S?t?的源程序

clc clear

d(1)=0;d(2)=1;d(3)=1;d(4)=1;d(5)=1;d(6)=0; d(7)=1;d(8)=2;d(9)=2;d(10)=0;d(11)=0;d(12)=1; r(1)=10; for i=1:1:11 r(i+1)=r(i)-d(i);

end q=d./r b=1-q s=1; for i=1:12

S(i)=b(i)*s; s=S(i); end

Nelson-Aalen法求解程序

clc clear

11 / 14

乘积极限法拟合样本的生存模型

d(1)=0;d(2)=1;d(3)=1;d(4)=1;d(5)=1;d(6)=0; d(7)=1;d(8)=2;d(9)=2;d(10)=0;d(11)=0;d(12)=1; r(1)=10; for i=1:1:11 r(i+1)=r(i)-d(i);

end d r q=d./r b=0; for i=1:12

B(i)=q(i)+b; b=B(i); S(i)=exp(-B(i)); end B S

12 / 14

本文来源:https://www.bwwdw.com/article/8dt.html

Top