生存分析课程设计乘积极限法拟合样本的生存模型
更新时间:2024-07-10 12:13:01 阅读量: 综合文库 文档下载
- 时间序列分析课程设计推荐度:
- 相关推荐
乘积极限法拟合样本的生存模型
乘积极限法拟合样本的生存模型
摘 要
随着社会的进步和医学研究要求的不断提高,生存分析的应用范围不再仅仅是字面上所理解的“生存分析”,更代表了一种处理缺失数据的基本分析思想。它的研究内容主要包括两个方面:描述生存过程以及分析影响生存过程的因素。由于生存分析在处理缺失数据上具有无法替代的作用,因此在临床试验中应用非常广泛。随着统计软件的不断发展,生存分析的理论和应用将会越来越广泛和深入,更多的符合生物医学实践的模型的建立将会越来越可行。生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。目前这方面的教材,国内还不太多,而且大多局限于生存分析的某一特定应用领域。在现有的几本教科书中,或者偏重于工程学,或者偏重于生物学和医学。本文主要通过简单的例子对成绩极限法和Nelson-Aalen进行介绍和简单的比较。
关键词:MATLAB;生存分析;乘积极限;Nelson-Aalen法
乘积极限法拟合样本的生存模型
PRODNCT-LIMITSURVIVAIMODELFITTINGSAMPLES
ABSTRACT
Along with social progress and the continuous improvement of medical research requirements, the scope of application of survival analysis is no longer just a literal understanding of \analysis\but also represents a process of fundamental analysis censored thought. Its research mainly includes two aspects: process description and analysis of the factors affecting survival process. Because survival analysis in dealing with censored data have irreplaceable, and therefore is widely used in clinical trials. With the continuous development of statistical software, the theory and application of survival analysis will be more extensive and in-depth, more in line with the practice established biomedical model will be more feasible. Survival analysis is the study of the phenomenon of survival and response time data and the statistical laws of a subject. The discipline has important applications in biology, medicine, insurance, reliability engineering, demography, sociology, and economics. Currently teaching in this area, not too much domestic and mostly confined to the survival of a specific application domain analysis. In the prior few textbooks, or emphasis on engineering, or emphasis on biology and medicine. In this paper, a simple example of a performance limit law and Nelson-Aalen introduction and a simple comparison.
Key words:MATLAB ;Survival analysis; Product limit;Nelson-Aalen method
乘积极限法拟合样本的生存模型
目录
1 问题提出 ..................................................................................................................................... 2
1.1 问题的重述....................................................................................................................... 2 1.2问题的提出........................................................................................................................ 2 2 问题分析 ..................................................................................................................................... 2
2.1相关知识简介.................................................................................................................... 2
2.1.1生存分析问题........................................................................................................ 2 2.1.3符号说明................................................................................................................ 2 2.1.3乘积极限法知识介绍 ............................................................................................ 3 2.1.4Nelson-Aalen法介绍 ........................................................................................... 4 2.1.5软件知识................................................................................................................ 5 2.2程序编写前分析................................................................................................................ 6 3 问题假设 ..................................................................................................................................... 6 4 问题的求解 ................................................................................................................................. 6
4.1 乘积极限求解................................................................................................................. 7 4.2 Nelson-Aalen法求解 ................................................................................................... 7 4.3 两种求解方法的比较..................................................................................................... 9 参考文献......................................................................................................................................... 10 附录 ................................................................................................................................................ 11
1 / 14
乘积极限法拟合样本的生存模型
1 问题提出
1.1 问题的重述
现有一个由10只实验鼠组成的样本,直到实验鼠全部死亡,以天为单位记录发生死亡的时间如下:2,3,4,5,7,8,8,9,9,12。
利用要求的方法求估计S(10);用要求的方法估计?(10);又知道S(t)?e
??(t)。
1.2问题的提出
1.运用乘积极限法估计S(10); 2.用Nelson-Aalen法估计?(10); 3.S(t)?e
??(t),由2)可得S(10)的又一估计值,与1)作比较,并说明原因。
2 问题分析
2.1相关知识简介 2.1.1生存分析问题
生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。随着社会的进步和医学研究要求的不断提高,生 存分析的应用范围不再仅仅是字面上的“生存分析”,更代表了一种处理删失数据的基本分析思想。它的研究内容主要包括两个方面:描述生存过程以及分析影响生存过程的因素。 2.1.3符号说明
djrj 为在第j 个子区间终点处同时发生死亡的人数;
为恰好在第j个死亡点之前的生存人数; 为在第j 个子区间内生存人数的死亡概率; 为生存分布函数;
2 / 14
qjS?t?
乘积极限法拟合样本的生存模型
??t? 为累计危险函数;
tm 为第m个时间点;
n 为样本含量
2.1.3乘积极限法知识介绍
乘积极限法,即kaplan-meier法。适用范围:小样本未分组资料、大样本未分组资料,可利用概率乘法定理来计算生存率。
S?t? 的估计:
假设对一个有n个对象的样本中的个体都从t?0 开始观察,并在对所有的
对象死亡之前终止研究,于是得到不同的时间t 处样本中终止的人数。
r在临床研究中,习惯上采用在每一死亡点进行分割的方法。如果j 是恰好第j个死亡点之前的风险集合(一般而言。可发生
dj 次死亡,但多数情况下令
dj?1),
qj?则由式
^djrj 求得
qj 的估计量是在终止于第j个死亡点的那个区间开始时生
存,在那个区间内死亡的概率。 因此,
m?r?d^??jjS?tm????1?qj?????j?1?j?1??rj^m????。
^可以估计出由t?0 到tm 的生存概率。对于
S?tm?t??tm,tm?1?S?t?,的估计量与相
同,因此样本在tm于t之间没有发生死亡事件,从而有
?rj?djS?t?????rj?1?j^m?,t?t?tm?1,m?1,2,?,??m?。
特别地,当t?t1 时,当tm?t?tm?1时
S?t??1^。
S?t?^的方差可以由下式近似表示
3 / 14
乘积极限法拟合样本的生存模型
^mVarS?t??rj????S?t???2?pj?1qjj?rj,
如果用
qj^ 代替
qj,
pj^ 代替
^pj,
S?t?^VarS?t??rj? 代替S(t),则得
mdj2??St??????rr?dj?1j?jj?,
j,rj?1?rj?dj,
如果不存在终止者(即完整数据的情况),则对于所有的显然
?rj?1?rm?1S?tm????????rr1j?1?j?,
^m此处r1?n 为初始样本,rm?1 为恰好在第m?1个死亡点之前的生存人数(或称为第m个死亡点之后的生存人数),的比例来确定。
2.1.4Nelson-Aalen法介绍
由累积危险函数定义?(t)???(y)dy??lnS(t)中定义S(t)?e??(t),其中
0tS?tm? 就由生存到那一时刻的生存人数与n
?(t)称为累积危险率函数。因此也可以通过首先估?(t)来估计S(t),定义
S(t)?e???(t)?
于是
?(t)??lnS(t)
??又S(tm)??(j?1^mrj?djrj)
将其带入?(t)??lnS(t) ,得
?m?rj?dj??t???ln??????j?1?rj^m??dj??ln(1?),tm?t?tm?1,m?1,2,?, ????rjj?1?????因为?ln(1?
djrj)?dj1dj?()2????,忽略二次项和更高次数的项,得 rj2rj4 / 14
乘积极限法拟合样本的生存模型
?ln(1?近似累积危险率估计量为
djrj)?djrj,
?(t)??j?1?mdjrj
于是,得到生存函数的近似
S(t)?e该近似量称作Nelson-Aalen估计量
???rjjj?1md
2.1.5软件知识
MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。
MATLAB是matrix&laboratory两个词的组合,意为矩阵工厂(矩阵实验室)。是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。
MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。
MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强
5 / 14
乘积极限法拟合样本的生存模型
大的数学软件。在新的版本中也加入了对C,FORTRAN,C++,JAVA的支持。
2.2程序编写前分析
由题意可知10只实验鼠发生死亡的时间如下:2,3,4,5,7,8,8,9,9,12。则死亡时间点为:2,3,4,5,7,8,9,12。 则得到:
d1?0,d2?1,d3?1,d4?1,d5?1,d6?0,d7?1,d8?2,d9?2,d10?0,d11?0,d12?1.r1?10,rj?1?rj?dj,j?1,2,3,?,11qj?^
djrj又可以得到
??t???j?1^mdjrj
引入新参数令
bj?1?qj,j?1,2,3,...,12
注:为了利于循环程序的编写在没有死亡的时间点j上令dj?0
3 问题假设
1、实验鼠的健康状况正常且处于同一健康水平; 2、实验鼠所处的环境相同; 3、实验鼠的死亡时间记录准确无误; 4、实验鼠的死亡没有外力和人为干扰; 5、实验鼠相互之间没有影响。
4问题的求解
6 / 14
乘积极限法拟合样本的生存模型
4.1 乘积极限求解
运行成绩极限法求解源程序(源程序见附录)得到:
由运行结果只S?10??0.1000 其中bj?1?qj,j?1,2,3,...,12
4.2 Nelson-Aalen法求解
7 / 14
乘积极限法拟合样本的生存模型
运行Nelson-Aalen法求解源程序(源程序见附录)得到:
结果如图所示:
其中B的值即为??t? 的值
S?10??0.1804
8 / 14
乘积极限法拟合样本的生存模型
4.3 两种求解方法的比较
有以上结果知Nelson-Aalen法的估计值比乘积极限法的估计值偏大。 原因如下:
乘积极限法公式如下所示,较为精确未取近似值
?rj?1?rm?1S?tm????????r1j?1?rj?,
^m而相应的Nelson-Aalen法的计算式如下 因?ln(1?djrj)?djrjdj1dj?()2????,,忽略二次项和更高次数的项,而使得 rj2rj, 估计偏小
?ln(1?djrj)?又因为近似累积危险率估计量为
?(t)??j?1?mdjrj
生存函数的近似为减函数
S(t)?e所以用此方法求的S 偏大
???rjjj?1md
9 / 14
乘积极限法拟合样本的生存模型
参 考 文 献
[1] 李晓林,孙佳美.生命表基础[M].北京:中国财政经济出版社,2006:1-133. [2] 刘国卫.MATLAB程序设计教程(第二版) [M].北京:中国水利水电出版社,2010:136-153.
[3] 张文彤,邝春伟.SPSS统计分析基础教程(第二版)[M].北京:高等教育出版社 ,2011:1-417.
[4] 姜启源,谢金星,叶俊编.数学模型(第三版)[M].北京:高等教育出版社,2005:1-202.
[5] 刘琼荪,何中市.数学实验(第一版)[M].北京:高等教育出版社,2004.01:1-247.
10 / 14
乘积极限法拟合样本的生存模型
附录
求S?t?的源程序
clc clear
d(1)=0;d(2)=1;d(3)=1;d(4)=1;d(5)=1;d(6)=0; d(7)=1;d(8)=2;d(9)=2;d(10)=0;d(11)=0;d(12)=1; r(1)=10; for i=1:1:11 r(i+1)=r(i)-d(i);
end q=d./r b=1-q s=1; for i=1:12
S(i)=b(i)*s; s=S(i); end
Nelson-Aalen法求解程序
clc clear
11 / 14
乘积极限法拟合样本的生存模型
d(1)=0;d(2)=1;d(3)=1;d(4)=1;d(5)=1;d(6)=0; d(7)=1;d(8)=2;d(9)=2;d(10)=0;d(11)=0;d(12)=1; r(1)=10; for i=1:1:11 r(i+1)=r(i)-d(i);
end d r q=d./r b=0; for i=1:12
B(i)=q(i)+b; b=B(i); S(i)=exp(-B(i)); end B S
12 / 14
正在阅读:
2019年有关雾霾的作文06-12
化工过程分析与合成考点(完美版)06-15
2015春元旦节安全检查记录表05-29
机械设计作业题(滑动轴承、滚动轴承)12-28
神钢售后服务研修教材内容 - 图文10-08
陕西冤民韩美侠上访十多年(上)被非法关押精神病医院六年01-21
经皮肾镜取石术76例的临床护理分析07-06
第十一章 第2节 对坐标的曲线积分08-17
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 生存
- 拟合
- 乘积
- 样本
- 模型
- 极限
- 课程
- 分析
- 设计
- 新课程高中数学测试题组(必修2)全套含答案A
- 吉林大学2013年学术学位硕士研究生招生专业目录 - 图文
- 日照图的类型及解题技巧
- 测量方案
- 2015学期五年级科学上册期末模拟卷
- 竞争法重点
- 生产许可证获证企业后续监管工作
- 高考报名号
- XF-手机镜片测试规范
- 2014-2015学年江苏省扬州中学高二上学期期中考试数学试卷(带解
- 电气专业设备KKS实施细则说明部分 - 图文
- 五年级上册书法教案
- 半导体物理学-(第七版)-习题答案
- 题库 心理知识竞赛决赛题库有答案全集
- 微机原理及应用期末试卷大全(有答案)
- 全球经济数据公布时间表
- 2010年11月所有IELTS口语题汇总及适当分类 - 图文
- 今年的龙岩市社会治安综合治理委员会
- 外研社六年级unit3教案
- 高填方路堤专项安全施工方案