2012年数学建模C题脑卒中发病环境因素分析及干预

更新时间:2024-03-27 09:41:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

脑卒中发病环境因素分析及干预

摘要

针对题目提供的脑卒中病人的信息,本文利用控制变量法和分层抽样对病人发病情况进行了统计分析,并引入回归分析的方法探讨了脑卒中发病率与气温、气压、相对湿度之间的关系。

对于问题1,本文抽取了2007-2010年4月中病人的信息作为研究对象,从年龄、性别以及职业三个方面对发病人群进行了详细的统计分析,具体的统计图表详见图1-图8,从抽样统计分析中可以看出脑卒中的发病人群主要集中在60-80岁,且男性发病率大于女性,在从事的职业中农民发病率最高,其次是退休人员,教师和工人的发病率较低。

对于问题2,在研究脑卒中发病率与气温、气压、相对湿度之间的关系时,首先利用一元多次回归研究了单个因素对发病率的影响,具体结果参见式(2)、(4)、(6);然后引入多元纯二次回归模型,探讨了气温、气压及相对湿度三者与发病率的关系,具体模型参见式(8),从回归关系中可以看出在高气压低温度低湿度情况下发病率较高,而在低气压高温度高湿度发病率较低。

对于问题3,本文通过查资料给出了脑卒中高危人群的重要特征为:脑卒中高危人群发病时突然无法行走,头晕眼花,失去平衡或协调能力等和血压的高低、血糖的浓度、血脂蛋白的含量等关键指标,随后利用问题1、2中得到的结论,对高危人群提出一份合理的预警和干预。

关键词:脑卒中 多元二次回归模型 分层抽样 环境因素

1

一.问题重述

脑卒中(俗称脑卒中)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。

数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。请你们根据题目提供的数据,回答以下问题:

1.根据病人基本信息,对发病人群进行统计描述。

2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。 3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。

二.问题分析

2.1问题1的分析

对于问题1要求对发病人群进行统计分析,本文采用控制变量方法以及分层抽样的方法,从年龄、性别、职业三个方面进行统计分析,通过绘制散点图和饼状图来形象的描述病人的发病特征。

2.2问题2的分析

对于问题2中要求研究脑卒中发病率与气温、气压、相对湿度之间的关系,本文首先详细统计了2010年中1到12月中每个月的平均发病率,然后引入一元多次回归来研究单个因素与发病率之间的关系,最后考虑到实际中气温、气压、相对湿度是共同影响发病率的,故再引入多元纯二次回归来探寻三者与发病率之间的关系。

2.3问题3的分析

对于问题3中要求查资料了解脑卒中的高危人群的重要特征和关键指标,结

[1,2]

合1、2中所得结论,对高危人群提出预警和干预的建议方案。本文首先理解高危人群的重要特征和关键指标的含义,从而对高危人群提出预警和具体的建议使其更有针对性,然后结合问题1,2中的结论再进一步对高危人群提出预警和干预的建议方案。

三.模型假设与约定

(1)假设气候不发生异常的波动。

(2)假设不发生战争及造成人口大幅度波动的自然灾害。 (3)统计数据为正规统计,未有虚假数据的掺杂。

(4)假定脑卒中发病率除给定的因素外不受其他因素的影响。

(5)不考虑突发事故, 和各种外界传染。即每个员工开始工作时身体健康没有感染。

2

四.符号说明及名词解释 x1 x2 x3 yi R 月平均气温 月平均气压 月平均相对湿度 月平均气温,气压,相对湿度分别对脑卒中人数的患病率 回归方程的拟合优度 2010年的12个月份 j 五.模型的建立与求解

5.1.问题1的分析与求解

在问题1中,因描述病人基本信息的因素较多,故本文采用控制变量的方法对数据进行分析处理。考虑到附件中提供的数据量较多,从而采取分层抽样方法对数据进行处理(如选取2007-2010年4月相关数据),然后利用EXCEL的散点

[6]

图和圆饼图进行了定量的描述。具体统计描述结果如图1-图8所示。

图1.2007年4月份不同年龄段及性别差异的发病率

图2. 2007年4月份不同职业中的脑卒中发病人数

通过分析图1-图2可知,在2007年4月脑卒中的发病情况为,发病人数多集中于年龄为60到80的人群中,且男性的发病率要多于女性;而在不同职业中农民的发病率接近50%,退休人员所占比例也高达16%,而工人和教师的发病率最低接近为0.

3

图3. 2008年4月份不同性别脑卒中发病的人数及主要年龄发病段

图4. 2008年4月份不同职业中的脑卒中发病人数

通过分析图3-图4可知,在2008年4月脑卒中的发病情况为,发病人数多集中于年龄为60到90的人群中,且男性的发病率要多于女性;而在不同职业中农民的发病率超过50%,退休人员和职工所占13%,而工人和教师的发病率最低接近为0。

图5. 2009年4月份不同性别脑卒中发病的人数及主要年龄发病段

图6 .2009年4月份不同职业中的脑卒中发病人数

通过分析图5-图6可知,在2009年4月脑卒中的发病情况为,发病人数多集中于年龄为60到90的人群中,且男性的发病率要多于女性;而在不同职业中

4

农民的发病率超过50%,退休人员和职工所占比例为14%,而工人和教师的发病率最低接近为0。

图7.2010年4月份不同性别脑卒中发病的人数及主要年龄发病段

图8. 2010年4月份不同职业中的脑卒中发病人数

通过分析图7-图8可知,在2010年4月脑卒中的发病情况为,发病人数多集中于年龄为60到90的人群中,且男性的发病率要多于女性;而在不同职业中农民的发病率超过50%,退休人员所占比例为9%,而工人和教师的发病率最低接近为0。

通过对2007年4月-2010年4月,共计4个月份,约5725名病人的抽样分析可知:①从性别和年龄上讲脑卒中的发病人数主要集中在60到80的年龄段,并且都是男性的发病率都大于女性;②从脑卒中在不同职业中的发病状况分析看农民的发病率最大,此外职工和退休人员的发病比例也相对较高[34],而工人和教师的发病率比较低接近为0。 5.2问题2的分析与求解: 5.2.1问题2的模型准备:

问题2中需要研究脑卒中的发病率与气温、气压、相对湿度之间的关系,而回归分析是研究变量之间相关关系的一种非常有效的方法,故本文采用一元多项式回归以及多元纯二次回归来探求脑卒中的发病率与气温、气压、相对湿度之间的关系[5]。

5.2.2问题2的模型建立与求解:

抽样选取2010年脑卒中的发病情况作为研究对象,首先对2010年的脑卒中发病率与平均气温,气压,相对湿度的数据处理如下:

5

月份 一月 二月 三月 四月 五月 六月 七月 八月 九月 十月 十一月 十二月 表1,2010年的脑卒中发病率与平均气温,气压,相对湿度的数据 发病率 平均温度 平均气压 平均湿度 0.088 0.082 0.081 0.085 0.086.5 0.084 0.081 0.082 0.084 0.083 0.086 0.04 4.43871 6.942857 8.748387 12.52333 20.70645 23.7 28.5871 30.43226 25.54667 18.05806 12.99333 6.93871 1025.755 1020.671 1026.37 1017.877 1009.78 1007.64 1005.223 1007.471 1011.513 1018.852 1021.94 1020.239 70.93548 74.67857 70.8064 5 69.5667 68.3871 76.4 75.58065 71.58065 77.2 74.29032 68.9 62.22581 ? 单因素对脑卒中发病率的影响:

①气温对脑卒中发病率的影响: 1)模型建立:

针对表1分析的数据建立一元三次回归模型;

y?b3x13?b2x12?b1x1?b0 (1)

其中,b3b2,b1,b0分别表示回归系数。

2)模型结果:

利用Matlab软件求解得回归系数b3,b2,b1,b0、拟合优度R及剩余标准偏差

S,具体程序参见附件程序1。所以建立的一元三次回归方程为:

y1?0.0935x13?0.0023x12?0.0001x1 (2)

其中拟合优度R2?0.9285,剩余标准偏差S?0.0000。 回归图像图9所示。

0.0890.0880.0870.0860.0850.0840.0830.0820.08151015202530图9:(气温对脑卒中发病率的影响)

通过对下图的分析可知当温度从5-10OC上升的过程中脑卒中发病率逐渐

下降,而当温度位于10-25度时发病率又逐渐上升,直至到达最高,然后又逐渐下降,这说明脑卒中发病率在气温大约10-25度时发病率呈递增趋势,当气温大约处于24-25度时达到最大值。 ②气压对脑卒中发病率的影响:

6

1)模型建立:

针对表1分析的数据建立一元二次回归模型;

y2?b2x22?b1x2?b0 (3)

其中,b2,b1,b0分别表示回归系数。 2)模型结果:

利用Matlab软件求解得回归系数b2,b1,b0拟合优度R2及剩余标准偏差S。

具体程序参见附件程序2。所以建立的一元二次回归模型为:

y2?32.2802x22?0.0634x2, (4) 其中拟合优度R2=0.8722,剩余标准偏差S=0.0000。 回归图像如下图。

0.0890.0880.0870.0860.0850.0840.0830.0820.08110061008101010121014101610181020102210241026图10(气压对脑卒中发病率的影响)

通过对下图的分析可以确定二次回归方程能够较好的反应脑卒中发病率与平均气压的关系,由图像知:拟合曲线为波谷型,这就说明脑卒中患者在低气压

[5]

和高气压发病率较高,而在中等气压发病率比较低。 ③相对湿度对脑卒中发病率的影响: 1) 模型建立:

针对表1分析的数据建立一元四次回归模型:

y3?b4x34b3x33?b2x32?b1x1?b0 。 (5)

其中,b4,b3,b2,b1,b0分别表示回归系数。 2)模型结果:

利用Matlab软件求解得回归系数b4,b3,b2,b1,b0拟合优度R及剩余标准偏差

S。具体程序参见附件程序3:程序1。所以建立的一元四次回归方程为:

(6) y3??323.8073x34?17.7975x33?0.3666x32?0.0034x3,

其中拟合优度R2=0.4721,剩余标准偏差S=0.0000。

回归图像如下图。

7

0.090.0880.0860.0840.0820.080.0780.076697071727374757677图11(相对湿度对脑卒中发病率的影响)

综合S和R知三次回归拟合优度与四次拟合优度都比较小,小于0.8所以它们的拟合效果不够好,所以有待于修正。但是从图像也能得出一些结论:拟合曲线呈波峰型,但是波峰几乎没有发病的,所以就说明拟合的并不理想,但是两边发病率比较集中,从而说明相对湿度比较高和比较低时发病率比较高,而中等相对湿度发病率比较低。

? 多因素对脑卒中的综合影响:

至此本文已经讨论了单个因素分别对脑卒中发病率的影响,而实际中气温、气压、相对湿度是共同影响脑卒中的发病率的,为此本文接下来建立多元纯二次回归模型讨论发病率与气温,气压,相对湿度三者之间的关系。

①多元二次回归模型的建立: 设纯二次回归方程为:

y??0??1x1???mxm???jjxj2 (7)

j?1m其中,?0,?1,?2,?3??m是回归系数,x1表示每月的气温对发病率的影响,

x2表示每月的气压对发病率的影响,x3表示每月的相对湿度对发病率的影响。

②多元线性回归模型的结果:

运用Matlab软件对上述多元回归模型进行求解得:

y??1.1367x32?0.0047x22?0.0340x12?52.187x3?22.735x2?23.085x1?14.625 (8)

其中拟合优度R2?0.856,剩余标准偏差S=0.0023,

发病率与气温、气压、和相对湿度的回归图如图12所示:

0.20.150.10.050-0.05-0.110152025105011001150120064666870727476

图12:发病率与气温、气压、和相对湿度的总体关系

通过图12可以分析出发病率与气温、气压和相对湿度之间的关系:①随着

8

气压的升高发病率逐渐减少且相对湿度产生的发病率的逐渐减少;②低气压发病率较高,低气温发病率也比较高;③随着相对湿度的增加发病率逐渐减少且气压产生的发病率也降低,低湿度发病率比较高;④随着温度的升高发病率曾先减少后增长趋势,但是气温与气压产生的发病率同时减少;⑤发病率在高气压低温度低湿度发病率较高,发病率在低气压高温度高湿度发病率较低。 5.3问题3的求解:

? 重要特征和相关指标:

通过查资料知:脑卒中是脑中风的学名,是一种突然起病的脑血液循环障碍性疾病,是中老年人常见病、多发病,发病率、致残率高,病人发病时出现语言和理解力混乱,单眼或双眼突然出现视力问题突然无法行走,头晕眼花,失去平衡或协调能力等现象[7,8]。

脑卒中的相关指标包括血压、血糖、血脂蛋白、脑血流量、纤维蛋白原水平、日

[9]

常的气候环境等。其中年龄、性别也与脑卒中的发病率有关。 ? 预警和干预建设方案:

在问题一中,我们可以看出脑卒中的发病人数主要集中在60到80的年龄段,并且都是男性的发病率都大于女性,从脑卒中在不同职业中的发病状况分析:农民的发病率最大基本占总体的一半左右,此外职工和退休人员的发病比例也较高。而在问题二中,我们可以看出随着相对湿度的增加发病率逐渐减少且气压产生的发病率也降低,低湿度发病率比较高。同理随着温度的升高发病率曾先减少后增长趋势,但是气温与气压产生的发病率同时减少。脑卒中的发病均存在明显的季节分布特征,在每年的冬天,高气压、低气湿和低气温条件,尤其是这些因素的剧烈变化与人群中风发病季节性增高关系密切,说明中风发病的季节分布是气候因素的季节差异造成的。

因此,我们对高危人群的提出预警和干预的建议如下:

1.对患有高血压病,糖尿病,心脏疾病,血脂代谢紊乱,血液流变学紊乱,短暂性脑缺血发作的病人,在脑卒中高发季节,要保持这些病情的稳定,不要让这些疾病的发作。这些人多看天气预报,及时了解气候的变化,实时添加衣服,保护自己的身体。

2.这些病人要坚持锻炼身体,适当控制自己的饭量,保持标准身材,体重不要超标。因为肥胖与超重均为缺血性中风的危险因素。 

3.这些病人要控制自己的酒量,或者不要饮酒。有吸烟习惯的人要戒烟,或要少吸烟。因为吸烟与酗酒都是脑卒中的诱发因素。 50岁以上的人,随着年龄增加中风发病率亦有增加。老年人保持自己的体重,克服吸烟与饮酒的不良习惯要预防脑卒中病的发作[10]。

4.进一步加大流行病学研究,摸清各危险因素在人群中的分布,较为彻底的摸清影响脑卒中发病的危险因素。

六.模型的评价与改进

6.1模型优缺点: 6.1.1模型的优点:

(1)模型采用常用的Excel表格对数据进行回归分析简单方便明了.

(2)模型二采用了一元多次模型,多元线性回归模型,多元二次回归模型,使得拟合的比较准确,是模型更能精确的反应出发病率与气温,气压,相对湿度的准确的关系,使模型更合理,更全面。

9

(3)模型1主要采用Excel表格对数据进行绘制散点图,来观察发病率在不同性别,年龄,职业中的高低,模型二使用的多元分析模型,一元多次回归等能很便捷地在Excel和matlab软件中进行运算,具有简洁性。

6.1.2模型的缺点:

回归分析在应用时多见的是多元线性回归和非线性回归,线性回归理论上要求自变量与应变量满足特定条件,而实际的发病率资料很少有满足要求的。曲线回归能较好的反映资料的变化趋势,但对未来因素的变化没有考虑,只适合于短期预测。回归分析法不能处理时间滞后变量。以上模型对疾病未来发病率的预测只是科学的估计,原因有三点:(1)每一种方法都是对事物发展过程的简化和抽象,只能从某个角度提供相应的信息,不能全面揭示疾病变化的信息;(2)建模用的资料大多来自流行病学调查,它们缺乏客观和特异的生物学指标;(3)有很多关系复杂的因素影响疾病发生发展与消退,当环境变化了,就会使原有模型的预测效果下降。

6.1.3模型的优化:

以上模型对疾病未来发病率的预测只是科学的估计,针对这个问题,我们如何来解决呢?一方面我们依据发病率的特点,用多种方法建立可能的模型,再对模型进行筛选,确定一个或多个合理模型,或者根据各种方法的优点建立组合模型,再一方面把其他新兴学科的知识和方法引入探讨疾病发病率规律之中,形成用于疾病发病率的拟合预测分析的新的方法,从而更加准确合理地预测疾病发病率,及时发现,积极预防,及早治疗。模型推广本文中的模型可用于研究受不同复杂变量影响的疾病的发病率,根据对疾病有影响的变量的种类,可增加或减少变量。从工作,生活方式预测某种疾病的发病率,从而达到及时发现,及早检验,积极预防的目的.对疾病的预防具有重要作用和意义。

七.参考文献

[1]费培之、程中瑗层主编,数学模型实用教程,四川大学出版社,(1998) [2]刘来福,曾文艺编著、问题解决的数学模型方法,北京师范大学出版社,(1999) [3]赵静、但琦编, 数学建模与数学实验,高等教育出版社,(2000). [4]Hastie TJ,Tibshirana RJ.Generalized addvitive models[M].London:Chap- Man and Hall,1990:89-90

[5]谢启楠.统计学原理(第六版)暨南大学出版社,(2006)

[6]威廉·D·贝里(吴晓刚译) 线性回归分析基础.上海人民出版社(2011) [7]周迎春. 心脑血管病调养与康复 世界图书出版社(2010) [8]于立敏.脑卒中危险因素分析及护理干预,承德医学学院学报

[9]谢淑萍,赵利杰,刘清;脑卒中的流行趋势及危险因素分析(北京部分地区)[J];卒中与神经疾病;1999年03期

[10]洪震;脑卒中的流行病学及其危险因素[J];中国卒中杂志;2006年08期

10

附录:

程序一

A=load ('shuju.txt'); % n=12;

% x=A(1,:); % y=A(4,:);

% x=[ones(n,1),x'];

% [b,bint,r,rint,s]=regress(y,x); % b,bint,s

% polytool(x',y,1) X=A(1,:); y=A(4,:);

x=[ones(11,1),X',X'.^2 X'.^3];

[b,bint,r,rint,stats]=regress(y',x,0.01); b,bint,stats polytool(X,y,3)

程序二

A=load ('shuju.txt'); % n=12;

% x=A(1,:); % y=A(4,:);

% x=[ones(n,1),x'];

% [b,bint,r,rint,s]=regress(y,x); % b,bint,s

% polytool(x',y,1) X=A(1,:); y=A(4,:);

x=[ones(11,1),X',X'.^2];

[b,bint,r,rint,stats]=regress(y',x,0.01); b,bint,stats polytool(X,y,2)

程序三:

A=load ('shuju.txt'); % n=12;

11

% x=A(1,:); % y=A(4,:);

% x=[ones(n,1),x'];

% [b,bint,r,rint,s]=regress(y,x); % b,bint,s

% polytool(x',y,1) X=A(1,:); y=A(4,:);

x=[ones(11,1),X',X'.^2,X'.^3,X'.^4];

[b,bint,r,rint,stats]=regress(y',x,0.01); b,bint,stats polytool(X,y,4)

程序四:x1=[1025.755 1020.671 1026.371 1017.877

1009.787 1007.64 1005.223 1007.471 1011.513 1018.852 1021.94 1223.6]';

x2=[70.93548 74.67857 70.80645 69.5667 68.3871 76.4 75.58065 71.58065 77.2 74.29032 68.9 62.22581]';

x3=[4.43871 6.942857 8.748387 12.52333 20.70645 23.7 28.5871 30.43226 25.54667 18.05806 12.99333 6.93871]';

y=[0.088 0.082 0.081 0.085 0.0865 0.08

0.081 0.082 0.084 0.083 0.086 0.04 ]'; x=[x1,x2,x3]

rstool(x,y,'purequadratic')

12

本文来源:https://www.bwwdw.com/article/pszr.html

Top