2003年全国大学生数学建模大赛论文

更新时间:2023-09-06 05:53:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数学建模论文

2003年全国大学生数学模型大赛论文

SARS疫情分析及走势预测

1

杨方凯,许送罡,姜舒2

合肥工业大学

2003,9

12

本文获得2003年全国大学生数学模型大赛一等奖。

杨方凯和许嵩罡是合肥工业大学2001级计算机科学与技术系本科生,姜舒(女)是合肥工业大学自动化系2001级本科生。

数学建模论文

目录

SARS疫情分析及走势预测..........................................................................................................................1

目录.........................................................................................................................................................2 摘要.........................................................................................................................................................3 引言.........................................................................................................................................................4 1.问题的提出.......................................................................................................................................5 2. 概要分析............................................................................................................................................6

2.1 模型的概要分析......................................................................................................................6 2.2 符号系统..................................................................................................................................6 2.3 模型假设..................................................................................................................................7 3. 微分方程初步建模............................................................................................................................8

3.1 基于经典的SIR模型(模型I)初步建立微分方程组........................................................8 3.3 利用估计出的日接触率和日治愈率预测............................................................................11 3.4 阻滞增长模型(模型Ⅱ)刻画自由传播阶段非典疫情..........................................................13 3.5 基于模型I和模型Ⅱ(模型Ⅲ)进行定量分析和比较..........................................................14 4.对SIR模型的修正.........................................................................................................................17

4.1 序列的平稳化........................................................................................................................17 4.2 模型辨识................................................................................................................................18

4.2.1 序列中心化.................................................................................................................18 4.2.2 各统计量的估计.........................................................................................................18 4.2.3 模型辨识.....................................................................................................................19 4.3参数估计.................................................................................................................................19 4.4 AR序列的预报.......................................................................................................................20 4.5 预测精度的计算....................................................................................................................22 5.模型的验证.....................................................................................................................................23 6 模型的优缺点.................................................................................................................................24 7 SARS对入境旅游业的影响..........................................................................................................25

7.1 模型的初步分析和假设........................................................................................................25 7.2 模型的建立和求解................................................................................................................25

7.2.1基本符号:..................................................................................................................25 7.2.2模型的建立和求解......................................................................................................26 7.2.3 2003年各月旅游人数函数y(t)的拟合:................................................................27

7.2.4 u(t)的拟合:...............................................................................................................28 7.2.5 η和 的拟合:............................................................................................................28 7.3 模型的最终解................................................................................................................29

8.小短文:在抗击非典过程中建立数学模型的作用........................................................................30 附录.......................................................................................................................................................32

附表一:北京疫情数据...............................................................................................................32 附表2:香港疫情数据................................................................................................................34

数学建模论文

摘要

本文首先评价了题目所给模型优缺点,然后建立自己的模型。

在建模过程中,把累计患病人数随时间变化的过程视为一非平稳随机过程,进而分解为由传染病规律决定的非随机趋势项和受社会各方面随机因素影响的随机项,分别建模。

在研究非随机趋势项时:

1.根据传染病的扩散规律初步建立微分方程模型(模型I),并且根据已有记录对病

人日接触率和疾病治愈率进行了精确刻画,进而提供了一组预测值; 2.针对疾病在自由扩散情况下的传染规律建立Logistic模型(模型II);

3.模型I与模型II结合,得到了可以加入政府控制力度因子的疾病传播全过程模型(模型III),可以直接反映政府控制早晚的不同代价。 在研究随机项时:

使用平稳随机时间序列的分析方法建立了3阶自回归模型AR(3)(模型IV),实现了误差预报;与模型I结合,修正原预测值,得到了精确的预测模型。 建模过程中,发现无论政府从何时开始控制,疾病最终将在65天左右得到有效抑制,所不同的是累计患者数量。

模型建立完毕之后,对香港的发病数量进行了预测,与实际数据相比,预测效果仍然很好,模型得到了验证。

本模型兼具机理分析方法和系统辨识方法,既继承了传统传染病研究的方法,又利用统计学原理进行修正,得到了平均预测精度为99.41%的预测模型;对模型的拓展既扩大了其使用范围,又可指导政府采取正确的控制措施,并对不同措施进行评价。

对于SARS对国民经济的影响,我们考察了它对入境旅游的影响,并建立了相应的数学模型,反映了正常情况下旅游业季节性和逐年增长的趋势,在非典逐步被控制后的迅速复苏。得出的函数关系式可用于对2003年第四季度入境旅游的人数进行预测。

最后的通俗短文,说明了建立传染病数学模型的重要性。

数学建模论文

引言

在今年二月到六月的非典突发过程中,有许多专家用数学模型对非典疫情的发展进行了预测,题目中所给的模型1也是其中较为典型的一个。虽然该模型是在非典爆发早期建立的,但仍有其实用价值:

模型的合理性:

z 模型形式的确立。由于该文章成文时数据量较少(仅限于5月7日以前),作为

早期模型,还存在着初始数据无法获得等困难。在这样的情况下,文章作者为了用尽量少的未知参数来刻画患者人数的增长情况,创造性的提出了指数模型和传染周期的概念,再以事实数据和估计数据进行拟合,这样就有效的避免了参数过多而数据量较少且不够精确而造成的误差,使模型可信性有所提高。 z 引入参数L的合理性。由于该模型主要针对SARS自由扩散的传染规律,则必

定存在患者未及时隔离而使疾病广泛传播。在其被医院隔离之前,存在着一个有限的传染时间。它在该模型中被描述为参数L,从而使传染规律得到一个较为准确的刻画。

z 动态调整参数K的合理性。K在该模型中用于表征每个病人每天的传染人数。

由于政府控制力度的加大和人们对SARS重视程度的加强,它的传染率必然会有所下降,表现为K值的减小。如果使用一个固定的K值,显然会使模型偏离实际。本模型跟据前期数据动态调整K值,可以在一定程度上提高模型的精度。

模型的实用性:

z 模型可用于对某种新流行病流行初期情况的预测。它是在拥有较少的数据量(包

括一些推算数据)和对病理特性不完全了解的情况下建立的。该模型可在一定程序的预测出北京病情完全控制的大致时间及大致的发病人数,虽然存在较大的误差,但在病情爆发的初期,能得到这样的结果已具有较高的实用价值,并且为后期进一步建立更精确的模型提供了参考。

本文利用附表一中提供的北京4月20日到5月20日的数据,建立了一个更加精确灵活的数学模型,希望能够为流行病的预防控制提供理论参考。

数学建模论文

1.问题的提出

今年2到6月,一次史无前例的流行病SARS传染席卷全国的大部分地区,尤其以首都北京,香港,广东等地最为严重。在疾病的控制上,一方面政府采取了行之有效的隔离、跟踪和治疗措施;另一方面,科学工作者基于数学工具建立的各种描述疾病扩散的数学模型起到了很好的指导作用。

数学建模论文

2. 概要分析

2.1 模型的概要分析

本模型的主要目的是对政府控制后某天为止的累计患者人数的估计。设U(t)表示第t天的累计患病人数,虽然从流行病学的角度说,U(t)有规律可循,但是在当今日益复杂多样的因素影响下,又呈现出一定的随机特性,所以把它表示为:

U(t)=f(t)+X(t) (2.1)

f(t)表示患病人数的增长和下降趋势,是由流行病传染特性决定的,非随机的因子; X(t)是一个随机变量,实际表现为对单纯依据传染病学规律所建模型的修正。 本模型就是依据(1.1)将U(t)分解为两部分,各个击破。 非随机部分:

1. 引入病人的日接触率和日治愈率,基于经典的SIR模型[1](P114)(模型I)初步

建立微分方程组;

2. 根据附表一提供的部分数据,估计日接触率和日治愈率随时间变化的函数; 3. 将估计出的日接触率和日治愈率回代入SIR模型,用于对附表一的另一部分

数据预测;

4. 为了对模型I进一步拓展,对控前疾病的自由传播建模(模型Ⅱ),进而与模

型I结合,得出含政府控制力度的疾病传染模型Ⅲ;

5. 基于模型Ⅲ对政府采用不同措施后的效益进行定量分析和比较; 6. 其他改进措施;

上述各点的具体处理技巧和细节将在第3部分的各节详细叙述。

随机部分:

作为对非随机部分的修正,随机部分的计算使用了“平稳时间序列分析”的方法建模(模型IV)

(t)进行平稳化处理,使趋势项消失,得到了一组1. 将模型I中估计所得的U

平稳误差序列X(t),进一步中心化,得到0均值的平稳序列w(t);

2. 利用统计学中的参数估计手段考察w(t)的各项统计特性,进行AR,MA,

ARMA模型辨识;

3. 估计模型中的各项系数,得到递推的误差预报函数;

(t)修正,整体考察得到最终的预报模型; 4. 利用预报函数对U

注:该非随机部分只对模型I修正,模型Ⅱ中的自由传播部分不属于修正范围; 上述各点的具体处理技巧和细节将在第4部分的各节详细叙述。

2.2 符号系统

公共符号及含义:

N(t):第t天实际累计患病人数;

数学建模论文

N:总人口数;

s(t):健康人数占总人口数的比例; i(t):患病人口占总人口的比例; r(t):免疫的人口占总人口的比例;

‘Ni(t):模型I中对累计患者的总数预测; ‘‘Ni(t):加入随机部分修正后的对累计患者的总数预测; 模型I中的各个符号及含义:

λ(t):病人日接触率(每个病人每天感染的健康人数); µ(t):疾病的日治愈率; ξ:城市人口密度;

模型Ⅱ中的各个符号及含义:

I(t):在疾病自由传播情况下累计患病人数占总人数比例; 模型IV中各个符号及含义:

xi:N(t)经平稳化后得到的平稳随机时间序列;

wi:xi中心化处理后的0均值平稳序列; γ k:wi的分组协方差估计;

k:wi的分组自相关函数估计; ρ

k,j:wi序列的偏相关函数估计; α

εt:白噪声序列;

φt:AR/MA/ARMA模型中递推方程的待估系数; Ni(t):误差预报值;

2.3 模型假设

1. 非典突发时,各重灾区采取了封闭措施,可以认为在这一段时间内总人数N基本

保持不变。

2. 将研究的人口的全体分为易感染型、病人和免疫型三类,三类人在总人数N中的

比例分别记作s(t)、i(t)和r(t)。根据SARS机理,可认为免疫型在短期内不会在患病,也不会传染别人,所以r应包含病愈和己死亡的病人两类,因为他们已经退出感染系统。

3. 每个病人每天有效接触的平均人数为λ(t,ξ),λ(t,ξ)称为日接触率,是关于时

间t和人口密度ξ的函数。当病人与健康者有效接触时,使健康者受感染变为病人。 4. 在建模过程中不必考虑疑似病例的问题,因为本文所建的模型是对已经确诊的患

者总数进行预测。疑似病倒中的患者数将最终归入患者总数,因而也不会影响对最终患者总数的预测。

数学建模论文

3. 微分方程初步建模

3.1 基于经典的SIR模型(模型I)初步建立微分方程组

考虑到非典的模型的特点:

z 非典疫情前后延时四个月,时间不是太长; z 治愈后的病人复发率非常低,可以忽略不记; z 非典潜伏期为二到七天,且无周期性发作趋势。 基本符合传染病SIR模型1,作以下假设:

z 非典突发时,各重灾区采取了封闭措施,可以认为在这一段时间内总人数N(其

[2]

值应为北京人口总数,经核实为1423万)的值基本保持不变。 z 将研究的北京人口的全体分为易感染型、病人和免疫型三类,三类人在总人数N

中的比例分别记作s(t)、i(t)和r(t)。其中r应包含病愈和己死亡的病人两类,他们在归为r类后已经退出感染系统。

z 每个病人每天有效接触的平均人数为λ(t,ξ),λ(t,ξ)称为日接触率,是关于

时间t和人口密度ξ的函数。当病人与健康者有效接触时,使健康者受感染变为病人。日治愈率为常数µ,是反映非典时期医疗水平的一个参数。由于非典时期相对较短,认为µ是一个常数也是合理的。 由前两条假设显然有

s(t)+i(t)+r(t)=1 (3.1)

再结合第三条假设有方程

N

di

=λNsi µNi dt

(3.2)

成立。对于病愈和已死亡的移出者而言应有

drN=µNi (3.3) dt

再记初始时刻的健康者和病人的比例分别是s0(>0)和i0(>0) (不妨设移出者的初始值r0=0),则由(3.1)、(3.2)和(3.3)式,SIR模型的方程可写作

di

=λsi µi dt ds

= λsi

dt (3.4)

i(0)=i0 s(0)=s0

3.2 估计日接触率和日治愈率随时间变化的函数

1

这里之所以没有采用SIER模型分析,是因为,首先非典病毒在潜伏期的传染性极低,其次目前尚无可靠的专业资

料证明非典为周期性发作的传染病

数学建模论文

(3.4)式求解析解较困难,而λ和µ又是预测的关键参数。为求得λ和µ,下面使用差分的方法处理数据。

(3.4)式可变形为

λ=

ds/dt

si

(3.5) i=

ds/dt+di/dt

µ

(3.6)

s和i的含义分别为从获得有效的北京数据的日期(4月20日)开始,到第t天为止,

易感染人数的占总体的比例和已经确诊病人数占总体的比例。Ns和Ni则表示对应的易

dsdi

感染人数和已确诊人数,N和N表示相邻两天里Ns和Ni各自增加的人数,由附

dtdt

表1计算得到为:

N(ds/dt)(人)N(di/dt)(人)t(天) Ns (人) Ni(人)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 14229208 14228840 14228672 14228435 14228260 14228054 14227795 14227497 14227389 14227146 14226987 14226850 14226696 14226555 14226442 14226369 14226276 14226186 14226114 14226116 14226085 14226018 14225981 14225937 14225931 14225898 14225916 14225878 14225837 339 482 588 693 774 877 988 1114 1199 1347 1440 1553 1636 1741 1803 1897 1960 2049 2136 2177 2227 2265 2304 2347 2370 2388 2405 2420 2434 -368 -168 -237 -175 -206 -259 -298 -108 -243 -159 -137 -154 -141 -113 -73 -93 -90 -72 2 -31 -67 -37 -44 -6 -33 18 -38 -41 -22 143 106 105 81 103 111 126 85 148 93 113 83 105 62 94 63 89 87 41 50 38 39 43 23 18 17 15 14 3

数学建模论文

29 14225815 2437

(表3.1)

-33 7

dsdi

和的离散值。 dtdtdsdi

于是对λ和µ的计算,就转化为利用第t天的s和i以及和的离散值计算出当

dtdt

天对应的λ和µ的离散的值。

µ µ t λ t λ

0 1.08561 0.663717 15 0.0490373 0.0158144 1 0.348576 0.128631 16 0.0459304 0.000510204 2 0.403099 0.22449 17 0.0351485 -0.00732064 3 0.252553 0.135642 18 -0.000936585 -0.0201311 4 0.266182 0.133075 19 0.0142437 -0.00872761 5 0.295365 0.168757 20 0.0300936 0.013022 6 0.301666 0.174089 21 0.0163401 -0.000883002 7 0.096965 0.0206463 22 0.0191026 0.000434028 8 0.202706 0.0792327 23 0.00255719 -0.00724329 9 0.118064 0.0489978 24 0.013928 0.00632911 10 0.095159 0.0166667 25 -0.00753986 -0.0146566 11 0.0991849 0.045718 26 0.015805 0.00956341 12 0.0862058 0.0220049 27 0.0169471 0.011157 13 0.0649209 0.0292935 28 0.00904126 0.00780608 14 0.0404982 -0.0116473 29 0.0135452 0.0106689

上表中每列分量除以总体数N,即可得到s和i以及

(表3.2)

在已经得到了λ和µ关于t的离散点对之后,用拟合的方法分别求出λ和µ的多项式拟合函数。由于λ是有效接触率,随疫情的发展,社会控制能力会逐步加强,λ应在预测中呈下降趋势,由此选用奇次多项式拟合,兼顾精度要求取5次为佳。类似的,µ为治愈率,它将有上升的趋势,这是研究和科学进步的必然结果,所以选用偶次的4次多项式进行拟合。

经Matlab计算得拟合的结果为

λ(t)=a0t5+a1t4+a2t3+a3t2+a4t+a5

a0=-2.086645471158186e-008 a1=3.826946418938200e-006

a2=-2.637966830667394e-004 a=8.460469830641663e-003 3

a4=-1.258413197153712e-001

a5=7.186295025799703e-001 (3.7)

数学建模论文

µ(t)=b0t4+b1t3+b2t2+b3t+b4

b0=3.690393696768289e-007 b1=-5.426546482413156e-005

b2=2.755384767332514e-003 b3=-5.569811914495037e-002 b4=3.698033771130149e-001

(3.8)

3.3 利用估计出的日接触率和日治愈率预测

在利用北京市提供的前30组数据得到的λ和µ关于t的拟合方程之后,下面进一步讨论如何利用已知的前30组数据,按照微分方程模型,对后35组数据进行预测。

回到(3.4)式,由差分定义可知存在

di

=it it 1 (3.9) dt

以及

ds

=st st 1 (3.10) dt

将(3.9)、(3.10)式代入(3.4)式,可得

st 1

st= λit+1 (3.11) it 1 it= 1+µ λst

为实现模型的预测,将(3.11)式整理为迭代的形式

λit 1+1+µ+λst 1 (λit 1+1+µ+λst 1)2 4λ(1+µ)

st=2λ (3.12)

it 1 it=

1+µ λst

且由(表3.1)知s0=14229208,i0=339。由此可算得第t天时Nit的值,也就是第t

天时已确定感染的病人数,下面将用迭代计算出的i值称为理论值,表示为i′(t),而实际数据得出的i值称为实际值,表示为i(t)。将计算结果整理成下表,以示比较。

t 0 1 2 3 4 5

Ni(t) 339 482 588 693 774 877

Ni′(t) 339.000475.479619.265761.197894.1941013.92

t 33 34 35 36 37 38

Ni(t) 2465 2490 2499 2504 2512 2514

Ni′(t) 2804.752794.752772.172738.332694.912643.91

数学建模论文

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 988 1114 1199 1347 1440 1553 1636 1741 1803 1897 1960 2049 2136 2177 2227 2265 2304 2347 2370 2388 2405 2420 2434 2437 2444 2444 2456 1118.591208.511285.351351.581409.971463.281514.041564.461616.361671.181729.981793.441861.901935.332013.362095.252179.972266.142352.092435.962515.712589.262654.592709.832753.422784.162801.3339 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 2517 2520 2521 2522 2522 2522 2522 2522 2522 2523 2522 2522 2522 2523 2523 2522 2522 2522 2521 2521 2521 2521 2521 2521 2521 2587.482527.872467.342408.042352.032301.182257.182221.532195.562180.4 2177.022186.172208.352243.702291.872351.782421.302496.902573.212642.652695.222718.702699.552624.712484.24

(表3.3)

上表中Ni(t)和Ni′(t)的值之间的偏差不是很大,两者随时间变化的走势基本相同。这表明模型的建立是遵从客观的自然规律的。而且这不大的偏差还将使用模型IV修正,达到更高的精度。

目前通过附表一所得到的数据仅为从4月20日起北京的非典统计数据,下图(图3.1)较为精确的给出了λ的理论值和实际值之间的比较。曲线代表的是经前30项数据拟合后推出的从4月20日(t=0)到6月23日(t=64)λ的理论值图像。点线则是对应时间的λ的真实值。从图上看,λ服从五次多项式拟合后的结果呈下降趋势。这说明自t=0起,在控制阶段中,政府的控制力和社会人群的主观能动性已经较突出的体现在了λ值的随时间的变化规律上。

下面对4月20日之前的情况进行详细的讨论,以此对卫生部门所采取的措施做出评论。具体而言,就是对提前或延后五天采取严格的隔离措施,对疫情传播所造成的影响做出估计。

数学建模论文

(图3.1) λ的理论值和实际值

3.4 阻滞增长模型(模型Ⅱ)刻画自由传播阶段非典疫情

在4月20日之前的患病人数,显然不能通过拟合的λ值算得结果,因为非典病人不可能一下子成为i0=339,一定也有一个从无到有的过程。解释为:

1. 在4月20日之前,宏观控制力不够,没能采取严格的隔离措施。

2. 社会人群能动性不足,不能及时有效的采取合理的方法防治非典病毒。

基于以上两点,结合传染病理论的相关知识,可以认为,传染病在初期没有人为干预情况下表现为自由传播。这一阶段的患病人数的增长可用Logistic模型(阻滞增长模型)刻划。

于是整个Ni(t)(病人总数)的变化过程可以描述为两部分。一部分是后期受控阶段的病人总数,也即模型I。另一部分即是在自由传染阶段模型Ⅱ,用Logistic模型描述为:

dI

=r(1 I)I

(3.13) dt

N I0=1

r为Logistic模型中的固有增长率。I为自3月2日开始起算的已确诊的病人数占总体的比例

(3.13)式求解得:

1

(3.14) I(t)= rt

1+(N 1)e

数学建模论文

北京第一例非典病人出现于3月2日[3],距题中4月20日相距50天。则有

NI(50)=339 (3.15)

结合(3.14)式,可以算得固有增长率r=0.1165。从而关于非典前期传染的数学模型建立为

1

(3.16) I(t)= 0.1165t

1+(N 1)e

式中t为距首例患病者被发现时(3月2日)的天数,N为北京人口总数。由(3.16)式可以很直观的看出,在距首例患者被发现后50天开始进行严格的隔离限制政策,得到NI(50)=339。如果提前5天下达严格制理措施,则得到I(45)=189。相反如果退后5天,则NI(55)=606。

而NI(45)=189和NI(55)=606分别为上述两种情况下,控制阶段的初始病例数。据此,可以对这两种情况的疫情发展进行预测。

首先给出以下两个命题:

z 命题1:对同一封闭地区,对于λ的变化,t和ξ 起决定性作用。其中t是距控

制过程开始的天数,ξ 是当地的人口密度。

证明:由于λ 的值反映的是有效接触率,随着时间的推移在社会中流动的传染病人数目将会相对减少,从而降低了λ的值。而难于获得的流动传染者的数据将表现为t对λ的影响。同时,如果当地人口密度ξ值较大。则意味着单位时间内人与人之间接触的频率将会相对增加,从传染病本身的含义,显然可以推知λ 受ξ 的影响是不可忽略的。 z 命题2:从数据拟合的λ(t,ξ)表达式不受控制过程开始时已患病人数的影响。

证明:根据附表一的北京统计数据,已经拟合出关于λ的五次多项式 (3.7)。这一多项式的系数不因控制阶段开始的提早或推后而改变。提早或推后改变的只是在突发的自由传播阶段已患病的人数,而这些人数相对于人口总数N十分微小。由此可知,在控制阶段开始后,对于同一地区的控制力可认为相同。则单位时间内隔离非典病人的人数应该随已患病人数的多少成比例放大或缩小。只要λ的值变为0,就意味着非典已经不再传染。从而已患病非典累计人数不再改变。而λ的解释式对同一地区是恒定的。同一地区的非典疫情完全受控的时间,也即不再有新的病历出现的时间都是相同的。

说明:在命题1中,提到t和ξ 对λ的影响起决定性作用。但是在同一地区,ξ的值代表的当地的人口密度。在一个相对较短的时期内,这个值可以认为是恒定的,从而在后面对北京地区的讨论中将λ(t,ξ)简化为λ(t)。也即同一地区内,λ只受t的影响。

3.5 基于模型I和模型Ⅱ(模型Ⅲ)进行定量分析和比较

模型I刻画了自由传播阶段的患者总数的变化,模型Ⅱ刻画了控制阶段的患者总数的变化。二者共同反映了自首例非典患者出现起,至非典患者总数不再增加为止,患者总数的变化的规律。将二者结合,称为模型Ⅲ,并将其用于下面的预测检验中。

为了检验上述假设的合理性,同时说明已经建立的微分模型有可靠的预测能力。 回到(3.12)式,对推迟五天隔离进行预测:

由NI(55)=606可知在(3.12)式中,Ns0=606,由此得出的Nit随时间变化的迭代

数学建模论文

结果如下表所示:

Nit t

0 606.00 1 849.96 2 1106.99 3 1360.69 4 1598.42 5 1812.43 6 1999.54 7 2160.27 8 2297.62 9 2416.00 10 2520.37 11 2615.67 12 2706.41 13 2496.53 14 2889.31 15 2987.30 16 3092.41 17 3205.85 18 3328.22 19 3459.48 20 3598.95 21 3745.35

t 22

23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43

Nit 3896.784050.804204.454354.364496.924628.414745.184843.934921.834976.785007.485013.604995.714955.354894.864817.254726.084625.214518.664410.454304.464204.34

(表3.4)

t 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64

Nit 4113.444034.793971.063924.633897.543891.503907.863947.504010.704096.814203.884328.154463.294599.714723.844817.804859.764825.554691.764440.664065.86

提前五天的情况可以类似的计算出来。这里就不再给出具体表格了。

下图(图3.2)是跟据提前五天和退后五天的迭代数据以及真实数据分别进行拟合得到的患病人数的增长曲线。从曲线中可以很明显的看出,无论是提前五天还是退后五天,总患病人数稳定的时间,都在控制阶段开始后的65天左右。这个结论证明了λ 不随控制阶段开始时患者总数的影响。并且针对同一时间t,设p1(t)、p2(t)和p3(t)分别代表(图3.2)中的退后五天、实际数据和提前五天对应时间总患病人数。则显然有:

p1(t) p2(t)>p2(t) p3(t) (3.17)

这也说明了越晚控制非典疫情,总患病人数增加的速度也更大。

数学建模论文

(图3.2) 提前和推迟控制与实际数据对照图

数学建模论文

4.对SIR模型的修正

本节使用平稳时间序列分析及预报的方法估计随机项,建立模型Ⅳ,对模型I的预测结果进行修正,以进一步提高预测精度。原预测序列和修正项结合得到模型Ⅴ

4.1 序列的平稳化

序列的平稳化将使用差分方法[4](P13)。该方法认为任意时间序列在进行有限次差分后可以得到一个平稳序列.经过平稳化后,非随机项将消失,留下平稳的随机项。

对其使用三阶差分后得到的序列如下:

36 2346 147 56104 11875 5052 6575 6357 28 4455 2113

3 2415

标记在图中如下:

4

1

1

10

15

11

19

(图4-1) 由图可见,数据基本已经在0的上下等幅度振动

在本模型中,使用前30个元素进行统计分析,来预测后35个元素。

数学建模论文

4.2 模型辨识

在时间序列分析理论中。常见的三种模型是AR(自回归,Auto Regression)模型,MA(滑动平均,Moving Average)模型和ARMA(滑动自回归混合模型),序列具体使用哪一个模型,以及该模型的阶数,是由其统计特性决定的。有关模型辨识的各个定理的证明参见文献[5](P268),这里仅给出所需要的公式和结论,以及演算的步骤。

4.2.1 序列中心化

设上述平稳序列为x1,x2,...x30,它是平稳过程{X(t),t=0,1,2,...}的一组采样值,则计算序列均值

130

x=xi (4.1) ∑30i=1

为该平稳过程均值的一个无偏估计;

再令: wi=xi x (4.2) 那么,w1,w2,w3,...为一零均值序列。

根据(4.1) x=0.5968 (4.2.1) 再由(4.2)式得x1,x2,x3,...经过中心化后的值为: 35.40326.4032 23.596845.4032 14.5968 56.5968103.4032 118.596874.4032 50.596851.4032 65.596874.4032 63.5968

28.5968 44.596856.4032

24.596814.40323.4032

0.59680.4032

记为w1,w2,w3,...w30。

54.4032 1.5968 21.5968 2.596812.40321.40322.4032 1.5968

4.2.2 各统计量的估计

协方差函数使用下式估计:

1N k

γ k=∑wiwi+k k=0,1,...,M (4.3)

Ni

在本题中,取N=30,M=7,得到的协方差函数的估计为:

r

γ =( 961.460706.6987 530.0682456.1680 451.7485) (4.4) 自相关函数使用下式估计:

γ

k=k k=0,1,2,... (4.5) ρ

γ 0

在本题中,得到的自相关函数的估计值为:

r

=( 0.73500.5513 0.47450.4699 0.4602) (4.6) ρ

偏相关函数使用下式估计:

数学建模论文

α 1 1,1=ρ kk

k+1 ∑ρ k+1 jα jα k+1,k+1=(ρ kj)(1 ∑ρ kj) 1 j=1,2,...,k (4.7) α

j=1j=1

k+1,j=α k,j α k+1,k+1α k,k j+1 α

在本题中,得到的偏相关函数的估计值为:

r

k,k=( 0.73500.3741 0.13350.1605 0.0452) (4.8) α

4.2.3 模型辨识

AR,MA,ARMA模型的重要特征体现在自相关函数和偏相关函数的截尾和脱尾特

性上,在95%的置信水平上,当

2 k< ρ (4.9)

N0

即可认为自相关函数截尾。AR(k)模型的特点是:自相关函数脱尾,偏相关函数从第k项开始截尾。

22

k,k从第三项本题中:N0=30,所以==0.3651,显然,ρk序列脱尾,α

30N0开始截尾,则模型辨识为AR(3)模型。

4.3参数估计

本节使用参数的矩估计法估计AR(3)模型的各个参数。用于估计的各个公式和结论

见文献[4](P279)

AR(3)模型的形式为:

wt φ1wt 1 φ2wt 2 φ3wt 3=at (4.10)

at为白噪声序列。此处要估计的参数为φ1,φ2,φ3

参数估计:

各待估参数写成矩阵形式,满足下列方程:

1 1Lρ p φρ ρ1 1 2 1 p 2 φLρ1ρ ρ2 (4.11) M = L LL ρ p 1ρ p 2L1 ρ φp p

其中的系数矩阵为Toeplitz矩阵,它是可逆的。代入各参数,解矩阵方程后可得各待估参数为:

r

=(0.71400.07170.1335) (4.12) φ

所以本序列的AR(3)模型为: wt=0.7140wt 1+0.0717wt 2+0.1335wt 3+at (4.13)

本文来源:https://www.bwwdw.com/article/ayyh.html

Top