时间序列分析 第五章-非平稳序列的随机分析汇总 - 图文

更新时间:2024-01-19 16:30:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

应 用 时 间 序 列 分 析 实 验 报 告 实验名称 第五章 非平稳序列的随机分析 一、上机练习 5.8.1 拟合ARIMA模型 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -16.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 ; proc gplot; plot x*t; symbol v=star c=black i=join; run; 输出时序图显示这是一个典型的非平稳序列。如图(1)所示: 图(1) 考虑对该序列进行1阶差分运算,同时考察差分序列的平稳性,在原程序基础上添加相关命令,程序修改如下: 1

proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; estimate p=1 noint; forecast lead=5 id=t; run; (1)我们在GPLOT过程中添加绘制了一个时序图“difx*t”,这是为了直观考察1阶差分后序列的平稳性。所得时序图如图(2)所示: 图(2) 时序图显示差分后序列difx没有明显的非平稳特征。 (2)“identify var=x(1);”,使用该命令可以识别差分后序列的平稳性。纯随机性和适当的拟合模型阶数。其中x(1)表示识别变量x的1阶差分后序列。识别部分的输出结果显示1阶差分后序列difx为平稳非白噪声序列,而且具有显著的自相关系数不截尾、偏自相关系数1阶截尾的性质。 (3)“estimate p=1;”对1阶差分后序列▽Xt拟合AR(1)模型。输出拟合结果显示常数项不显著,添加或修改估计命令如下: estimate p=1 noint; 这就是命令系统不要常数项拟合AR(1)模型,拟合结果显示模型显著且参数显著。如图(3)所示: 2

输出结果显示,序列Xt的拟合模型为ARIMA(1,1,0)模型。 (4)“forecast lead=5 id=t;”,利用拟合模型对序列Xt作5期预测。 5.8.2 拟合Auto-Regressive模型 在SAS系统中有一个AUTOREG程序,可以进行残差自回归模型拟合。下面以临时数据example5_2的数据为例,介绍相关命令的使用。 一、建立数据集,绘制时序图 data example5_2; input x@@; t=_n_; lagx=lag(x); cards; 3.03 8.46 10.22 9.80 11.96 2.83 8.43 13.77 16.18 16.84 19.57 13.26 14.78 24.48 28.16 28.27 32.62 18.44 25.25 38.36 43.70 44.46 50.66 33.01 39.97 60.17 68.12 68.84 78.15 49.84 62.23 91.49 103.20 104.53 118.18 77.88 94.75 138.36 155.68 157.46 177.69 117.15 ; proc gplot data=example5_2; plot x*t =1; symbol1 c=black i=join v=start; run; 输出时序图如图(4)所示: 3

图(4) 时序图显示,序列x有一个明显的随时间线性递增的趋势,同时又有一定规律性的波动,所以不妨考虑使用误差自回归模型拟合该序列的发展。 二、因变量关于时间的回归模型 proc autoreg data=example5_2; model x=t/dwprob; run; 语句说明: (1)“proc autoreg data=example5_2;”指令SAS系统对临时数据集example5_2进行自回归程序分析。 (2)“model x=t/dwprob;”指令SAS系统以变量t作为自变量,变量x作为因变量,建立线性模型: Xt=a+bt+Ut 并给出残差序列{Ut}DW检验统计量的分位点。 本例中,序列x关于变量t的线性回归模型最小二乘估计输出结果如图(5)所示。 图(5) 序列关于变量t的线性回归模型最小二乘估计结果 本例输出结果显示,DW统计量的值等于0.7628,输出概率显示残差序列显著正相关。所以考虑对残 4

差序列拟合自相关模型,修改AUTOREG程序如下: proc autoreg data=example5_2; model x=t/ nlag=5 backstep method=ml ; run; model语句是指令系统对线性回归模型Xt=a+bt+Ut的残差序列{Ut}显示延迟5阶的自相关图,并拟合延迟5阶自现关图。 由于自相关延迟阶数的确定是由我们尝试选择的,所以nlag的阶数通常会指定得大一些。这就导致残差自回归模型中可能有部分参数不显著,因而添加逐步回归选项backstep,指令系统使用逐步回归的方法筛选出显著自相关因子,并使用极大似然的方法进行参数估计。 输出结果如下四方面的结果: 1. 因变量说明 因变量说明 2.普通最小二乘估计结果 该部分输出信息包括误差平方和(SSE)、自由度(DFE)、均方误差(MSE)、根号均方误差(Root MSE)、SBC信息量、AIC信息量、回归部分相关系数平方(Regress R-Square)、总的相关系数平方(Totel R-Square),DW统计量(Durbin-Watson)及所有待估参数的自由度、估计值、标准差、t值和t统计量的P值。如图(6)所示: 图(6) 普通最小二乘估计结果 3.回归误差分析 该部分共输出四方面的信息:残差序列自相关图、逐步回归消除的不显著项报告、初步均方误差(MSE)、自回归参数估计。 本例该部分输出结果如图(7)所示。 5

立序列{Xt}关于时间t的线性回归模型,并检验残差序列的自相关性和异方差性,如果检验结果显示残差序列具有显著自相关性,建立残差自回归模型;如果残差序列具有显著异方差性,则要建立条件异方差模型。 语句说明: (1)“model x=t/nlag=5 dwprob archtest;”,该命令指令系统建立序列{Xt}关于时间t的线性回归模型,并检验残差序列5阶延迟的自相关性并输出DW检验的P值,同时对残差序列进行异方差检验。 DW检验结果显示残差序列具有显著的正相关性,如图(14)所示。 图(14) 普通最小二乘估计输出结果 残差序列5阶延迟自相关图显示残差序列至少具有2阶显著自相关性,如图(15)所示。 图(15) 残差序列自相关图 参数估计结果显示回归模型常熟截距项不显著,如图(16)所示。 图(16) 线性回归模型参数估计结果 异方差检验结果显示,残差序列具有显著地异方差性,且具有显著地长期相关性,如图(17)所示。 11

图(17) 异方差检验结果 (2)“model x=t/nlag=2 noint garch=(p=1,q=1);”,综合考虑序列残差序列自现关性和异方差性检验结果,尝试拟合无回归常数项的AR(2)-GARCH(1,1)模型。 模型最总拟合结果如图(18)所示。 图(18) 普通最小二乘估计输出结果 参数检验结果显示除GARCH(1,1)模型中的常数项不显著外,其他变量均显著,整个模型的R^2高达0.9954,且正态性检验不显著(P值为0.3106),这与假定GARCH的残差函数εt/(ht)^(1/2)服从正态分布相吻合,所以可以认为该模型拟合成功。 (3)“output out=out p=p residual=residual lcl=lcl ucl=ucl cev=cev;”将估计值(p=),残差(residual=),序列置信下限(lcl=),序列置信上限(Ucl=),条件方差(cev)的结果存入临时数据集work.out。 后面整个data步的工作都是对结果数据集work.out进行数据加工,已获得以下数据: 残差序列方差齐性假定下95%的置信下限:l95=-1.96*sqrt(51.42515); 残差序列方差齐性假定下95%的置信上限:u95=1.96*sqrt(51.42515); 残差序列条件方差假定下95%的置信下限:Lcl_GARCH=-1.96*sqrt(cev); 12

残差序列条件方差假定下95%的置信上限:Ucl_GARCH=1.96*sqrt(cev); 条件方差假定下,序列的95%的置信下限Lcl_p=p-1.96*sqrt(cev); 条件方差假定下,序列的95%的置信上限Ucl_p=p+1.96*sqrt(cev); 分别绘制两种拟合效果图,图(19)是针对残差序列的波动性拟合情况,及在方差齐性和非齐两种假定下的置信区间,绘制命令如下: plot residual*t=2 l95*t=3 Lcl_GARCH*t=4 u95*t=3 Ucl_GARCH*t=4/overlay; 图(19) 残差序列在两种方差假定下的置信区间效果图 图(21)是原序列的拟合情况,及在方差齐性和非齐两种假定下的置信区间,绘图命令如下: plot x*t=5 lcl*t=3 LCL_p*t=4 ucl*t=3 UCL_p*t=4/overlay; 图(21) 序列在两种方差假定下的置信区间效果图 13

图中,中间的波动曲线为残差序列或原序列,虚线为根据无条件方差得到的95%置信区间,而实线为根据条件方差得到的95%置信区间。

习题1

data example5_1; input x@@; difx=dif(x); t=_n_; cards;

304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ;

proc gplot; plot x*t;

symbol v=star c=black i=join; proc gplot;

plot x*t difx*t;

symbol v=star c=black i=join; proc arima;

identify var=x(1); estimate p=1;

forecast lead=5 id=t; run; 实验结果:

14

x31030029028027026001020304050t60708090100110 图1.1 序列时序图 由时序图可知,该序列不平稳,是一个非平稳序列。 x100-10-2001020304050time60708090100110 图1.2 序列difx时序图 差分运算的实质是使用自回归方式提取确定性信息,因此用1阶差分对序列的信息提取。该时序图没有明显的非平稳特征。 15

图1.3 序列difx模型拟合结果 根据检验结果显示,该序列延迟各阶的P值都大于显著性水平0.05,接受原假设,即股票的收盘价1阶差分序列为非白噪声序列。 图1.4预测结果 由上图可得,预测该股票下一天的收盘价为288.6812。 习题5 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 2203 2360 2254 2165 2024 2078 2214 2292 2207 2119 2119 2137 2132 1955 1785 1747 1818 1909 1958 1892 1919 1853 1868 1991 2111 2119 1991 1859 1856 1924 1892 1916 1968 1928 1898 1850 16

1841 1824 1823 1843 1880 1968 2029 1996 1933 1805 1713 1726 1752 1795 1717 1648 1512 1338 1383 1344 1384 1484 1597 1686 1707 1640 1611 1632 1775 1850 1809 1653 1648 1665 1627 1791 ; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; forecast lead=7 id=t; run; 实验结果: 图5.1序列时序图 由时序图可知该序列不平稳,即该序列为一个非平稳序列。 1阶差分序列时序图: 17

图5.2序列difx时序图 而差分运算能使用自回归方式提取确定性信息,因此对序列进行1阶差分运算,考察其1阶差分序列的平稳性。1阶差分序列值始终在0周围上下波动,即1阶差分序列平稳。 白噪声检验结果如下: 图5.3序列difx模型拟合结果 根据检验结果显示,该序列延迟各阶的P值都大于显著性水平0.05,接受原假设,即股票的收盘价1阶差分序列为非白噪声序列。 预测图: 18

图5.4预测结果

由上图可得,预测1939—1945年英国绵羊的数量分别为1851,1872,1879,1880,1879,1877,1875。

习题六

data example5_3; input x@@; t=_n_;

lagx=lag(x); cards;

4.99 5 5.03 5.03 5.25 5.26 5.3 5.45 5.49 5.52 5.7 5.68 5.65 5.8 6.5 6.45 6.48 6.45 6.35 6.4 6.43 6.43 6.44 6.45 6.48 6.4 6.35 6.4 6.3 6.32 6.35 6.13 5.7

5.58 5.18 5.18 5.17 5.15 5.21 5.23 5.05 4.65 4.65 4.6 4.67 4.69 4.68 4.62 4.63 4.9 5.44 5.56 6.04 6.06 6.06 8.07 8.07 8.1 8.05 8.06 8.07 8.06 8.11 8.6 10.8 11 11 11 9.48 9.18 8.62 8.3 8.47 8.44 8.44 8.46 8.49 8.54 8.54 8.5 8.44 8.49 8.4 8.46 8.5 8.5 8.47 8.47

8.47 8.48 8.48 8.54 8.56 8.39 8.89 9.91 9.89 9.91 9.91 9.9 9.88 9.86 9.86 9.74 9.42 9.27 9.26 8.99 8.83 8.83 8.83 8.82 8.83 8.83 8.79 8.79 8.69 8.66 8.67 8.72 8.77 9 9.61 9.7 9.94 9.94 9.94 9.95 9.94 9.96 9.97 10.83

10.75 11.2 11.4 11.54 11.5 11.34 11.5 11.5 11.58 12.42 12.85 13.1 13.12 13.1 13.15 13.1 13.2 14.2 14.75 14.6 14.6 14.45 14.5 14.8 15.85 16.2 16.5 16.4 16.4 16.35 16.1 13.7 13.5 14 12.3 12 14.35 14.6 12.5 12.75 13.7 13.45 13.55 12.6 12 11 11.6 12.05 12.35 12.7 12.45 12.55 12.2 12.1 11.15

11.85 12.1 12.5 12.9 12.5 13.2 13.65 13.65 13.5 13.45 13.35 14.45 14.3 15.05 15.55 15.65 14.65 14.15 13.3 12.65 12.7 12.8 14.5 15.1 15.15 14.3 14.25 14.05 14.7 15.05 14.05 13.8 13.25 13 12.85 12.6 11.8 13 12.35 11.45 11.35 11.55 10.85 10.9

12.3 11.7 12.05 12.3 12.9 13.05 13.3 13.85 14.65 15.05 15.15 14.85 15.7 15.4 15.1 14.8 15.8 15.8 15 14.4 13.8 14.3 14.15 14.45 14.1 14.05 13.75 13.3 13 12.55 12.25 11.85 11.5 11.1 11.15 10.7 10.25 10.55 10.25 10.3 9.6 8.4 8.2 7.25

19

8.35 8.25 8.3 7.4 7.15 6.35 5.65 7.4 7.2 7.05 7.1 6.85 6.5 6.25 5.95 5.65 5.85 5.45 5.3 5.2 5.55 5.15 5.4 5.35 5.1 5.8 6.35 6.5 6.95 8.05 7.85 7.75 8.6 ; proc gplot; plot x*t; symbol v=star c=black i=join; proc autoreg data=example5_3; model x=lagx/lagdep=lagx archtest; model x=lagx/lagdep=lagx noint garch=(p=1,q=1); output out=out p=xp; proc gplot data=out; plot x*t=2 xp*t=3/ overlay; symbol2 v=star i=none c=black; symbol3 v=none i=join c=red w=2; run; 实验结果; 得到序列时序图如下: z17161514131211109876540100200t300400 图6.1序列时序图 结果显示该序列不平稳。 20

图6.2DW检验结果 根据时序图用延迟因变量auto-regressive模型对该序列进行拟合,并进行异方差分析。Durbin h统计量的的P值小于显著性水平0.05,因此残差序列为非白噪声序列,存在着相关性,需要继续对残差序列进行自回归拟合。 异方差检验结果如下: 图6.3异方差检验结果 Q统计量检验和LM检验结果显示,除延迟1阶不存在异方差外,其它延迟各阶都显示残差序列{vt}具有显著的异方差自相关性,而且具有长期自相关性,因此用GARCH模型进行序列的拟合。 参数估计结果如下: 图6.4参数估计结果 结果显示常数项不显著,因此去除常数项进行拟合。 21

GARCH(1,1)模型最终拟合结果: 图6.5模型最终拟合结果 结果显示,参数ARCH1,GARCH1不显著,所以最终拟合模型为: Zt=0.9995zt-1+vt; vt=h1/2et; ht=0.2743+2.099E-23ht-1; 直观地观察拟合效果图 z17161514131211109876540100200t300400 图6.6拟合图 22

二、实验体会 本次实验主要是ARIMA模型的拟合。首先绘制一个时序图,如果不平稳,再做1阶差分或者2阶差分用auto-regressive拟合或者garch拟合。 当我们拟合一个时间序列时,先通过差分法或适当的变换使非平稳序列的化成为平稳序列,我们再要考虑的是参数化和记忆特征的有效性,用这种参数方法拟合序列为某种特定的结构,只用很少量的参数,使参数的有效估计成为可能。相对于一个序列的过去值可用传统的Box和Jenkins方法建模。随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)存在一些问题,它只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。对于时间序列数据分析无论是采用确定性时序分析方法还是随机时序分析方法,分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。Box和Jenkins特别强调差分方法的使用,他们使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。而Gramer分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。 对平稳性和季节性的识别通常有直接估计和利用proc arima中identify语句两种方法,或两者结合起来一起判断。直接估计平稳性。直接估计就是通过直接观察时间序列折线图来检验序列是否平稳。如果时间序列有某种趋势或呈现出增加或减少范围的扩散现象,则序列是不平稳的。利用proc arima估计平稳性。如果序列的折线图并不明显地呈现上述现象,而我们又无法直接判断序列究竟平稳与否,通常可以利用proc arima过程的identify语句来检测序列是否平稳。 如果断定一个时间序列是不平稳的,通常可以作一些简单的变换或修正,使其减少趋势或平稳化。然后对变换后的新序列建模预测,可以避免将数据拟合成更复杂的模型。 最常用的变换方法有:如果时间序列呈线性趋势,均值不是常数,利用一阶差分将产生一个平稳序列。如果时间序列呈二次趋势,均值不是常数,利用二阶差分将产生一个平稳序列。如果时间序列呈现出随时间的上升或下降而偏差,方差不是常数,通常可利用取自然对数转化为平稳序列。如果时间序列呈现指数趋势,均值和方差都不是常数,通常也可利用取自然对数转化为平稳序列。如果时间序列呈现“相对环”趋势,通常将数据除以同时发生的时间序列的相应值转化为平稳序列。 ARIMA模型有三个参数(p,d,q),这里p指模型的自回归部分的阶数,d指序列差分的次数,q指模型平均移动部分的次数。该过程通常分三个阶段进行:首先识别序列,然后估计和诊断检验模型,最后进行预测。 23

本文来源:https://www.bwwdw.com/article/wroo.html

Top