AR,MA,ARIMA模型介绍及案例分析

更新时间:2024-06-09 19:28:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

BOX-JENKINS预测法

1 适用于平稳时序的三种基本模型

(1)AR(p)模型(Auto regression Model)——自回归模型

p阶自回归模型:

????=??+?1?????1+?2?????2+?+??????????+????

式中,????为时间序列第??时刻的观察值,即为因变量或称被解释变量;?????1,?????2,?,???????为时序????的滞后序列,这里作为自变量或称为解释变量;????是随机误差项;??,?1,?2,?,???为待估的自回归参数。 (2)MA(q)模型(Moving Average Model)——移动平均模型

q阶移动平均模型:

yt???et??1et?1??2et?2????qet?q

式中,?为时间序列的平均数,但当{yt}序列在0上下变动时,显然?=0,可删除此项;et,et?1,et?2,?,et?q为模型在第t期,第t?1期,?,第t?q期的误差;?1,?2,?,?q为待估的移动平均参数。

(3)ARMA(p,q)模型——自回归移动平均模型(Auto regression Moving Average Model)

模型的形式为:

yt?c??1yt?1??2yt?2????pyt?p?et??1et?1??2et?2????qet?q

显然,ARMA(p,q)模型为自回归模型和移动平均模型的混合模型。当q=0,时,退化为纯自回归模型AR(p);当p=0时,退化为移动平均模型MA(q)。

2 改进的ARMA模型

(1)ARIMA(p,d,q)模型

这里的d是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳(具有一定趋势的)序列变换为平稳的,通常来说d的取值一般为0,1,2。

对于具有趋势性非平稳时序,不能直接建立ARMA模型,只能对经过平稳化处理,而后对新的平稳时序建立ARMA(p,q)模型。这里的平文化处理可以是差分处理,也可以是对数变换,也可以是两者相结合,先对数变换再进行差分处理。

(2)ARIMA(p,d,q)(P,D,Q)s模型

对于具有季节性的非平稳时序(如冰箱的销售量,羽绒服的销售量),也同样需要进行季节差分,从而得到平稳时序。这里的D即为进行季节差分的阶数;

P,Q分别是季节性自回归阶数和季节性移动平均阶数;S为季节周期的长度,如

时序为月度数据,则S=12,时序为季度数据,则S=4。

在SPSS19.0中的操作如下

? 必须要先打开一个数据源,才可以定义日期

? 数据?定义日期?选择日期的起始点,此时变量栏中会出现日期变量。

(3)ARIMAX模型

在ARIMA(p,d,q)(P,D,Q)s模型中,再加入除自身滞后时序变量以外的解释变量X。

3 模型的识别

模型的识别的本质是确定ARIMA(p,d,q)(P,D,Q)s中的p,d,q以及P,D,Q与

S的取值。借助于自相关函数(Auto correlation Function, ACF)以及自相关分析

图和偏自相关函数(Partial Correlation Function, PACF)以及偏自相关分析图来识别时序特性,并进一步确定p、q、P、Q。

3.1 自相关函数

自相关是时间序列Y1,Y2,?Yt诸项之间的简单相关。它的含义与相关分析中变量之间的简单相关一样,只不过它所涉及的是同一序列自身,因而称作自相关。自相关程度的大小,用自相关系数rk度量。

rk??(yt?1n?kt?y)(yt?k?y)?(yt?1n

t?y)2式中,n为样本数据的个数;k为滞后期;y为样本数据平均值。 自相关系数rk,可看作自变量k的函数,即自相关函数。它表示时间序列滞后k个时间段的两项之间相关的程度。如r1表示每相邻两项间的相关程度;r2表示每隔一项的两个观察值得相关程度。

随机序列自相关系数的抽样分布,近似于以0为均值,1n为标准差的正态n。如果一个分布。自相关系数的95%置信区间为(?1.96?,1.96?),此处??1时间序列的自相关系数全部落入这个区间,则认为该序列是纯随机序列。

将时间序列的自相关系数绘制成图,并标出一定的置信区间(通常采用?2倍标准差作为置信区间的两个端点),被称作自相关分析图。 SPSS19.0中的操作

1. 输入变量数据;定义时间序列日期(数据?定义日期)

2. 分析?预测?自相关(如下);将要分析的变量从左侧移入右侧变量框中

3. 勾选自相关、偏自相关,转换暂时不选(如果为非平稳序列,可勾选差分/自然对数转换,其中差分的阶数需要根据自相关图形来确定,通常为0,1,2)

未进行差分处理,由图可知几乎一半的自相

关系数未进入置信区间,说明该序列非平稳,此时需要进行差分处理,即在重复

第2步时,差分选项选择1或2。

3.2 偏自相关函数

偏自相关函数是时间序列Yt,在给定了Yt?1,Yt?2,?Yt?k?1的条件下,Yt与Yt?k之间的条件相关。由于它需要考虑排除其他滞后期的效应,因而被称为偏自相关。偏自相关系数?kk计算公式如下。

?r1 k?1?k?1??r??k?1,j?rk?j ?kk??k?j?1 k?2,3,?k?1??1???k?1,j?rk?j?j?1?偏自相关系数?kk,可看作自变量k的函数,即偏自相关函数,?1??kk?1。它用以测量当剔除其他滞后期(t?1,2,3,?,k?1)的干扰的条件下,Yt与Yt?k之间相关的程度。与自相关系数类似,同样可以采用偏自相关分析图来对模型进行识别。

3.3 ARIMA模型的参数确定

Step1:判断时序是否平稳,若不平稳,经过若干次逐期差分或季节差分使其平稳,则可确定d和D。对于社会经济现状,一般d和D的数值取0,1或2。

若自相关系数ACF随着滞后期(一般设为16)增大,而迅速趋于0,则认为该时序是平稳的。

若自相关系数ACF随着滞后期增大,自相关系数ACF不趋于0,则认为该时序是非平稳的。更具体地说,若随着时滞k的增大,自相关系数ACF缓慢减小,说明随着序列两项间隔的提前,相关程度变弱,则序列具有趋势性;若对于季度数据或月度数据,当滞后期为4(或12),8(24)等时,自相关系数ACF显著地部位0,即在随机区间之外,则意味着该时序具有季节性。如果时序具有趋势性,那么需要进行逐期差分,由逐期差分的次数决定d的取值;如果序列具有季节性,那么要进行季节差分,由季节差分次数决定D的值。

左侧图形为未经过差分处理的某城市农村居民收入的ACF图,可以看出自相关系数并未迅速趋于0,说明该时序是非平稳的。右侧为该序列的线性图,也正说明了该时序是有明显的上升趋势的,需要进行差分处理。

Step2:经差分平稳后,确定时序所适合的模型,其依据如下表所示。

ARMA(p,q)序列特征表 模型 拖尾 自相关函数 AR(p) MA(q) ARMA(p,q) 拖尾 指数衰减和(或) 正弦衰减 拖尾 拖尾 指数衰减和(或) 截尾 正弦衰减 偏自相关函数 截尾(阶) 指数衰减和(或) 指数衰减和(或) 正弦衰减 正弦衰减 关于p,q的取值

当不包括时滞k?12(或4),24(或8),p取落入随机区间之外的偏相关系数PACF的个数或与0有显著差异的PACF的个数,q取落入随机区间之外的自相关系数ACF的个数或与0有显著差异的ACF的个数。

当仅观察时滞k?12(或4),24(或8),p取显著不为0的PACF的个数,

q取显著不为0的季节自相关数目。

本文来源:https://www.bwwdw.com/article/6qw6.html

Top