第04章 一元时间序列分析方法

更新时间:2023-08-07 14:25:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

金融计量pdf

第四章 一元时间序列分析方法

[学习目标]

¾ ¾ ¾ ¾

时间序列数据是经济分析中的一类重要数据。时间序列分析是现代计量经济学的重要内容,在金融数据分析中具有广泛的应用。一元时间序列模型是一类特殊的模型,我们可以利用金融变量自身过去的数值,也可以根据误差项的当前及过去的数值中所提供的信息来建立模型并做出预测。这与通常计量经济学中所谈论的结构式模型不同, 结构式模型是试图用其他解释变量的当前值或过去值的变动来解释因变量的变化模型,其本质上是多元的; 而通常, 时间序列模型是缺乏理论基础的,它的建立与使用不是建立在关于变量的行为模式的任何理论模型基础上的,而是从观测到的数据中实证地获得其特征模型。

本章将叙述时间序列分析的基本概念和时间序列模型的识别、估计、检验,包括自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)、单整自回归移动平均模型(autoregressive integrate moving average models,ARIMA)以及时间序列平稳性与单位根检验。

了解平稳性和白噪声过程; 熟悉随机序列模型; 熟悉ARIMA过程;

掌握时间序列的平稳性和单位根检验。

第一节 时间序列的相关概念

一、平稳性

平稳性是时间序列分析的基础。判断一个序列平稳与否非常重要,因为一个序列是否平稳会对它的行为及其性质产生重要的影响。在时间序列平稳性,一般包括下列两类平稳过程:

1、严格平稳过程(Strictly Stationary Process)

如果对所有的t,任意正整数n和任意n个正整数(t1, ,tn),(yt1, ,ytn)的联合分布与(yt1+m, ,ytn+m)的联合分布是相同的, 即:

P{yt 1≤b1, ,yt n≤bn}=P{yt1+m≤b1, ,ytn+m≤bn} (4.1)

则称时间序列{yt}为严格平稳的。换句话说,严平稳要求序列{yt}的概率测度在时间的平移变换下保持不变。

2、弱平稳性过程(Weakly Stationary Process)

如果一个时间序列{yt}的均值,方差在时间过程上保持是常数,并且在任何两时期之间的协方差值仅依赖于该两时期间的距离或滞后,而不依赖于计算这个协方差的实际时间,则称时间序列{yt}是弱平稳的。弱平稳的时间序列有如下性质:

E(yt u)(yt u)=σ2<∞E(yt u)=u

1

金融计量pdf

E(yt1 μ)(yt2 μ)=γt2 t1

t1,t2 (4.2)

可见,如果一个时间序列概率分布的所有阶矩都不随时间变化,那它就是严格平稳的;而如果仅仅是一阶矩和二阶矩(即均值和方差)不随时间变化,那它就是弱平稳的。在金融文献里,通常假定资产收益率序列是弱平稳的。我们对某种时间序列做平稳性假定是因为,若一个时间序列是非平稳的,则我们只能研究其在研究期间的行为。每个时间序列数据集都是特定的一幕,结果,就无法把它推广到其它期间。因此,从预测角度看,这种非平稳时间序列没有什么太大的实际价值。 二、自协方差(auto-covariance)

决定yt是如何与它自身的先前值相关的,对于一个平稳的时间序列,它只依赖于yt与

yt 1之差。其中,

E[yt E(yt)]E[yt s E(yt s)]=γs,s=0,1,2 (4.3)

被称为自协方差函数。

另一种更为简洁的方法使用自相关系数来描述他们之间的关系。考虑弱平稳时间序列当yt与它的过去值yt l线性相关时,可以把相关系数的概念推广到自相关系数,yt与{yt},

yt l的相关系数称为yt的间隔l为的自相关系数,通常记为ρl,在弱平稳性的假定下它只是

l的函数,定义

ρ

lCov(yt,yt l)γl

== (4.4)

γ0Var(y)t

这里用到弱平稳序列的性质Var(yt)=Var(yt 1)。由定义,我们有ρ0=1,ρl=ρ l和

1≤ρl≤1。并且,一个弱平稳序列yt是前后不相关的当且仅当对所有l>0有ρl=0。

而我们要分析的时间序列数据是随机过程的一个样本,因此,我们只能计算样本的自相

关函数,也称样本自相关系数。定义为:

ρl=t=l+1

∑(y

T

T

t

y)(yt l y)

, 0≤l<T 1 (4.5)

t

∑(y

t=1

y)2

根据定义易知,样本自相关函数随着l的增加而下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列下降速度快得多。 三、白噪声过程

如果时间序列{yt}是一个有有限均值和有限方差的、独立同分布的随机变量序列,则称时间序列yt为白噪声。特别的,若时间序列还服从均值为0,方差为σ的正态分布,则

2

2

金融计量pdf

这个序列称为高斯白噪声。白噪声是一种十分重要的时间序列,它是其它各类型时间序列的重要组成部分,在金融市场效率理论中具有重要的意义。-Tsay21

对于白噪声序列,自相关系数为零。在实际应用中,如果所有样本的自相关函数接近为零,则认为这个序列为白噪声序列。

若一个随机过程满足:E(yt)=μ

Var(yt)=σ2

γt r

σ2若t=r=

0若t≠r

(4.7)

则我们称之为白噪声过程(white noise process)。

因此,白噪声过程的均值和方差均为常数,且除滞后零阶外,自协方差都为零。因此,白噪声过程的自相关系数在s=0时的值为1除外,其余时刻均为0。如果μ=0,且上述三个条件都成立,则这一过程就称为带有零均值的白噪声过程。为说明这一过程,在此我们特举例说明。这里,我们选取了上海证券交易所上市的“浦发银行”(交易代码:600000)在2005年的全年收益率数据,剔除波动率超过5%的异常数值后的收益率时间序列,就表现为一个由白噪声过程产生的时间序列(见图4-1)。

图4-1:由白噪声过程产生的时间序列

如果进一步假定yt是服从标准正态分布的,而样本的自相关系数也是近似地服从如下正态分布:

~N(0,1/T) (4.8) γs

表示从样本中估计得到的滞后s阶的自相关系数.这一结果这里,T是指样本容量,γs

可以用来对自相关函数进行显著性检验, 通过给自相关函数建立一个置信区间, 来检验其估计得到的自相关系数是否显著地不等于零。比如,置信度95%的置信区间是:brooks-204

3

金融计量pdf

±1.96 s落在这个区间外,则滞后s阶的自相关系对给定的s值,如果样本的自相关系数ρ

数为零的假设就被拒绝。

还可以运用Q统计量对所有m个自相关系数ρs是否同时为零进行联合检验。 金融应用中常需要检验的几个自相关系数是否同时为零,Box和Pierce(1970)提出了混成

检验统计量:

k2 (4.10) Q(m)=T∑ρ

k=1

m

其中,T为样本容量,m为最大滞后长度。Q统计量通常用于检验一个时间序列是否是白噪声。在大样本中,它近似服从自由度为m的χ分布。在实际的检验中,通常会计算出不同滞后阶数的Q统计量,自相关系数和偏自相关系数。如果各阶Q统计量都没有超过由

设定的显著性水平决定的临界值,则接受原假设,即不存在序列相关,并且此时,各阶的自相关和偏自相关系数都接近于0;如果在某一滞后阶数m,Q统计量超过设定的显著性水平的临界值,则拒绝原假设,说明序列存在m阶自相关。由于Q统计量的值要根据自由度m来估算,因此,一个较大的样本容量是保证Q统计量有效的重要因素。

然而,用Box-Pierce统计量来检验小样本的性质并不是很好。在小样本情况下,该统计量经常导致错误的决策。为提高有限样本检验的功效,Ljung和Box(1978)年提出修正统计量:

2

Q(m)=T(T+2)∑

*

m

k2ρT k

(4.11)

k=1

从Ljung-Box统计量的表达可以看到,(T+2)和(T k)两项在渐进意义上可相互抵消,从而Ljung-Box检验等同于Box-Pierce检验。对于时间序列线性依赖关系的混合检验,这一

统计量也非常适用。

第二节 随机序列模型

若对每一个固定的t,yt是一个随机变量,则y1,y2,┅yt,┅为随机时间序列。而揭示随机时间序列自身变化规律和相关关系的数学表达式就是时间序列分析模型。

随机时间序列分析模型分为三类:自回归模型(auto-regressive model, AR)、移动平均模型(moving-average model,MA)和自回归移动平均模型(auto-regressive moving average model,ARMA)。对于任一个时间序列,怎样判断它是遵循纯AR过程(若是的话,阶数p取什么值),纯MA过程,(若是的话,阶数q取什么值)或是ARMA模型,此时p和q各取多少。我们将遵循以下四个步骤对这三个模型做一详细介绍:

步骤一:识别。就是找出适当的p和q值。我们即将说明怎样借助相关图和偏相关图来解决此类问题。

步骤二:估计。一旦辨别适当的p和q值,下一步便是估计模型中所含自回归和移动平

4

金融计量pdf

均项的参数。一般情况下可用简单的最小二乘法进行计算,但有时则有必要寻求非线性估计方法。

步骤三:诊断。选定模型并估计其参数之后,下一步就要看所选的模型对数据拟合的是否够好。对所选模型的一个简单的检验,是看从该模型估计出来的残差是不是白噪声;如果是,就可接受这个具体的拟合;如果不是,我们必须重新在做。

步骤四:预测。ARMA建模方法之所以得以普及,理由之一是它在预测方面的成功。有许多事例用这个方法做出的预测比用传统的计量经济建模方法做出的预测更为可靠,特别是在短期预测方面。 一、自回归模型(AR)

若一个时间序列可表示为

yt=φ0+φ1yt 1+εt (4.12)

其中,{εt}为白噪声,E(εt)=0,var(εt)=σε,则称rt为一阶自回归过程,或简称

2

为AR(1)。假定序列是弱平稳的,则E(yt)=μ,Var(yt)=γ0,Cov(yt,yt l)=γl,其中

μ,γ0是常数,γl是l的函数而与t无关。对式(4.12)两边取期望,得

E(yt)=φ0+φ1E(yt 1) (4.13) 在平稳性的假定下,E(yt)=E(yt 1)=μ,从而

μ=φ0+φ1μ 或 E(xt)=μ=

φ0

(4.14) 1 φ1

可见,第一,若φ1≠1,则yt的均值存在;第二,yt的均值为0当且仅当φ0=0。 利用φ0=(1 φ1)μ,我们可以把AR(1)模型写成如下形式:

yt μ=φ1(yt 1 μ)+εt (4.15) 对等式两边平方,然后取期望得到

Var(yt)=φ1Var(yt 1)+σt (4.16)

2

2

在平稳性假定下,Var(yt)=Var(yt 1)故

σt2

Var(yt) (4.17) 2

1 φ1

由于随机变量的方差是非负有限的,这就要求φ1<1。这样,AR(1)模型的弱平稳性可推得 1<φ1<1。反之,若 1<φ1<1,可以证明xt的均值,方差,自协方差是有限的。从

2

5

金融计量pdf

而,模型是弱平稳的。所以,模型弱平稳的充分必要条件是φ1<1。.

AR(1)过程可扩展为p阶自回归过程,记为AR(p)。AR(p)模型表示为:

yt=φ0+φ1yt 1+φ2yt 2++φpyt p+εt (4.18)

在p阶可见,自回归模型是时间序列yt表示为它的先前值与一个误差项εt的线性函数。自回归中,φ1、φ2, ,φp是自回归参数,它表明每改变一个单位时间值时,对yt所产生的影响,它是根据样本观测值来估计的参数。

2、AR模型阶的识别

在实际应用中,一个AR时间序列的阶p是未知的,必须根据实际情况来决定。这个问题叫做AR模型的阶的决定。一般可以通过两种方法:第一种方法是利用偏自相关函数(partial autocorrelation function, PACF), 第二种方法是用某个信息准则函数。

(1)偏自相关函数(PACF)

偏自相关就是yt和yt l之间的,除去居中的诸y(即yt 1,yt 2, yt l+1)的影响后的相关。其相关程度可用偏自相关系数φl,l度量。进行回归

yt=α

+α1yt 1+ +α

l 1

yt (l 1)+ +φl,lyt l+εt,

t=1,2, ,T

(4.19)

因此,滞后l阶的偏相关系数是当yt对yt 1, yt l作回归时yt l的系数。称之为偏相关是因为它度量了l期间距的相关而不考虑l 1期的相关。对一个AR(p)模型,间隔为的样本偏自相关系数不应为零,而对所有j>p,φj,j应接近零,我们利用这一性质来决定阶p。 许多经济计量软件在给出自相关函数及Q统计量之外,还会给出偏自相关函数PACF,从而加以辅助性判断自回归阶数。张-154

(2)采用信息准则法判别模型阶数

在实际应用中,很难利用自相关函数来确定模型的合理阶数。较为简便的方法是,所选定的阶数应使得信息准则的数值达到最小。

对于信息准则,一般应用赤池(Akaike)准则信息准则(AIC)和许瓦兹(Schwarz)贝叶斯信息准则(SBIC)。它们分别表示为:

2k Tk

2)+lnT (4.20) SBIC=ln(σ

T 2)+AIC=ln(σ

为残差和方差(等于残差平方和除以自由度的数量T k),k=p+q+1是式中,σ

待估计参数的总个数,T是样本容量。相比较而言,SBIC准则的惩罚项严于AIC准则。

3、 参数估计

6

2

金融计量pdf

对一个AR(p)模型,我们常用条件最小二乘法来估计其参数,条件最小二乘是从第

p+1个观测值开始的。具体的说,在给定开始的p个观测值的前提下,我们有

yt=φ0+φ1yt 1+φ2yt 2+ +φpyt p+εt (4.21)

其中的参数可用最小二乘法估计。记φi是φi的估计,所拟合的模型为

+φ yt=φ01yt 1+φ2yt 2+ +φpyt p (4.22)

对应的残差为

=y εyt (4.23) tt

为残差序列,并得到 称εt

∑ε

2tT

{}

2σε=

t=p+1

T 2p 1

(4.24)

4、 模型验证

对实际数据所时拟合的模型,要仔细地验证它的合理性。若模型是合理的,其残差序列

与一个白噪声的应该是白噪声。残差的样本自相关函数和Ljung-Box统计量可用来检验εt

接近程度。对AR(p)模型,Ljung-Box统计量Q(m)渐进服从自由度为m p的χ分布。如果所拟合的模型经经验验证是不合理的,那么就需要对它进行修正。

5、 预测

预测是时间序列分析的一个重要应用。对AR(p)模型,假定我们在时间指标为h的点

2

yh(l)为yh+l上,欲预测yh+l(l≥1)。时间指标h称为预测原点,正整数l成为预测步长。设

的最小均方误差预测,即预测函数 yk(l)使得

E yh+l yh(l) ≤minE(yh+l g)2 (4.25)

g

其中g是h时刻可用信息的函数。我们称 yh(l)为yt的以h为预测原点的向前l步预测。 (1)向前一步预测

由AR(p)模型,我们有

2

yh+1=φ0+φ1yh+ +φpyh+1 p+εh+1 (4.26)

取条件期望有

7

金融计量pdf

yh(1)=E(yh+1yh,yh 1, )=φ0+∑φiyh+1 i (4.27)

i=1

p

对应的预测误差为

eh(1)=yh+1 yh(1)=εh+1 (4.28)

在计量经济的文献中,εh+1从而,向前1步预测误差的方差为Var[eh(1)]=Var(εh+1)=σε。

2

称为t+1时刻序列的抖动。

(2)向前两步预测

由AR(p)模型,我们有

yh+2=φ0+φ1yh+1+ +φpyh+2 p+εh+2 (4.29)

取条件期望,我们有

yh(2)=E(yh+2yh,yh 1, )=φ0+φ1 yh(1)+φ2yh+ +φpyh+2 p (4.30)

对应的预测误差为

eh(2)=yh+2 yh(2)=φ1 yh+1 yh(1) +εh+2=εh+2+φ1εh+1 (4.31)

预测误差的方差为Var[eh(2)]=(1+φ1)σε。很明显,Var[eh(2)]>Var[eh(1)]。这意

2

2

味着预测步长的增加会使预测的不确定性也增加。这与我们的经验是一致的:对时间序列来说,我们在h时刻对h+2的把握不如对h+1的把握大。

(3)向前多步预测

一般地,我们有

yh+l=φ0+φ1yh+l 1+ +φpyh+l p+εh+l (4.32)

取条件期望为

yh(l)=φ0+∑φi yh(l i) (4.33)

i=1

p

其中,当i≤0时,约定 yh(l)=yh+l。可以证明,对平稳AR(p)模型,当l→∞时,

yh(l)收敛于E(yt)。也就是说,对这样的序列,长期的点预测趋向于无条件均值。在金融

文献中,这种性质称为均值逆转,预测误差的方差则趋向于yt的无条件方差。

6、 判定预测是否精确

在实际中应用中,通常是对整个样本外的区间进行预测,然后将其与实际值比较,把他们之间的差异用某种方法加总。对第i个观测值的预测误差定义为其实际值和预测值之间的差值,再求其平方或取其绝对值使各项为正后进行加总。我们将均方误差定义为:

T

1

MSE=(yt+s ft,s)2 (4.34) ∑T (T1 1)t=T1

8

金融计量pdf

其中,ft,s为变量在t时刻所做的s期预测;yt为变量在t时刻的实际值;T是全样本,

T1是第一个样本外的预测值。

绝对平均误差(MAE)测定的是平均的绝对预测误差,由

T

1

MAE=yt+s ft,s (4.35) ∑T (T1 1)t=T1

给出。调整的MAPE(AMAPE)或对称的MAPE纠正了预测值与实际值之间的非对称性。

Tyt+s ft,s100

(4.36) AMAPE=∑T (T1 1)t=T1yt+s+ft,s

AMAPE中的对称性来自于将预测误差除以预测值和实际值的平均值的两倍。因此,无

论预测值是0.5,实际值是0.3;还是实际值是0.5,预测值是0.3,AMAPE得到的结果都

将是一样的。而标准的MAPE公式则不同,因为其分母只是yt+s,所以无论是yt或ft,s哪一个大都会影响到结果

Tyt+s ft,s100

(4.37) MAPE=∑y

T (T1 1)t=T1

t+s

MAPE还有一个比MSE更优越的性质是它可以被解释成偏误百分率,换句话说,它的

值限定在0到100之间。

,定义为:

另一个流行的评价标准是Teheil的U统计量(1996)

U=

(4.38)

其中,fbt,s是从基准模型中获得的预测值——它通常是一个简单的模型,如朴素随机游走模型。U统计量等于1表示所考虑的模型和基准模型具有相同的准确性。而U统计量小

于1则表示所模型优于基准模型;U统计量大于1则相反。虽然这一测度很有用,但正如Makridakis和Hibon(1995)指出的那样,这一测度并非是完美的,如果fbt,s和yt+s的值是一样的,这时U统计量的值会因为分母为零而趋于无穷。与MSE相同,U统计量的值也要受到非正常值的影响,并且它具有较小的直观意义。 [案例说明4-1]上证指数收益率的AR建模

本案例数据来自高铁梅(2006)《计量经济分析方法与建模》,数据选取了上证收盘指数(1991年1月~2003年3月)的月度时间序列S作为研究对象,用AR(1)模型描述其变化规律。

9

金融计量pdf

在此,对其做变化率,srt=100(St St 1)/St 1(t=1,2, ,T),这样便得到了变化率序列。一般来讲,股价指数序列并不是一个平稳的序列,而通过变化后的变化率数据,是一个平稳序列,可以作为我们研究、建模的对象。

对上证收益率数据拟合。在此,记上证股价指数变化率序列为sr,建立如下模型:

srt=c+φ×srt 1+ut t=1,2, ,T (4.39)

回归结果为:

srt=3.5020-0.0605srt 1+ut

t=(1.8790) (-0.7279)

图4-2: AR(1)回归结果

图4-3:上证指数收益率序列及其拟合值

10

金融计量pdf

在图4-3中,实线是上证指数变化率序列,虚线是AR(1)模型的拟合值。从该图可以看出我国上证股价指数变化率序列在1991-1994年之间变化很大,而后逐渐趋于平稳。近年来,波动平缓,并且大多在3%下面波动。拟合曲线基本代表了这一时期的均值。

[案例说明4-2]应用AR(1)进行预测

下面,我们利用建立的AR(1)模型进行预测。我们选取2000年1月至2006年6月的我国广义货币供应量(M2)月度数据的时间序列,进行AR(1)建模并预测。选择“forecast”,会弹出如4-4窗口。在此,Eviews中提供了两种预测方式:“Dynamatic”和“Static”。前者是根据所选择的一定估计区间,进行多次向前预测;后者只能滚动地进行向前一步预测,即每预测一次,用真实值替代预测值,加入到估计区间,再进行向前一步预测。在此,我们选择“Dynamatic”方式进行预测,预测结果见图4-6。

图4-5中实线代表的是M2的预测值, 两条虚线则提供了2倍标准差的置信区间。图4-5的右边列出了评价预测的一些标准,如绝对平均误差MAE(Mean Absolute Error)、调整的MAPE(mean absolute percent Error)。Theil不相等系数为0.008101, 表明模型的预测能力不错,而对它的分解表明偏误比例较大,意味着存在系统误差,需要对模型进行修正。

图4-4:AR(1)模型预测窗口

11

金融计量pdf

图4-5: 利用AR模型进行预测

二、移动平均模型(MA)

若一个随机过程xt可为下面形式:

yt=c0+εt+θ1εt 1+ +θqεt q (4.40)

则称方程式(4.40)表示的是q阶的移动平均过程(moving average),表示为MA(q)。在MA(q)模型中,θ1,θ2, ,θq为参数,εt为白噪声过程。

将MA(q)模型表示为滞后算子的形式为:

yt=(1+θ1L+θ2L2+ +θqLq)εt (4.41)

或简化为:

xt=Θ(L)εt (4.42)

由于移动平均过程的组成部分都是白噪声过程,因此任何一个移动平均过程都是平稳的。其前两阶矩不随时间变化,它们分别为:

E(εt+θ1εt 1+ +θqεt q)=0 (4.43)

Var(yt)=E(yt2)=σ2(1+θ12+ +θq2) (4.44)

最简单的移动平均过程是MA(1),可表达为:

yt=(1+θ1L)εtMA(q) (4.45)

1、 MA模型阶的识别

12

金融计量pdf

自相关函数是识别MA模型的阶的有用工具。一个时间序列yt具有自相关函数ρl,若

ρl≠0但对l>p有ρl=0,则yt服从一个MA(q)模型。

2、 MA模型估计

估计MA模型通常用最大似然法。有两种方法求MA模型的似然函数。第一种是条件似然法,即假定初始的扰动(即εt,t≤0)都是0;这样ε1=y1 c0

,ε2=y2 c0+θ1ε1, ,

计算似然函数所需要的抖动可以递推得到。这种方法称为条件似然法。所得到的估计是条件最大似然估计。第二种方法是把初始抖动εt,t≤0当作模型的附加参数与其它参数一起估计出来。这种方法称为精确似然法。精确似然估计优于条件似然估计,但计算会更复杂一些,如果样本量较大,这两种似然估计是接近的。

3、 MA模型预测

由于MA模型有有限记忆性,它的点预测很快可以打到序列的均值。设预测原点为h,对MA(1)过程的向前1步预测,模型为

yh+1=c0+εh+1+θ1εh (4.46)

取条件期望,我们有

rh(1)=E(yh+1yh,yh 1, )=c0+θ1εh

eh(1)=yh+1 yh(1)=εh+1 (4.48)

向前1步预测误差的方差为Var[eh(1)]=关于向前2步预测,由方程

σε2。

yh+2=c0+εh+2+θ1εh+1 (4.49)

我们有

rh(2)=E(yh+2yh,yh 1, )=c0

eh(2)=yh+2 yh(2)=εh+2+θ1εh+1 (4.50)

预测误差的方差为Var[eh(2)]=(1+θ1)σε。它大于或等于向前1步预测误差的方差。

2

2

上面的结果表明MA(1)的向前2步预测即是模型的无条件均值。这一点对任意预测原点h都正确。总而言之,对一个MA(1)模型,以h为预测原点的向前1步预测为c0+θ1εh,向前

多步预测为模型的无条件均值c0。如果我们画出rh(l)对l变化的图象,会看到从一步以后

预测值成一个水平直线。对一个MA(p)模型,向前p步以后的预测就达到模型的均值。

三、ARMA模型

13

金融计量pdf

自回归模型和移动平均模型是时间序列中最基本的两种模型类别,将这两种基本的模型类别结合起来,就产生了自回归移动平均模型(ARMA)。

若一个时间序列xt可表示为:

yt=φ1yt 1+ +φpyt p+εt+θ1εt 1+ +θqεt q (4.51)

或者表达为:

(1 φ1L φpLp)yt=(1+θ1L+ +θqLq)

Φ(L)yt=Θ(L)εt (4.52)

则称时间序列模型为自回归移动平均模型,表示为ARMA(p,q)。在模型中,Φ(L)和

Θ(L)分别表示为滞后之后p和q阶的表达式,并称其为自回归算子和移动平均算子。

最常用和最简单的自回归移动平均过程是ARMA(1,1)过程。该模型表达为:

yt φ1yt 1=εt+θ1εt 1 (4.53)

在上式中,等号左边的组成部分为自回归部分,右边为移动平均部分,这样就使其具有自回归和移动平均模型的性质。若该过程要符合平稳性和可逆性的性质,则要求:

φ1<1;1<1 (4.54)

1. ARMA模型的识别

ARMA模型阶的决定方法之一是考虑ACF和PACF以及一些选定的ARMA过程如AR(1),AR(2),MA(1),MA(2),ARMA(1,1),ARMA(2,2)相应的相关图。因为每一随机过程都有它典型的ACF和PACF式样,如果所研究的时间序列适合于其中的一个样式,我们就能辨别该时间序列符合这个过程。当然,我们仍有必要利用诊断性检验以判明所选的ARMA模型是否足够精确。

表4-1 ACF与PACF的理论模式

模型种类 ACF的典型模式 PACF的典型模式 AR(p) 指数衰减或衰减的正旋波或二者 显著的直至滞后p的尖住 MA(q)

显著的直至滞后q的尖住 指数下降

ARMA(p,q) 指数衰减 指数衰减

可见,AR(p) 过程的ACF和PACF, 和 MA(q)过程的ACF和PACF相比,有相反的模式;对于AR(p)情形,AC按几何或指数规律下降(常描写为拖尾者),而PACF则在一定的之后忽然截断(常描写为断尾)。但对于MA(q)情况适得其反。

14

金融计量pdf

在某些时候,ACF和PAC都不是很有用。这时我们可以借助Tsay和Tiao(1984)提出的新方法—利用推广的自相关函数(EACF)来决定ARMA过程的阶。EACF的基本思想是:如果我们能得到ARMA模型的AR部分的相合估计,则能导出 MA部分。对所导出MA部分,用ACF决定MA部分的阶。此函数的导出相对复杂一些,但是用起来是很容易的。EACF的结果可以用一个二维表格表示,这个表的行对应于AR的阶p。列对应于MA的阶q。ARMA(1,1)模型的EACF的理论形式由下表给出。这个表的主要特征是:它包含由”O”组成的三角形,并且这个三角形左上角顶点位于阶(1,1)。我们正是用这样的特征来识别一个ARMA过程的阶。一般地,对模型ARMA(p,q),”O”组成的三角形的左上角顶点位于(p,q)的位置。

表4-2: ARMA(1,1)模型的EACF理论表

MA

AR 0 1 2 3 4 5 6 7 0 X X X X X X X X 1 X O O O O O O O 2 * X O O O O O O 3 * * X O O O O O 4 * * * X O O O O 5 * * * * X O O O

注:“X”表达非零;“O”表达零;“*”表达非零或零,它在识别阶(1,1)中不起任何作用。

[案例说明4-3]应用Eviews建立ARMA模型的实例——以中国联通(600050)为例 使用的数据为联通公司股票的日股价序列,期限为2003-1-2日至2006年9月15日,共886个样本观测值。

该模型涉及三个步骤:识别、估计和诊断性检验。首先,通过观察自相关系数,对数据结构加以识别。

(1) 估计高达36阶的自相关系数

(a)价格序列 (b)收益率序列 图4-6:中国联通的价格序列和收益率序列

Eviews得到的相关检验统计量的结果如下:

15

金融计量pdf

首先,我们对股价(price)序列进行统计量检验,结果的第一栏表明,自相关函数非常稳定,衰减缓慢,其36阶自相关系数仍为0.738。第四和第五栏分别给出了1阶到36阶自相关系数和偏自相关系数的值,具体的滞后阶数见第三栏。

第六栏中的Ljung-Box检验统计量(Q-Stat),该检验的滞后阶数等于所在行的行数(即第3列中的数值)。对于第一行,该统计量服从χ(1)分布;对于第二行,该统计量服从χ(2)分布,依此类推。最后1列是这些统计量的p值。由于原始数据可能是非平稳序列,这会导致该检验的无效性。所以,通常用对数收益率序列来替代原始的股价序列,否则,原始序列的非平稳性还可能导致其他方面的问题。中国联通收益率序列的自相关和偏自相关函数如2

2

图4-8。

图4-7:中国联通价格序列的检验统计量

16

金融计量pdf

图4-8:中国联通收益率序列的检验统计量

一般而言,

若自相关系数位于置信区间±1.96×则为统计显著的(其中,T

为观测值的个数)。在本例子中,置信区间为[-0.066,+0.066],即中国联通收益率的自相关系数大于0.066或小于-0.066时,为统计显著的。然而,从检验结果看,并不显著,即无法拒绝各滞后期均不存在自相关性的零假设。

从以上分析可见,线性时序模型似乎无法准确反映中国联通收益率序列的结构特征。下面,将结合信息准则对此问题作进一步分析。

(2)采用信息准则法判别模型阶数

在实际中,很难利用自相关函数来确定模型的合理阶数。较简便的方法为,选定的阶数应使信息准则的值达到最小。

在Quick按钮下选择Estimate Equation命令,并在弹出的窗口中键入: return ar(1) ma(1)

选定LS-Least Squares(NLS and ARMA)为估计方法,在样本范围为整体样本,点击OK安久,就完成了ARMA(1,1)的设置(见图4-9)。其输出结果见图4-9:

17

金融计量pdf

图4-9:ARMA(1,1)的设置框口

图4-10:ARMA(1,1)的估计结果

结果中,同时给出了AR和MA特征方程根的逆,用以检验模型代表的过程是否平稳或者可逆的。要使该方程的AR和MA分别是平稳和可逆的,他们的逆根绝对值必须大于1,显然这里并不满足此条件。在此,我们还可以看到,ARMA输出标题中,给出了估计模型时的迭代次数,这表明Eviews使用了数值迭代优化法对系数进行估计。

18

金融计量pdf

对其它ARMA模型,可以重复以上步骤,即可得到需要的信息准则的值。以ARMA(5,5)为例子,在方程设定窗口内键入:

Return c ar(1) ar(2) ar(3) ar(4) ar(5) ma(1) ma(2) ma(3) ma(4) ma(5) 求出全部信息准则的值。选择使信息准则值最小的模型。 2. 用ARMA模型进行预测

用ARMA模型进行预测,在计算期望条件时相当简单。

在此,假定ft,s表示利用ARMA(p,q)在t时刻对x的未来值作s期预测的函数。通过所谓的预测函数做出如下预测,其形式如下:

ft,s=∑aift,s i+∑ajεt+s j (4.55)

i=1

j=1

pq

式中,ft,s=xt+s,s≤0;εt+s=0,s>0

=εt+s,s≤0

而ai和bj分别是自回归系数和移动平均系数。

[案例4-4]在Eviews中运用ARMA模型进行预测

一旦选定了模型的阶数并利用一定的数据完成了模型估计后,就可以利用该模型对序列的未来值进行预测。估计出所需模型并在Eviews中打开输出结果窗口后,点击Forecast图标。Eviews使用两种预测方法:动态预测和静态预测。动态选项从预测第一项开始,计算多步预测值;而静态选项则计算一系列向前一步的预测值,此时每生成一个预测值,就将样本范围向前移动一个观测值,以便将真实值而非预测值作为滞后因变量。在此,我们应用了上证指数1990年12月19日至2006年8月31日时间区间,共3856交易日的样本数。采用Eviews软件的Froecast预测模型,动态预测和静态预测的结果分别如下:

(a)动态预测

19

本文来源:https://www.bwwdw.com/article/ra9j.html

Top