Chapter14 非平稳序列与单位根检验

更新时间:2024-07-11 02:52:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

20 非平稳随机过程

从本章起介绍计量经济学近20年来最新研究成果。从1974年开始计量经济学工作者渐渐意识到当用含有单位根的时间序列建立经典计量经济模型时会出现一些问题,这就是虚假回归。

应该知道通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以在建立模型时,必须依靠经济理论,同时对参数进行假设检验。实际上,只有经济理论是不够的。比如处于调整中的经济变量,哪些是它的外生变量,哪些是它的无关变量,单凭经济理论就很难判别清楚。所以当研究经济变量参数变化规律时,常常采用另外一种方法,即依靠统计理论的方法,通过设计具有某种特征的能生成数据的随机过程或数据生成系统研究经济问题。下面常常用到数据生成系统这个概念。 20.1 趋势平稳与差分平稳

20.1.1 趋势平稳:均值非平稳

如果yt不是围绕着某个常数波动,而是围绕某一趋势波动,即

yt = ?0 + ?1 t + ut, (4.8)

? (L)ut = ? (L) vt

ut为平稳可逆的ARMA过程。显然,E(yt) = ?0 + ?1 t。因此,{ yt }是非平稳的。将?0 + ?1 t称作趋势成分。因为该过程是由确定性趋势?0 + ?1 t和平稳随机过程ut组成,yt减去趋势后,即yt - ?0 - ? t = ut为平稳过程。因此,将其称作退势平稳过程或趋势平稳过程(trend stationary process)。

线性趋势只是确定性趋势的一个例子。实践中另外一种常见情形是二次趋势,即 yt = ?0 + ?1 t + ?2 t2 + ut, (ut ? WN(0, ?2))

均值非平稳的另外一种常见情形是存在结构突变。即在不同的时段,yt围绕着不同的均值波动。战争、石油危机、政府政策等都属于由结构突变导致的序列非平稳情形。这可以通过引入虚拟变量来刻画:

yt = ?0 + ?1 D + ut,

对于均值非平稳过程的分析与原来的平稳过程没有本质差异。首先利用LS方法进行退势,利用退势后的残差{ut}建立ARMA模型。几个关键特征如下。

冲击项的影响是短暂的。由平稳可逆的ARMA过程的特点可知,冲击项vt对yt的影响会逐渐消失,因此,影响是短暂的。这种影响的模式取决于ut的ARMA结构。如果为MA(q)过程,则vt对yt的影响只会持续q期;如果为AR(p)过程,则vt对yt的影响是长久的,但影响程度逐渐衰减,给定足够长的间隔期,影响可以忽略不计。但冲击项vt不会影响yt的长期趋势成分。

变量表现为趋势回归。长期趋势成分是序列波动的中心线。围绕这这一中心线的波动成分为ARMA过程。但波动不会长期偏离长期趋势成分,我们称之为趋势回归。

冲击项不改变长期预测。我们已经知道,ut的ARMA结构有助于提高短期预测精确度。对于MA(q)成分会影响未来q期的预测,AR(p)成分会影响未来无穷期的预测,但程度呈指

1

数衰减,以至于忽略不计。即冲击项的影响是短暂的,所以对yt的长期预测就是其趋势成分。

预测误差的方差是有界的。长期内的预测误差即是ut,预测误差即是ut的方差,显然是有界的。

20.1.2 差分平稳:方差非平稳

另外一种非平稳过程表现为方差非平稳:

xt = xt-1 + ut (20.1) 其中,ut 是平稳可逆的ARMA过程。随着时间的推移,{ xt }的方差变得无限大。

xt = xt -1 + ut = ut + (xt -2 + ut-1)

= x0 + (ut + ut-1 + ut-2 + … + u1) = x0 +E(xt) = x0 Var(xt) =

t?1

?u

i?0

t?1

t?i

?var(ui?0t?1t?i)= t?u2? ?

?u

i?0

t?i

称作随机趋势。与趋势平稳过程不同,这种过程的差分是平稳过程。因此,

也将其称作差分平稳过程。

E(xt - xt-1) = E( ut ) = 0

这表示yt的变化的期望值为0。 案例:股票价格。

20.1.3 差分平稳:均值、方差非平稳

另外一种更一般的差分平稳过程为带漂移项的过程:

xt = ? + xt-1 + ut (20.2)

其中,ut 是平稳可逆的ARMA过程。

xt = ? + xt -1 + ut = ? + ut + (? + xt -2 + ut-1) = x0 + ? t + (ut + ut-1 + ut-2 + … + u1) = x0 + ? t +

t?1

?u

i?0

t?i

E(xt) = x0 + ? t

这一公式表明,如果把第t期视作初始期,对t+1期最好的预测值为x0 + ?,对t+2期最好的预测值为x0 + 2 ?。其中,x0表示第t期的观测值。

Var(xt) =

t?1

?var(ui?0t?1t?i)= t?u2? ?

?u

i?0

t?i

称作随机趋势。与趋势平稳过程不同,这种过程的差分是平稳过程。因此,

也将其称作差分平稳过程。

2

E(xt - xt-1) = E(? + ut ) = ?

? 表示yt变化的期望值。因此,如果? > 0,则yt表现出上扬的趋势;如果? < 0,则yt表现出下跌的趋势。

差分过程的几个关键特征。

冲击项的影响是长久的。每一期的冲击的影响都是长久的。

变量不会表现为均值回归。ut的期望值虽然为0,但其方差越来越高,因此回归均值的时间也越来越长。

冲击改变长期预测。由预测公式:E(xt) = x0 + ? t,第t期对未来期的预测分别为: E(xt+1) = xt + ?, E(xt+2) = xt + ? , ...

而xt中包含了ut。即ut对未来所有期的预测都产生影响。

预测误差的方差是无界的。 预测误差为:

xt - E(xt) =

?u

i?0

t?1

t?i

其方差为t?u2。随着时间的推移,预测误差的方差变得无穷大。 从上述分析可以看出,趋势平稳和差分平稳是两种截然不同的过程。

xt = ?0 + ?1 t + ut, xt = x0 + ? t +

t?1

?u

i?0

t?i

两种过程虽然都包含趋势成分?0 + ?1 t。但对于趋势平稳过程来讲,由于扰动项的ut的方差有界,因此表现为趋势回归,即围绕着(?0 + ?1 t)波动,不会长期偏离这一趋势。而对于差分平稳过程来讲,由于扰动项的ut的方差无界,因此不会表现为趋势回归,即存在长期偏离(?0 + ?1 t)的现象。同时,从预测的角度来讲,两种过程的预测机制也截然不同。 20.2 宏观经济变量增长模型的回顾

20.2.1 趋势成分的设定

如前文所述,常数增长率模型设定为:

yt = (1 + g) yt-1 , t = 1, 2, … (形式1)

我们来看上述模型的另外两种替代表述形式。 形式1:

依次迭代可以得到

yt = y0 (1 + g) t log(yt) = log(y0) + log(1+g) t = ? + ? t (形式2) 因此,log(yt)遵循确定性时间趋势。?表示连续增长率,g表示离散增长率。 形式2:

对形式1进行差分,可得:

3

?log(yt) = log(yt) - log(yt-1) = ? (形式3)

现在考虑在常数增长率模型中引入随机成分。常数增长率模型的三种表达式中,应该采用哪一个呢? 形式1:

yt = (1 + g) yt-1 + ut

当g > 0时,这是一个非平稳的过程。它体现了的意义与时间序列不相符。因此,这一模型显然不可用。 形式2:

log(yt) = ? + ? t + ut

这是趋势平稳过程。即,yt的水平值出现随机波动,波动是围绕长期趋势(? + ? t)出现的。 形式3:

?log(yt) = ? + ut

这是差分平稳过程。即,yt的增长率出现随机波动,波动是围绕增长率?出现的。 20.2.2 水平变量或对数变量

因为很多宏观变量,比如GDP、贸易额等,都呈现指数型的增长。因此,在增长率模型中经常对其取对数。以我们国家GDP为例。对于初始数据,线性趋势模型显然是不合适的,必须用(至少)二次趋势来拟合。

yt = ?0 + ?1 t + ?2 t2 + ut,

另外一种替代方法是取自然对数。取过对数后的数据呈现明显的线性趋势。因此,可以直接用

Log(yt) = ?0 + ?1 t + ut

拟合数据。这种模型相对于二次趋势模型来讲,参数较少,可以节省自由度;而且具有直观的经济含义。

再来观察初始变量与对数变量的差分。初始变量的差分仍然表现出增长的趋势,而且方差越来越高。而对数变量的差分表现为平稳状态,且没有明显的异方差。 20.3 时间序列的分解

时间序列分析中,一个有用的分界是将序列分解为永久成分和短暂成分。其中,永久成分是模型的长期趋势,而短暂成分是指模型的暂时冲击。

对于趋势平稳过程,其长期时间趋势就是其永久成分,而随机扰动由于是平稳可逆ARMA过程,所有影响都是暂时的,为模型的短暂成分。

对于差分平稳过程,其永久成分和短暂成分可以通过BN分解公式得到。 20.4 单整过程及其考察的意义

单整:若一个随机过程 {xt} 必须经过d次差分之后才能变换成一个平稳可逆的ARMA过程,则称 {xt} 是d阶单整过程。用xt ? I(d) 表示。显然,平稳过程是0阶单整的,表示为

4

I(0)。

对于I(d) 过程xt

?(L) (1- L) d xt = ?(L) ut (20.3) 若xt ? I(d),yt ? I(c),一般情况下, zt = (a xt + b yt) ? I (max[d, c]).

? zt = ? (a xt + b yt) = (a xt + b yt) - (a xt -1 + b yt - 1) = (a ? xt + b ? yt)

当 c > d 时,zt只有差分c次才能平稳。一般来说,若xt ? I (c),yt ? I (c),则 zt = (a xt + b yt) ? I (c).

但也有zt的单整阶数小于c的情形。当zt的单整阶数小于c时,则称xt与yt存在协整关系。

经济问题中的非平稳变量大多是I(1)过程。本章主要讨论I(1)过程。在详细讨论I(1)过程之前,首先需要明确几个问题。

(1)设xt?xt?1u?t,ut ? (0, ?2)。通过迭代可以得到:xT??Tt?1tu?x0?(u1?u2??ut)。

I(1)过程的设定必须包含初始条件的设定。比如,x0=0;或者为随机变量,Var(x0)

E(xT)??t?1E(ut)?0Var(xT)??t?1??T?2T2T (20.4)

即:I(1)过程的方差随着时间的推移而线性增加。因此,如果过程始于无穷遥远的过去,方差则无穷大。为讨论有限方差的I(1)过程,假定I(1)过程始于t=0。

(2)如果过程为xt = ? + xt-1 + ut,通过迭代可以得到: xt = ? + xt -1 + ut = x0 + ? t + (ut + ut-1 + ut-2 + … + u1)

即:如果I(0)过程为非零均值,则I(1)带有线性趋势项。?=0时,称I(1)过程为无漂移的I(1)过程; ??0时,称I(1)过程为有漂移的I(1)过程。显然,有漂移的I(1)过程可以表示为无漂移的I(1)过程与线性趋势项的加和。

(3)I(1)过程也称作差分平稳过程,或者单位根过程。

以随机游走过程和平稳的AR(1)过程为例,说明非平稳过程的特点。对于随机游走过程

xt = xt-1 + ut , x0 = 0, ut ? IN (0, ?2)

前文已经证明:

Var(xT)??t?1?2?T?2

xT 和 xT - k的协方差?k和相关系数?k 分别为:

tt?kt?kTE(xt,xt?k)?E(?i?1ui?i?1ui)??i?1ui2?(t?k)?2 (20.5)

?k?Cov(xT,xT?k)Var(xT)Var(xT?k)?(T?k)?u2T?u2(T?k)?u2?T?k (20.6) T对于AR(1) 过程yt = ?1 yt-1 + vt , ? ?1? < 1, y0 = 0, vt ? IN(0, ?v2) 有

5

yt = vt + ?1 vt-1 + ?1 vt-2 = … =

t?12

?i?0t?1?1ivt?i (yt只有有限记忆力)

Var(yt) = E(

?i?0?1ivt?i)2 =

11??12

?v2 (方差为有限值)

表3.1 随机游走过程和平稳的一阶自回归过程统计特征比较

方差

自相关系数

穿越零均值点的期望时间

记忆性

随机游走过程 t?u2 (无限的) 平稳的一阶自回归过程 ?u2/(1-?12) (有限的) ?k =?1k 有限的 暂时的

?k =1?(k/T)? 1, ? k, T? ?

无限的 永久的

20.5 考察序列单整性质的重要意义

至少有两个方面的原因使得我们要格外关注变量的单整性。第一个是非平稳变量导致的虚假回归问题。第二个是模型预测。 20.5.1 单整过程的概念

20.5.2 考察单整过程的意义

1. 虚假相关和虚假回归

用蒙特卡罗模拟方法分析相关系数的分布。 ut ? IN(0, 1), ut ? I (0) vt ? IN(0, 1), vt ? I (0)

每次生成T=100的相互独立的{ut}和{vt},并计算Ruv。重复1万次,从而得到Ruv的分布。 xt = xt-1 + ut , x0 = 0, xt ? I (1) yt = yt-1 + vt , y0 = 0, yt ? I (1)

利用{ut}和{vt},每次生成T=100的{xt}和{yt}并计算Rxy。重复1万次,从而得到Rxy的分布。

pt = pt-1 + xt , p0 = 0, pt ? I (2) qt = qt-1 + yt , q0 = 0, qt ? I (2) 利用{xt}和{yt},每次生成T=100的{pt}和{qt}并计算Rpq。重复1万次,从而得到Rpq的分布。

1. 两个相互独立的I(0)变量{ut}和{vt}的相关系数Ruv的分布为正态(见图3.1a)。 2. 两个相互独立的I(1)变量{xt}和{yt}的相关系数Rxy的分布为倒U形(见图3.1b)。 3. 两个相互独立的I(2)变量{pt}和{qt}的相关系数Rpq的分布为U形(见图3.1c)。

6

43210-0.3-0.2-0.100.10.20.300.060.050.040.030.020.010-1-0.500.52.521.510.5 0-1-0.500.5 图3.1a 图3.1b 图3.1c

问题的严重性在于当变量非平稳时,认为R服从的是正态分布,但实际上R服从的却是图3.1b和图3.1c那样的倒U和U字型分布,因此增加了拒绝概率,本不相关的两个变量结论却是相关!

图3.1三条曲线叠加示意图 图3.2 t(98)分布和虚假回归条件下的t分布

由数据生成过程可知xt和yt为I(1)变量且相互独立。作如下回归 yt = ?0 + ?1xt + wt ,

?)的分布见图3.2。拒绝?1 = 0的概率大大增加。从而造成虚假回归(Granger 1974t(?1年提出)。

2. 预测机制

20.6 维纳过程与常用极限分布

20.6.1 维纳过程

维纳过程可看作是一个在 [0, 1] 区间内连续的随机游走过程。我们来看如何从随机游走过程构造维纳过程。

设xt = xt-1 + ut,x0 = 0,ut ? IN(0, ?2)。通过迭代可以得到:xT??Tt?1tu。

E(xT)??t?1E(ut)?0Var(xT)??t?1??T?2T2T

7

定义函数

?xj?1?(T?r?j?1)ujj?1j,?????r?,?j?1,2,?T?TT?T?yT(r)??

x?T,??????????????????????????????r?1??T?或者写为

yT(r)?x[T?r]?(T?r?[T?r])u[T?r]?1T?,?????r?1

其中,[T r ] 表示T r 的整数部分。比如T = 1000,r = 0.0204, 则 [T r ] = [20.4] = 20。YT (r)

是在泛函空间[0, 1] 内定义的一个右连续的随机变量。随着T的增大,yT(r) 在区间 [0, 1] 内越来越密集。下图是T=10、T=100以及T=1000时随机模型的yt (r)变化趋势图。

D我们关注的是当T??时,yT (r)的极限分布。由中心极限定理,xT/T????N(0,1)。

当T??时,T r??,因此,

x[T?r]Tr?由此可得:

D???N(0,1)。

yT(r)?x[Tr]?(T?r?[T?r])u[T?r]?1x[Tr]Tr?x[Tr]Tr??T?(T?r?[Tr])u[T?r]?1T???????????r??????????r

D?Op(T?1/2)???N(0,r)由yT(r)增量的独立性可得:

DyT(r2)?yT(r1)???N(0,r2?r1)

定义:对于任意一个连续的随机过程W(r ),r ? 0,r ? [0, 1],如果满足如下条件 (1) W(0) = 0。

(2) 对于0?s

(3) 对于每0?t1< t2<…

W(r) 表示泛函空间D[0, 1] 中的标准维纳过程。而? W(r) 称作方差为? 2的维纳过程。

泛函中心极限定理(连续映射定理):若f(?) 是泛函空间D[0, 1] 中的一个连续函数,则:当t→∞ 时,

f (yt (r) ) ? f ( W(r) ). (3.21)

一般渐进理论与适用于非平稳过程的上述渐进理论的区别是对于前者样本矩收敛于一

8

个常数,而对于后者标准化的样本矩收敛于一个随机变量。在推导非平稳随机过程的样本统计量的极限分布过程中泛函中心极限定理代替了传统的中心极限定理。

20.6.2 几个常用的渐进分布结论

下面推导 T?3/2?Tt?1tx的极限分布。由(3.19)式

yT(r)?x[Tr]T1/2?xt?1t?1t,???r? (3.22) T1/2TT则yT (r) 是一个阶跃函数(阶跃始自 (t-1) / T, t = 1, 2, …, T )。在每一个阶跃内,函数值保

持不变。

对于常数c有下式成立,

?

t/T(t?1)/Tcdv?cv|tt?1c?c(?)? v?(t?1)/TTTTv?t/T对于yT (r),有

?t/T(t?1)/TyT(r)di?TTyT(i) T利用 (3.22) 式和上式,

T?3/2Txt?1T1/2yT(r)x?????t?1TTt?1t?1t?1t/TT ???t(t/?1)/TyT(r)dr???????????t?11T(t?1)/TyT(r)dr?yT(r)] T??yT(r)dr0根据连续映射定理,当T ? ?,

T?3/2?xt?1Tt?1??yT(r)dr??W(r)dr (3.23)

0011用类似的方法可以证明,当T ? ?,

T?2?xt?1?1TT2t?T?2?(xt?1Tt?1?ut)?T2?2?(xt?1T2t?1?2xt?1ut?ut2) (3.24)

Txt?12?2?T?(1/2)?T?(2xt?1ut?ut2)t?1Tt?1??[yT(r)]2dr?op(1)??[W(r)]2dr0011

给出如下数据生成系统

yt = yt-1 + ut , y0 = 0, ut ? IID (0, ?u2) xt = xt-1 + vt , x0 = 0, vt ? IID (0, ?v2) E(ui vj) = 0, ? i, j

9

xt和yt是相互独立的。对于以下回归 ?+??xt +w?t, yt =?01?,??,t(??),R2,DW的极限分布。 求?011当T ? ?,

T?3/2?xt?1Tt?T?3/2?(xt?1Tt?1?ut?x0)?T?3/2?xt?1Tt?1?T?3/2?(ut?1Tt?x0)

???????????????????v?yT(r)dr?op(1)??v?Wv(r)dr0011同理, 当T ? ?,T?3/2?yt??u?Wu(r)dr,

t?1010T1TT?2?yt2??u2?[Wu(r)]2dr

t?1TT?2?xt2??v2?[Wv(r)]2dr

t?101T?2?(yt?y)?T2t?1T?2?yt?[T2t?1T?3/2?12y]???tu??0[Wu(r)]dr?t?1?22T22T??W(r)dr? ?0u?11?2T?2?(xt?x)?T2t?1T?2?xt?[T2t?1T?3/2?1xt]??v??[Wv(r)]2dr??t?1?0??

W(r)dr??0v??2T?2?yxt?1Ttt?T?2?(yt?1?1Tt?1T?ut)(xt?1?vt)Tyt?1xt?1?2????????????????????u?vT??T?(yt?1vt?xt?1ut?utvt)?1/2?vT?1/2t?1?uTt?1????????????????????u?v??j?1TTj/T(j?1)/Tj/TYT(r)XT(r)dr?op(1)YT(r)XT(r)dr?op(1)10 (3.49)

????????????????????u?v??j?110(j?1)/T????????????????????u?v?YT(r)XT(r)dr?op(1)??u?v?Wu(r)Wv(r)dr

用泛函中心极限定理可以证明,当T ? ?,有

?服从Wiener过程函数的分布,所以随着T的增大,??的分布发散。 ⑴ T -1/2?000.140.120.10.080.060.040.02-20-10010 (p130, (3.54) ) 10

?服从Wiener过程函数的分布。因为两个Wiener过程相互独立,所以其最大可能取⑵?1值为零。

0.80.70.60.50.40.30.20.1-3-2-1012(p129, (3.51) )

?) 的极限分布存在,所以t(??) 的分布发散。 ⑶ 因为T -1/2 t(?110.080.060.040.02-30-20-1001020 (p131, (3.58) ) ⑷ R2有非退化的极限分布。不收敛于零。

432100.20.40.60.81 (p132, (3.59) ) ⑸ DW统计量依概率收敛于零。 (p132, (3.60) ) ?,??,t(??),R2,DW的分布模拟结给定条件ut , vt ?IN (0,1), T = 100, 模拟10000次得?011果如下(见书74-77页,图3.4, 3.5, 3.6, 3.7, 3.8)。

65432100.20.40.60.8 (p132, (3.60) )

11

20.7 单位根检验

20.7.1 几种随机过程

由于虚假回归问题的存在,在回归模型中应避免直接使用非平稳变量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列的平稳性。这一章则给出严格的统计检验方法,即单位根检验。

在介绍检验方法之前,先讨论所用统计量的分布。给出三个简单的自回归数据生成过程(d.g.p.), yt = ? yt-1 + ut , y0 = 0, ut ? IID(0, ? 2) (4.1) yt = ? + ? yt-1 + ut , y0 = 0, ut ? IID(0, ? 2) (4.2) yt = ? + ? t + ? yt-1 + ut , y0 = 0, ut ? IID(0, ? 2) (4.3) 其中? 称作位移项(漂移项),? t称为趋势项。

显然,对于以上三个模型,当 ? ? ? < 1时,yt 是平稳的,当 ? ? ? = 1时,yt 是非平稳的。 以模型 (4.1) 为例,若? ? ? < 1,统计量

??)= (???) (4.5) t(??)s(?渐近服从标准正态分布。根据中心极限定理,当T ? ? 时,

???) ? N (0, ? 2 (1- ? 2 ) ) (4.6) T(?T?)服从什么分布呢?当 ? ? ? = 1时,变量非平稳,上述极那么在 ? ? ? = 1条件下,统计量 t(?限分布发生退化(方差为零)。

首先观察 ? = 1条件下,数据生成系统(4.1),(4.2) 和 (4.3)的变化情况。 (1)? = 1条件下的(4.1) 式是随机游走过程。

10y=y(-1)+u220052000180001600-51400-10204060801001201401601802001200

50100150200250300

图4.1 由yt = yt-1+ ut生成的序列 图4.2深圳股票综合指数(file:stock)

(2)? = 1条件下的 (4.2) 式是含有随机趋势项的过程。将(4.2) 式作如下变换则展示的更清楚。

yt = ? + yt-1 + ut = ? + (? + yt-2 + ut-1) + ut = … = y0 + ? t +

?ui= ? t + ?ui (4.7)

i?1i?1tt 12

这是一个随机游走过程和一个趋势项之和。所以称作随机趋势过程(stochastic trend process),有漂移项的非平稳过程(non-stationary process with drift)见图 4.2,虽然总趋势不变,但随机游走过程上下游动。因为对yt作一次差分后,序列就平稳了, ? yt = yt - yt-1 = ? + ut (平稳过程)

所以也称yt为差分平稳过程(difference- stationary process)。

80stochastic trend process6020y=-0.1+y(-1)+u0-2040-40-60-80-10020050100150200250300350400

1002003004005006007008009001000

图4.2a 由yt = 0.1+ yt-1+ ut生成的序列 图4.2b 由yt = - 0.1+ yt-1+ ut生成的序列(file:simu2)

(3)趋势非平稳过程

? = 1条件下的 (4.3) 式是含有随机趋势和确定性趋势的混合随机过程(见图 4.3)。 yt = ? + ? t + yt-1 + ut = ? + ? t + [? + ? (t-1) + yt-2 + ut-1] + ut

= …

= y0 + ? t + (? t) t - ? (1+2 +…+ t) += y0 + ? t + ? t -2

?ti?1iu

?2( 1+ t ) t +

?ui?1ti= (? -

?2) t +

?2t +?ui, (设定y0=0)

2

ti?1含有随机趋势和确定性趋势的混合随机过程实际上是随机游走加上一个时间t的2次方过程。这种过程在经济问题中非常少见。

80706050403020100-1025507510012520trend stationary process151050-5

20406080100120140

图4.3 yt = 0.01+ 0.01t + yt-1+ ut生成的序列(y4) 图4.4 yt = 0.1 t + ut 生成的序列(file:simu2)

13

20.7.2 DF检验

1. 无截距项、无趋势项的情形

模型为

yt = ? ut-1 + vt, (4.1)

零假设和备择假设分别是,

H0:? = 1, ( yt非平稳) H1:? < 1, ( yt平稳)

给定 ? = 1,则

?? ??ytyt?1t?1T?yt?1T2t?1 (4.9)

因已知y0 = 0,

????t?1(yt?1?ut)yt?1?Tt?1Ty2t?1??t?1yt?12?Tt?1Ty2t?1??t?1utyt?1?Tt?1Ty2t?1?1???Tt?1tTt?1uyt?1y2t?1

??1????Tt?1tTt?1uyt?1y2t?1 (4.10)

前文已经证明,

TT?2?yt?12??2?(W(r))2dr (4.11)

t?120tT1?yt?1??(yt?1?ut)??y2t?1t?1TT2t?1??ut?2?yt?1ut

2t?1t?1TT对上式移项整理,

T1?T2T1?2T2?22?yt?1ut???yt??yt?1??ut???yT??ut? (4.12) ?2?t?1t?1t?1t?1t?1?2??T当T? ∞,

21?2?yT?1T2?12T?yt?1ut????1/2???ut???[W(1)2?1] (4.13)

2?t?1???T?Tt?1??2?1T由上式知?yt?1ut是O(T)的。由 (4.11) 式知?yt?12是O(T 2 )的。所以当T ? ? 时,

t?1t?1TT?)?Plim(1??Plim(??Tt?1tTt?1tuyt?1T22t?1uyT2)?1 (4.14)

?是 ? =1的一致估计量。 可见? 由(4.10)式、(4.11) 式和 (4.13) 式,当T ? ? 时,

14

??1)? T(?T?1?uytt?1Tt?1Tt?1?(1/2)[W(1)2?1]T?2?yt?12?W(r)dr012 (4.15)

?- 1)是检验单位根的一个常用统计量。有三个结论如下: T (??是O(T –1 )的。由 (4.6) 式知,当yt 平稳时,??是O(T –1 /2 )的。所以前(1)由上式知??以速度T接近真值? = 1,所以称??是? = 1的超一致估计量。 者的收敛速度更快。??- 1)的极限是标准维纳过程的函数。 (2)T(?它不服从正态分布,也不服从t分布。W(1)2

? ?2(1),尽管 (4.15)式分子的期望为零,但其分布是不对称的。

P{ ( W(1)2 –1 ) < 0} = P{ W(1)2 < 1 } = 0.68 [W(1)~N(0, 1)]

?的值将有0.68的概率小于1。 这表明,尽管? = 1,对于给定的样本,??- 1) 不服从t分布,所以假设检验时不能查t临界值表。 (3) 因为T(?检验单位根的另一个统计量是DF统计量。DF统计量的表达式与通常意义的t统计量

完全相同。

??1??1(?t?1yt?12)1/2??DF????)?(Ty2)?1/2?s(??t?1t?1利用结论 (4.11) 和 (4.13) 式,当T ? ? 时,

T??Tuyt?1tt?1Ty2t?1t?1???(?Tt?1tTuyt?1y2)1/2t?1t?1 4.16)

??1?(1/2W)(2?(1)1)?1 DF? (4.17) ?)s(?(?W(r)2dr)1/20?- 1) 和DF统计量的百分位数表,Full (1976) 用蒙特卡罗模拟方法得到T(?分别见附表

5和6。以模型 (4.2),? = 1为条件,取样本容量T = 100,用蒙特卡罗方法模拟10000次得

?,T(??- 1) 和DF的分布分别见图4.1和4.2。??的分布是左偏的,峰值小于1。T(??- 到的?1) 的分布也是左偏的,峰值小于0。DF分布近似于t分布,但整体向左大约移动了1.6个单位。

以附表6中a部分的相应百分位数作为临界值,若用样本计算的 DF > 临界值,则接受H0,yt 非平稳; DF < 临界值,则拒绝H0,yt是平稳的。

图4.12 单位根检验示意图

15

上述DF检验还可用另一种形式表达。(4.24) 式两侧同减yt-1,得

? yt = (?-1) yt-1 + ut , (4.27) 令 ? = ? - 1,代入上式,

? yt = ? yt-1 + ut , (4.28) 与上述零假设和备择假设相对应,用于模型 (4.27) 的零假设和备择假设是 H0:? = 0, ( yt非平稳) H1:? < 0, ( yt平稳)

这种模型形式的变化并不影响DF统计量的值,所以检验规则仍然是 若DF > 临界值,则yt是非平稳的; 若DF < 临界值,则yt是平稳的。 这种检验方法是DF检验的常用方法。(便于在计算机上实现)

2. 存在截距项时的情形

yt = ? + ut ,ut = ? ut-1 + vt, (4.1)

零假设和备择假设分别是,

H0:? = 1, ( yt非平稳) H1:? < 1, ( yt平稳)

将模型滞后一阶,两边同时乘以?,得到 ?yt-1 = ? ? + ?ut-1

可得到Dicky-Fuller检验方程:

yt = ? (1- ?) + ?yt-1 + vt = ?0 + ?yt-1 + vt

因此,对原假设? = 1的检验等价于检验联合假设:?0 = 0,? = 1。但实践中,仅对? = 1进行检验。

构建统计量

(1/2)[W?(1)2?W?(0)2?1]?DF?T(??1)? 1?2?W(r)dr??0??1(1/2)[W?(1)2?W?(0)2?1]? DFt??1?s(?)W?(r)2dr??0其中,W?(r)?W(r)??W(s)ds

013. 存在截距项和趋势项时的情形

模型为

yt = ? + ? t + ut , ut = ? ut-1 + vt, (4.1)

零假设和备择假设分别是,

H0:? = 1, ( yt非平稳) H1:? < 1, ( yt平稳)

16

将模型滞后一阶,两边同时乘以?,得到

?yt-1 = ? ? + ?? (t-1) + ?ut-1

可得到Dicky-Fuller检验方程:

yt = ? (1- ?) + ?? + ? (1- ?) t + ?yt-1 + vt = ?0 + ?1 t + ?yt-1 + vt

因此,对原假设? = 1的检验等价于检验联合假设:?1 = 0,? = 1。但实践中,仅对? = 1进行检验。检验统计量为:

(1/2)[W?(1)2?W?(0)2?1]?DF?T(??1)? 1?2?W(r)dr??0??1(1/2)[W?(1)2?W?(0)2?1]? DFt??1?s(?)W?(r)2dr??0其中,W?(r)?W(r)?a?d?r

a??(4?6s)W(s)ds,??d??(?6?12s)W(s)ds

0011

注意

1. DF检验是左单端检验。因为 ? > 1意味着强非平稳,? < 1意味着平稳。当接受? <

1,拒绝 ? = 1时,自然也应拒绝? > 1。 2. 在实际检验中,若H0不能被拒绝,说明yt是非平稳序列(起码为一阶非平稳序列)。

接下来应该继续检验 ? yt 的平稳性。即

? 2 yt = ? ? yt-1 + ut , (4.31)

直至结论为平稳为止。从而获知 yt 的单整阶数。

?t不能存在自相关。如存在自相关,说明yt不是一个AR(1) 3. (4.28) 式的残差序列 u过程,则不能使用DF检验。

?4. 在含有截距项和趋势项时,即使?=0,结论也成立。即,DF?和DFt?也可以用于检

验无漂移随机游动的序列。然当,当原假设过程为无趋势时,因为平稳备择假设的的有限样本势大于的有限样本势,因此应该使用DF??和DFt?作为统计量。另一方

?面,如果过程可能具有时间趋势时,却没有利用DF?和DFt?进行检验,将导致错

误的大样本结论。

20.7.3 ADF检验

以上方法只适用于AR(1) 过程的单位根检验。当时间序列为AR(p) 形式,或者由以上

形式检验得到的残差序列存在自相关时,应采用如下形式检验单位根。

?yt-1 + ? yt = ?????? y

i?1kt-i + ?t , (4.34) v 17

因为上式中含有? yt的滞后项,所以对于? = 0(yt非平稳)的检验称为增项DF检验或ADF检验。模型 (4.19) 研究的就是这种条件下的DF分布。 1. DF检验

对于AR(p+1)过程

yt = ?1 yt-1 + ?2 yt-2 + … + ? p yt-p-1 + u t , (4.18) 根据BN分解公式,AR(p)可以重新表述为:

yt??yt?1???j??yt?j?ut

j?1p????i,?????j?????i(j?1,2,...,p)i?1i?j?1p?1p?1

可以证明,?与AR(p+1)特征多项式的特征根相对应:当? = 1时,yt中含有单位根。 结论:假设{yt}为ARIMA(p,1,0)过程,则{ ?yt }为I(0)平稳过程。则

yt??yt?1???j??yt?j?ut

j?1p的单位根检验统计量为:

??1)T(?ADF???Stat:???DF???1??????1pADF?t?Stat:????1??)Se(?

?DFtADF检验中对?=1检验的DF统计量的分布与 DF检验统计量的分布近似相同。 (4.19)

式中的差分项 ? yt-j , j = 1,2, …, p – 1之所以不会对DF统计量的分布产生影响是因为当 yt ? I(1),则全部 ? yt-j ? I(0)。yt与 ? yt-j的交叉积渐进被忽略。从而使 (4.19) 式中 ? 的DF统计量的分布与 (4.1) 式中 ? 的DF统计量渐近相同。 2. 存在位移项时的情形

存在位移项时有如下结论成立,

结论:假设{yt}为ARIMA(p,1,0)过程,则{ ?yt }为I(0)平稳过程。则

yt????yt?1???j??yt?j?ut

j?1p的单位根检验统计量为:

??1)T(?ADF???Stat:???DF????????1??1pADF?t?Stat:????1??)Se(?

?DFt?3. 存在趋势项时的情形

存在趋势项时有如下结论成立,

结论:假设{yt}为ARIMA(p,1,0)过程,则{ ?yt }为I(0)平稳过程。则

yt????t??yt?1???j??yt?j?ut

j?1p 18

的单位根检验统计量为:

??1)T(?ADF???Stat:???DF????????1??1pADF?t?Stat:????1??DFt??)Se(?

即:当模型 (4.18) 中含有位移项 ? 和趋势项 ? t时,对应? 的DF统计量的分布分别

与模型 (4.2) 和模型 (4.3) 中DF统计量的分布相同。 4. Said-Dicky扩展

现在进一步放宽对yt的限制。考虑如下过程 yt = ? yt-1 + ut , (4.22) 其中允许随机项ut是一个ARMA(p, q) 过程,甚至参数 p, q 的值也可未知。则可以用下式研究 ? 和DF统计量的分布。 ?yt-1 + yt = ?????? yt-i + v?t , (4.23)

i?1k若? = 1,上式是一个差分的AR(k) 过程。加入 ?yt 滞后项的目的是捕捉 (4.22) 式误差项

ut中的自相关。(ut的自相关项对于模型 (4.22) 来说是移动平均项,所以 ?yt 滞后项的加入可以捕捉之。)因为可逆的移动平均过程可以转化为一个无限阶的自回归过程,所以对ut而言的移动平均项vt, t = 1, …, q完全可以通过增加ut 的滞后项而吸收。进而被足够的? yt-i项

?t近似为一个白噪声过程。 所吸收。从而使vSaid-Dickey (1984) 证明 (4.23) 式中 ? 的DF统计量的分布与 (4.1) 式中 ? 的DF统

计量的分布类似。 当 (4.23) 式中加入位移项 ? 和趋势项? t时, ? 的DF分布分别与 (4.2) 式和 (4.3) 式中 ? 的DF分布相同。

5. 对未知滞后阶数p的处理

?。这里直接给出关于p的选择的几个基本结论。令p表示真实的滞后阶数,其估计量为p ?满足条件: 结论1:如果p???,但p?/T1/3?0, T??时,p?期滞后的ADF统计量与基于p期滞后的ADF统计量具有相同的渐进分布。 则基于p?有无穷多个。这一结论并没有给我们提供选择p的实际指导,因为满足如上条件的p这时候,可以考虑利用信息准则

C(T)?SSR?IC?ln??(j?1)(注意,公式中为j+1) ?T?T??的选择范围是j = 0, 1, 2, …, pmax。pmax为大于或等于真实阶数p的整数。pmax为样本容量pT的函数,为表明这一点,我们用pmax(T)表示。但如果{?yt }为平稳可逆的ARIMA(p,0,q)过

程,则pmax(T)必须大于真实的阶数p。

19

?,pmax(T)满足条结论2:Ng and Perron(1995)证明,如果根据从一般到特殊的规则选择p件

T??时,pmax(T)??,但pmax(T)/T1/3?0

且存在常数c满足,pmax(T)?c?Tg??(0?g?1/3)

?期滞后的ADF统计量与基于p期滞后的ADF统计量具有相同的渐进分布。 则基于p通过上述分析,可以明确的是,如果pmax(T)满足上述条件,则无论采用序贯t准则、

AIC准则或是BIC准则,ADF统计量具有相同的渐进分布。那么该如何确定pmax(T)呢?

Schwert(1989)的模拟表明,在小样本及中等大样本中(T=25至1000),减少显著性

???12?T/100??为p水平扭曲的重要方法是自回归包含足够的滞后阶数。他所选择的p?1/4?。 ?6. 检验形式的选择

实际中并不知道被检验序列的d.g.p. 属于哪一种形式,(4.1)、(4.2) 还是 (4.3) 式。怎样选择单位根检验式呢?

一般方法是当被检验序列中存在趋势项时,则应该采用 (4.3) 式和(4.2) 式。如不存在趋势项时,则应该采用 (4.1) 式。同时还要区别退势平稳过程。

对(2)式进行联合检验,H0:? =? =0。但所用的F统计量不再服从F分布。实际分布见表2。

表2 对(4.2)式进行联合检验H0:? =? =0的F分布表

T 25 50 100 250 500 ∞ s.e.

0.01 0.29 0.29 0.29 0.30 0.30 0.30 0.002

0.025 0.38 0.39 0.39 0.39 0.39 0.40 0.002

0.05 0.49 0.50 0.50 0.51 0.51 0.51 0.002

1-? 0.10 0.90 0.65 0.66 0.67 0.67 0.67 0.67 0.002

4.12 3.94 3.86 3.81 3.79 3.78 0.01

0.95 5.18 4.86 4.71 4.63 4.61 4.59 0.02

0.975 6.30 5.80 5.57 5.45 5.41 5.38 0.03

0.99 7.88 7.06 6.70 6.52 6.47 6.43 0.05

摘自:Dickey-Fuller(1981)

6. 也可以对(4)式进行联合检验,H0:? =? =0。但所用的F统计量不再服从F分布。而服从如表3的分布。

表3 对(4.3)式进行联合检验H0:? =? =0的F分布表

T 25 50 100 250 500 ∞ s.e.

0.01 0.76 0.76 0.76 0.76 0.76 0.77 0.004

0.025 0.90 0.93 0.94 0.94 0.94 0.94 0.004

0.05 1.08 1.11 1.12 1.13 1.13 1.13 0.003

1-? 0.10 0.90 1.33 1.37 1.38 1.39 1.39 1.39 0.004

5.91 5.61 5.47 5.39 5.36 5.34 0.015

0.95 7.24 6.73 6.49 6.34 6.30 6.25 0.020

0.975 8.65 7.81 7.44 7.25 7.20 7.16 0.032

0.99 10.61 9.31 8.73 8.43 8.34 8.27 0.058

摘自:Dickey-Fuller(1981)

20

?)的分布。 7. (4.2) 式中t(??)的分布见图11a。t(??)不再服从t分布。可见对?的显著性检验DF检验式(2)中t(??)0.05 = -2.57,临界值t(??)0.95 = 也应该用蒙特卡罗模拟结果计算。T = 50条件下,临界值t(?2.51。

0.30.50.250.40.20.150.10.050.30.20.1-4-202 -4-202 ?)分布的蒙特卡罗模拟(T =50,模拟1万次) 图4.13b t(??)分布与DF分布的比较 图4.13a t(??)的极限分布。 ?)和t(? 8. (4.3) 式中t(??)统计量分布的蒙特卡罗模拟结果见图12。t(??)的分?), t(??), t(?DF检验式(4)中t(?布近似相同,但服从的不是t分布,所以不能用通常的t分布临界值做显著性检验。T =100

?)0.05 = -2.89,?)0.95 ?)0.05 = -2.80,?)0.95 =2.87;条件下,临界值t(?临界值t(?临界值t(?临界值t(?=2.66。

0.20.50.150.40.30.20.10.050.1-6-4-2024 -6-4-2024 ?)分布的蒙特卡罗模拟(T =100,模拟1万次) 图12b t(??)分布与DF分布的比较 ?), t(??), t(?图12a t(??)统计量分布的蒙特卡罗模拟结果(file:uniroot3)见下表。 ?)和t(?t(?条件是:数据生成过程为yt = yt-1 + ut , ut ? IID(0, 1)。

估计模型是:yt = ? + ? t + ? yt-1+ ut。

?)的分布(模拟5万次) 表0: 估计模型yt = ? + ? yt-1+ ut中t(?obs CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 1 -3.71607 -2.98201 -2.64194 2.51020 2.86467 3.56780 2 -3.57894 -2.91253 -2.58341 2.52826 2.88722 3.58953 3 -3.47011 -2.85596 -2.54997 2.55833 2.88539 3.50376 4 -3.44065 -2.85378 -2.54470 2.57503 2.90392 3.56663 5 -3.42902 -2.82471 -2.52979 2.54631 2.87799 3.56599 6 -3.37406 -2.82317 -2.53374 2.54035 2.88494 3.56644

T

30 50 100 150 200 250

注:(M.File:unitroot02)

21

-3.3V005-3.4-2.80V025-2.85-3.5-2.90-3.6-2.95-3.71/T0.010.020.030.04-3.80.00

-3.000.001/T0.010.020.030.04

表0中数据(file:uniroot3)

?)的分布(模拟5万次) 表1: 估计模型yt = ? + ? t +? yt-1+ ut中t(?obs CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 1 -4.07560 -3.32138 -2.92816 2.80000 3.19462 3.99269 2 -3.94834 -3.25371 -2.86465 2.83257 3.19808 3.87910 3 -3.85926 -3.17450 -2.81506 2.87025 3.21765 3.83482 4 -3.76003 -3.09851 -2.77422 2.89550 3.26019 3.90150 5 -3.76003 -3.10629 -2.77177 2.89391 3.25672 3.90993 6 -3.74954 -3.10582 -2.77119 2.91474 3.29941 3.95097

T

30 50 100 150 200 250

注:(M.File:unitroot01)

?)的分布(模拟5万次) 表2: 估计模型yt = ? + ? t +? yt-1+ ut中t(?obs CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 1 -3.96132 -3.20650 -2.83006 2.83372 3.23184 4.04315 2 -3.90374 -3.19471 -2.84496 2.78472 3.14982 3.85176 3 -3.85822 -3.25775 -2.91985 2.66820 3.02138 3.70615 4 -3.95734 -3. 29940 -2.96328 2.65191 2.99519 3.62287 5 -3.91488 -3.31539 -2.96642 2.63986 2.96134 3.57071 6 -3.97728 -3.32261 -2.96771 2.63847 2.97243 3.56027

T

30 50 100 150 200 250

注:(M.File:unitroot01)

例1 (file:b4c1)日本失业率时间序列。 依次用(4.3)、(4.2)、(4.1)式检验单位根,该序列是无趋势项、无漂移项的单位根过程。

0.035Y0.0300.0250.0080.0060.0040.002DY0.0200.0000.0150.0100.00550556065707580859095-0.002-0.004-0.006

50556065707580859095

22

0.035Y0.0300.0250.0200.0150.0100.0050.00Y(-1)0.010.020.030.04

例2(file:japopu)日本人口序列是有趋势项、有漂移项的单位根过程。

1.41.21.0Y0.040.03DY0.020.010.80.60.40.21880190019201940196019800.00-0.01-0.02-0.031880

19001920194019601980

? yt = 0.00925 +0.00025 t - 0.0250 yt-1 +0.2098 ? yt-1 + ut [t =1, (1876年)] (3.6) (3.1) (-2.6) (2.3)

DW=2.0, t =1, (1876年), DF= -2.6 > DF0.05= -3.44

? 2 yt = 0.00297 - 0.3923 ? yt-1 - 0.3848 ?2yt-1 - 0.2364 ?2 yt-2 + ut (3.1) (-3.6) (-3.5) (-2.6)

DW=2.0, t =1, (1876年), DF= -3.6 < DF0.05= -2.9

例3深圳股票综合指数序列(file:stock)。依次用(4.3)、(4.2)、(4.1)式检验单位根,该序列是无趋势项、无漂移项的单位根过程。

700SZ6001000000012000000GDP8000000500600000040040000003001002003004005006002000000

808284868890929496980002

深圳股票综合指数(file:stock) 美国GDP序列(file:consump, x)

例4 美国GDP序列(file:consump)。依次用(4.3)、(4.2)式检验单位根,该序列是无趋势项、有漂移项的单位根过程。F检验结果如下。

23

(EQ04)

例5 (file:simu2)T = 250的理论退势平稳过程TREND1的检验结果如下: 例6 (file:simu2)T = 1000的理论随机趋势过程Y3的检验结果如下:

30252015100250trend stationary pro.200150stochastic trend pro.1050-550100150200250500-502004006008001000

退势平稳过程(file:simu2, TREND1) 随机趋势过程(file:simu2,, Y3,)

结论很正确。

单位根检验的EViews操作:

从工作文件(Work File)中打开序列数据(Series)窗口。点击View键,选Unit root test功能。这时会打开一个对话框。其中有四项选择。

(1)ADF检验还是PP检验(缺省状态是ADF检验)。 (2)检验对象是当前序列(Level),还是其一阶差分序列(1st difference),二阶差分序列(2nd difference)?缺省状态是当前序列。

(3)检验式中应包括的附加项。有三种选择,“漂移项”(Intercept),“趋势项和漂移项”(Trend and Intercept),“无附加项”(None)。缺省状态是加漂移项。

(4)检验式中滞后差分项的个数。显示的数字随样本容量的不同而不同。 20.7.4 对单位根检验的几点说明

单位根检验不是检验序列是否平稳,而是检验序列是否存在随机趋势。如果拒绝原假设,说明序列中不存在随机趋势,而是趋势平稳过程。这时,需要用LS退势的方法将序列转换为平稳过程。当然,在没有趋势项时,长期趋势退化为常数均值;在没有截距项和趋势项时,长期趋势退化为0均值。这时,不需要用LS进行退势,可以对序列直接建立ARMA模型。

如果接受原假设,则说明序列中存在随机趋势成分。在模型I和II中,如果接受原假设,说明序列为差分平稳过程。这时,需要用差分的方法将其转换为平稳过程。在模型III中,如果接受原假设,说明序列中即存在随机趋势成分,也存在长期趋势成分。

因此,单位根检验本质上是检验序列是否存在均值回归或趋势回归。如果不含有单位根,则序列表现为均值回归或趋势回归。如果含有单位根,则序列不存在均值回归或趋势回归。

将不同形式的ADF检验汇总如下。 ADF检验方程 接受H0 接受H1 Model I: y = ?yt-1 + lag(?yt-j)+ vt yt = ? ut-1 + vt, tModel II:

yt为仅含有随机趋势的差分平稳过程;即?yt为零均值。 yt为含有一次时间趋yt为零均值平稳可逆ARMA过程。 yt为非零均值平稳yt = ?0+ ?yt-1 + lag(?yt-j)+ vt 24

yt = ? + ut ut = ? ut-1 + vt, Model III: yt = ? + ? t + ut ut = ? ut-1 + vt 势和随机趋势的差分可逆ARMA过程。 平稳过程;即?yt为非零的常数均值。 yt为含有二次时间趋yt为线性趋势平稳yt = ?0 + ?1 t + ?yt-1 + lag(?yt-j) 势和随机趋势的过程;过程。 即?yt表现为线性趋+ vt 势。 20.7.5 单整阶数的确定

如果检验出yt存在单位根,则表明yt至少含有一个单位根,即至少为I(1)过程。接着检验?yt是否存在单位根。如果拒绝原假设,则表明?yt不存在单位根,yt为I(1)过程,检验结束。如果接受原假设,则表明?yt仍然存在至少一个单位根,即yt至少为I(2)过程,接着对?yt进行单位根检验。

这里,我们需要注意对?yt进行单位根检验的形式。如果对yt采用Model III,那么?yt

已经消除了时间趋势项,只剩下漂移项,因此应该采用Model II进行检验。同样地,如果对yt采用Model II,那么?yt已经消除了漂移项,因此应该采用Model I进行检验。

20.8 其他形式的单位根检验

20.8.1 DFGLS检验

ERS(1996)提出了ADF检验的修正形式。在ADF检验中,直接在检验方程中加入位移项或时间趋势项,而ERS是在检验之前,首先通过退势的方法将位移项或时间趋势项剔除。

首先将yt作拟差分,

?yt,???????????????t?1 d(yt|?)??y??y,???t?1t?1?t利用拟差分数据作OLS回归,

d(yt|?)?d(Xt|?)'β(?)?ut

其中,X为常数项,或者常数项和趋势项。

ERS建议

????1?7/T??????????Xt?{1}

1?13.5/T,????X?{1,t}t?定义退势序列为:

?(?) ytd?yt?Xt'β然后,利用形式1对ytd回归ADF检验方程:

25

?ytd??ytd?1??1?ytd?1????p?ytd?p?ut

利用t统计量或?统计量进行检验。但需要注意的是,模型中包含常数项时,t统计量服从DF分布。但如果模型中同时包含常数项和趋势项时,t统计量不服从DF分布。ERS(1996)模拟了不同样本容量下的临界值。 20.8.2 Phillips-Perron(PP)检验

Phillips and Perron (1988)提出了解决序列相关问题的非参数检验方法。PP方法使用DF检验方程,但对t统计量和?统计量进行了修正,使得自相关不影响统计量的渐进分布。PP检验统计量为:

???t???t??0??f0?1/2??)T(f0??0)Se(? 1/2?2f0??2(T?k)??为回归方程的标准差,?0?其中,?,f0表示残差的0频率谱。

T在PP检验中,有两个基本设定。一是模型形式的选择,即是否包含常数项或时间趋势项。其二是选择估计f0的方法。PP修正的t统计量的渐进分布与ADF统计量相同。因此,临界值与判别方法也相同。

零频率谱的两种估计方法。核估计方法和谱密度估计方法。核估计公式为:

??f0j??(T?1)?T?1??(j)?K(j/l)

?(j)表示残差的协方差估计量。 其中,l表示窗宽参数,K表示核函数,?20.8.3 Kwiatkowski, Phillips, Schmidt, and Shin (KPSS)检验

The KPSS (1992)检验与其他单位根检验的方法不同,这种检验的原假设为序列是平稳的。KPSS统计量是基于OLS回归的残差。

yt?Xtβ?ut

检验统计量为:

?S(t)LM?t2Tf02?i ,???S(t)??ui?1tKPSS(1992)给出了KPSS LM统计量的渐进分布及其临界值。

20.8.4 Elliot, Rothenberg, and Stock Point Optimal (ERS)检验

ERS检验是利用拟差分方程的残差构建的统计量。 原假设为:??1;备择假设:???。

26

统计量为:PT?SSR(?)??SSR(1)

f0Elliot, Rothenberg, and Stock(1992)给出了T=50,100,200和?下的临界值。 20.8.5 Ng and Perron (NP)检验

Ng and Perron (2001)基于GLS退势序列提出了四种检验统计量。

20.9 结构突变与单位根检验

Perron指出,对于在趋势或水平值存在结构突变的过程来说,如果不考虑这种突变,当用ADF统计量检验单位根时,将会把一个带趋势突变或水平值突变的退势平稳过程误判为随机趋势非平稳过程。即进行单位根检验时不考虑结构突变,会导致检验功效降低(实为退势平稳过程,检验结果却认为是单位根过程)。

结构突变的两种形式。

10010080806060404020200204060801001201401601802000

20406080100120140160180200

图22 含有均值突变的过程 图23 含有斜率突变的过程

检验实例3:有T=100的均值突变平稳过程yt如图24。ADF检验式估计结果是 ?yt = -0.0119 yt-1 -0.3656 ?yt-1 + ut

(-0.5)* (-3.8) R2=0.14, DW=2.07, ADF(0.05) = -1.94,T=100

由于ADF检验式没有考虑均值突变,检验结果yt是单位根过程。用虚拟变量(D=0,(1-50);D=1,(51-100))区别突变前后两个时期,得ADF检验式如下:

1086420-2102030405060708090100

图24 含有均值突变的平稳过程

27

?yt = -0.9499 yt-1 + 0.0126 ?yt-1 + 0.2714 + 7.3115 D + ut

(-5.9)* (-0.1) (1.5) (5.7) R2 = 0.37, DW=1.84, ADF(0.05) = -1.94,T=100

因为ADF= -5.9 < -1.94,所以,yt为带有均值突变的退势平稳过程。 20.9.1 结构突变点已知条件下的单位根检验方法

Perron (1989, 1990)给出了结构突变点已知条件下的单位根检验方法。结构突变点已知时,称其为外生性结构突变点。假定发生结构突变的时点已知为tB。

模型(1):

H0:yt为水平(截距)突变的单位根过程(在tB +1期发生脉冲式突变)。表示为

yt = ? +?1D1t +yt-1+ut, ut ?I(0) , (6)

其中

0, t?tb?1 D1t = ? ?? 1, t?tb?1H1:含有一个水平(截距)突变点的退势平稳过程。

yt = ? +?2D2t +? t + ut, (7) 其中

1 , t?tb D2t = ? ?? 0 , t?tb 原假设是,yt 为水平(截距)突变的单位根过程;备择假设是,yt 为漂移项突变(由? 变化到? +?2)的趋势平稳过程。

模型(2):

H0:从tB +1期始发生漂移项突变(实为序列发生斜率突变,对于取对数的经济变量是增长率发生突变)的单位根过程。

yt = ?+?2 D2t +yt-1+ut, ut ?I(0) , (8)

其中

1 , t?tb D2t = ? ?? 0 , t?tb 即在t ? (tB +1) 时,截距(对于取对数的经济变量是增长率)由? 突变到?+?1。

H1:自(tB +1)期始,含有斜率(趋势)突变(对于取对数的经济变量是增长率发生突变)的退势平稳过程(原理见退势平稳过程)。 yt = ? +? t +?3 D3t + ut, (9) 其中

? t?tb, t?tb D3t = ?

? 0 , t?tb 原假设是,yt 为漂移项突变的单位根过程;备择假设是,yt 为斜率突变(由? 变化到? +?3)的趋势平稳过程。

28

模型(3):

H0:从tB +1期始,同时发生脉冲式突变和截距突变,即截距和斜率(对于取对数的经济变量是增长率)同时发生突变的单位根过程。

yt = ? +yt-1+?1 D1t +?2 D2t +ut, ut ?I(0) (10)

其中

0, t?tb?1 D1t = ?,D2t = ?? 1, t?tb?1? 1 , t?tb ?? 0 , t?tb 即从t ? (tb +1) 时始,?1表示截距发生突变;?2表示斜率发生突变(对于取对数的经济变量是增长率),从截距为零,斜率为?,突变到截距为?1,斜率为?+?2。其中D1t是脉冲式虚拟变量,D2t是阶跃式虚拟变量。

H1:自(tB +1)期始,截距和斜率发生双突变的的退势平稳过程。

yt = ? +? t +?2D2t +?4 D4t + ut, (11)

其中

? 1 , t?tB D2t = ?,D4t =

? 0 , t?tB ? t, t?tB ?? 0, t?tB 原假设是,yt 为水平和漂移项双突变的单位根过程;备择假设是,yt 为截距和斜率双突变(水平由? 变化为? +?2,斜率由? 变化为? +?4)的趋势平稳过程。

Perron指出,如果数据由备择假设(带有结构突变的退势平稳过程)生成,则无论过程中含有哪种突变,随着突变点的增加,如下检验式

yt = ?* + ?1* yt-1 +?* t + ut*, 中?1的OLS估计量都逐渐趋近于1,从而错误地给出结论,yt含有单位根。 实际检验分为两类。(1)突变的发生是瞬时的,称为可加性离群(additive outlier)情形,用AO表示。突变是脉冲式的,只影响yt水平值。(2)突变以后yt是渐变的,即相当于在某一时刻的新息上加载冲击,称为新息值离群(innovation outlier)情形,用IO表示。因为模型是动态的,一个时刻的新息冲击要扩散到序列的以后若干期,也许是无限期。 下面以AO情形为例,介绍带有结构突变的时间序列的单位根检验方法。 首先根据具体情况,按三个备择假设模型(7)、(9)、(11)之一回归,即从yt中剔出常

?t(i)表示。其中i = 1, 2, 3,数项、固定趋势和结构变化的影响,所得为退势、退结构残差,用u分别表示用(7)、(9)、(11)式回归得到的残差序列。ADF检验式写为,

i)???u????j?u?t(??uj?vt, i = 1, 2, 3 (i)t(i)t?1j?1p(i)

定义? 所对应的统计量t(?、(9)、(11)式相?)为AOADF。其中i = 1, 2, 3,分别与(7)

对应。AOADF(i) 不服从标准的ADF分布。其渐近分布与获得残差序列的回归式i有关,与突变点的位置? = tb / T有关。

表5 AOADF(i) 统计量在? 已知、未知条件下以及最小t统计量检验用渐近临界值

?

检验式 0.1 0.2 (1) -3.68 -3.77 ? 已知

0.3 0.4

-3.76 -3.72 0.5 0.6 -3.76 -3.76 29

0.7 0.8 -3.80 -3.75 ? 未知 0.9

-3.69 -4.80 Min(t) -4.64 5% 10% (2) (3) (1) (2) (3) -3.65 -3.75 -3.40 -3.36 -3.45 -3.80 -3.99 -3.47 -3.49 -3.66 -3.87 -4.17 -3.46 -3.58 -3.87 -3.94 -4.22 -3.44 -3.66 -3.95 -3.96 -4.24 -3.46 -3.68 -3.96 -3.95 -4.24 -3.47 -3.66 -3.95 -3.85 -4.18 -3.51 -3.57 -3.86 -3.82 -4.04 -3.46 -3.50 -3.69 -3.68 -3.80 -3.38 -3.35 -3.46 -4.42 -5.08 -4.58 -4.11 -4.82 -4.08 -4.62 -4.37 -3.77 -4.28

注:引自Zivot and Andrews表2、3、4和Perron(1997)表1。

AOADF(i) 临界值表见表5。AOADF(i) 统计量的临界值的绝对值大于相应ADF临界值,并以? = 0.5(结构突变点发生在样本区间的中心点)时达到最大。给定检验水平和?值,有下式关系存在。

AOADF(1) < AOADF(2) < AOADF(3)

30

本文来源:https://www.bwwdw.com/article/5p5.html

Top