18动态分布滞后(ADL)

更新时间:2023-12-27 08:24:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第5章 动态回归与误差修正模型

本章假定变量具有平稳性,第6章将把误差修正模型的应用向非平稳变量扩展。

5.1 均衡与误差修正机制

均衡指一种状态。达到均衡时将不存在破坏均衡的内在机制。这里只考虑平稳的均衡状态,即当系统受到干扰后会偏离均衡点,而内在均衡机制将努力使系统重新回到均衡状态。

下面通过一个例子说明系统均衡概念。以两个地区某种商品的价格为例,假设地区A中该商品物价由于某种原因上升时,该商品就会通过批发商从价格低的B地区向价格高的A地区流动。从而使批发商从中获利。这种活动将直接导致该商品在B地区的需求增加,从而使该商品在B地区的价格上涨。从A地区看,由于增加了该商品的供给,则导致价格下降,反过来的情形也是一样,从而使两各地区的该商品价格越来越接近。用该两个地区的价格数据绘制一张平面图,价格A = 价格B的直线表示此问题的均衡状态。如上所述,当价格离开这条直线后,市场机制这只无形的“手”就会把偏离均衡点的状态重新拉回到均衡状态。随着时间推移,无论价格怎样变化,两个地区的价格都保持一致。

若两个变量xt , yt永远处于均衡状态,则偏差为零。然而由于各种因素的影响,xt , yt并不是永远处于均衡位置上,从而使ut ? 0,称ut为非均衡误差。当系统偏离均衡点时,平均来说,系统将在下一期移向均衡点。这是一个动态均衡过程。本期非均衡误差ut是yt下一期取值的重要解释变量。当ut > 0时,说明yt相对于xt取值高出均衡位置。平均来说,变量yt在T+1期的取值yt+1将有所回落。所以说ut = f (yt , xt ) 具有一种误差修正机制。

当然这种均衡不意味着一定是1比1的关系。例如中国宏观消费比问题。 5.2 “一般到特殊”建模法

分布滞后模型:如果回归模型中不仅包括解释变量的本期值,而且包括解释变量的滞后(过去)值,则这种回归模型称为分布滞后模型。例

yt = ?0 +

??xii?0nt?i+ ut , ut ? IID (0, ? 2 ) (5.1)

上述模型的一个明显问题是xt与xt -1 , xt-2, …, xt - n 高度相关,从而使 ?j的OLS估计值很不准确。实际上对于分布滞后模型,这并不是一个严重问题,因为人们的注意力并不在单个回归系数上,而是在这些回归系数的和式,?i?0?i上。通过这个和式可以了解当xt变化时,对yt 产生的长期影响。尽管对每个?j 估计得不很准确,但这些估计值的和却是相当精确的。看下式

?) = Var(??ii?0nn?Var(??i)+ 2??Cov(??i,??k), (5.2)

i?0i?0k?0nni?1若xt - i与xt - k , (i ? k) 是正相关的(实际中常常如此),则(5.2)式中的协方差项通常是负的。当这些项的值很大(绝对值)且为负时,Var(??) 比 ?i?0in?i?0Var(??i)小,甚至比每个Var(??i)

n还小。

分布滞后模型中的解释变量存在高度相关,克服高度相关的一个方法是在等号右侧加一个被解释变量的滞后项(回顾第2章的可逆性)。

动态模型(自回归模型):如果在回归模型的解释变量中包括被解释变量的一个或几个滞后值,则称这种回归模型为动态模型(或自回归模型)。例

yt = ?0 + ?1 yt-1 + ?1 xt + ut

1

动态分布滞后模型:如果在分布滞后模型中包括被解释变量的若干个滞后值作解释变量,则称之为动态分布滞后模型或自回归分布滞后模型。例

yt = ?0 +

??yii?1mt?i+

???j?1i?0pnjixjt?i+ ut , ut ? IID (0, ? 2 ) (5.3)

用ADL (m, n, p) 表示,其中m是自回归阶数,n是分布滞后阶数,p是外生变量个数。对ADL (m, n, p) 模型可采用OLS法估计,参数估计量是有偏的,但具有一致性。以简单自回归模型

yt = ? yt-1 + ut , ? ? ? ? 1, ut ? IID(0, ? 2) , (5.5) 为例,模型满足

yt ?I(0);随着T??,yt-1与ut相互独立;E(ut? yt-1) = 0;yt具有非零的有限的4阶矩。

? 的OLS估计量计算公式是

?T? ? = ?yy??tt?1?t?22?. (5.6) y?t?1??t?2?T把 (5.5) 式代入 (5.6) 式得

? = ??(?yt?2Tt?1?ut)yt?12t?1??yt?2Tt?1T2??yt?22Tt?1ut?yt?2T=

?yt?2t?1?T = ? +?yu??t?1t?t?22?. (5.7) y?t?1??t?2?Tyt-1与ut是相关的。上式右侧第二项的期望不为零。所以,用OLS 法得到的回归系数估计量是

有偏估计量。若对 (5.7) 式右侧第二项的分子分母分别除以(T-1)(样本容量)并求概率极限,

plim[(T?1)? = ? + plim?T???1T??plim[(T?1)T??t?2T?1?yt?1ut]?yt?12]t?2T= ? (5.8)

?也是一致估计量。 可见? 最常见的是ADL (1, 1) 和ADL (2, 2) 模型,

yt = ?0 + ?1 yt-1 + ?0 xt + ?1 xt-1 + ut , ut ? IID (0, ? 2 ), (5.9) 和

yt = ?0 + ?1 yt-1 + ?2 yt-2 + ?0 xt + ?1 xt-1 + ?2 xt-2 + ut , ut ? IID (0, ? 2 ) 对于ADL (1, 1) 模型 (5.9),xt和 yt的长期关系是 yt =

?0???1+0xt = ?0 + ?1 xt , (5.10) 1??11??1上式称作静态模型,参数称作静态参数或长期参数。长期参数描述变量之间的均衡关系。

动态模型 (5.9) 中的参数称作动态参数或短期参数。短期参数描述变量通向均衡状态过程中的

2

非均衡关系。通过对?0 , ?0 和 ?1 施加约束条件,从ADL模型(5.9)可以得到许多特殊的经济模型。下面以9种约束条件为例,给出特定模型如下:

(1) 当 ?1 = ?1 ? 0 成立,摸型(5.9)变为

yt = ?0 ? ?0 xt + ut . (5.11) 这是一个静态回归模型。

(2) 当 ?0= ?1= 0时,由模型(5.9)得

yt = ?0 + ?1 yt-1 + ut . (5.12) 这是一阶自回归模型。

(3) 当 ?1 ? ?0 = 0 时,则有

yt = ?0 + ?1 xt-1 + ut . (5.13) xt-1是yt的超前指示变量。此模型称为前导模型。

(4) 当约束条件是 ?1 ??,?1 ? - ?0 时,(5.9)式变为

? yt = ?0 + ?0 ? xt + ut . (5.14) 这是一个一阶差分模型。当xt与yt为对数形式时,上述模型为增长率模型。

(5) 若 ?1 = 0成立,模型(5.9)则变为一阶分布滞后模型。

yt = ?0 + ?0 xt + ?1 xt - 1 + ut . (5.15) (6) 取 ?1 ? 0,则模型(5.9)变为标准的局部调整模型(偏调整模型)。

yt = ?0 + ?1 yt -1 + ?0 xt + ut. (5.16) (7) 当 ?0 ? 0 时,由模型(5.9)得

yt = ?0 + ?1 yt -1 + ?1 xt -1 + ut . (5.17) 模型中只有变量的滞后值作解释变量,yt的值仅依靠滞后信息。这种模型称为“盲始”模型。 (8)给定 ?1 ? - ?1 ,模型(5.9)化简为

yt = ?0 + ?1 ( yt-1 - xt-1 ) + ?0 xt + ut (5.18) 此模型称为比例响应模型。解释变量为xt与 ( yt-1- xt-1)。

以上所列举的例子说明实际上许多有特殊经济意义的模型都是由一个一般的ADL模型化简得到的。这种建立模型的方法是首先从一个包括了尽可能多解释变量的“一般”ADL模型开始,通过检验回归系数的约束条件逐步剔除那些无显著性变量,压缩模型规模,(在这个过程中要始终保持模型随机误差项的非自相关性。)最终得到一个简化(或“特殊”)的模型。这种方法称为“一般到特殊”建模法。也称作亨德里(Hendry)建模法。关于检验约束条件是否成立的方法将在5.4节讨论。

在1.5节中曾讨论,模型若丢失重要解释变量将导致回归系数的OLS估计量丧失无偏性和一致性。“一般到特殊”建模法的主要优点是能够把由于选择变量所带来的设定误差减到最小。因为在初始模型中包括了许多变量,所以不会使回归系数的OLS估计量存在丢失变量误差。虽然因为在初始模型中包括了许多非重要解释变量,从而使回归参数估计量缺乏有效性,但随着检验约束条件的继续,那些非重要的解释变量被逐步剔除掉,从而使估计量缺乏有效性的问题得到解决。

3

5.3 误差修正模型(ECM)

误差修正模型由Sargan 1964年提出,最初用于存储模型。1977年由Hendry-Anderson和Davidson完善。

ECM模型由 ADL (m, n, p) 模型变换而来。 下面通过ADL (1, 1) 模型推导简单的ECM模型。有

yt = ?0 + ?1 yt-1 + ?0 xt + ?1 xt-1 + ut , ? ?1 ? < 1, ut ? IID (0, ? 2 ), (5.25) 其中ut应不存在自相关和异方差。如果这个条件不能满足,可通过增加xt和 yt的滞后项或加入新的变量从而使ut满足要求。从上式两侧同时减yt-1,在右侧同时加减 ?0 xt -1得,

?yt = ?0 + ?0 ? xt + (?1 -1) yt-1 + (?0 + ?1) xt-1 + ut (5.26) 上式右侧第三、四项合并,

?yt = ?0 + ?0 ? xt + (?1 - 1 ) ( yt-1 - k1 xt-1) + ut (5.28) 其中k1 = (?0 + ?1) / (1 - ?1 )。在上述变换中没有破坏恒等关系,所以不会影响模型对样本数据的解释能力,也不会改变OLS估计量的性质。

上式称为ECM模型,(?1 -1) ( yt-1- k1 xt-1) 称为误差修正项。( yt -1- k1 xt -1) 表示前一期的非均衡误差,由 (5.25) 式知,若yt平稳,必有 ? ? ? < 1,所以非均衡误差项的系数 (?1 -1) 必为负。说明误差修正项对 ?yt有一个反向修正作用。当前一期yt,即yt-1相对于均衡点取值过高(低)时,通过误差修正项的反向修正作用,使本期 ?yt减小(增加),yt 向均衡位置移动。(?1 -1) 表示误差修正项对 ?yt的调节速度。进一步变换 (5.28) 式

?yt = ?0 ? xt + (?1- 1 ) ( yt-1 - k0 - k1 xt-1) + ut (5.29) 其中k0 = ?0 / (1 - ?1 )。( yt -1 - k0 - k1 xt –1 ) 是xt和 yt的常期关系,?yt = ?0 ? xt + (?1- 1 ) (?) 是xt和 yt的短期关系。

(10) 当约束条件 ?1 + ?0 + ?1 ? ? 成立时,模型(5.29)变为

? yt = ?? ? xt + (?1 - ?? [ yt-1 - k0 - xt-1 ] + ut , (5.31? 这是一个k1 = 1的特殊误差修正模型。

ECM模型有如下特点: ⑴ 上述模型中的 ? yt,? xt 和非均衡误差项都是平稳的。应用最小二乘法估计模型时,参数估计量都具有优良的渐近特性。在第6章可以看到,即使变量是非平稳的,只要存在协积关系,误差修正模型也不会存在虚假回归问题。

⑵ 误差修正模型中既有描述变量长期关系的参数,又有描述变量短期关系的参数;既可研究经济问题的静态(长期)特征又可研究其动态(短期)特征。

⑶ 误差修正模型中的变量不存在多重共线性问题。 ⑷ ut是非自相关的。如果ut是自相关的,可在模型中加入?yt和?xt的足够多滞后项,从而消除ut的自相关。同时相应加大误差修正项的滞后期。 ⑸ 建模过程中允许根据t检验和F检验剔除ECM模型中的差分变量。在ECM模型中剔除差分变量,相当于在原ADL 模型中施加一个约束条件。例如剔除差分变量 ? xt,相当于在原ADL(1, 1) 模型中施加约束条件,?0 = 0。 ⑹ 在非均衡误差项中剔除任何水平滞后变量都是危险的,这将影响长期关系的表达。

⑺ ECM模型中的k0 , k1未知,ECM模型不能直接被估计。估计方法是 ① 若变量为平稳变量或者为非平稳变量但存在长期均衡关系,可以把误差修正项的括号打开,对模型直接用OLS法估计。②先估计长期均衡关系,然后把估计的非均衡误差作为误差修正项代入ECM模型,并

4

估计该模型。

5.4 动态模型的若干检验方法

在用“一般到特殊”方法建立模型时的,首先应对初始模型(即对回归参数不加任何约束的动态分布滞后模型)的随机误差项进行异方差和自相关检验。对模型的其他检验都应建立在随机误差项是一个白噪声序列的基础之上。在检验约束条件是否成立的过程中逐步剔除不显著变量,化简模型,同时还要保持模型随机误差项的非自相关性和同方差性不被破坏。在这个过程中要用到许多统计量。下面介绍一些常用的检验方法。

1. F检验

把样本数据取对数后建立回归模型,随机误差项一般不会存在异方差。对于随机误差项的一阶自相关检验可用DW统计量完成。对于ADL模型(5.9),约束条件(5),(6),(7)和(10),即 ?1 = 0,?1 ? 0,?0 ? 0 和 ?1 + ?0 + ?1 - 1 = 0(见5.2和5.3节)的是否成立可用t检验完成。如果t统计量的绝对值大于临界值,则相应约束条件不成立,相应解释变量不能轻易地从模型中剔除掉。否则接受相应约束条件,从模型中剔除相应解释变量。

对于联合线性约束条件(1),(2),(3)和(4)(见5.2节)可用F检验完成。假定模型误差项服从正态分布,共有m个线性约束条件,则所用统计量是

F =

(SSEr?SSEu)/m (5.45)

SSEu/(T?k)其中SSEr 表示施加约束条件后估计模型的残差平方和,SSEu 表示未施加约束条件的估计模型的残差平方和,m表示约束条件个数,T 表示样本容量,k表示未加约束的模型中被估参数的个数。在零假设“约束条件真实”条件下,

F ? F( m , T – k )

因为两个模型都是用OLS法估计的,所以可把被解释变量的总平方和(SST)分解为回归平方和 (SSR) 与误差平方和(SSE)两部分。对于不加约束的模型有

SST = SSRu + SSEu . 对于施加约束条件的模型有,

SST = SSRr + SSEr .

如果约束条件成立,那么在施加约束条件下求到的SSEr 不会比不加约束条件的SSEu大很多,用样本计算的F值不会很大。若F值小于临界值,则约束条件是可接受的(真实的)。否则应该拒绝零假设。注意,F检验的零假设是m个约束条件同时为零,备择假设是m个约束条件不同时为零。所以拒绝零假设并不排除有部分约束条件为零。应利用t检验进一步对每一个参数进行显著性判别。

比如对ADL模型(5.9)检验联合约束条件 ?1 = ?1 = 0,则(5.9)式为无约束模型,(5.11) 式为约束模型。

yt = ?0 + ?1 yt-1 + ?0 xt + ?1 xt-1 + ut , ut ? IID (0, ? 2 ), (无约束模型) (5.9) yt = ?0 ? ?0 xt + ut . (约束模型) (5.11) 用SSEu和SSEr分别表示对(5.9)和(5.11)式进行OLS估计得到的SSE,F统计量按下式计算

F =

(SSEr?SSEu)/2

SSEu/(T?4)其中2表示约束条件个数,T表示样本容量,4表示无约束模型(5.9)中被估参数个数。

5

~若约束条件成立,则施加约束条件下 ?j的极大似然估计量 ?j应与不施加约束条件下?j的极大

~~?j非常接近。也就是说 ?logL/??似然估计量?应近似为零。LM检验的原理是如果 ?logL/??

jj显著地不为零,则约束条件不成立。LM统计量定义为

LM = (其中

?logL~?1?logL~)' (I(?))(~) (5.66) ?????logL~~~是以(?logL/??j)为元素组成的列向量,同时用?j替换了?j 。I(?) 称为信息矩阵,??~其逆矩阵是?j的方差协方差矩阵。在约束条件成立条件下,LM近似服从 ?2(m) 分布。

LM ? ? 2(m) ,

其中m表示约束条件个数。

假定有两个约束条件f1(?) = 0和f2(?) = 0。为求这两个约束条件下的对数似然函数(5.64)的极大似然估计量,应按拉格朗日乘数法则建立如下函数,

logL* = logL + ?1 f1 (?) + ?2 f2 (?) , (5.67) 其中?1,?2为拉格朗日乘数,求解约束极值问题应对所有的j都满足? logL*/? ?j = 0, 即

?f(?)?f(?)?logL*?logL= + ?11 + ?22 = 0, ? j (5.68)

??j??j??j??j由上式得

?f(?)?f(?)?loLg = - ?11 - ?22, ? j (5.69)

??j??j??j~当上式中的?j 用?j代替后,如果显著地不为零,则约束条件不成立。根据上式,只有当?1, ?2

不为零时,?logL/??j 才显著地不为零。所以判别规则是如果 ?1,?2 显著地不为零,则拒绝约

~束条件。因为(5.69)式是 ?logL/??j的函数,所以称其为拉格朗日乘数统计量。

对于线性回归模型,通常并不是按(5.66)式,而是通过一个辅助回归式计算LM统计量的值。LM统计量与辅助回归式的可决系数R 2 有直接联系,而辅助回归式的形式直接与被检验的约束条件有关。

LM检验的实际步骤如下:

?t。用OLS法估计约束模型,计算残差序 (1) 利用约束模型确定LM辅助回归式的因变量u?t,并把u?t作为LM辅助回归式的因变量。 列u (2) 利用非约束模型确定LM辅助回归式的解释变量。例如非约束模型如下式,

yt = ?0 + ?1 x1t + ?2 x2 t +… + ?k xk t + ut . (5.70) 把上式改写成如下形式

ut = yt - ?0 - ?1 x1t - ?2 x2 t -… - ?k xk t . (5.71)

则LM辅助回归式中的解释变量按如下形式确定。

11

-

?ut, j = 0, 1, …, k. ??j对于非约束模型(5.70),LM辅助回归式中的解释变量是1, x1t , x2t , …, xk t 。第一个解释变量1表明常数项应包括在LM辅助回归式中。 (3) 建立LM辅助回归式如下

?t= ?? + ?1 x1t + ?2 x2 t + … + ?k xk t + vt , (5.72) u?t由第一步得到。 其中u(4) 用OLS法估计上式并计算可决系数R 2。 (5) 用第四步得到的R2计算LM统计量的值。 LM = T R 2

其中T表示样本容量。由于上式计算的LM的值与(5.66)定义的LM的值相等(证明略)。在零假设成立前提下,T R 2 服从m个自由度的 ?2(m) 分布,

LM = T R 2 ? ?2(m)

其中m表示约束条件个数。

判别规则是,

若LM < ? 2? (m) , 则接受零假设,约束条件成立。

若LM > ? 2? (m) , 则拒绝零假设,约束条件不成立。

以模型(5.46)为例介绍用LM辅助回归方法检验约束条件 ?2 + ?3 = 1。 yt = ?1 x 1t + ?2 x2 t + ?3 x3 t + vt , (5.46) 检验约束 ?2 + ?3 ? ? 是否成立。当施加约束 ?? + ?? ? ? 时,上式变为,

yt = ?1 x1t + ?2 x2 t + (1 - ??) x3 t + vt , (5.47)

上式相对于(5.46)式为约束模型。若对(5.46)和(5.47)进行OLS估计,则会发现所得结果相同。

?x1t +??x2 t +??x3 t (5.48) ?t =? y213?是对 于是遇到参数不可识别问题。除非 ?2 和 ?3 存在准确的关系 ?2 + ?3 = 1,否则无法知道?3? +?? = 1成?3 的估计还是对(1- ?2)的估计。即便 ?2 + ?3 = 1真的成立,实际中也很难有 ?23立。为避免参数的不可识别性,可利用约束最小二乘法(RLS)进行估计。

从(5.47)式两侧减去x3 t 得,

yt - x3 t = ?? x1t + ?? x2 t - ?2 x3 t + vt (5.49) 令yt* = yt - x3 t,x2 t* = x2 t - x3 t,上式变为,

yt* = ?1 x1t + ?2 x2 t* + vt , (5.50)

?t作为LM辅助回归的因变量。第一步,用OLS法估计(5.50)式,并把得到的残差序列 v变换(5.46)式得

vt = yt - ?1 x1 t - ?2 x2 t - ?3 x3 t .

根据第二步,LM辅助回归解释变量是x1t, x2 t 和x3 t。根据第三步,LM辅助回归式是

?2x2 t +??3 x3 t ?t= ??1x1t +? v

12

(原式中没有?0,所以上式中没有常数项。)计算可决系数R 2。则 LM = T R 2 ? ?2(1) .

例:(file: nonli12)对台湾制造业生产函数

Lnyt= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2

(4.4) (3.9) R2 = 0.89, F = 48.45, DW=1.3, T=15 用LM统计量检验?3 = 0是否成立。

??t, (1) 用OLS法估计约束模型,计算残差序列u?t Lnyt = 2.16 + 1.24 Lnxt1 + u (4.9) (17.6) R2 = 0.96, F = 312

?t作为LM辅助回归式的因变量。 并把u (2) 确定LM辅助回归式的解释变量。例如非约束模型如下式,

Lnyt = ?1 + ?2 Ln x1t + ?3 Lnx2 t + ut (29) 把上式改写成如下形式

ut = Lnyt - ?1 - ?2 Lnx1t - ?3 Lnx2 t (30)

则LM辅助回归式中的解释变量按如下形式确定。

-?ut, j = 1, 2, 3 ??j对于非约束模型(30),LM辅助回归式中的解释变量是1, Lnx1t , Lnx2t。第一个解释变量1表明常数项应包括在LM辅助回归式中。 (3) 建立LM辅助回归式如下

?t= ?? + ?1 Ln x1t + ?2 Ln x2 t + vt , (31) u?t由第一步得到。 其中u(4) 用OLS法估计上式并计算可决系数R 2。

?t= -10.67 - 0.67 Lnxt1 + 1.18 Lnxt2 (32) u (-3.9) (-3.7) (3.9) R2 = 0.89, F = 48.45, DW=1.3

(5) 用第四步得到的R2计算LM统计量的值。 LM = T R 2 = 0.89?15 = 13.35 > ?2(1) = 3.8 原假设?3 = 0不成立。

例:自相关BG检验属于LM检验。

以2元线性回归模型,检验是否存在1阶自相关为例,约束模型和非约束模型分别是 yt = ?0 +?1 x1t + ?2 x2 t + ut (约束模型,? = 0) (33) yt = ?0 +?1 x1t + ?2 x2 t + ut, ut = ?ut-1 + vt (34) 即

yt = ?0 +?1 x1t + ?2 x2 t + ?ut-1 + vt (非约束模型) (35) ?t作为LM辅助回归式的因变量。由非约束模型(35)知LM辅用OLS法估计(33)式,得到u助回归式的解释变量是1,x1t,x2t,ut-1,所以LM辅助回归式是

?t= ?? + ?1 x1t + ?2 x2 t + ?3 u?t-1 + vt (5.72) u 13

上式正是自相关BG检验式。从中提取R 2计算统计量。

对LR,W和LM检验方法的选择应以做实际计算时的难易程度而定。一般来说W和LM检验应优于LR检验,因为W和LM检验只需要估计一个模型即可,而LR检验需估计约束与非约束两个模型。对W 和LM检验方法的选择应以约束模型与非约束模型哪个更容易估计而定。应该注意,即使三种检验方法都可使用,它们的计算结果通常也是不相同的。因为三个统计量只是渐近相同,对于线性回归模型,在小样本条件下有如下关系成立。

LM ? LR ? W. (5.73)

上式说明只有当 LM检验的结果为拒绝零假设(约束条件不成立)或者W检验的结果为接受零假设(约束条件成立)时,三种检验的结论才是一致的。所以实际中,三种检验方法有可能得出相互不一致的结论。另外只有当用参数的样本估计值计算的约束条件完全成立时,即把参数估计值代入约束条件能准确成立时,(5.73)式中的三个统计量才有完全相等的关系。

?当对数似然函数中只含有一个参数? 时,LM, LR 和W三种检验的关系可用图5.1表示。?~~?)- log L(?和? 分别表示无约束和约束估计量。LR检验是对纵向距离 log L(?) 的测量,W检

~~?=????验则是对水平距离 (?) 的测量,而LM检验计算的是当? 时,对数似然函数的斜率。因为这三个统计量都是渐近地服从?验要比用上述三种检验更可靠。

所以当样本比较小且约束条件为线性时,用(m) 分布,

F检

图5.1 LR, W 和LM 检验

5.自相关的LM检验(见书,EViews中有)

DW统计量只适用于一阶自相关检验,而对于高阶自相关检验并不适用。利用LM统计量可建立一个适用性更强的自相关检验方法,既可检验一阶自相关,也可检验高阶自相关。

考虑两种误差过程的模型。AR(n) 模型

ut = ?1 ut-1 + … + ?n ut - n + wt (5.74) 和MA(n) 模型。

ut = vt + ?1 vt-1 + … + ?n vt - n (5.75) 其中wt 和vt 为白噪声过程,ut是如下模型

yt = ? Xt + ut , (5.76)

中的随机误差项。模型(5.76)的解释变量Xt中也可包含yt的滞后项。零假设定义为

?1 = ?2 = …= ?n = 0

这表明ut不存在自相关。建立LM辅助回归式

14

?t= ?1u?t?n+ ? Xt , (5.77) ?t?1+ … + ?nu u?t是(5.76)式中ut的估计值。定义 上式中的 uLM = T R 2 ? ? 2(n)

其中T表示样本容量,R 2是(5.77)式中的确定系数。在零假设成立条件下,LM统计量近似

?t的最大滞后期。如果零假设成立,服从 ?2(n) 分布。其中n表示(5.77)式中u(5.77)式中的?i ,

i = 1, 2, …, n 近似等于零。R 2 的值应很小。从而导致LM统计量的值很小,小于临界值。

6.异方差的HT检验(EViews中无) 此方法由伯伦奇—帕甘(Brensch-Pagan 1979)提出。在经济时间序列中常见的异方差形式有如下几种

? u2 = ? 2? 'Xt = ? 2 (?0 + ?1 x1 t + ?2 x2 t + …) (5.78) ? u2 = ? 2 (? 'Xt ) 2 = ? 2 (?02 + ?12 x1 t2 + ?22 x2 t2 + …+???i?jxitxjt),

i?j和

? u2 = ? 2exp (? 'Xt ) 2 = ? 2 exp (?02 + ?12 x1 t2 + ?22 x2 t2 +…+???i?jxitxjt),

i?j其中 ?u2 是误差项ut 的方差,? 是系数向量,Xt 是与ut方差变化有关的变量向量。通常Xt是由模型 yt = ? Xt + ut 中的解释变量的子集所构成。Xt中也可包含yt的滞后变量。误差项的同方差性等于零假设

H0: ?1 = ?2 = … = ?n = 0

如果H0成立,?u2 = k? 2 (k是常量),ut具有同方差性。对于(5.78)形式的异方差可通过如下辅助回归做LM检验

?t2u?2?= ?0 + ?1 x1t + ?2 x2 t + … + ?n x n t , (5.79)

?是原回归模型yt = ? xt + ut 的标准误差。LM统计量定义如下, 其中? HT = T R 2 ? ? 2(n)

其中R 2是(5.79)式的可决系数。在零假设成立条件下,HT统计量渐近服从 ? 2(n) 分布。其中

n表示(5.79)式中解释变量个数。由回归函数(5.79)分析,如果零假设成立,可决系数R 2 的值应很小。当R 2 的值很大时,说明ut2 中存在有规律的变化成分。

7.条件异方差的ARCH检验(见书,EViews中有) 8.White检验(EViews中有)

White检验由H. White 1980年提出。Goldfeld-Quandt 检验必须先把数据按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 ?2 统计量进行异方差检验。White检验的具体步骤如下。以二元回归模型为例,

yt = ?0 +?1 xt1 +?2 xt2 + ut (5.9)

?t。 ①首先对上式进行OLS回归,求残差u

15

②做如下辅助回归式,

?t2= ?0 +?1 xt1 +?2 xt2 + ?3 xt12 +?4 xt22 + ?5 xt1 xt2 + vt (5.10) u?t2对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。注意,上即用u式中要保留常数项。求辅助回归式(5.10)的可决系数R2。 ③White检验的零假设和备择假设是 H0: (5.9)式中的ut不存在异方差, H1: (5.9)式中的ut存在异方差 ④在不存在异方差假设条件下统计量

T R 2 ? ? 2(5) (5.11) 其中T表示样本容量,R2是辅助回归式(5.10)的OLS估计式的可决系数。自由度5表示辅助回归式(5.10)中解释变量项数(注意,不包括常数项)。

⑤判别规则是

若 T R 2 ???2? (5), 接受H0 (ut 具有同方差)

若 T R 2 > ?2? (5), 拒绝H0 (ut 具有异方差)

9. 正态分布的JB检验(见书,Eviews中有)。

在实际分析中,可用JB统计量检验一组数据的正态分布性。在给出JB统计量定义之前先给出偏度和峭度的定义。

偏度(S)是描述变量分布对称性的一个统计量。定义如下

1T(yt?y)3?T?1t?1s3 S = (5.81)

其中T表示样本容量,y表示yt的均值,s 表示yt的标准差。由公式知若分布是以y为对称的,则S = 0。当分布为右偏倚时,S ? 0;反之,S ? 0。对于正态分布,S = 0。

峰度(K),亦称峭度,是描述分布的两侧尾部“薄”、“厚”的一个统计量。定义为,

1T(yt?y)4?T?1t?1s4 K = (5.82)

其中T,y和s的定义如前。正态分布的峭度等于3。如果一个分布的两侧尾部比正态分布的两侧尾部“厚”,则该分布的峭度K ? 3;反之,K ? 3。

检验正态分布性的JB(Jarque-Bera)统计量定义如下,

JB =

T?n2 1[S + (K – 3 )2 ] ? ? 2(2) , (5.83)

46若用一般时间序列数据计算上式,取n = 0。若用回归式的残差序列计算上式,则n表示回

归式中解释变量个数。S表示偏度,K表示峭度。假设是

H0:变量服从正态分布; H1:变量不服从正态分布。

根据计算结果,

若JB ? ? 2? (2),接受该分布服从正态分布, 若JB ? ? 2? (2),拒绝该分布服从正态分布, 其中 ? 表示检验水平。

16

正态分布JB检验的EViews输出结果(零假设是随机变量服从正态分布,file:stochas1)

因为JB = 3.88 < ?

2

0.95(2) = 5.99,所以上述分布为正态分布。

0.50.40.30.20.12468

因为JB = 60.16 > ? 20.95(2) = 5.99,所以上述分布不是正态分布。 10. 赤池信息准则和施瓦茨准则(见书,EViews中有)

确定动态分布滞后(ADL)模型最大滞后期的方法除了用前面介绍的F统计量外,也可采用赤池(Akaike)信息准则和施瓦茨(Schwartz)准则。

赤池信息准则(AIC)定义如下。

?? AIC = log???T?t2??t?1u?2k+, (5.84) T???TT?t2是ADL估计模型的残差平方和,k是模型中解释变量的个数,T是样本容量。上其中?t?1u 17

式右侧第一项随着k的增大变小。第二项则随着k的增大变大。随着k的变化,AIC有极小值存在。使用AIC准则的方法是通过连续增加解释变量个数直到AIC取得极小值,从而确定最优k值。

EViews 3.0的计算公式是

?logL?2kAIC = -2??+

T??T

施瓦茨准则(SC)定义如下。 ?? SC = log???T?t2??t?1u?klogT+, (5.85) T???TT?t2,k,T定义如前。与AIC准则类似,SC准则也随k的变化有极小值存在。使用其中?t?1uSC准则的方法与AIC准则相类似。 EViews 3.0的计算公式是

?logL?klogTSC =-2? ?+

T?T?注意,AIC和SC准则并不是比较模型不同设定优劣的最明确统计量,但是与其他判别方法相结合,这两个准则可用来确定ADL模型的最大滞后期k。

700Shenzhen stock600500400300100200300400500600

深证成指序列(1999.1.4-2001.10.15, file:stock3)

18

以上两个输出结果中的SZ表示深证成指序列。因为第二个输出结果中的赤池信息准则和施瓦茨准则值都比第一个输出结果中的相应值小,所以建立三阶动态自回归模型没有必要。

检验参数约束条件是否成立的EViews操作:

19

在当前回归估计结果窗口中点击View键,选择Coefficient Tests功能,会看到3种关于参数约束的检验方法。(1)Wald-Coefficient Restrictions(参数约束的Wald检验),(2)Omitted Variables -Likelihood Ratio(是否已丢失变量的似然比检验),(3)Redundant Variables-Likelihood Ratio(是否含有多余参数的似然比检验)。

(1)Wald-Coefficient Restrictions(参数约束的Wald检验)(已讲过) (2)Omitted Variables -Likelihood Ratio(是否已丢失变量的似然比检验)(已讲过)

做Omitted Variables -Likelihood Ratio(是否已丢失变量的似然比检验)检验时,意味着把当前的回归结果当作是约束模型,在随后弹出的对话框中应列写在回归方程中拟新加入的解释变量名。

(3)Redundant Variables-Likelihood Ratio(是否含有多余参数的似然比检验)。(已讲过) 做Redundant Variables-Likelihood Ratio(是否含有多余参数的似然比检验)检验时,意味着把当前的回归结果当作是非约束模型,在随后弹出的对话框中应列写从现在的回归方程中拟删除的解释变量名。

Residual Tests(模型残差的检验)。

在当前回归估计结果窗口中点击View键,选择Residual Tests功能,会看到7种关于检验残差的方法。

(1)Correlogram-Q-statistics(相关图与偏相关图,Q检验)(已讲过), (2)Correlogram-Squared Residuals(残差平方序列的相关图与偏相关图)(未讲过), (3)Histogram-Normality Test(残差的直方图与分布正态性检验)(已讲过), (4)Serial Correlation LM Test(序列相关LM检验)(已讲过), (5)ARCH LM Test(自回归条件异方差LM检验)(已讲过), (6)White Heteroskedasticity (no cross terms)(White异方差检验(不含交叉项))(已讲过), (7)White Heteroskedasticity (cross terms)(White异方差检验(含交叉项))(已讲过)。

介绍第2个功能,

Correlogram-Squared Residuals(残差值平方序列的Q检验)。在

rk Q = T (T+2) (31)

T?kk?1?K2的定义式中,如果估计的自相关系数rk是用残差值的平方序列计算的,那么Q统计量考察的是

残差序列中是否存在自回归条件异方差(ARCH、GARCH过程)。Q统计量渐近服从?2( K - p - q) 分布。检验方法与所用临界值与上述检验是否为白噪声过程的Q统计量相同。

这时的零假设是残差序列中不存在自回归条件异方差。备择假设是存在自回归条件异方差。 例1 日元兑美元汇率AR (2)模型中的残差是否存在条件异方差(file:JPYEN)

20

1 2

F =

46 47 0.9667 1.0347 T- k = 42 ? j T + n – k = 43 ?j (SSE2?SSE1)/n(1.0347?0.9967)/1==2.95

SSE1/(T?k)0.9967/(46?4) 也可以做若干期的邹预测检验。比如用1952-1996年数据估计一个模型,然后加入1997、

1998年数据检验模型的稳定性。估计过程如上,但对话框中要填入1997 1998两年。 案例1:开滦煤矿利润影响因素的实证分析(ADL模型(1903~1940),file:LH1,见《学术论坛》,2003.1, p. 88-90)

通过这个案例说明怎样比较变量贡献的大小,以及怎样求变量间长期关系。

1912年成立开滦矿物总局。1912~1940年开滦煤矿年利润高达20.2%,远远高于其他民族资本企业。

6000500040003000816销煤量 x1141210吨煤售价 X22000100000510152025303540642

0510152025303540

图1 开滦煤矿销煤量变化曲线(x1, 1903-1940) 图2 开滦煤矿吨煤售价变化曲线(x2, 1903-1940)

40000利润 Y30000200001000000510152025303540

图3 开滦煤矿利润变化曲线(1903-1940)

11LNY101011LNY998876.5LNX17.07.58.08.59.0

71.0LNX21.52.02.53.0

图4 开滦煤矿利润对销煤量散点图 图5 开滦煤矿利润对吨煤售价散点图

26

Yt =0.2937 Yt-1+0.2038 Yt-2+4.2469 X1t–3.5106 X1t -1+2964.25 X2t –1390.66 X2t –1-1433.01 X2t –2 (1) (2.5) (2.4) (7.3) (-5.5) (7.3) (-1.7) (-2.3)

R2 = 0.96, s.e.=1504.7, LM(2) = 4.10, ARCH(1) = 2.6, DW=2.16, F=128.7, Q(15) = 8.1 (1905-1940) 用上式求长期关系,

Yt = 1.4653 X1t + 278.6X2t (2)

?j* = ?j (

s(Xj)s(Yj)), j = 1, 2

?1* = 1.4653 (1453.8 / 7134.1) = 0.2986 ?2* = 278.6 (2.2067 / 7134.1) = 0.0862

无量纲长期参数估计结果是

Y = 0.2986 X1 + 0.0862X2 (3) 这说明实际上X1 对Y的影响大于X2对Y的影响。

LnYt = 0.7502 LnYt-1+1.8804 LnX1t –1.6210 LnX1t -1+1.5037 LnX2t –1.4787 LnX2t –1 (4)

(9.0) (8.2) (-6.7) (6.0) (-4.9)

R2 = 0.95, LM(2) = 1.91, ARCH(1) = 0.27, DW=1.7, F=140.7, Q(15) = 6.0, (1903-1940) LnYt = 1.038 LnX1t + 0.100 LnX2t (5) 这说明LnYt 对LnX1t的弹性系数远远大于LnYt对LnX2t的弹性。

案例2:关于日本人均消费的误差修正模型(1963-1993年(T = 31),见教材206-213页,file: b5c1)

本案例介绍怎样用“一般到特殊”建模法建立日本人均消费模型,怎样求变量间长期关系。 1993年(当年价格)日本人均收入为157.2万日元。相当于6.3万元人民币(利用1993年汇价1000日元 = 40元人民币计算),相当于11.8万元人民币(利用2000年汇价1000日元 = 75元人民币计算),相当于4400元人民币(利用1991年PPP,1000日元 = 2.79元人民币计算)。

(注意:本章假定变量具有平稳性。但本案例中变量是非平稳的。因为变量具有协整性,所以不影响对误差修正模型的介绍。)

定义变量如下:

LnCt:对数的人均年消费额(不变价格,1985 = 1)。

LnIt:对数的人均年可支配收入额 (不变价格,1985 = 1)。 LnPt:对数的消费价格指数(1985 = 1)。 原始数据摘自日本《家计调查年报》1963, …, 1993(日本总务厅统计局出版)经作者进一步计算得到LnCt,LnIt 和LnPt 数据(见表5.1)。曲线分别见图5.2和图5.3。

27

5.04.84.64.44.24.03.86570758085900.40.0LnILnC-0.8LnP-0.4-1.2-1.6

657075808590

图5.2 LnCt 和LnIt 图5.3 LnPt

首先建立一个ADL(1, 1, 2) 模型(含有两个外生变量,解释变量与被解释变量各滞后一期)作为“一般模型”。 用1963-1993年数据得估计结果

LnCt= 0.2621 + 0.8297 LnIt - 0.0414 LnPt + 0.6501 LnCt-1 - 0.5532 LnIt-1 + 0.0543 LnPt-1

(1.81) (7.75) (-0.65) (4.69) (-3.65) (1.07)

? R 2 = 0.9989, SSE = 0.0015, DW = 1.90 (5.87)

LM1 = 0.039, LM2 = 4.76, ARCH = 0.58, T = 30

?t是否存在一阶和二阶自相关。其中括号内给出的数字是t值。LM1 和 LM2 分别用来检验 u?t是否存在异方差。ARCH用来检验u因为 ? 2(1) = 3.84,? 2(2) = 5.99,DW = 1.90,可见模型 (5.87) 的残差项中不存在自相关和异方差。因为R 2 = 0.9989,(5.87) 式中的解释变量解释了LnCt变化

的99.89 %。综上,可以把 (5.87) 式看作“一般模型”。

用 (5.87) 式计算变量间的长期关系。

?* = ?0(1??1)= 0.2621 / (1- 0.6501) = 0.7491,

?* = (?0??1)(1??1)= (0.8297 - 0.5532) / (1- 0.6501) = 0.7902, ?* = (?0??1)(1??1)= (-0.0414 + 0.0543) / (1- 0.6501) = 0.0369.

LnCt = 0.7491 + 0.7902 LnIt + 0.0369 LnPt (5.89)

从 (5.87) 式中删除解释变量LnPt得

LnCt= 0.3181 + 0.8756 LnIt + 0.6466 LnCt-1 - 0.6078 ?1 LnIt-1 + 0.0218 LnPt-1. (5.91)

(2.75) (10.97) (4.72) (-4.86) (2.09)

? R 2 = 0.9989, SSE = 0.0015, DW = 1.95 LM2 = 2.8, ARCH = 0.26, F = 68.1, T = 30

由DW,LM2 和ARCH的值知上式既不存在自相关也不存在异方差(由一般到特殊的第一步)。解释变量解释了LnCt变化的99.89 %。由t值可以看出上式中的所有参数都具有显著性,不应该再从中删除任何解释变量。

假如从上式中删除收入变量(LnIt和LnIt-1),得

LnCt= 0.1932 + 0.9600 LnCt-1 - 0.0168 LnPt-1. (5.92)

(0.88) (19.95) (-0.78)

? R 2 = 0.9935, SSE = 0.0088, DW = 2.27, F = 2060.3, T = 30

这相当于对模型(5.90)施加约束 ?0 = ?1 = 0。对上述联合约束进行检验的F统计量的值按下

28

式计算,

F =

(SSEr?SSEu)/m(0.0088?0.0015)/2= = 60.8 (5.93)

0.0015/(30?5)SSEu/(T?k)因为F0.05 (2, 25) = 3.39,F = 60.8 ? 3.39,约束条件 ?0 = ?1 = 0被拒绝,所以LnIt和LnIt-1是重要

的解释变量,不应从模型中删除。同理LnCt-1和LnPt-1也是重要的解释变量,不应从模型中删除。

从模型 (5.91) 两侧同减LnCt-1,重新估计得

?LnCt= 0.3181 + 0.8756 LnIt - 0.3534 LnCt-1 - 0.6078 LnIt-1 + 0.0218 LnPt-1, (5.95)

(2.75) (10.97) (-2.58) (-4.86) (2.09)

? R 2 = 0.9159, SSE = 0.0015, DW = 1.95, F = 68.1, T = 30. 在 (5.95) 式右侧同时加减 LnIt-1,重新估计得,

?LnCt= 0.3181 + 0.8756 ? LnIt - 0.3534 LnCt-1 + 0.2678 LnIt-1 + 0.0218 LnPt-1, (5.97)

(2.75) (10.97) (-2.58) (2.35) (2.09)

? R 2 = 0.9159, SSE = 0.0015, DW = 1.95, LM2 = 2.8, ARCH = 0.26, F = 68.1, T = 30. 对上式作进一步线性变换,

?LnCt= 0.3181 + 0.8756 ? LnIt - 0.3534 (LnCt-1 - 0.7578 LnIt-1 - 0.0617 LnPt-1 ), (5.98)

把截距项移入括号,得到误差修正模型的标准形式。

??LnCt= 0.8756 ? LnIt - 0.3534 (LnCt-1 - 0.9001 - 0.7578 LnIt-1 - 0.0617 LnPt-1 ), (5.99)

日本(对数)人均消费与人均可支配收入、价格的长期关系是

LnCt = 0.9001 + 0.7578 LnIt + 0.0617 LnPt (5.100)

?这一结果与 (5.89) 式

LnCt = 0.7491 + 0.7902 LnIt + 0.0369 LnPt (5.89)

极为相似。(5.99) 式中误差修正项的系数为负。这个结果与误差修正机制相一致。-0.3534说明误差修正项以35.34%的比例对下一年度的?LnCt的取值产生影响。? LnIt的短期参数是0.8756。误差修正模型 (5.99) ,即模型 (5.97) 的残差图以及 ?LnCt的实际曲线与拟合曲线见图5.4。

0.08ResidualActualFitted0.060.040.020.020.010.00-0.01-0.026570758085900.00-0.020.030.020.010.00-0.01-0.02-0.0365ResidualActualFitted4.84.64.44.24.03.8

7075808590

?t 图5.5 LnCt的实际值与拟合值以及残差序列u?t 图5.4 ?LnCt的实际值与拟合值以及残差序列u

29

(相对于误差修正模型 (5.99)) (相对于误差修正模型 (5.102))

由上可知 (5.87) 式是“一般模型”, (5.99) 式是最后的“特殊模型”。估计的长短期参数都通过了显著性检验,残差序列中不存在自相关。

现在用LnCt,LnIt和LnPt直接建立模型如下,

LnCt= 0.6071 + 0.8185 LnIt + 0.0337 LnPt (5.102) R 2 = 0.9979, SSE = 0.0035, DW = 0.64, F = 6552.4, T = 31.

虽然回归系数都通过了t检验,但检验自相关的DW值却非常小。由DW = 0.64知自相关系数 ? = 1 – DW / 2 = 1 - 0.32 = 0.68。说明残差序列中存在严重的自相关。模型 (5.87)和 (5.102) 的SSE分别是0.0015和0.0035。可见模型 (5.102) 对数据的拟合远不如模型 (5.87) 好,即不如模型 (5.99) 好。模型 (5.102) 的残差图以及LnCt的实际曲线与拟合曲线见图5.5,该图说明模型不但存在严重的自相关,而且预测精度也不高。实际上 (5.102) 式是一个虚假回归式(检验方法见第7章)。

? (5.09) (33.15) (2.68)

30

本文来源:https://www.bwwdw.com/article/f9sx.html

Top