18模型设定与诊断检验
更新时间:2023-11-09 06:56:01 阅读量: 教育文库 文档下载
模型诊断与检验
1.检验方法与统计量
(1)回归函数的F检验。 多元回归模型,
yt = ?0 +?1xt1 + ?2xt2 +…+ ?k- 1xt k -1 + ut , (1) H0:?1= ?2 = … = ?k-1 = 0;H1:?j不全为零 原假设成立条件下,统计量
SSR/(k?1)F = ? F(k-1,T-k)
SSE/(T?k) 注意:SSR旧指回归平方和(regression sum of squares),现指残差平方和(sum of squared residuals)。SSE旧指残差平方和(error sum of squares (sum of squared errors)),现指回归平方和(explained sum of squares)。
检验规则是,若 F ? F? (k-1,T-k),接受H0;
若 F > F? (k-1,T-k) , 拒绝H0。
(2)回归参数的t检验。 对于多元回归模型,
yt = ?0 +?1xt1 + ?2xt2 +…+ ?k- 1xt k -1 + ut , (2)
如果F检验的结论是接受原假设,则检验止。如果F检验的结论是拒绝原假设,则进一步作t检验。
H 0:?j = 0;H1:?j ? 0,(j = 1, 2, …, k-1) 原假设成立条件下,统计量
t =
??j?)s(?j? t???k?
判别规则:若? t ?? t????k?,接受H 0; 若? t ?> t????k?,拒绝H 0。
(3)检验约束条件是否成立的F检验。
约束条件的F检验可以用来检验回归参数的一个或多个线性约束条件,如H 0:?1 ? 0,?2 ? 0,?1 +?0 + ?1 =1,?1 /?2 ?0.8等。
在零假设“约束条件成立”条件下,统计量
F =
(SSEr?SSEu)/m? F( m , T – k )
SSEu/(T?k)其中SSEr 表示施加约束条件后估计模型的残差平方和;SSEu 表示未施加约束条件的估计模型的残差平方和;m表示约束条件个数;T 表示样本容量;k表示非约束模型中被估参数的个数。
判别规则是,若F < F? (2, T - 4),约束条件成立, 若F ? F? (2, T - 4),约束条件不成立。 例:(file: b1c4)中国国债发行额模型
首先分析中国国债发行额序列的特征。1980年国债发行额是43.01亿元(占GDP的1%),2001年国债发行额是4604亿元(占GDP的4.8%)。以当年价格计算,21年间(1980-2001)
1
增长了106倍。平均年增长率是24.9%。
5000DEBT400030002000100008082848688909294969800
中国当前正处在社会主义市场经济逐步完善,宏观经济平稳运行的阶段。国债发行总量(DEBTt,亿元)应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国债发行额(DEBTt,亿元)模型如下:
DEBTt = ?0 +?1 GDPt +?2 DEFt +?3 REPAYt + ut
其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元)。用1980-2000年数据得输出结果如下;
DEBTt = 4.38 +0.34 GDPt +1.00 DEFt +0.88 REPAYt (11.7)
(0.2) (2.1) (26.6) (17.2)
R2 = 0.9986, DW=2.12, T =21, (1980-2000) , SSE = 48447.75
用F统计量检验是否可以对上式施加约束GDPt和DEFt的系数?1 =0,?2 = 0。给出约束模型估计结果如下,
DEBTt = 104.85 +1.63 REPAYt (11.8)
(0.8) (12.4)
R2 = 0.89, DW=0.7, T =21, (1980-2000) , SSE = 3772378
F =
(SSEr?SSEu)/m(3772378?48447.75)/2== 653.35
SSEu/(T?k)48447.75/(21?4)因为F= 653.35 ? F0。05 (2 , 17),约束条件不成立,不应在模型中删除变量GDPt和DEFt。
附录:
EViews操作(1):在(11.7)式窗口中点击View,选Coefficient Tests, Redundant Variables -Likelihood Ratio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入拟删除变量GDP,DEF。可得如下结果。
EViews操作(2):在(11.8)式窗口中点击View,选Coefficient Tests, Omitted Variables -Likelihood Ratio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量GDP,DEF。也可得到如上结果。
(4)JB正态性检验
在给出JB统计量的定义之前,先给出偏度(skewness)和峭度(kurtosis,峰度)的定义。对于时间序列(y1, y2, …, yT),偏度S定义为,
2
S?1T?(y?y)tt?1T3?3
x< Md < Mo x= Md = Mo MO ? Md ? x
其中y表示yt的平均数,? 表示yt的标准差。由公式知,若分布是以y对称的,则偏度为零。所以若yt服从正态分布,则偏度为零;若分布是右偏倚的,则偏度S ? 0;若分布是左偏倚的,则偏度S ? 0。
峭度K定义为
K?1T?(y?y)tt?1T4?4
正态分布的峭度为3。如果一个分布的两侧尾部比正态分布的两侧尾部“胖”,则该分布的峭度K ? 3,反之则K ? 3。
JB(Jarque-Bera)统计量定义如下,
JB =
T?n21[S?(K?3)2] ? ?2(2) 64其中T表示观测值个数。对于直接得到的观测时间序列,取n = 0。对于残差序列,取n等于原
回归模型中解释变量个数。S表示偏度。K表示峭度。计算结果 若JB ? ? 2?(2),该分布为正态分布, 若JB ? ? 2?(2),该分布不是正态分布。
当用样本计算偏度和峭度时,T应换为T -1,? 2用yt的样本方差s2代替。 例:(file: simu2, x)EViews操作如下。
3
因为JB = 3.81 < ? 20.05 (2) = 5.99,所以上述分布为正态分布。
0.50.40.30.20.12468
(file: simu2, trend)
因为JB = 59.98 > ? 20.05 (2) = 5.99,所以上述分布不是正态分布。 英 K. Pearson提出的分布律检验适用性更广。
4
(5)似然比(LR)检验
下面介绍三种常用的检验方法,即似然比(LR)检验,沃尔德(W)检验和拉格朗日(lagrange)乘数(LM)检验。这三种检验所用统计量都是利用极大似然估计法计算的。LR检验由内曼—皮尔逊(Neyman-Pearson 1928)提出,只适用于对线性约束的检验。W检验和LM检验既适用于对线性约束条件的检验,也适用于对非线性约束条件的检验。
首先介绍LR检验。LR检验的基本思路是如果约束条件成立则相应约束模型与非约束模型的极大似然函数值应该是近似相等的。用
2?eTt??,??2) = -log 2???2- log L(? (3) ?2?2?和??2分别是对 ?(参数集合)表示非约束模型的极大似然函数。其中?,? ? 的极大似然估计。
用
?t2e~~2T2~ log L(?,?) = -log 2??-~ (4) 2?2~~2表示约束模型的极大似然函数。其中?和?分别是对 ? 和 ? 2 的极大似然估计。定义似然比
(LR)统计量为
?~~2?, ??2) ] (5) LR = - 2 [ log L(?, ?) - log L(?中括号内是两个似然函数之比(似然比检验由此而得名)。在零假设约束条件成立条件下 LR ? ? ??m) (6) 其中m表示约束条件个数。用样本计算LR统计量。
判别规则是,若LR < ? 2? (m) , 则接受零假设,约束条件成立。 若LR > ? 2? (m) , 则拒绝零假设,约束条件不成立。 例:(file: b1c4)仍以中国国债发行总量(DEBTt,亿元)模型为例。选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国债发行额(DEBTt,亿元)模型如下:
DEBTt = ?0 +?1 GDPt +?2 DEFt +?3 REPAYt + ut
其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元)。用1980-2000年数据得输出结果如下;
DEBTt = 4.38 +0.34 GDPt +1.00 DEFt +0.88 REPAYt (11.7)
(0.2) (2.1) (26.6) (17.2)
R2 = 0.9986, DW=2.12, T =21, (1980-2000)
用LR统计量检验是否可以对上式施加约束GDPt和DEFt的系数?1 = ?2 = 0。给出约束模型估计结果如下,
DEBTt = 104.85 +1.63 REPAYt 变 (11.8)
(0.8) (12.4) R2 = 0.89, DW=0.7, T =21, (1980-2000)
附录:
EViews操作(1):在(11.7)式窗口中点击View,选Coefficient Tests, Redundant Variables -Likelihood Ratio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入GDP,DEF。可得如下结果。
5
EViews操作(2):在(11.8)式窗口中点击View,选Coefficient Tests, Omitted Variables -Likelihood Ratio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量GDP,DEF。也可得到如上结果。
(6)W检验
W检验的优点是只需估计无约束模型。当约束模型的估计很困难时,此方法尤其适用。W检验由沃尔德(Wald 1943)提出,适用于线性与非线性约束条件的检验。
W检验的原理是测量无约束估计量与约束估计量之间的距离。先举一个简单例子。比如对如下模型检验线性约束条件?2 = ?3是否成立。
yt = ?1 x 1t + ?2 x2 t + ?3 x3 t + vt (7)
~~~~W检验只需对无约束模型(7)进行估计,因为对约束估计量?2和?3来说,必然有?2-?3= 0。如
?-??应该近似为零。如果约束条件不成立,则无约束估计果约束条件成立,则无约束估计量?23?-??应该显著地不为零。关键是要找到一个准则,从而判断什么是显著地不为零。 量?23?-??-??)的抽样分布。依据经典回归的假定条件,?)服从均值为首先需要知道(?(?2233?-??-??-??) 的正态分布。?) 是未知的,?) (?2-?3),方差为Var(?通常Var(?使用的是Var(?222333的样本估计量,定义W统计量为,
????) W =(?23????)? N(0, 1) Var(?23在约束条件成立条件下,W渐进服从N(0, 1) 分布。
下面讨论多个约束条件的情形。假定若干约束条件是以联合检验的形式给出,
f(? ) = 0, (8)
~其中f(?) 表示由约束条件组成的列向量。用?表示施加约束条件后对参数集合 {?1, ?2, …, ?k }
~?代入上式时,通常上式不的估计。若把 ? 代入上式,则上式一定成立。当把无约束估计值?会成立。W统计量定义如下,
?)' [Var( f(??) ) ]-1 f(??) (9) W = f(??)是用??代替? 后的f(? )表达式,Var(f(??)) 是f(??)的估计的方差协方差矩阵。计算公其中f(?式如下:
?)?)?f(??f(??? Var(f(?)) = () (Var(?) ) ()' (10)
???????)???表示 f(?) 用无约束估计量 ?? 代替后的偏导数矩阵,其中?f(?其中第i行第j列位置上的?) 是??的估计的方差协方差矩元素表示第i个约束条对第 j个无约束估计量的偏导数值。Var(?阵。
?)' [Var( f(??) ) ] –1 f(??) 渐近服从 ? ??m) 分布。 在约束条件成立条件下,W = f(? 6
?)' [Var( f(??) ) ]-1 f(??) ? ? ??m) . W = f(?其中m表示被检验的约束条件的个数,
举一个非线性约束的例子如下。假定对模型
yt = ?1 xt1 +?2 xt2 +?3 xt3 + ut (11)
?,??分别表示 ??,?和??,检验约束条件 ?1 ?2 = ?3 是否成立。用??? 和 ?? 的非约束估计量。?1231?既可以是极大似然估计量,也可以是最小二乘估计量。因为对于本例 f(??) 只含有一?和??23个约束条件,所以改用f(??) 表示,有 f (??) = ??1??2-??3
?f(??)?f(??)?f(??)?f(??)????= (??? ) = ( ?? -1 ), 1???2????213?Var(?? Var(???1)Cov(??) =??Cov(?1?1??Cov?????2)Var(??2)13)??2)Cov(??2???3)? ??Cov(??1??3)Cov(??2??3)Var(??3)?????和 Var(f(??)) = (??2 ??1 -1) Var(??)???????2?1?, ??1????根据(9)式,W统计量的具体表达式是,
W =
(??1??2???3)2??
???(??2???1)????1??2??Var(?)????????1????1???在零假设 ?1 ?2 = ?3 成立条件下,W统计量近似服从 ? ?(1) 分布。
例:(file: nonli12)对台湾制造业生产函数,检验?1/?2 = 0.5是否成立。
Lny?t= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2 (4.4) (3.9) R2 = 0.89, F = 48.45, DW=1.3 检验?2/?3 = 0.5是否成立。 变换约束条件为
?2 - 0.5?3 = 0
因为只有一个约束条件,则
f(??) = f (??) = ?2 - 0.5?3 ?f(??)?)?)?f(??)???= (?f(???? ?f(? ) = (0 1???2???1 -0.5 ) 3 7
(12)
(13) (14) (15)
在(15)式窗口中点击View,选Coefficient Covariance功能。
?7.38600.3776?0.8157?? ?) = ?0.3776Var(?0.0235?0.0439?????0.8157?0.04390.0912???)?)?f(??f(???Var(f(?)) = () (Var(?) ) ()'
???????7.38600.3776?0.8157??= ?01?0.5? ?0.37760.0235?0.0439?????0.8157?0.04390.0912???) = f (??) = ?2 - 0.5?3 = (0.6731-0.5?1.1816) = 0.0823 f(??)' [Var( f(??) ) ]-1 f(??) W = f(??0??1?= 0.0903 ?????0.5??(0.0823)21= 0.0823 () 0.0823 = = 0.0750
0.09030.0903因为W = 0.075 < ? ??1) = 3.8,所以,约束条件?0 = ?1 = 0被接受,成立。
在(15)式窗口中点击View,选Coefficient Tests, Wald-Coefficient Restrictions功能得
概率大于0.05,说明统计量落在了零假设的接收域。结论是接受原假设(约束条件成立)。
(7)LM乘数检验。
与W检验不同的是拉格朗日(Lagrange)乘数(LM)检验只需估计约束模型。所以当施加约束条件后模型形式变得简单时,更适用于这种检验。LM检验是由艾奇逊—西尔维(Aitchison-Silvey 1960)提出的。LM检验另一种表达式是由拉奥(Rao 1948)提出的,称为得分检验。
首先给出非约束模型的对数似然函数
logL( ?, ? ? ) (16)
?j必然有 对于非约束极大似然估计量?
8
?loLg= 0, ? j (17) ???j~若约束条件成立,则施加约束条件下 ?j的极大似然估计量 ?j应与不施加约束条件下?j的极大
~~?j非常接近。也就是说 ?logL/??似然估计量?j应近似为零。LM检验的原理是如果 ?logL/??j
显著地不为零,则约束条件不成立。LM统计量定义为
?logL?logL~ LM = (~)' (I(?))?1(~) (18)
????~~~其中(?logL/??)是以(?logL/??j)为元素组成的列向量,同时用?j替换了?j 。I(?) 称为信
~息矩阵,其逆矩阵是?j的方差协方差矩阵。在约束条件成立条件下,LM近似服从 ?2(m) 分布。
LM ? ? 2(m) ,
其中m表示约束条件个数。
假定有两个约束条件f1(?) = 0和f2(?) = 0。为求这两个约束条件下的对数似然函数(16)的极大似然估计量,应按拉格朗日乘数法则建立如下函数,
logL* = logL + ?1 f1 (?) + ?2 f2 (?) , (19) 其中?1,?2为拉格朗日乘数,求解约束极值问题应对所有的j都满足? logL*/? ?j = 0, 即
?f(?)?f(?)?logL*?logL= + ?11 + ?22 = 0, ? j
??j??j??j??j由上式得
?f(?)?f(?)?loLg = - ?11 - ?22, ? j (20)
??j??j??j~当上式中的?j 用?j代替后,如果显著地不为零,则约束条件不成立。根据上式,只有当?1, ?2
不为零时,?logL/??j 才显著地不为零。所以判别规则是如果 ?1,?2 显著地不为零,则拒绝约
~束条件。因为(20)式是 ?logL/??j的函数,所以称其为拉格朗日乘数统计量。
对于线性回归模型,通常并不是按(18)式,而是通过一个辅助回归式计算LM统计量的值。LM统计量与辅助回归式的可决系数R 2 有直接联系,而辅助回归式的形式直接与被检验的约束条件有关。
LM检验的实际步骤如下:
?t。用OLS法估计约束模型,计算残差序列u?t,并把u?t (1) 确定LM辅助回归式的因变量u作为LM辅助回归式的因变量。
(2) 确定LM辅助回归式的解释变量。例如非约束模型如下式,
yt = ?0 + ?1 x1t + ?2 x2 t +… + ?k xk t + ut . (21) 把上式改写成如下形式
ut = yt - ?0 - ?1 x1t - ?2 x2 t -… - ?k xk t . (22)
则LM辅助回归式中的解释变量按如下形式确定。
?u -t, j = 0, 1, …, k.
??j对于非约束模型(5.70),LM辅助回归式中的解释变量是1, x1t , x2t , …, xk t 。第一个解释变量1表明常数项应包括在LM辅助回归式中。 (3) 建立LM辅助回归式如下
9
?t= ?? + ?1 x1t + ?2 x2 t + … + ?k xk t + vt , (23) u?t由第一步得到。 其中u(4) 用OLS法估计上式并计算可决系数R 2。 (5) 用第四步得到的R2计算LM统计量的值。 LM = T R 2
其中T表示样本容量。由于上式计算的LM的值与(18)式定义的LM的值相等(证明略)。在零假设成立前提下,T R 2 服从m个自由度的 ?2(m) 分布,
LM = T R 2 ? ?2(m) 其中m表示约束条件个数。
例:以如下非约束模型介绍用LM辅助回归方法检验约束条件 ?2 + ?3 = 1。
yt = ?1 x 1t + ?2 x2 t + ?3 x3 t + vt , (24) 检验约束 ?2 + ?3 ? ? 是否成立。当施加约束 ?? + ?? ? ? 时,上式变为,
yt = ?1 x1t + ?2 x2 t + (1 - ??) x3 t + vt , (25)
上式相对于(24)式为约束模型。若对(24)和(25)式进行OLS估计,则会发现所得结果相同。
?x1t +??x2 t +??x3 t (26) ?t =? y213?是对 于是遇到参数不可识别问题。除非 ?2 和 ?3 存在准确的关系 ?2 + ?3 = 1,否则无法知道?3? +?? = 1成?3 的估计还是对(1- ?2)的估计。即便 ?2 + ?3 = 1真的成立,实际中也很难有 ?23立。为避免参数的不可识别性,可利用约束最小二乘法(RLS)进行估计。
从(25)式两侧减去x3 t 得,
yt - x3 t = ?? x1t + ?? x2 t - ?2 x3 t + vt (27) 令yt* = yt - x3 t,x2 t* = x2 t - x3 t,上式变为,
yt* = ?1 x1t + ?2 x2 t* + vt , (约束模型。) (28)
?t作为LM辅助回归的因变量。第一步,用OLS法估计(28)式,并把得到的残差序列 v变换(24)式得
vt = yt - ?1 x1 t - ?2 x2 t - ?3 x3 t .
根据第二步,LM辅助回归解释变量是x1t, x2 t 和x3 t。根据第三步,LM辅助回归式是
?2x2 t +??3 x3 t , ?t= ??1x1t +? v(原式中没有?0,所以上式中没有常数项。)计算可决系数R 2。则
LM = T R 2 ? ?2(1) .
例:(file: nonli12)对台湾制造业生产函数
Lnyt= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2
(4.4) (3.9) R2 = 0.89, F = 48.45, DW=1.3, T=15 用LM统计量检验Lnxt2的系数,?3 = 0是否成立。
??t, (1) 用OLS法估计约束模型,计算残差序列u?t Lnyt = 2.16 + 1.24 Lnxt1 + u (4.9) (17.6) R2 = 0.96, F = 312 ?t作为LM辅助回归式的因变量。 并把u
10
(2) 确定LM辅助回归式的解释变量。例如非约束模型如下式,
Lnyt = ?1 + ?2 Ln x1t + ?3 Lnx2 t + ut (29) 把上式改写成如下形式
ut = Lnyt - ?1 - ?2 Lnx1t - ?3 Lnx2 t (30)
则LM辅助回归式中的解释变量按如下形式确定。
?u -t, j = 1, 2, 3
??j对于非约束模型(30),LM辅助回归式中的解释变量是1, Lnx1t , Lnx2t。第一个解释变量1表明常数项应包括在LM辅助回归式中。 (3) 建立LM辅助回归式如下
?t= ?? + ?1 Ln x1t + ?2 Ln x2 t + vt , (23) u?t由第一步得到。 其中u(4) 用OLS法估计上式并计算可决系数R 2。
?t= -10.67 - 0.67 Lnxt1 + 1.18 Lnxt2 (23) u (-3.9) (-3.7) (3.9) R2 = 0.89, F = 48.45, DW=1.3
(5) 用第四步得到的R2计算LM统计量的值。
LM = T R 2 = 0.89?15 = 13.35 > ?2(1) = 3.8 原假设?3 = 0不成立。
例:自相关BG检验属于LM检验。
以2元线性回归模型,检验是否存在1阶自相关为例,约束模型和非约束模型分别是 yt = ?1 +?1 x1t + ?2 x2 t + ut (约束模型,? = 0) (33)
yt = ?1 +?1 x1t + ?2 x2 t + ut, ut = ?ut-1 + vt (34) 即
yt = ?1 +?1 x1t + ?2 x2 t + ?ut-1 + vt (非约束模型) (35)
?t作为LM辅助回归式的因变量。由非约束模型(35)知LM辅用OLS法估计(33)式,得到u助回归式的解释变量是1,x1t,x2t,?,所以LM辅助回归式是
?t= ?? + ?1 x1t + ?2 x2 t + ?3 u?t-1 + vt (5.72) u上式正是自相关BG检验式。从中提取R 2计算统计量。
对LR,W和LM检验方法的选择应以做实际计算时的难易程度而定。一般来说W和LM检验应优于LR检验,因为W和LM检验只需要估计一个模型即可,而LR检验需估计约束与非约束两个模型。对W 和LM检验方法的选择应以约束模型与非约束模型哪个更容易估计而定。应该注意,即使三种检验方法都可使用,它们的计算结果通常也是不相同的。因为三个统计量只是渐近相同,对于线性回归模型,在小样本条件下有如下关系成立。
LM ? LR ? W (29)
上式说明只有当 LM检验的结果为拒绝零假设(约束条件不成立)或者W检验的结果为接受零假设(约束条件成立)时,三种检验的结论才是一致的。所以实际中,三种检验方法有可能得出相互不一致的结论。另外只有当用参数的样本估计值计算的约束条件完全成立时,即把参数估计值代入约束条件能准确成立时,(29)式中的三个统计量才有完全相等的关系。
?当对数似然函数中只含有一个参数? 时,LM, LR 和W三种检验的关系可用图5.1表示。? 11
~~?)- log L(?) 的测量,W检和? 分别表示无约束和约束估计量。LR检验是对纵向距离 log L(?~~?=????验则是对水平距离 (?) 的测量,而LM检验计算的是当? 时,对数似然函数的斜率。
因为这三个统计量都是渐近地服从?验要比用上述三种检验更可靠。
2
所以当样本比较小且约束条件为线性时,用(m) 分布,
F检
图5.1 LR, W 和LM 检验
(8)邹突变点检验(Chow Breakpoint Tests),邹检验。
突变点检验由邹至庄1960年提出。当研究同一问题,在不同时段得到两个子样本时,需要考察两个不同时段的回归系数是否相同,即回归系数在不同时段是否相等。当然这一检验也适用于两个截面样本的情形。
图5.2 一个解释变量情形
两个样本容量分别用n1和n2表示,并定义T = n1 + n2。假定所建立的多元回归模型形式为, yt = ?0 + ?1xt 1 + … + ?k-1 xt k-1 + ut
以T,n1和n2为样本分别对上述模型进行估计,所得结果用以下符号表示。
样本容量 残差平方和 相应自由度 回归系数 1 T SSET T- k ?j, j = 1, …, k-1 2 n1 SSE1 n1 - k ?j, j = 1, …, k-1 3 n2 SSE2 n2 - k ?j, j = 1, …, k-1
注:3次回归的模型形式应相同。
原假设与备择假设:
H0:?j = ?j , j = 1, …, k-1。 H1:?j, ?j,不全对应相等。 则所用统计量定义为
12
F =
[SSET?(SSE1?SSE2)]/[T?k?(n1?k?n2?k)]
(SSE1?SSE2)/(n1?k?n2?k)[SSET?(SSE1?SSE2)]/k? F(k, T-2 k)
(SSE1?SSE2)/(T?2k) =
检验规则是
若F > F? (k,T-2k) 拒绝H0(回归系数有显著性变化) 若F < F? (k,T-2k) 接受H0(回归系数无显著性变化)
例:(file: break2)东北、华北、华东、华中21省市1993和1998年耕地面积(land,百万公顷)和农业产值(Y, 百亿元)数据见图(已取对数)。用圆圈表示的观测点为1993年数据,用三角表示的观测点为1998年数据。大体看各省市1998年耕地面积比1993年耕地面积略有减少,产值却都有增加。以1993和1998年数据为两个子样本,以42个数据为总样本,求得残差平方和见下表
33LOG(Y93)LOG(Y98)LOG(Y93)LOG(Y98)22110LOG(LAND)-2-101230LOG(LAND)-2-10123-1-1
1 2 3
因为, F =
样本容量 残差平方和 相应自由度 T = 42 SSET = 14.26 T - k = 40 n1= 21 SSE1 = 4.37 n1 - k = 19 n2= 21 SSE2 = 3.76 n2 - k = 19
回归系数
?1 ?1
注:三次回归的模型形式Lnoutt = ?0 +?1 Lnlandt + ut。
[SSET?(SSE1?SSE2)]/k[14.26?(4.37?3.76)]/2= = 14.33 > F(1, 40) = 7.31
(SSE1?SSE2)/(T?2k)(4.37?3.76)/38所以两个年度21省市的农业生产发生了很大变化。
例:中国对数货币流通量的突变点检验(1952-1998,file: Dummy5)
检验中国对数货币流通量LM是否在1978年发生突变。在对话框中输入1978(注意:1978属于后一个子样本),得EViwes结果如下:
13
直接结算SSET = 11.0326, SSE1 = 0.802576, SSE2 = 0.232164。代入公式,
F =
[SSET?(SSE1?SSE2)]/k[11.0326?(0.802567?0.232164)]/2== 207.737
(SSE1?SSE2)/(T?2k)(0.802567?0.232164)/43与EViwes输出结果相同。
(9)回归系数的稳定性检验(Chow检验)
在样本T基础上求出回归模型系数的估计值后,再增加n个观测值从而考查原参数估计值是否稳定时,可采用如下的Chow检验法,
首先对同一形式模型(含k个被估参数)用样本T和样本T+ n分别进行回归,计算结果表示如下,
样本容量 残差平方和 相应自由度 回归系数 1 T SSE1 T- k ? j 2 T + n SSE2 T + n - k ?j
注:两次回归的模型形式应相同。
原假设与备择假设:
H0: ?j = ?j , (j = 1, …, k-1)。 H1: ?j与?j , (j = 1, …, k-1),不全对应相等。 则所用统计量定义为
(SSE2?SSE1)/[T?n?k?(T?k)](SSE2?SSE1)/n? F = ? F(n, T- k)
SSE1/(T?k)SSE1/(T?k)检验规则是
若F < F? ( n, T- k) 接受H0(回归系数无显著性变化) 若F > F? ( n, T- k) 拒绝H0(回归系数有显著性变化)
例:中国对数货币流通量的稳定性检验(1952-1998,file: Dummy5)
按上面的表示方法,EViews先算出T + n个样本的回归式,对于本例即先算出1952-1998年为样本的回归式,然后再从1998年开始除掉一个或若干个年份的值,检验参数稳定性。
下面的计算相当于用1952-1997年数据估计一个模型,然后加入1998年数据检验预测的稳定性。
14
1 2
F =
样本容量 残差平方和 相应自由度 回归系数 46 0.9667 T- k = 42 ? j 47 1.0347 T + n – k = 43 ?j
(SSE2?SSE1)/n(11.03265?10.57111)/1==1.96
SSE1/(T?k)10.57111/(47?2)
(10)检验过程是否为白噪声的Q统计量
在介绍Q统计量之前,先介绍序列yt的估计的自相关函数(相关图)的定义,
1T(y?yt)(yt?k?yt)T?kt?k?1t rk =, k = 1, 2, …. T1(yt?yt)2Tt?1??其中rk表示yt与yt-k估计的自相关系数,是对自相关系数?k的估计。yt?k= (?yt?k)/ (T-k)。在
15
EViews中定义yt= (?yt)/ T。
模型残差序列是否为白噪声的检验是用Box-Pierce (1970) 提出的Q统计量完成的。Q检验的零假设是
H:?1 = ?2 = … = ?K = 0
即序列是一个白噪声过程。其中?i表示自相关系数。Q统计量定义为
Q = T
?k?1Krk2 (30)
随着T??,Q渐近服从?2( K - p - q)分布,其中T表示样本容量,rk 表示用残差序列计算的自相关系数值,K表示自相关系数的个数,p 表示模型自回归部分的最大滞后值,q表示移动平均部分的最大滞后值。
Ljung和Box认为(30)式定义的Q统计量的分布与?2( K - p - q)分布存在差异(相应值偏小),于是提出修正的Q统计量。
rk2 Q = T (T+2) (31)
k?1T?k?K其中rk ,K,p,q的定义如(30)式。修正的Q统计量(31) 渐近服从 ?2( K - p - q) 分布。且它的近似性比原Q统计量的近似性更好。(注意:EViews中给出的Q统计量就是按(31)式定义的。)
用残差序列计算Q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则Q值将很大,反之Q值将很小。判别规则是:
若Q < ?2? ( K - p - q) ,则接受H0。 若Q > ?2? ( K - p - q) ,则拒绝H0。
其中? 表示检验水平;p,q分别表示时间序列模型中自回归和移动平均滞后项的个数。 实际检验中,K取15左右即可。
例:(file: simu2, xt)白噪声序列xt ? IID(0, 1)。Q统计量的值如下,
(file: simu2, xt)
因为Q(10) = 5.9 < ?20.05 (10 - 0 - 0) = 18.3 ,则序列非自相关。
(11)模型的平方的残差值序列构造Q统计量 在Q统计量的定义中,
rk2 Q = T (T+2) (31)
k?1T?k?K 16
如果估计的自相关系数rk是用平方的残差值序列计算的,那么Q统计量考察的是残差序列中是否存在ARCH、GARCH过程。Q统计量渐近服从?2( K - p - q) 分布。检验方法与所用临界值与上述检验是否为白噪声过程的Q统计量相同。
这时的零假设是残差序列中不存在ARCH、GARCH过程。备择假设是存在ARCH、GARCH过程。
下图是对日元兑美元汇率AR (2)模型中平方的残差值序列的1-10期的Q统计量计算结果。以k = 10为例,
因为Q(10) = 277.99 < ?20.05 (10 - 2 - 0) = 15.5 ,所以模型残差序列中存在ARCH过程。
(file:JPYEN, EQ01)
(11)异方差的White检验
White检验由H. White 1980年提出。White检验的原理属于LM检验。White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布。它是通过一个辅助回归式构造 ?2 统计量进行异方差检验。White检验的具体步骤如下。
以二元回归模型为例,
yt = ?0 +?1 xt1 +?2 xt2 + ut (32)
?t。 ①首先对上式进行OLS回归,求残差u②做如下辅助回归式,
?t2= ?0 +?1 xt1 +?2 xt2 + ?3 xt12 +?4 xt22 + ?5 xt1 xt2 + vt (33) u?t2对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。注意,上即用u式中要保留常数项。求辅助回归式(33)的可决系数R2。
③White检验的零假设和备择假设是
H0: (32)式中的ut不存在异方差, H1: (32)式中的ut存在异方差 ④在不存在异方差假设条件下统计量
T R 2 ? ? 2(5)
17
其中T表示样本容量,R2是辅助回归式(33)的OLS估计式的可决系数。自由度5表示辅助回归式(33)中解释变量项数(注意,不计算常数项)。
⑤判别规则是
若 T R 2 ???2? (5), 接受H0 (ut 具有同方差) 若 T R 2 > ?2? (5), 拒绝H0 (ut 具有异方差) 例:(file:hete01,hete02)
1986年中国29个省市自治区农作物种植业产值yt(亿元)和农作物播种面积xt(万亩)数据研究二者之间的关系。得估计的线性模型如下,
yt = -5.6610 + 0.0123 xt (5.18) (12.4) R2 = 0.85, F = 155.0, T = 29
300Y604080RES200200100-20-40-60X005000100001500020000
-800T102030
图5.7 农作物产值yt和播种面积xt (file:hete01) 图5.8 残差图(file:hete02)
无论是从yt和xt观测值的散点图(见图5.7)还是模型的残差图(见图5.8)都可以发现数据中存在异方差。
用White方法检验是否存在异方差。在上式回归的基础上,用残差做如下回归。
?t= -219.70 + 0.1595 xt - 3.54(- 6) xt2 u (-0.5) (1.5) (-0.6) T = 29, R2 = 0.2765
2 18
因为T R 2 = 29? 0.2765 = 8.018> ? 2(2) = 6.0,所以存在异方差。输出结果见下表
注意:输出结果中的概率是指?2 (2)统计量取值大于8.02的概率为0.018。示意如下图。
0.50.40.30.20.12468
(12)自相关的LM检验(亦称BG检验) BG检验的特点是既可检验一阶自相关,也可检验高阶自相关。BG检验由Breusch- Godfrey提出。BG检验是通过一个辅助回归式完成的,属于LM统计量。具体步骤如下。
对于多元回归模型
yt = ?0 + ?1x1 t + ?2 x2 t + … + ? k –1 x k-1 t + ut (34)
考虑误差项为n阶自回归形式
ut = ?1 ut-1 + … + ?n ut - n + vt (35) 其中vt 为随机项,符合各种假定条件。零假设为
H0:?1 = ?2 = …= ?n = 0 这表明ut不存在n阶自相关。用估计(34)式得到的残差建立辅助回归式,
?nu?1u?t=??t?n+?0 +?1x1 t +?2 x2 t + … + ? k –1 x k-1 t + vt (36) ?t?1+ … +? u?t是(34)式中ut的估计值。估计上式,并计算可决系数R2。构造LM统计量, 上式中的u LM = T R2
19
其中T表示(34)式的样本容量。R2为(36)式的可决系数。在零假设成立条件下,LM统计量渐近服从 ?2(n) 分布。其中n为(35)式中自回归阶数。如果零假设成立,LM统计量的值将很小,小于临界值。
判别规则是,若LM = T R2 ? ?2(n),接受H0;
若LM = T R2 > ?2(n),拒绝H0;
(13)格兰杰非因果性检验
格兰杰非因果性检验是VAR模型的一个副产品。格兰杰非因果性检验式是2变量VAR模型中的一个方程式。格兰杰(Granger)非因果性定义如下:
格兰杰非因果性:如果由yt和xt滞后值所决定的yt的条件分布与仅由yt滞后值所决定的条件分布相同,即
?( yt ? yt -1, …, xt -1, …) = ?( yt ? yt -1, …), (37) 则称xt -1对yt存在格兰杰非因果性。
格兰杰非因果性的另一种表述是其他条件不变,若加上xt的滞后变量后对yt的预测精度不存在显著性改善,则称xt -1对yt存在格兰杰非因果性关系。
根据以上定义,xt 对yt 是否存在因果关系的检验可通过检验VAR 模型以yt 为被解释变量的方程中是否可以把xt 的全部滞后变量剔除掉而完成。比如VAR 模型中以yt 为被解释变量的方程表示如下:
yt =
?iyt?i+??ixt?i+ u1 t (38) ?i?1i?1kk如有必要,常数项,趋势项,季节虚拟变量等都可以包括在上式中。则检验xt 对yt存在格兰杰
非因果性的零假设是
H0: ?1 = ?2 = …= ?k = 0
显然如果(38)式中的xt 的滞后变量的回归参数估计值全部不存在显著性,则上述假设不能被拒绝。换句话说,如果xt 的任何一个滞后变量的回归参数的估计值存在显著性,则结论应是xt 对yt 存在格兰杰因果关系。上述检验可用F统计量完成。 F =
(SSEr?SSEu)k (39)
SSEu(T?kN)其中SSEr 表示施加约束(零假设成立)后的残差平方和。SSEu 表示不施加约束条件下的残差平方和。k表示最大滞后期。N表示VAR模型中所含当期变量个数,本例中N = 2,T表示样本容量。在零假设成立条件下,F统计量近似服从F( k, T - k N ) 分布。用样本计算的F值如果落在临界值以内,接受原假设,即xt 对yt 不存在格兰杰因果关系。
注意:
为简便,通常总是把xt-1 对yt存在非因果关系表述为xt(去掉下标 -1)对yt存在非因果关系(严格讲,这种表述是不正确的)。
在实际中,除了使用格兰杰非因果性概念外,也使用“格兰杰因果性”概念。
顾名思义,这个概念首先由格兰杰(Granger 1969)提出。西姆斯(Sims 1972)也提出因果性定义。这两个定义是一致的。
例:(file: stock)以661天(1999.1.4-2001.10.5)的上海(SH)和深圳(SZ)股票收盘价格综合指数为例,
20
15000CP100005000IP00500010000150002000025000
在回归估计结果窗口中点击View键,选择Stability Tests,Recursive Estimates (OLS only), Recursive Residuals功能。图中给出递归残差曲线,和正负两个标准差区间的致信域。
④2。累计(cumulative sum)递归残差检验(CUSUM Test);
累计递归残差检验用统计量(Brown, Durbin and Evans, 1975)定义如下, Wt =
ei, t = k +1, …, T s.e.i?k?1?t其中et表示递归残差。s.e.表示用整个样本估计的回归函数的标准误差(残差的标准差)。CUSUM
统计量Wt是标准化的递归残差的和。随着时间的推移,如果模型回归参数具有稳定性,应该有
E(Wt) = 0。
如果模型回归参数不稳定,将离开零均值线。在累计递归残差图中用一对5%的显著性曲线评价Wt值得偏离。如果Wt值到了5%显著性曲线以外,预示着模型回归参数不稳定。下图表示模型
31
参数还算稳定。
例:(file: b1c1, EQ124)中国宏观消费与国民收入模型(1952-1993)
④3。累计递归残差平方检验(CUSUM of Squares Test);
累计递归残差平方检验统计量(Brown, Durbin and Evans, 1975)定义如下,
k?1St =i?Ti?k?1?e?et2i, t = k +1, …, T
2i其中et表示递归残差。在原假设,回归参数具有稳定性,成立前提下有
E(St) =
t?k。 T?k这条直线从t = k的零点开始,到t = T的1结束(图中过(k, 0),(T, 1)两点的直线)。图中给出5%的显著性曲线。如果Wt值到了5%显著性曲线以外,预示着模型回归参数,或者说残差的方差不稳定。
例:(file: b1c1, EQ124)中国宏观消费与国民收入模型(1952-1993) 图中表示出回归参数某种程度的不稳定。
④4。一步预测检验(One-step Forecast Test); 一步预测检验图给出递归残差曲线(兰线),标准误差曲线(红虚线,95%置信区间)以及相应概率值等于和小于0.15的递归残差点(兰色圆点)。兰色圆点表示概率在5%,10%,15%水平上拒绝模型参数稳定的点。概率小于0.05的点与递归残差曲线中跑到两条红色曲线以外的点相对应。
例:(file: b1c1, EQ124)中国宏观消费与国民收入模型(1952-1993)
图中上半部分画的是递归残差图。下半部分有4个点的概率低于0.05。说明有4个点跑到两条红色曲线以外。
32
④5。n步预测检验(N-step Forecast Test);
n步预测检验图中上半部分画的是递归残差图。下半部分画的是递归邹至庄回归系数稳定性检验(Chow Forecast test)。图中圆点表示F统计量的显著性概率值。
例:(file: b1c1, EQ124)中国宏观消费与国民收入模型(1952-1993)
针对本例,n步预测检验图显示模型参数比较稳定。只是在1954,1967,1970和1971年在0.05水平上,模型参数不太稳定。
④6。递归参数走势图(Recursive Coefficients)。
递归参数图给出随样本值个数的逐步增加,参数估计值的走势变化曲线以及正负2个标准差的致信区间带。图中最后一年的回归参数值与全样本回归结果中的回归参数值相等。当选定的回归模型试图克服突变点时,递归参数图会出现剧烈的跳动。
例:(file: b1c1, EQ124)中国宏观消费与国民收入模型(1952-1993)
图中显示全样本回归结果中的截距项是262,收入对消费的边际系数是0.63。
33
滞后10期的Granger因果性检验结果如下:(当概率小于0.05时,表示推翻原假设)
上表中概率定义为,
P(F>1.36) = 0.19316
图示如下:
0.80.60.40.2临界值 1.36 0.511.52 P(F>23.44) = 0.00000
因为F值(1.36)落在原假设接受域,所以原假设“上海股票价格综合指数对深圳股票价格综合指数不存在Granger因果关系” 被接受。
因为F值(23.44)落在原假设拒绝域,所以原假设“深圳股票价格综合指数对上海股票价格综合指数不存在Granger因果关系” 被推翻。
用滞后1?10期的检验式分别检验,结论都是深圳股票价格综合指数是上海股票价格综合指数变化的原因,但上海股票价格综合指数不是深圳股票价格综合指数变化的原因,
EViews操作方法是,打开数剧组窗口,点View键,选Granger Causility。在打开的对话窗口中填上滞后期(下面的结果取滞后期为10。),点击OK键。
(14)内生性Hausman检验
Hausman(1978)首先提出关于变量内生性的检验用统计量。Davison和MacKinnon(1989,
21
1993)又提出一种借助辅助回归进行Hausman检验的方法。假定需要作如下回归,
yt = ?0 +?1 xt1 +?2 xt2 +?3 zt + ut (40)
其中zt有可能是由yt决定的内生变量。那么对上式的OLS估计量一定是有偏的和不一致的。为了检验zt的内生性,应该找到一组工具变量,既与zt高度相关,又与上式中的误差项ut不相关。工具变量的选择在实际中是非常重要的一步。比如,选择了xt3 和 xt4作为工具变量。内生性Hausman检验通过如下两次回归完成。
第一个回归式是用待检验变量zt对上式中的全部外生变量xt1 ,xt2和选定的工具变量xt3 ,xt4回归。
zt = ?0 +?1 xt1 +?2 xt2 +?3 xt3 +? xt4 + vt
?t。 用OLS法估计上式,并提取残差序列v?t作为附加变量加入到(40)式 第二步是把v?t+ ut (41) yt = ?0 +?1 xt1 +?2 xt2 +?3 zt +?4v用OLS法再次回归。
如果zt具有外生性,或者说?0,?1,?2,?3具有一致性,那么回归系数?4的OLS估计量应该没有显著性。如果?4的OLS估计量具有显著性,则推翻原假设?0,?1,?2,?3具有一致性,结论是?0,?1,?2,?3不具有一致性,zt是内生变量。
2.模型诊断与EViews操作
在EViews中,模型诊断与检验功能可以分为3大类。(1)模型参数约束检验,(2)模型残差检验,(3)模型稳定性检验。
EViews中模型诊断功能一览 1 2 1级检验功能 模型参数约束检验 模型残差检验 2级检验功能 参数约束的Wald检验。 丢失变量的似然比检验。 多余参数的似然比检验。 残差序列的相关图与偏相关图,Q检验。 残差平方序列的相关图与偏相关图。 残差直方图与分布正态性检验。 序列相关LM检验。 自回归条件异方差LM检验。 异方差White检验(不含交叉项)。 异方差White检验(含交叉项)。 邹突变点检验。 邹预测检验。 Ramsey模型设定误差检验。 递归估计(只适用于OLS估计)。 3级检验功能 递归残差。 累计递归残差检验。 累计递归残差平方检验。 一步预测检验。 n步预测检验。 递归参数走势图。 3 模型稳定性检验
22
下面介绍EViews操作。
(1)模型参数约束检验(Coefficient Tests)。 模型参数约束检验中包括3种检验。
①Wald-Coefficient Restrictions(参数约束的Wald检验);
②Omitted Variables -Likelihood Ratio(丢失变量的似然比检验); ③Redundant Variables- Likelihood Ratio(多余参数的似然比检验)。前1种属于Wald检验;后两种属于似然比(L R)检验。
在回归估计结果窗口中点击View键,选择Coefficient Tests功能,会看到3种关于参数约束的检验方法。① Wald-Coefficient Restrictions(参数约束的Wald检验),② Omitted Variables -Likelihood Ratio(丢失变量的似然比检验),③Redundant Variables- Likelihood Ratio(多余参数的似然比检验)。
① Wald-Coefficient Restrictions(参数约束的Wald检验) 例:(file: nonli12)对台湾制造业生产函数检验?1/?2 = 0.5是否成立。 Lnyt= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2
(4.4) (3.9) R2 = 0.89, F = 48.45, DW=1.3
检验?1/?2 = 0.5是否成立。应选择方法①,参数约束的Wald检验。注意,相应的命令应该是
c(2)/c(3)=0.5
?
23
概率大于0.05,说明统计量落在了零假设的接收域。结论是接受原假设(约束条件成立)。
② Omitted Variables-Likelihood Ratio(丢失变量的似然比检验)
做Omitted Variables -Likelihood Ratio(丢失变量的似然比检验)检验时,意味着把当前的回归结果当作是约束模型,在随后弹出的对话框中应列写在回归方程中拟新加入的解释变量名。
例:(file: nonli12)以台湾制造业生产函数为例(file: nonli12)。 在如下回归式 Lnyt= 2.16 + 1.24 Lnxt1
(4.9) (17.7) R2 = 0.96, F = 312.5, DW=1.0 中检验是否应该加入资本变量(Lnxt2)。H0:Lnxt2的系数?2 = 0。在估计上式的窗口中点击View键,选择Coefficient Tests,Omitted Variables-Likelihood Ratio功能(如下图),
?
得一对话框,填入变量Lnxt2(如图所示), 点击OK键,
24
因为概率小于0.05,说明统计量落在了原假设的拒绝域。结论是拒绝原假设(?2 = 0)。约束条件不成立。
③ Redundant Variables-Likelihood Ratio(多余参数的似然比检验)。
做Redundant Variables-Likelihood Ratio(多余参数的似然比检验)检验时,意味着把当前的回归结果当作是非约束模型,在随后弹出的对话框中应列写从现在的回归方程中拟删除的解释变量名。
例:(file: nonli12)以台湾制造业生产函数为例。 在如下回归式 Lnyt= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2
(4.4) (3.9) R2 = 0.89, F = 48.45, DW=1.3 中检验是否应该剔除劳力变量(Lnxt1)。H0:Lnxt1的系数?1 = 0。在估计上式的窗口中点击View键,选择Coefficient Tests,Redundant Variables-Likelihood Ratio功能(如下图),
?
得一对话框,填入变量Lnxt1(如图所示), 点击OK键,
因为概率小于0.05,说明统计量落在了原假设的拒绝域。结论是拒绝原假设(?1 = 0)。约束条件不成立,Lnxt1因该保留在模型中。
25
(2)模型残差检验(Residual Tests)。 模型残差检验中包括7种检验方法。
①Correlogram-Q-statistics(残差序列的相关图与偏相关图,Q检验); ②Correlogram- Squared Residuals(残差平方序列的相关图与偏相关图); ③Histogram-Normality Test(残差的直方图与分布正态性检验); ④Serial Correlation LM Test(序列相关LM检验); ⑤ARCH LM Test(自回归条件异方差LM检验);
⑥White Heteroskedasticity (no cross terms)(异方差White检验(不含交叉项)); ⑦White Heteroskedasticity (cross terms)(异方差White检验(含交叉项))。
在回归估计结果窗口中点击View键,选择Residual Tests功能,会看到7种关于检验残差的方法。
①Correlogram-Q-statistics(相关图与偏相关图,Q检验)功能用来识别残差序列是否为白噪声过程。
②Correlogram- Squared Residuals(残差平方序列的相关图与偏相关图)功能给出的是残差平方序列的相关图与偏相关图。此功能可用来检查残差序列中是否存在自回归条件异方差(ARCH)。如果不存在自回归条件异方差,各期的自相关与偏相关系数都应该等于零,Q统计量没有显著性。
③Histogram-Normality Test(残差的直方图与分布正态性检验)功能用来画残差序列的分布图以及相关统计量的值,并检验残差序列的分布正态性。
检验正态分布性的JB(Jarque-Bera)统计量定义如下,
JB =
T?n2 1[S + (K – 3 )2 ] ? ? 2(2) , 64其中n表示原回归式中解释变量个数。S=
1T(yt?y)3?T?1t?1s3表示偏度,K=
1T(yt?y)4?T?1t?1s4表示
峭度。原假设与备择假设是
H0:变量服从正态分布; H1:变量不服从正态分布。
根据计算结果,
若JB ? ? 2? (2),接受该分布服从正态分布, 若JB ? ? 2? (2),拒绝该分布服从正态分布, 其中 ? 表示检验水平。
④Serial Correlation LM Test(序列相关LM检验)功能见自相关一章。
26
例:(file:AUTOCO6)天津市城镇居民人均消费与人均可支配收入的关系。
⑤ARCH LM Test(自回归条件异方差LM检验)功能用来检验残差序列是否为ARCH过程,所用统计量一个是F,一个是Obs*R-squared= T R2(LM统计量)。
例:(file:JPYEN, EQ01)
⑥White Heteroskedasticity(White异方差检验)用来检验残差序列是否存在异方差。 例:(file: Hete01)
(3)Stability Tests(模型稳定性检验)。
在回归估计结果窗口中点击View键,选择Stability Tests功能,会看到4种关于模型稳定性的检验方法。
①Chow Breakpoint Tests(邹突变点检验), ②Chow Forcast Tests(邹预测检验),
③Ramsey RESET Test(Ramsey模型设定误差检验),
④Recursive Estimates (OLS only)(递归估计(只适用于OLS估计))。 分别介绍如下:
① Chow Breakpoint Tests(邹突变点检验)
例:(file: Dummy5)中国对数的货币流通量(1952-1998)
27
② Chow Forcast Tests(邹预测检验) 例:见第1节。
③ Ramsey RESET Test(Ramsey模型设定误差检验)
RESET(Regression Specification Error Test)检验由Ramsey (1969)提出。可以检验如下3种情形。①丢失变量;②模型形式不正确;③解释变量与误差项相关。
模型设定误差包括丢失变量、模型形式不正确、解释变量与误差项相关、误差项存在自相
28
关、异方差、非正态性分布等。对模型
yt = ?0 +?1 xt + ut (43)
的设定误差检验是通过对新加入变量zt回归式
yt = ?0 +?1 xt +?2 zt + ut (44)
完成的。如果(43)式不存在设定误差,那么?2应该等于零。
对于模型形式的设定错误可以通过增添解释变量的高次幂实现。例如对(43)式可以检验下式中?2估计量的显著性。
yt = ?0 +?1 xt +?2 xt2 + ut (45) Ramsey建议用(43)式的拟合值的高次幂代替(45)式中的xt2。例如
?t2 +?3y?t3 + ut (45) yt = ?0 +?1 xt +?2 y原假设是
H0: ?2 = ?3 = 0
EViews输出结果给出的是关于检验约束条件是否成立的F和LR检验。判别规则是,
若F < F? (m, T - k),LR < ? 2? (m),约束条件成立,不存在设定误差。 若F ? F? (m, T - k),LR ? ? 2? (m),约束条件不成立,存在设定误差。 其中m表示约束条件个数。
例:(file: b1c1, EQ124)以1952-1993年中国宏观消费与国民收入(不变价格)模型为例,
29
因为F和LR 统计量都落在了临界值以外,模型存在设定误差。
④ Recursive Estimates (OLS only) (递归估计(只适用于OLS估计)) 递归估计可以考察6项内容。注意:递归分析只适用于OLS估计。
④1。递归残差(Recursive Residuals);
递归残差:设模型中含有k个被估参数,样本容量是T。用样本值区间为{1, …, k}的第1个子样本估计模型。然后按顺序每次增加一期样本值{1, …, k+i}, i = 1, 2, …, T- k进入子样本,估计模型,直至把样本范围扩大到{1, …, T-1}。用每次估计的模型预测被解释变量在样本外第一期的值,并计算残差(预测误差)。按上述顺序得到的残差(预测误差)序列(共含有T- k+1个残差值)称作递归残差序列。递归残差序列可用来评价模型预测能力的好坏。递归残差序列图除了给出递归残差序列外,还给出每个预测点正负两个标准误差的置信范围。如果残差点到了标准误差置信范围(红色虚线表示)以外,说明模型的回归参数不稳定。
例:(file: b1c1, EQ124)以1952-1993年中国宏观消费与国民收入数据(不变价格)得散点图如下:
30
正在阅读:
18模型设定与诊断检验11-09
水下吸泥清淤机项目可行性研究报告(发改立项备案+2013年最新案例范文)详细编制方案09-25
绿化工程施工组织设计06-03
《邓稼先传》读后感05-30
幼儿园社会教育领域活动教学策略11-22
湘阴风俗文化12-03
2017年上半年宁夏省泌尿科主治医师(放射科)考试试题04-07
晨雾作文350字06-19
爱公司演讲比赛方案04-23
关于大学生社团活动总结多篇06-02
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 诊断
- 模型
- 设定
- 检验
- 非银行金融机构非现场监管特色指标定义及计算公式一览表 - 图文
- 二0区翻煤笼丁字口扩修安全技术措施
- 串联电抗器如何选取电抗率
- 五年级数学下册《第八单元达标测试卷》(附答案)
- 普洱市人民政府关于印发普洱市“四好农村路”建设实施方案的通知
- 大中型水利水电工程移民安置前期工作管理暂行办法(水规计〔2010〕33号)
- 义乌市城西街道夏演村西站路延伸段旧村改造
- 语文五年级上册多音字
- 2017-2018学年高中生物每日一题有丝分裂过程中染色体、姐妹染色单体和DNA含量的变化新人教版必修1
- 还原问题1.9-1.16
- 34G互操作过程中脱网RAU重建fail问题
- 流失率方案
- 基于USB4716心电监测系统设计 - 图文
- 微生物学总论题-药物分析10
- 把公司当做自己的家
- 仁爱版八年级下英语期中知识点复习
- 广西2009年度中小学教师系列高级评委会评审通过人员名
- 农村党员、村民代表“底线管理”办法
- 《现代商贸工业》2016年第1期目录抢鲜看
- 八年级下册《诗经》两首(关雎,蒹葭)导学案 - 图文