计量经济学--时间序列数据分析

更新时间：2024-06-17 11:34:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

时间序列数据的计量分析方法

1.时间序列平稳性问题及处理方案

1.1序列平稳性的定义

从平稳时间序列中任取一个随机变量集，并把这个序列向前移动h个时期，那么其联合概率分布仍然保持不变。

平稳时间序列要求所有序列间任何相邻两项之间的相关关系有相同的性质。 1.2不平稳序列的后果

可能两个变量本身不存在关系而仅仅因为有相似的时间趋势而得出它有关系，也就是出现伪回归；破坏回归分析的假设条件，使得回归结果和各种检验结果不可信。

1.3平稳性检验方法：ADF检验 1.3.1ADF检验的假设：

?辅助回归方程：Yt????Yt?1??t????Yii?1t?i??t（是否有截距和时间趋势项

在做检验时要做选择）

原假设：H0：p=0,存在单位根

备择假设：H1：P<0，不存在单位根

结果识别方法：ADF Test Statistic 值小于显著性水平的临界值，或者P值小于显著性水平则拒绝原假设并得出结论：所检测序列不存在单位根，即序列是平稳序列。

1.3.2实例

对1978年2008年的中国GDP数据进行ADF检验，结果如表一。

表一 ADF检验结果

Augmented Dickey-Fuller test statistic t-Statistic Prob.* 3.063621 1 Test critical values: 1% level -3.699871 5% level -2.976263 10% level -2.62742 从结果可以看出，ADF的t统计量值大于10%显著性水平上的临界值，P值为１，接受原假设，说明所检测的GDP数据是不平稳序列。 1.4不平稳序列的处理方法 1.4.1方法

如果所要分析的数据是不平稳序列，可以对序列进行差分使其变成平稳序列，但是这样做的后果是使新得出的数据丧失了许多原序列的特征，我们能从数据中得到的信息会变少，通常差分的次数不能超过两次。

经验表明，存量数据是二阶单整，做二次差分可以使其平稳，流量数据是一阶单整，做一次差分可以使其平稳，增量数据通常就是平稳序列。 1.4.2实例

将上述GDP数据作二阶差分，然后进行ADF检验，结果见表二。

表二二阶差分数据ADF检验结果

Augmented Dickey-Fuller test statistic t-Statistic Prob.* -2.734775 0.0809 Test critical values: 1% level -3.689194 5% level -2.971853 10% level -2.625121 从结果中可以看出，ADF的t统计量小于10%显著性水平的临界值，P值为0.08，如果选择10%的显著性水平则可以认为序列是平稳序列。

说明：在单位根检验的EVIEWS软件界面上有多种检验平稳性的方法，如果选择ADF检验，还需要选择要检验的序列的形式，原序列、一阶差分序列或是二阶差分序列；还可以选择辅助回归函数的形式：只有截距项；有截距项和时间趋势项；没有截距项也没有时间趋势项。

如果对回归结果的残差进行ADF检验（不包含时间趋势和截距）可以确定回归方程的变量是否存在协整关系，或者确定模型的设定是否合理。单位根检验是为数不多的对时间序列数据和残差都适用的检验方法，其余的各种检验都是基于回归结果的残差进行的，虽然自相关性检验对变量可以检验，但通常没有什么意义。

2.异方差性问题及其解决方案

2.1 异方差的定义

对于不同的样本点，方差不再是一个固定的常数，而有些是互不相同的，则称模型存在异方差 2.2 异方差产生的原因

模型中缺少某些解释变量；测量误差。 2.3 异方差产生的后果

参数诂计量非有效；统计量失真；模型的预测失效。 2.4 异方差的检验， 2.4.1检验方法

图示检验法；Goldfeld-Quandt(戈德菲尔德-匡特)检验；Glejser（戈里瑟）检验；Park(帕克)检验；White（怀特）检验；Remark：

说明：怀特检验和戈德菲尔德-匡特检验要求样本数量比较大；图示检验和怀特检验只能检验出是否存在异方差，但不能给出异方差与解释变量的函数关系；帕克检验和戈里瑟检验可以给出异方差如何依赖具体的解释变量和具体的函数形式。

2.4.2 G-Q检验 a.检验假设 H0:σ1 =σ2, H1:σ1 ≠σ2；

结果识别方法：F远大于１为递增方差，F接近于１为同方差；若计算得到的F值小于所设显著性水平的临界值则认为总体不存在异方差；F值大于所设显著性

水平则认为存在递增异方差。 b.检验统计量 F＝RSS2/RSS1 C.步骤

将解释变量按升序或降序排列，去除中间的四分之一，对小数值的四分之一点五回归得SSR１，对大数量的四分之一点五回归得SSR2。

获得F统计量临界值用命令scalar f=@qfdist(0.95,10,10)（5%的显著性水平，两样本的容量都为12）。

说明：G-Q检验要求样本数量较大，并且不能知道异方差与解释变量的具体函数形式。只对解释变量排序，排序功能在工作文件的Procs里。

2.4.3White检验的假设回归方程：Yt??0??1X1t??2X2t??t

222辅助回归方程：ei?a0?a1X1t?a2X2t?a3X1t?a4X2t?a5X1tX2t?ui（是否包括交叉项在做检验时要做选择）

原假设：H0：不存在异方差（辅助回归方程除截距项外其余系数均为零）备择假设：H1：存在异方差

结果识别方法：White检验提供了三个统计量，三个统计量对应的P值大于所设定的显著性水平则说明不存在异方差，否则存在异方差。但是同时也要考虑辅助回归方程的有效性，需要通过回归结果的F统计量结果来帮助判断检验结果是否可信。

White检验的各个变量之间往往呈现多重共线性，因此我们关注的是方程的总体上是否显著（F统计量），而不关心某个单个变量是否显著（t统计量）。

White检验能回答是否存在异方差，但不能给出异方差的函数形式

White检验可以粗略认为通过所有解释变量的二阶泰勒级数展开逼近任何非线性函数，如果在White检验情况下没有发现异方差，方程存在异方差的可能性一般会很小，而Park检验和戈里瑟检验则不一定

2.4.2实例用模型gdpt?果如表三。

表三 White检验结果

Heteroskedasticity Test: White

F-statistic 33.72139 Prob. F(1,29) 0.0000 Obs*R-squared 16.66677 Prob. Chi-Square(1) 0.0000 Scaled explained SS 9.277265 Prob. Chi-Square(1) 0.0023 Variable Coefficient Std. Error t-Statistic Prob. C 37350022 13208734 2.827676 0.0084 XF^2 0.023261 0.004006 5.807012 0.0000

表三的上部分是White检验结果，共列出了三种统计量，用F统计量表示回

?0??1xft??t，进行OLS回归，对残差进行White检验，检验结

归方程系数同时为零的概率。F统讲量的P值很小，说明系数不太可能同时为0，则拒绝原假设，接受存在异方差的观点。表三的下部分是辅助回归方程的各种统计统数，其中各系数的t统计量很小，说明各系数不太可能为零，这与检验结果是一致的。所以检验结果可信。

2.4.3 Glejser戈里瑟检验 a.辅助回归方程

?abs(e)??abs(e)??abs(e)??abs(e)????Xj????2????Xj????

????Xj????????/Xj???b.方法

第一步，产生残差的绝对值序列

第二步，做最小二乘回归，尝试不同的函数形式，这依赖于散点图

第三步，用t统计量检验变量的显著性来判断是否存在异方差

结果识别方法：通过回归结果相关系数的t统计量来判断是否存在异方差，并可以知道方差存在的具体形式。

2.4.4 Park检验 a.辅助回归方程

ei??f(Xji)??XInei?In(?)?aInX22222ajievi2ji?vi;vi?i.i.d(0,?v)

b.检验假设 H 0:α =0

结果识别方法：回归结果的相关系数显著为0，则说明不存在异方差。说明：Park检验不存在异方差并不一定真正不存在异方差。 C．方法

第一步，获取回归方程的残差

第二步，以残差平方的对数为因变量，以比例因子为唯一的解释变量，建立辅助回归方程

第三步，采用t检验看是否存在异方差

说明：选择比例因子是Park检验的关键，也就是说可能有多个解释变量但只选其中的一个。怀特检验是广义的Park检验

可以构造权序列对原始方程进行加权，以1/X?j为权数，但这种方法不一

定能完全消除异方差，原因在于异方差可能还有其他解释变量有关

2.5异方差的解决方案

2.5.1 对数变换法

对各时间序列数据取对数，缩小解释变量的尺度从而缩小异方差的倍数。 2.5.2加权最小二乘法

对模型进行加权，使其成为一个不存在异方差性的模型，然后用普通最小二乘法进行估计。通常采用残差绝对值的倒数作为权数。

说明：进行加权最小二乘回归时首先进行普通最小二乘回归生成残差序列，然后新建残差变量，可命名为e1，然后最进加权最小二乘回归。

在EVIEWS软件的残差检验界面中提供了多种检验方法，如果选择了WHITE检验则需要选择辅助方程中是否包括交叉项，选择交叉项会由于解释变量太多而减少自由度，因此在多元回归中建议不选择包括交叉项。

3 序列相关问题及其解决方案

3.1 序列相关的定义

模型中的随机于扰项不相互独立，也就是模型回归后的残差序列存在着自相关。

3.2序列相关产生的原因及后果

原因：经济现象固有的惯性；模型设定偏误（漏掉了重要的解释变量或是模型数形式误设，如二次关系误设成只是一次关系）；数据处理的影响。

后果：参数估计无偏但估计量无效；预测功能失效。 3.3序列相关的检验 3.3.1D-W检验

这种检验的结果在一般的回归结果中都直接给出，识别方法是，如果其值为2或接近于2则说明不存在序列相关。

D-W检验存在的问题：只能检难残差的一阶自相关；模型中要有截距项；模型右边不能含滞后项；无数据缺失。 3.3.2 相关图、Q统计量检验

主要用于确定ARMA模型的具体形式及滞后阶数。 3.3.3BG(L-M)检验 3.3.3.1L-M检验的假设

kp辅助回归方程：

Yt??0???iXit???j?t?j??t

i?1j?1原假设：H0：?i?0（直到?阶滞后不存在序列相关，?为预先定义好的整数。）备择假设：H1：存在?i?0（存在自相关）

识别方法：L-M检验结果的F统计量的P值大于设定的显著性小平则接受原假设，接受不存在序列相关；从一阶开始不断调整检验阶数，并通过辅助回归函数系数的t统计量确定存在几阶自相关。 3.3.3.2 实例

用模型gdpt?果如表四。

?0??1xft??t，进行OLS回归，对残差进行L-M检验，检验结

表四序列相关检验结果

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 119.3309 Prob. F(3,26) 0.0000

Prob.

28.901

Obs*R-squared Chi-Square(3) 0.0000 Variable Coefficient Std. Error t-Statistic Prob. C -78.72442 757.602 -0.103913 0.9180 XF 0.008915 0.024426 0.364963 0.7181 RESID(-1) 1.497125 0.195276 7.666701 0.0000 RESID(-2) -0.439763 0.349507 -1.258238 0.2195 RESID(-3) -0.151719 0.249972 -0.606943 0.5492

表四上部所示，F统计量的值近似为零，说明辅助回函数的系数在1%的显著平拒绝原假设，接受存在序列相关的假设。

表下部是辅助回归函数的相关统计量，其中相关系数的t统计值可帮助确定存在几阶滞后相关。表四中确定不存在三阶滞后相关，存在一阶滞后相关，对于是否存在二阶滞后相关要将LM检验设定为二阶来做判断。实际上自相关性检验是从一阶开始，而不是直接检难三阶自相关。 3.4序列相关的处理方案：

最常用的方法是广义最小二乘法（GLS: Generalized least squares）

一阶差分法（First-Order Difference)

广义差分法(Generalized Difference)( ARMA模型)

修正标准误方法（HAC）(可以在OLS回归中直接实现) 3.4.1用自相关和偏自相关系数来识别AR或者是MA模型

MA(q)的识别：MA(q)的自相关系数的q步以后是截尾的；MA(q)的偏自相关系数呈现出某种衰减的形式是拖尾的；可以通过识别一个序列的偏自相关系数的拖特征，大致确定模型是否服从MA(q)过程。

AR(p)的识别：AR(p)模型的自相关系数会呈现出某种形式的衰减；可以通过识别模型的偏自相关系数的个数，来确定AR(p)模型的阶数p。（也可以通过模型的LM检验来确定滞后的阶数） 3.4.2实例

用模型gdpt??0??1xft??t，进行OLS回归，对残差进行自相关性检验。结果显示，残差的自相关性呈现拖尾，偏自相关系数呈现一阶截尾。我们可以初步判断模型应为AR(1)模型。但是通过残差的LM检难显示为二阶序列相关，因此我们将模型定义为AR(2) 。修正后的回归结果如表五。

表五修正序列相关的AR模型的回归结果

Method: Least Squares Coefficient-Statisti

Variable t Std. Error c Prob.

C XF AR(1)

-2633.2890 2.4631 1.9346

6911.2710 0.2272 0.2224

-1.0231 0.2535

AR(2) R-squared 0.999511 F-statistic Adjusted Prob(F-statisticR-squared 0.999452 ) 0.0000 Durbin-Watson stat 2.153095 上表中的相关系数都通过了t检验，并且DW值为2.15，可以认为模型不存在一阶自相关。实际上，此时对残差进行LM检验应就不存在序列相关。

说明：标准误经过HAC修正后，DW统计量失效；与HC修正后，White检验失效具有异曲同工之处。

0.7064 0.000

10.8403

0 0.000

8.6971

0 0.000

-4.0357

17033.39 -0.3810

4. 多重共线性问题及解决方案

4.1 多重共线性的定义

如果两个或多个解释变量之间出现了较强的近拟相关性并且是线性相关性则称为多重共线性。

4.2 多重共线性出现的原因

经济变量之间内在着内在联系；经济变量在时间上有相关的共同趋势;解释变量中含有滞后项。 4.3 多重共线性的影响

参数估计值不稳定，方差很大；回归系数的符号有误，经济含义不合理；变量的显著性检验失去意义。 4.4 多重共线性的诊断

R方值很大，t值较小（P很大）；理论性强，检验值弱；新引入变量后方差增大；

4.5 多重共线性的解决方案

先验信息法：根据经济理论或其它研究提前确定模型参数之的关系；用相对数代替决定数；删去模型中次要的或可替代的解释变量；差分法；增大样本容量；逐步回归法。

4时间序列的计量经济分析

4.1多元回归分析 4.1.1数据来源

本文从《中国统计年鉴》2009 及2001中获得了从1978年至2008年的中国宏观经济数据，包括消费、投资、政府购买、进口、出口，并以此为根据计算出了国民生产总值。

4.1.2分析模型

a.为了分析消费、投资与政府购买对国内生产总值的影响，构构建了如下模型：

lggdpt??0??1lgxft??2lgit??3loggt??t

b.将上述模型中的数据进行单位根检验，结果显示所有数据均为二阶单整。此刻应该对数据进行处理使其变为平稳序列，通常的方法是做差分，做二阶差分可以做数据变为平稳序列，但是这样数据会失去对于经济现象的解释能力。在这里暂不做处理。

c.模型回归后结果进行自相关性检验，发现残差存在着二阶滞后相关，进一步检验显示残差的自相关性呈现一阶截尾，偏自相关系数呈现二阶尾。因此为修正模型存在的自相关性，用ARMA(2,1)模型。

d.lggdpt??0??1lgxft??2lgit??3loggt?[ar(1)??4,ma(1)??5,ar(2)??6]??t进行线性回归。回归结果见表六。

e.对上述回归结果进行异方差性检验、序列相关性检验并对残差进行单位根检验。结果见表七、表八和表九。

表六 ARMA(2,1)模型回归结果 Method: Least Squares

Std.

Variable Coefficient Error t-Statistic Prob. C 1.190058 0.082989 14.33987 0.0000 LOGXF 0.317094 0.043349 7.314991 0.0000 LOGI 0.414209 0.035709 11.59955 0.0000 LOGG 0.267179 0.065803 4.06027 0.0005 AR(1) 1.385592 0.110758 12.51004 0.0000 AR(2) -0.93242 0.117263 -7.951531 0.0000 MA(1) -0.999913 0.119961 -8.335315 0.0000 R-squared 0.999926 Adjusted R-squared 0.999906 F-statistic 49709.31 Durbin-Watson stat 2.337958 Prob(F-statistic) 0.0000

结果显示，模型中各变量的系数通过了t检验，但是拟合较高，说明模型中变量存在线性相关。

表七 ARMA(2,1)模型回归的异方差检验结果 Heteroskedasticity Test: White

F-statistic 1.44882 Prob. F(7,21) 0.2389

Prob.

Obs*R-squared 9.444254 Chi-Square(7) 0.2223 Scaled explained Prob. SS 3.676272 Chi-Square(7) 0.8162

Std.

Variable Coefficient Error t-Statistic Prob. C 0.024483 0.035803 0.683823 0.5016

GRADF_01^2 4.10E-05 4.19E-05 0.976626 0.3399 GRADF_02^2 -2.44E-06 2.43E-06 -1.00031 0.3285 GRADF_03^2 -2.85E-06 3.02E-06 -0.94617 0.3548 GRADF_04^2 5.97E-06 3.95E-06 1.510542 0.1458 GRADF_05^2 0.006783 0.026155 0.259321 0.7979 GRADF_06^2 0.016332 0.014781 1.104939 0.2817 GRADF_07^2 -3.84E-05 5.61E-05 -0.68348 0.5018 R-squared 0.325664 Durbin-Watson stat 2.000288 Adjusted R-squared 0.100885 Prob(F-statistic) 0.238901

表七分为三个部分，上部分为异方差检验的三种统计量，结果大于10%的显著性水平，因此接受原假设不存在异方差。表的中部为辅助回归方程的系数，t统计量的p值大于10%的显著性水平，接受回归系数均为零的原假设，这些统计值可以帮助判断White检验统计量的可信度。表的下部为辅助回归方程回归结果的统计量，可以判断辅助回归结果的有效性，并帮助判断White检验统计量的可信度。通常辅助加归方程有效性高，White检验统计量的可信度才高。

表八 ARMA(2,1)模型回归的自相关性检验结果 Breusch-Godfrey Serial Correlation LM Test

F-statistic 1.664913 Prob. F(1,21) 0.211

Prob.

Obs*R-squared 2.050869 Chi-Square(1) 0.1521

Std.

Variable Coefficient Error t-Statistic Prob. C -0.03999 0.08959 -0.446356 0.6599 LOGXF 0.023911 0.04746 0.503815 0.6196 LOGI -0.00531 0.039672 -0.133752 0.8949 LOGG -0.01675 0.070903 -0.236232 0.8155 AR(1) 0.02948 0.118002 0.24983 0.8051 AR(2) -0.0339 0.121122 -0.279871 0.7823 MA(1) -0.00028 0.000379 -0.740892 0.467 RESID(-1) -0.25905 0.259587 -0.997922 0.3297 R-squared 0.07072 Durbin-Watson stat 2.110225 Adjusted

Prob(F-statistic)

R-squared -0.23904 0.973851

如上表所示，由于经过进行了自相关性的修正，因此只检验了回归结果的一阶滞后相关。上表分为三部分，上部分为LM检验的三个统计值，结果的p值大于10%的显著性水平，因此接受在滞后p阶内不存在自相关的原假设，表的中部和下部分别为辅助回归方程的系数的相关统计量，可以判断辅助回归方程回归结果的有效性，进而帮助判断LM检验结果的可信度。

表九 ARMA(2,1)模型回归残差的单位根检验结果 Augmented Dickey-Fuller test statistic

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.266203 0.0000 Test critical values: 1% level -2.650145 5% level -1.953381 10% level -1.609798

Std.

Variable Coefficient Error t-Statistic Prob. E11(-1) -1.177009 0.187834 -6.266203 0.0000 R-squared 0.592447 Durbin-Watson stat 2.061427 Adjusted R-squared 0.592447

上表第一部分是ADF检验结果，结果P值为0，说明原假设存在单位根不能接受，所检验的残差序列不存在单位根。表的中部和下部是辅助回归方程的相关统计量，协助判断ADF统计结果的可信度。

综上所述，所建立的ARMA(2,1)模型通过了异方差、序列相关检验，并且残差序列平稳，虽然模型中各变量是I(2)序列，但是回归结果依然是有效的。因为如果经济变量是不平稳的，但是如果它们存在长期的稳定关系，即它们之间是协整的，则可以使用经典的回归分析方法建立回归模型。

说明：线性回模性在建模时所要注意的题问有序列的平稳性、异方差性、序列相关以及多重共线性，但是异方差性可以通过加权最小二乘法修正，序列相关可以用ARMA模型修正，因此回归最大的问题仅仅是序列的平稳性，以及多重共线性问题。上述例子中，为了保持对经济现象的解释能力并没有对序列进行差分使其变成平稳序列，而是希望序列本身存在协整关系而解决这个问题。

4.2 联立方误模型 4.2.1定义

联立方程模型用以描述相互影响的经济现象或经济系统，充分反映变量间相互依赖、相互交错的因果关系，揭示经济系统中各部分、各因素之间的数量关系和系统的数量特征，对经济系统进行预测、分析和评价。 4.2,2诂计方法

普通最小二乘法；间接最小二乘法；二阶段最小二乘法 4.2.3实例

用改进的乘数加速数模型研究政府构买与出口与国民生产总值之间的关系，数据采用从《中国统计年鉴》2009 及2001中获得了从1978年至2008年的中国宏观经济数据，包括消费、投资、政府购买、进口、出口，并以此为根据计算出了国民生产总值。 4.2.4模型

?Yt?Ct?It?Gt?Xt?Mt????Ct??Yt?1?2???(Gt?Xt)/Yt?2?p?(??????)p??? ?It??(Ct?Ct?1)????Mt??Yt?1?上式中Y、C、I、G、X、M分别表示国内生产总值、消费、投资、政府购买、出口和进口，

t代表时间，p代表t?1期的国内生产总值增长率。

4.2.5 估计方程

?Yt?Ct?It?Gt?Xt?Mt????Ct??0??1Yt?1?u1t??? It????(Ct?Ct?1)?u012t???Mt??0??Yt?1?u?13t??这里把政府购买和出口当做外生变量，需要估计参数a、?和?。

采用二阶段最小二乘回归法，结果如表十。

表十联立方程模型回归结果

C(1) C(2) C(3) C(4) C(5) C(6)

Estimation Method: Two-Stage Least Squares

Coefficient Std. Error t-Statistic Prob. 3802.4030 856.5173 4.4394 NA 0.3727 0.0080 46.5594 0.0000 -5584.8810 3331.0090 -1.6766 0.0973 9.4571 0.6698 14.1200 0.0000 -3475.7900 1230.0020 -2.8258 0.0059 0.3277 0.0133 24.6029 0.0000

得出结论：(Gt?Xt)/Yt?2?p2?3.572p?3.527

参考文献：

[1].杜江.计量经济学及其应用[M].机械工业出版社，2010(3).

[2].高铁梅.计量经济分析方法与建模[M].清华大学出版社，2009(5).

上式中Y、C、I、G、X、M分别表示国内生产总值、消费、投资、政府购买、出口和进口，

t代表时间，p代表t?1期的国内生产总值增长率。

4.2.5 估计方程

?Yt?Ct?It?Gt?Xt?Mt????Ct??0??1Yt?1?u1t??? It????(Ct?Ct?1)?u012t???Mt??0??Yt?1?u?13t??这里把政府购买和出口当做外生变量，需要估计参数a、?和?。

采用二阶段最小二乘回归法，结果如表十。

表十联立方程模型回归结果

C(1) C(2) C(3) C(4) C(5) C(6)

Estimation Method: Two-Stage Least Squares