时间序列分析讲义(3)

更新时间:2023-10-22 21:30:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第四次作业

第1题 已知某地区每年常驻人口数量近似服从MA (3) 模型(单位:万人)

Yt?100??t?0.8?t?1?0.6?t?2?0.2?t?3,?t~iidN?0,25?。

2002—2004 年的常驻人口数量及1步预测数量下表。 年份 2002 2003 2004 常驻人口数量 104 108 105 预测的常驻人口数量 110 100 109 (1)计算此模型的均值函数E?Yt?和自相关函数??k?。(2)预测未来5年该地区常驻人口数量的95%的置信区间。

第2题 一个销售序列的拟合ARIMA (1, 1, 0)模型为

(1?0.43B)(1?B)Zt?at,at~IIDN(0,2)。

已知观测值Z49?33.4,Z50?33.9。计算Z51,Z52,Z53的预报值,以及它们的90%置信的预报区间。

第3题 基于样本y1,y2,?,y100估计模型(c2),得到

Y?13.26?0.188t?0.9013Y?utt?1t. (7.214)(0.1543)(0.0698)在通常的检验水平上(

??10%,5%,1%)检验该模型是否存在单位根。

◆ 自回归求和移动平均(ARIMA)过程的预测

(实际问题中常用到的补充内容,教材没有。期末必考一题)

回忆在教材的第二章第二节我们学习过ARIMA(p,d,q)过程。 定义 设d?1为整数。对时间序列X,t?Z,如果它的d次向后 差分序列Y:?(1?L)dX是因果平稳的ARMA(p,q)过程,则称X是

?t?tt?t?ARIMA(p,d,q)过程,即满足模型

??(L)X??(L)(1?L)dX????(L)uu~WN(0,?2)。

tt0ttp其中?(x)?1??x????x?0的p个根都在单位圆|z|?1以外,并且

1pq?(x)?0与?(x)?1??1x????qx?0没有公共根。

由于方程??(x)??(x)(1?x)d?0有d重单位根x?1位于单位圆

|z|?1上,称Xt是单位根过程,它必然不能是平稳的(既不是因果平

稳的,也不是非因果平稳的)。而ARIMA(p,d,q)过程存在是否可逆的问题。回忆时间序列可逆性的定义。

??定义 称(可以是平稳的或非平稳的)时间序列X,t?Z是可逆

?的,如果存在数列?,j?0满足?|?|??以及常数?,使得

jjj?0?u?????X(m.s) tjt?jj?0是白噪声WN(0,?2)。

可逆性是与因果平稳性没有关联的性质。由于以上ARIMA(p,d,q)

???t?过程可以看作是ARMA(p+d,q)过程

??(L)X????(L)ut0t程的可逆性。

u~WN(0,?2),

t因此可以通过ARMA过程可逆性的判定定理去判别ARIMA(p,d,q)过

补充推论 以上ARIMA(p,d,q)过程X是可逆的,当且仅当方程

?t?q?(x)?1??x????x?0的q个根都在单位圆|z|?1以外。此时X1qt有唯一的逆转形式

????u????(L)X?????X(m.s.),

ttjt?jj?0??j?0?0?其中???,?(x)???x满足???1和??j0q?(1)j?01???jj?1?(x)?(x)(1?x)d????唯一确定。 ??|?j|??,由?(x)??(x)?(x)j?0d??(1)(1?1)还注意到由于??(1)??????0,且???1,因此有

0j?(1)j?0?????1。

?????j0j?1注解 设f(t)是至多d?1次确定性的(非随机的)多项式。则对以上ARIMA(p,d,q)过程X,有

?t??(L)(1?L)d[X?f(t)]??(L)[(1?L)dX?(1?L)df(t)]tt,

??(L)(1?L)dX????(L)ut0t因为(1?L)df(t)?0。例如,(1?L)3[???t??t2]?0。所以,

012ARIMA(p,d,q)过程可以表示带有确定性多项式趋势的序列,X不能

t被?(L)(1?L)dX????(L)u唯一确定。

t0t注解 对ARIMA(p,d,q)过程X的建模可以先对它进行d次差分,

t然后对差分序列Y:?(1?L)dX建立因果平稳的ARMA(p,q)过程,经

tt????过初步识别、参数估计、用信息准则定阶、诊断式检验的完整步骤。

现在我们开始讨论ARIMA(p,d,q)过程的预测问题。设有ARIMA(p,d,q)过程X满足模型

?t?u~IID(0,?2)

tp(加强为独立同分布的白噪声)。其中?(x)?1??x????x?0与

1pq?(x)?1??x????x?0的根都在单位圆|z|?1以外,且没有公共根。

1q则以上补充推论说X是可逆的,并且有唯一的逆转形式(见推论中形式)。由逆转形式可以看出:对1?t??,如果给定了X,X??(L)X??(L)(1?L)dX????(L)utt0t?t?t,?(到t?1无穷远过去)的值,则也给定了u,u,?(到无穷远过去)的值。tt?1但是反之不然,因为序列

?Xt?不

能被模型

?(L)(1?L)dX????(L)u唯一确定。当时间原点在t时,记条件期

t0t望

?。 E(?):?E??X,X,?(到无穷远过去)tt?1??t?? 我们首先介绍ARIMA(p,d,q)过程的递推预测方法。记

??(x)??(x)(1?x)d?(1??x????xp)(1?x)d1p

?1???x?????xp?d1p?d为p?d次多项式。将原模型

??(L)X??(L)(1?L)dX????(L)u

tt0t改写为

X?????X????X?u??u????ut01t?1p?dt?p?dt1t?1qt?q。

设时间原点在1?t??。对任何l?1,在

?????X????Xt?l01t?l?1p?dt?l?p?d

?u??u????ut?l1t?l?1qt?l?q式中各项取条件期望E(?),并利用u的独立性而得到提前l期的最小

ttX均方误差“近似预测”的递推公式

y?y,y,?,y~N(?y,?2)2?t?T,

01t?1tt?1且 yy?0~N(0,?2)10

所以得到条件的似然函数

L(?,?2;y,?,yy?0)?f(yy,?,y;?,?2)T?11T0T1?f(yy,y,?,y;?,?2)?f(yy?0;?,?2),

T?112T?210?T2??1T??22????2???exp???(yt??yt?1)?2????2?t?1???lnL(?,?2)?lnL(?,?2)2?0,其中y?0。解,得到?,?的条件?00????2最大似然估计

T?yt?1ytT2?1?y)2(其中y?0)??T?(y????t?2 ?, ?。

tt?10T2t?1y?t?1t?2-----------------------------------------------------------------------------------------------------------------------------------------

2?,?我们以Y?0为条件,使用最小二乘法估计。那就是要最小

0化条件的误差平方和函数

T2TS(?)??u??(y??y)2。

ttt?1t?2t?2dS(?)?0,得到?的最小二乘估计 解

d?T?yt?1yt?相等)??t?2 ? (与条件的最大似然估计?。

T2?yt?1t?2然后取?2的最小二乘估计

S(?)1T2。 2???(y??y)?tt?1自由度T?2t?2

◆ 复习线性统计模型及其最小二乘估计

设有线性模型Y?Xβ?e,其中

?y??1?Y????为观察值向量,已知的非随机的设计矩阵 n?1??y?n?????1?????为未知参数向量, (n?m)列满秩, βX??x???m?1?n?m?ij??????m??e??1?2?为随机误差向量。则β的最小二乘估计使

e????~IID?0,???n?1????e?n?得误差平方和

e2?Y?Xβ2?(Y?Xβ)T(Y?Xβ)

最小化,它由

??(XTX)?1XTY β给出,它具有性质:

?)?β; (1) 无偏性E(β?,β?)??2(XTX)?1; (2) 协方差阵cov(β2SSE2???(3)?,SSE?Y?Xβ为残差平方和;

n?m?~N(β,?2(XTX)?1), (4)若进一步有e~N(0,?2I),则βn?1n?与SSE相互独立。 SSE?2~?2(n?m),并且β想要检验H0:?:?αTβ??0对双边备择假设H1:αβ??0,其中

Tα?(?1,?,?m)T和实数?已知。构造T统计量 0T?????0????????SSE?20?0?n?mSSE22d2??d, n?m?2d2????0?)?ar(?V??:?αTβ?, 其中??)??2αT(XTX)?1α:??2d2, Var(??):???ar(??2d2。 V当H0为真时,T~t(n?m)。如果|T|?t?2(n?m),则在检验水平?上拒

绝H0,而接受H1。

我们现在继续讨论AR(1)过程的单位根检验。回忆前面得出了?的 (条件的)最小二乘估计。现在用线性模型的架构表述估计过程。我们的线性模型为

Y??Y?u

TT?1T?y??y?2???1?其中Y????为观察值向量,Y????为随机向量的设计矩

T??T?1??yy?T??T?1??u??2?阵,?为单个未知参数,u????为随机误差向量。?的最小二乘估

T???u??T?计使得误差平方和

uT2T?Y??Y??(y??y)2:?S(?)

TT?1tt?1t?22最小化,它等于

T?yt?1yt??(YTY。 ?)?1YTY?t?2T?1T?1T?1TT2?yt?1t?2根据一般线性统计模型的理论,检验H0:??1 的T比值统计量定义为

?????1??ar(??)V???1??2d2?,

其中

?T2?2T?1d?(YY)???y?T?1T?1t?1???t?2??1,

TSSE2?1?y)2。 ????(T?2)?(y??tt?1(T?1)?1t?21?1(教材第90页最后一行中的写错了,原著中为(T?2))。

T?1?y??1?但是,由于现在的设计矩阵Y????是随机向量的,不是确定

T?1??y?T?1?性的,所以当H0:??1为真时,统计量??并不精确地服从t(T?2)分布,

它的渐近分布由以下定理给出。

补充定理1 当对模型(a)的H0:??1为真时,则有

1?2?W(1)?1?d??T??。 ??1)?2?(1)T(?1W2(r)dr?01?2d?W(1)?1?????2?(2)?1W2(r)dr?0T??。

(教材第91页(3.11b)式中极限分布写错了)。

W(r),r?0,W(0)?0?是标准的布朗运动(或称维纳过程)其中?。

??1)和??的分布、以及它们的渐近分布都定理1(1)-(2)中T(???1)和??的是非标准分布。Dickey用Monte-Carlo 模拟方法计算了T(?

Y?0.164?0.9247Y?u,t?1,2,?tt?1t, (0.037)?ar(???0.9247的标准差,即V?)?0.037。目(0.037)表示估计???的是检验

H:??1同时??0 对 H:??1。

001?统计量进行检验,其样本值为????0.9247?1??2.035。对我们用??0.037?的累积分布的临样本数T?100,在下尾概率0.1,0.05,0.01上,??????2.035界值分别是-2.58,-2.89,-3.51,见教材附表2情况二。由于?比这三个临界值都大,所以在检验水平??10%,5%,1%上都不能拒绝零假设H:??1同时??0。从而强烈地认为Y是不带漂移的随机游

00t走。

第三种情况。考虑有线性趋势的模型 Y?(???t)?X,t01t其中Y?0,而X是AR(1)过程

0tt?1,2,?, (模型(c1))

X??X?u,t?1,2,?,u~IIDN(0,?2)。

ttt?1t为了便于估计模型参数,我们把单位根分离出来作为一个系数,把模

型改写为

Y????t??Yt0?u,t?1t(模型(c2)) t?1,2,?。

事实上,

Y????t??X?ut01t?1t????t??[Y????(t?1)]?u01t?101t。 ?[?(1??)???]??(1??)t??Y?u011t?1t:????t??Y?u0t?1t给定样本y,y,?,y。我们对模型(c2) 检验

12T零假设 H:??1同时??0

0对 备择假设H:??1同时??0

1,1或对 备择假设H1,2:??1。

:??1为真时,(X1,10t0t是因果平稳零均值的AR(1)过程),模型(c1) 表明Y是趋势平稳过程。

t当H为真时, Y是带漂移项?的随机游走。当H当H:??1为真时,Y是线性趋势(???t)与爆炸性非平稳过程Xt1,201t的叠加。

注解 有相当一部分国内甚至国外教材,包括王黎明的教材,对DF检验的第三种情况只是说零假设为H:??1,而没有特别强调

H:??1同时??0, 这不够准确,未能理解Dickey和Fuller的原

0文中的本意。“距离线性趋势的平稳偏差构成的模型是具有漂移的随机游走的一个自然的替代物(alternative) (Dickey and Fuller (1986)”。我们使用的张世英的教材第91页中讲述的是正确的。

0我们用线性模型的架构和最小二乘法估计模型(c2),得到?的估计

?。详细过程比前两种情况更复杂,从略。定义T比值统计量为 量????1??????,

?ar(??)V?我们用下标?标记第三种情况。

补充定理3 当H:??1同时??0 为真时,(而我们错误地估计

0了模型(c2)),则有

d(T?2H)(T?6K)?1??1)?(1) T(?T?? ?2(G?H2?3K2)d(T?2H)(T?6K)?1??(2)?T??, ?2G?H2?3K2其中

1W2(r)dr,T?W(1),H?1W(r)dr,G??0?0,

1rW(r)dr?1W(r)dr.K?2?0?0W(r),r?0,W(0)?0?是标准的布朗运动(或称维纳过程)而?。

??1)和??的分布、以及它们的渐同样,定理3(1)-(2)中T(???近分布都是非标准分布。Dickey用Monte-Carlo 模拟方法计算了

??1)和??的经验累积分布的临界值,见教材后附表1和附表2中T(???的情况三。表中样本容量T??意指定理3(1)-(2)中的两个含布朗

运动的渐近分布的临界值。

例4 不解答了。作为第四次作业的第3题。

基于样本y,y,?,y12100Y?13.26?0.188t?0.9013Y?utt?1t. (7.214)(0.1543)(0.0698)估计模型(c2),得到

在通常的检验水平上(??10%,5%,1%)检验该模型是否存在单位根。

注解* (1)对第二种情况,如果确实知道在模型(b)中??0,当

?和检验统计量??H:??1为真时,我们估计了模型(b),则估计量???0分别具有正常的渐近正态分布和渐近学生氏-t分布,而不是定理2(1)

-(2)中给出的非标准分布。比如有

01???0??2??。 12???0??3??(2) 类似地,如果确实知道在模型(c)中??0,当H:??1同时??0

0?和检验统计量??分别具有为真时,我们估计了模型(c),则估计量?????)?d??T(?1??0????002????32???N??0?,??1(??1)???T????0?????2???正常的渐近正态分布和渐近学生氏-t分布,而不是定理3(1)-(2)中给出的非标准分布。

例5 (魏武雄《时间序列分析》例9-2) 基于样本y,y,?,y12114估计模型(b),得到

Y?125.34?0.9143Y?utt?1t (51.46)(0.0358)125.34?0?2.43?1.96?Z0.025,在水平5%上拒绝常数项??0。由于

051.46?统计量检验单位根。 这例子应属于祝捷(1)中情况,不能用??但是魏武雄却做错了!我个人认为。

0.9143?1??????2.394。对最接近的样本数T?100,在下尾概率0.1,

0.0358?的累积分布的临界值分别是-2.58,-2.89,-3.51。由0.05,0.01上,??????2.394比这三个临界值都大,所以在检验水平??10%,5%,于?1%上都不能拒绝零假设H:??1同时??0。从而强烈地认为Y是不

00t带漂移的随机游走。

本文来源:https://www.bwwdw.com/article/zy3f.html

Top