用博克斯—詹金斯模型研究中国农业总产值

更新时间:2023-07-25 07:23:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

用博克斯—詹金斯模型研究中国农业总产值

一、方法介绍

(一)基本思路

博克斯—詹金斯模型Box-Jenkins方法是在定性分析的基础上,按照一定的数学理论建立各因素的综合模型。主要包括自回归模型(简称AR模型)、滑动平均模型(简称MA模型),自回归滑动平均模型(简称ARMA模型)。

(二)博克斯—詹金斯模型形式

博克斯—詹金斯模型具体有以下几种形式: 1.自回归模型(简称AR模型) 设p阶自回归模型记为AR(p)

xt 1xt 1 2xt 2 pxt p t

p

为当前值与过去相关数据的时期跨

度。p

1时,上式即为xt 1xt 1 t, t为一系列零均值的相互独立的正态随

机变量,xt为平稳随机序列。

2.滑动平均模型(简称MA模型)

滑动平均法是假定时间序列任一期的值是它以前各期的加权平均,而以前各期的权重是按指数递减的。加权平均是线性组合的一种形式。q阶移动平均模型MA(q):xt

t 1 t 1 2 t 2 q t q

q

q 1时,一阶移动平均模型

MA(1):xt

t 1 t 1。若 i

2

i 1

,则过

程平稳。

3.自回归滑动平均模型(简称ARMA模型)

ARMA模型方程为:

xt 1xt 1 2xt 2 pxt p t 1 t 1 q t q

(1)ARMA模型的前提假设(条件):建立模型的时间序列是由一个零均值的平稳随机过程产生的。即平稳随机过程的统计特征不随时间的移动而变化,在图像上表现为所有的样本曲线皆在某一水平线上随机波动。

(2)ARMA模型依据的基本思想:几乎所有的时间序列按时间顺序排列的观察值之间都具有依赖关系或自相关性。这种自相关性如果被定量描述出来,就可以从序列的过去值预测其未来值。

当一个时间序列中xt与xt 1具有线性关系时,可以用线性回归方程表示他们之间的相关性,即一个序列内部的自相关性。xt

1xt 1 t

,该式一般称为一

阶自回归模型,记作AR(1)。式中 1可用最小二乘法求出, t为残差项,它要满足假设条件,即残差项序列各项之间应相互独立,即 t与 t 1, , 2等无关。如果 t的独立性通不过检验,可把 t分解成两部分,一部分依赖于 t 1,可用

1 t 1

表示,另一部分可分解余下的残差,用 t表示, t t 1 t 1,因此,

1xt 1 t 1 t 1。

一阶自回归移动平均的ARMA(1,1)模型可以表示为:xt

(三)博克斯—詹金斯模型的识别与估计

该模型的识别是根据样本自相关函数及样本偏相关函数的形态来判断模型的类别。

1.自相关函数

自相关是时间序列x1,x2, ,xt诸项之间的简单相关,其大小用自相关系数度量。自相关系数是不同滞后期或时滞值之间的相关,其计算公式为:

k

cov(xt,xt k)

t

(x (x

x1,t T

t

t

t)(xt k t k)

2

t k

t)

(x

t k

t k)

2

对于平稳时间序列而言,两个不同时期的变量之间的相关系数,与具体期数无关。即如果{

k

covx(t,xt k)

}是一平稳过程,则有 t

t k

,因此有

r(k)r(0)

2t

,

其中r(k)

cov(xt,xt k)为协方差函数,r(0) cov(xt,xt)

2t

。自相关函数揭

示了{x1,t T}的相邻数据之间存在多大程度的相关。

如果对于所有的k

0

,序列的自相关函数等于或近似等于零,则说明序列

的当前值与过去时期的观测值无关,这时该序列没有可预测性。如果时间序列是自相关的,就意味着当前回报依赖于历史信息,因此可通过历史信息来预测未来回报。当自相关系数随着k的增大迅速向零逼近时,表明该序列平稳;反之,自相关系数不随k值增大而迅速向零逼近,并以较大的数值延续多个时期,表明该序列属于非平稳序列。

2.偏自相关函数

偏自相关是时间序列 xt ,在给定了xt 1,xt 2 ,xt k 1的条件下,x1与xt k之间的条件相关,它用以测量当其他滞后期1,2,…,k

1的时间序列的作用在

已知条件下,x1与xt k之间的相关程度。由于它需要考虑排除其他滞后期的效应,因而被称作偏子相关,其相关程度用自相关系数 kk度量, 1 kk 1,当k

k 1

1。

1

k

kk

j 1k 1

(k 1,j)

k j

1

当k=2,3,…

(k 1,j)

j 1

j

kk (k 1,j) kk (k 1,k j) (j 1,2 ,k

3.AR模型的参数估计

AR模型的一个重要特性是样本序列xt自相关函数具有逆推的性质,即

p

rk

j 1

pj

X

k j

(k

0

),取方程组中k

1~p

,则p个方程写成矩阵形式。

r1 r0 rr 2 1 rp rp 1

r1r0 rp 2

rp 1

r

p 2

r

0

p2 pp

p1

,即为Yule-Walker方程,其中系数矩阵为Toeplitz

相关矩阵。

k应用估计值r

k r

1T

T k

t 1

xtxt k,k 0,1,2,3

,则

p2 pp

p1

r0

r1= rp 1

r1r0 rp 2

rp 1

r

p 2

r

0

1

r1

r 2 rp

AR(p)模型残差序列{ t}的方差估计值 2为:

p

p1xt 1 p2xt 2 ppxt p) E(xt

22

0 r

j 1

pj

j r

p

综合上述结果可得:r0

j 1

pj

(p) rj

p

4.MA模型参数估计 对于MA(q)模型,xt

本的自相关函数应满足: 2(1 12

k r

rk

j 1

pj

rk j 0,k 1,2 ,p

t 1 t 1 q t q

,设{ t}为白噪声,则求样

2 q)

2

2

(k

0)

1 k 1 q k q)

2( k

(1 k q)

用线性迭代即可求出参数 1, 2, , q和 2。

5.ARMA模型参数估计

第一步:设模型p,q已确定,从样本序列的自相关系数序列{rk}出发, rq 1 rq 2

1rq 2rq 1 prq p 1 1rq 2rq 1 prq p 2

rq p

1rq p 1 2rq p 2 prq

1, 2, , p。 由样本数据求出rk后,代入上述方程组即可求出

xt第二步:令~x) 为:rk(~

p

xt 1xt 1 2xt 2 pxt p,

xt)其协方差函数rk(~

r(~x)

i

i,j 0

j

d j ir

MA(q)序列,再用对MA(q)的

xt(t第三步:将~

p 1,p 2, ,T)近似看作

迭代方法求出参数 2a, 1, 2, , q的估计值。

6.模型的识别

(1)若自相关函数在q步以后截尾,则可以认为它是MA(q)模型。

(2)若偏自相关函数在p步以后截尾,则序列可以建立AR(p)模型。

(3)若序列的自相关和偏自相关函数都拖尾,则要建立ARMA(p,q)模型。(p,q)的阶数可以从低到高逐个取为(1,1),(1,2),(2,1)等进行尝试。模型的识别见表1。

表1 模型的识别

模型方程

xt

AR(0,p)

p

MA(0,q)

q

ARMA(p,q)

p

q

i

i 1

i

xt i t

xt t

i 1

i

t i

xt

i 1

xt i t

i 1

i

t i

自相关函拖尾 数

偏自相关

截尾(k

函数

截尾(k

p)

p)

拖尾 拖尾

拖尾

自相关函数rk、偏自相关 kk的截尾性,从理论上说,是指他们在某步以后全部为0。

对于AR(p),当k递推出 kk

2n

p

, kk~N(0,

1n

),从而,存在一个p值,当k

p

的个数不超过4.5%,就可认为kk是截尾的,由此判断xt符

合AR(p)模型,并确定p值。

对于MA(q),当k因此,对每一个

k r

2n

q

2

q

k分布渐进于正态分布N(0,时,r

1n

q

2

1

i)2), (1 2 r

i 1

q 0

1

,检验

q 1,r q 2, ,r q mr

m

一般取

n

)中满足

i)2 (1 2 r

i 1

k在的个数,若此个数不超过m的4.5%,则可近似认为,r

满足此条件时的q处截尾,因而可初步{xt}服从MA(q)序列。

二、简单例证

表1给出了2001—2005年各季度的数据共20个,计算序列的自相关函数和偏自相关函数,并运用Box-Jenkins方法预测2006年各季度的农林牧渔产值。

表1 2001—2005年各季度的农林牧渔总产值 年份 季度 总产值(亿元) 年份 季度 总产值(亿元) 年份 季度 总产值(亿元) 年份 季度 总产值(亿元) 年份 季度 总产值(亿元)

2001

1 3339.1

2 5547.5

3 7644.1

4 9648.9

2002

1 3535.6

2 5726.1

3 4 7810.95 10318.15

2003

1 3893.2

2 5771.6

3 8249.9

4 11777.1

2004

1 4834.2

2 7451.7

3 10456.9

4 13496.2

2005

1

5556.4

2 8090.7 3 11471.2 4 14332.6

资料来源:中国统计局网站

表2 农林牧渔总产值的时间序列 时间 1 2 3 4 5 6 7 8 9 总产值 (亿元) 3339.1 5547.5 7644.1 9648.9 3535.6 5726.1 7810.95 10318.15 3893.2 时间 11 12 13 14 15 16 17 18 19 总产值 (亿元) 8249.9 11777.1 4834.2 7451.7 10456.9 13496.2 5556.4 8090.7 11471.2

图1 自相关函数的输出结果

图2 偏相关函数的输出结果

图3 自相关函数图

Partial ACF

图4 偏相关函数图

由图3和图4可以看出,若偏自相关函数在13步以后截尾,则序列可以建立AR(13)模型。运用Spss14.0的输出结果见以下各图。

图5 2006年1-4季度农林牧渔的预测值

图6 2001—2006年各季度农林牧渔的观测值和预测值图

图7 2001—2005年各季度农林牧渔的预测值

图7 输出结果的有关指标数值

参考文献:

[1]刘思峰.预测方法与技术.[M].高等教育出版社,2005.8 [2]孙文生.经济预测方法.[M].中国农业大学出版社,2004.10

[3]张桂喜.经济预测、决策与对策.[M].首都经济贸易大学出版社,2003.6

[4]李志辉,罗平.Spss for Windows 统计分析教程.[M].电子工业出版社,2005.2

[5] Breslow N.E. and Day N.E:Statistical method in cancer research Vol I: The analysis of Case-control studies,IARC Scientific Publication,Lyon,1980,No.32.

本文来源:https://www.bwwdw.com/article/6yqm.html

Top