第九章时间序列分析

更新时间:2024-04-01 07:20:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第九章 时间序列分析

时间序列用于描述现象随时间发展变化的特征。时间序列分析就是利用时间序列数据,运用一定的统计方法,研究现象的变化规律和对现象的发展进行预测。时间序列分析方法主要有传统的时间序列分析方法和现代时间序列分析方法。本章主要介绍传统的时间序列分析方法,内容包括时间序列的指标分析与预测方法。

第一节 时间序列概述

一、时间序列的概念与分类

(一)时间序列的概念

时间序列是同一现象在不同时间上的相继观测值排列而成的序列。商务经济中的数据大多以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份、周或其他任何时间形式。时间序列又称为动态数列,它由两个基本要素构成,一是现象所属的时间,二是现象在各个时间的指标数值。

表9-1为我国1996年至2005年国内生产总值GDP等时间序列。

表9-1 我国国内生产总值等时间序列 GDP 年份 人均GDP 城镇人口比重全国年末就业消费价格指数 (%) (亿元) (元) 人数(万人) (上年=100) 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 71176.6 78973.0 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 5846 6420 6796 7159 7858 8622 9398 10542 12336 14040 30.48 31.91 33.35 34.78 36.22 37.66 39.09 40.53 41.76 42.99 68950 69820 70637 71394 72085 73025 73740 74432 75200 75825 108.3 102.8 99.2 98.6 100.4 100.7 99.2 101.2 103.9 101.8 资料来源:国研网 www.drcnet.com.cn (二)时间序列的种类

1.根据时间序列的指标表现形式分类。根据时间序列指标的表现形式不同,可以分为绝对数时间序列、相对数时间序列和平均数时间序列。绝对数时间序列是最基本的时间序列,相对数时间序列和平均数时间序列是在其基础上派生出来的。

(1)绝对数时间序列。根据绝对数所编制的时间序列称为绝对数时间序列。按序列所反映的时间状态的不同,绝对数时间序列又分为时期序列与时点序列。

①时期序列。根据时期指标所编制的时间序列称为时期序列。如表9-1中,GDP属于时期指标,GDP序列就为时期序列。时期序列的特点是序列中的指标具有可加性,其数值的大小与所属时期的长短有直接关系。

②时点序列。根据时点指标所编制的时间序列为时点序列。如表9-1中,全国年末就业人数属于时点指标,全国年末就业人数序列就为时点序列。时点序列的特点是序列中各指标

1

值不能相加,各时点指标数值与时间间隔长短没有直接联系。

(2)相对数时间序列。把一系列同类的相对指标按时间顺序排列而成的序列称为相对数时间序列。如表9-1中,城镇人口比重属于相对指标,故城镇人口比重序列为相对数时间序列。相对数时间序列中各指标值不能直接相加。

(3)平均数时间序列。把一系列同类的平均数按时间顺序排列而成的序列称为平均数时间序列,它反映现象一般水平的发展变化,如表9-1中的人均GDP时间序列。平均数时间序列中各指标值不能直接相加。

2.根据时间序列的发展变化规律分类。根据时间序列所形成的折线图,可以把时间序列分为平稳时间序列与非平稳时间序列两大类。平稳时间序列是基本上不存在趋势的序列。而非平稳时间序列是包含趋势、季节性或周期性成分的序列,它可能只含有其中一种成分,也可能是几种成分的组合。因此,非平稳时间序列又可以分为有趋势的时间序列、季节型时间序列和几种成分混合的复合型时间序列。这部分内容,本章后面还将做详细的介绍。

二、编制时间序列的原则

时间序列编制的最基本的原则是保证数列中各指标数值之间的可比性。具体应注意以下几点:

第一,时间上的可比性。一般时期序列的时期长短应一致,时点序列时点间的间隔应尽量保持一致。

第二,指标数值上的可比性。为了保持可比性,要求总体范围一致、计算方法一致、计算单位一致和指标内容等一致。

第二节 时间序列的指标分析

一、发展水平与平均发展水平

(一)发展水平

时间序列中各指标数值称为发展水平。发展水平是计算其它动态指标的基础,它既可是绝对数,也可是相对数和平均数。发展水平通常用ai表示。

时间序列各指标可以表示为a0,a1,a2...an?1,an,通常把第一个指标数值a0称为最初水平,最后一个指标数值an称为最末水平。在时间序列分析中,我们将所研究时期的发展水平称为报告期水平,将作为比较基础时期的发展水平称为基期水平。

如表9-1中的GDP时间序列,最初水平a0?71176.6亿元,最末水平an?183084.8亿元。若将2004年的GDP与2000年的GDP相比,则2004年的发展水平为报告期水平,2000年的发展水平为基期水平。

(二) 平均发展水平

平均发展水平是时间序列中各个时期或时点的发展水平的平均数,表明现象在一段时间内的一般发展水平,又称为序时平均数。不同的时间序列具有不同的特点,计算序时平均数的方法有所不同。

1. 根据绝对数时间序列计算序时平均数 ①根据时期序列计算序时平均数。根据时期序列计算序时平均数用简单算术平均法。计

2

算公式为:

a?a2???ana?1?n?ani (9.1)

式中:a代表序时平均数,ai代表各期发展水平,n代表时期项数。

【例9-1】以表9-1中数据计算“十五”期间(2001年—2005年)我国年平均GDP。 解:a??ani

?109655.2?120332.7?135822.8?159878.3?183084.8?141754.8(亿元)5②根据时点序列计算序时平均数。根据时点序列计算序时平均数,要用间隔长度作为权数进行加权平均。计算公式为:

a?a3a?ana1?a2f1?2f2????n?1fn?1222a? (9.2)

f1?f2????fn?1式中:fi代表时间间隔。

【例9-2】某企业2006年下半年商品储存额如表9-2,求其下半年平均商品储存额。 表9-2 某企业2006年下半年商品储存额 单位:万元 日期 商品储存额 6月30日 100 8月31日 120 11月30日 104 12月31日 118 解:根据公式9.2,该企业2006年下半年平均商品存储额为: 100?120120?104104?118?2??3??1222a??111.17(万元)

2?3?1对时点序列求序时平均数时,如果时间间隔相等,公式(9.2)就简化为所谓的“首末折半法”,其公式表示如下:

aa1?a2???an?1?n2 (9.3) a?2n?12.根据相对数或平均数时间序列计算序时平均数。相对数或平均数时间序列是绝对数时间序列派生出来的,所以其序时平均数计算就不能用序列中相对数或平均数直接计算,而是应分别计算出相对数或平均数分子与分母的平均数后,再进行对比。计算公式如下:

c?a (9.4) b式中:c代表相对数或平均数时间序列的序时平均数,a代表作为分子的时间序列的序时平均数;b代表作为分母的时间序列的序时平均数。

【例9-3】某商场2006年第一季度各月份销售数据如表9-3,求商品平均流转次数。

3

表9-3 一季度有关销售数据 单位:万元 次

月份 商品销售额(a) 平均库存额(b) 商品流转次数(c) 1月 120 60 2.0 2月 143 65 2.2 3月 289 85 3.4 解:商品流转次数=商品销售额,所以,第一季度的商品平均流转次数为:

平均库存额a?120?143?289??3c?==2.63(次)

?60?65?85??3b二、增长量与平均增长量

(一)增长量

增长量是报告期发展水平与基期发展水平之差。即: 增长量=报告期水平 — 基期水平

增长量分为逐期增长量与累积增长量。逐期增长量是报告期水平与前一期水平之差,表示报告期比前一期增加的绝对量;累积增长量是报告期水平与某一固定时间的水平之差,表示报告期比某一固定时期增加的绝对量。增长量的值可能为正数,也可能为负数,故又称为增减量。

【例9-4】某企业2002—2005年的销售额数据如表9-4,试计算其逐期增长量与累积增长量。

表9-4 某企业2002—2005年销售额 单位:万元

年 份 销售额 逐期增长量 累积增长量 2002 1000 — — 2003 1200 200 200 2004 1360 160 360 2005 1500 140 500 解:根据上述的方法计算逐期增长量和累积增长量,其计算结果见表9-4。 可以看出,各累积增长量等于相对应时期逐期增长量之和。 (二)平均增长量

平均增长量是逐期增长量的序时平均数。其计算公式为:

逐期增长量之和 平均增长量=n?1(a2?a1)?(a3?a2)???(an?an?1) (9.5)

n?1累积增长量an?a1或 平均增长量= (9.6) ?n?1n?1?【例9-5】根据例9-4资料,计算该企业2003—2005年销售额平均增长量。

解:该企业2003—2005年销售额平均增长量为:

200?160?140?166.67(万元)

4?1500?166.67(万元) 或 3 三、时间序列的速度分析

4

(一)发展速度与增长速度

1.发展速度。发展速度是时间序列中报告期水平与基期水平之比,即:

报告期水平发展速度=?100% (9.7)

基期水平发展速度有环比发展速度与定基发展速度之分。环比发展速度是报告期水平与前一期水平之比,说明报告期水平相对于前一期水平的发展程度。定基发展速度是报告期水平与某一固定时期水平之比,说明报告期水平相对于该固定时期水平的发展程度。环比发展速度和定基发展速度可以如下表示:

环比发展速度:

aa1a2,,?,n a0a1an?1aa1a2,,?,n a0a0a0定基发展速度:

不难看出,环比发展速度的连乘等于相应时期的定基发展速度,即:

aaa1a2????n?n a0a1an?1a02.增长速度。增长速度又称为增长率,是反映增长程度的相对指标。其计算公式:

增长速度=发展速度-100%

=增长量?100% (9.8)

基期水平增长速度与发展速度类似,由于对比的基期不同,可以分为环比增长速度与定基增长速度。环比增长速度是报告期水平与前一时期水平之比减100%,说明现象逐期增长变化的程度;定基增长速度是报告期水平与某一固定时期水平之比减100%,说明现象在整个观察期内的增长变化程度。环比增长速度和定基增长速度可以如下表示:

逐期增长量环比增长速度=环比发展速度?100%=?100% (9.9)

前期水平累积增长量定基增长速度=定基发展速度?100%=?100% (9.10)

固定时期水平 (二)平均发展速度与平均增长速度

平均发展速度是各个时期环比发展速度的序时平均数,表明现象在一段时间内逐期发展的平均速度。平均增长速度为平均发展速度减100%后的结果。平均发展速度的计算公式为:

n平均发展速度=aaa1a2???n?nn (9.11) a0a1an?1a0公式中n为环比发展速度的项数。

【例9-6】根据例9-4的数据,计算该企业2003年—2005年的发展速度、增长速度、平均发展速度与平均增长速度。

表9-5 某企业销售额的速度指标

年份 销售额(万元) 发展速度(%) 环比 定基 2002 1000 - 100 5

2003 1200 120.0 120 2004 1360 113.3 136 2005 1500 110.3 150

增长速度(%) 环比 定基 - - - 20.0 20.0 10 13.3 36.0 12 10.3 50.0 13.6 增长1%的绝对值(万元) 解:利用上述相应公式计算环比发展速度和定基发展速度、环比增长速度和定基增长速度,其计算结果见表9-5。

利用公式(9.11)计算2003年至2005年的平均发展速度为:

平均发展速度=3120%?113.3%?110.3%?114.47% 或平均发展速度=3an31500??114.47% a01000则平均增长速度=平均发展速度-1=114.47%-1=14.47% (三)时间序列速度分析应注意的问题

应用速度指标分析社会经济现象时应当注意以下几点:

首先,时间序列中如果出现了零或负数,不宜用速度指标分析。例如,某企业连续4年利润额分别为10,-20,0,5万元,对于这样时间序列,要么无法计算速度指标进行分析,要么无法解释其实际意义。

其次,不能单纯看发展速度与增长速度,要把速度指标与绝对水平指标结合分析。通常通过计算增长1%的绝对值来补充增长速度分析中的局限性。增长1%的绝对值是环比增长速度每增长1%的数量,计算公式为:

前期水平 (9.12) 增长1%的绝对值=100根据表9-5的销售额数据,可以计算出该企业各年增长1%的绝对值,见表9-5。从表9-5看出,2003年的增长速度为20%,远远高于2005年10.3%的增长速度,但2003年增长1%的绝对值仅10万元,小于2005年增长1%的绝对值13.6万元。

第三节 时间序列的成分与预测程序

一、时间序列的成分

为了便于对时间序列的分析与预测,把时间序列分为四种成分,即:趋势成分、季节成分、循环成分与不规则成分。根据时间序列中包含的成分不同,时间序列可以分为平稳序列与非平稳序列。平稳序列中各观察值基本围绕某个固定的水平上下波动,其波动可以看作是随机的,如图9-1。

(一)趋势成分(T)

趋势成分是时间序列在较长时期内呈现出来的某种持续向上或向下的变动,也称为长期趋势。时间序列中的趋势可以是线性的,也可以是非线性的。图9-2为一种有趋势的时间序列。

(二)季节成分(S)

季节成分又称为季节变动,是时间序列在一年内重复出现的周期性波动。实际上,季节变动中“季节”一词是广义的,它不仅仅指一年中的四季,也指任何一种一年中周期性的变化。在现实生活中,季节变动是一种极为普遍的现象,如农业生产、交通运输、建筑业、旅游业、商品销售以及工业生产中都存在明显的季节变动。图9-3为含季节成分的时间序列。

6

(三)循环成分(C)

循环成分又称为循环变动,是指变动周期大于一年的有规律的重复变动。循环变动通常是由于商业和经济活动而引起的,不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动。循环变动不同于季节变动,循环波动大多无固定规律,变动周期多在一年以上,且周期长短不一,比如我们经常提及的经济周期。

(四)不规则成分(L)

不规则成分也称为随机变动,指受偶然性因素的影响呈现出的某种随机波动。

1051041031021011009998979695199719981999200020012002200320042005

图9-1 平稳时间序列

16000140001200010000800060004000200001996199719981999200020012002200320042005

图9-2 有趋势的时间序列

5000450040003500300025002000150010005000123456789101112

图9-3 有季节成分的时间序列

传统时间序列分析的一项主要内容就是把以上四种成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达。稍后将分别进行分析。

按四种成分对时间序列的影响方式不同,可以设为不同的组合模型。常见的有加法模型与乘法模型。加法模型假定各成分之间是独立的,而乘法模型则假定成分间是相互影响的。

乘法模型:Y?T?S?C?I 加法模型:Y?T?S?C?I

7

其中乘法模型较为常用。本章时间序列分析方法以乘法模型为基础。

二、预测程序

时间序列分析的一个主要目的就是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、循环性和随机成分等,而对于一个具体的时间序列,它可能只含有一种成分,也可能同时含有几种成分。含有不同成分的时间序列所用的预测方法是不同的。因此,在用时间序列进行预测时,通常包括以下几个步骤:

第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。 第二步:找出适合此类时间序列的预测方法。

第三步:对可能的预测方法进行评估,以确定最佳预测方案。 第四步:利用最佳预测方案进行预测。 下面我们按以上步骤进行简要的讨论。

(一)确定时间序列的类型

时间序列的类型由它包含的成分所决定。几乎所有经济活动的时间序列数据均包含不规则成分,它是由一些随机因素引起的,具有不可预测性,对其的处理,一般通过平均或平滑消除其影响。对于循环成分的确定,需要较长时期的数据,在预测中,通常不分析循环成分。所以对时间序列只需着重分析趋势成分与季节成分。对于时间序列成分的分析,往往从时间序列的折线图入手。

1.趋势成分的确定:绘制折线图。绘制折线图时,横轴代表时间,纵轴代表指标数值。 【例9-7】试确定表9-1中我国1996年—2005年GDP时间序列的趋势。

解:绘制折线图如图9-4。从图中可以看出,1996年-2005年GDP具有长期增长的线性趋势。

2000001800001600001400001200001000008000060000400002000001996199719981999200020012002200320042005

图9-4 1996年-2005年我国GDP变化趋势

判断趋势成分是否存在还可以用回归分析,就是用一条趋势线去拟合,然后进行统计检验,看其线性趋势是否显著。

2.季节成分的确定。季节成分的确定至少需要三个变动周期的数据,而且数据要按季度(或月、周、天)列示。确定季节成分一般绘制年度折叠折线图,即在绘制折线图时,将每个周期的数据分开画在同一图上。如果时间序列只有季节成分,年度折叠折线图将会有交叉;如果时间序列即含有季节成分又含有趋势成分,那么折叠折线图不会交叉,各年的图形有上有下。如果是上升趋势,后面年度的折线将高于前面年度,反之亦然。

【例9-8】表9-6为某旅游景点2003年—2005年每季度接待的游客人数,试绘制年度折叠折线图,并判断其是否存在季节成分。

表9-6 某旅游景点2003年—2005年接待游客数 单位:万人 年份

第一季度 第二季度 8

第三季度 第四季度 2003 2004 2005 32 41 57 40 51 65 61 74 93 28 36 57 解:绘制年度折叠折折线图如图9-5。

从图9-5可以看出,游客数量具有明显的季节性,并且后面年份的折线高于前面年份的折线,说明该旅游景点接待游客数量不仅具有季节性,而且含有上升趋势。

图9-5 接待游客人数的年度折叠时间序列图

(二)选择可用的方法

确定时间序列的类型后,第二步就是选择适当的预测方法。图9-6给出了可能的时间序列类型和可供选择的方法。

时间序列 否 是否存在趋势 是 是否存在季节 否 是 是 是否存在季节 否 静态预测法 移动平均法 加权移动平均法 指数平滑法 季节性预测法 季节多元回归模型 季节自回归模型 时间序列分解法 趋势预测法 线性趋势预测 非线性趋势预测 自回归预测模型 图9-6 时间序列类型与可选择预测方法

图9-6表明,若时间序列不存在趋势和季节变动,通常用移动平均法和指数平滑法预测;若只存在趋势,则根据趋势的具体表现形式,用线性趋势预测法、或非线性趋势预测法、或

9

自回归预测模型法预测;若不仅存在趋势还存在季节变动,则用季节多元回归模型、或季节自回归模型、或时间序列分解法预测。

(三)预测方法的评价

在选择并采用某一种特定的方法进行试预测后,需要评价该方法的预测效果或准确性。时间序列预测中,设时期t对应的实际值为Yt,预测值为Ft,评价的方法就是求出单个实际值与预测值之差,即et?Yt?Ft,来判断预测的准确程度。但数据量较大时,应该用反映总体预测误差的指标来评价预测方法的准确性。反映总体预测误差的指标有平均误差、平均绝对误差、均方误差、平均百分比误差和平均绝对百分比误差。本章主要介绍均方误差的计算和运用。

均方误差(mean square error)是通过平方消去误差et的正负号后计算的平均误差,用

MSE表示,其计算公式为:

?(YMSE?t?Ft)2n (9.13)

式中:Yt为时期t的实际值,Ft为时期t的预测值,n为预测值的项数。

若均方误差小,表明用该预测方法预测的准确程度高、预测效果好。所谓利用最佳预测方案进行预测,就是要利用预测准确程度最高或预测误差最小的方法预测。

在进行了以上步骤的计算与分析后,就可以利用最佳预测方案进行预测。 下面将分别介绍平稳时间序列、有趋势时间序列以及含季节成分时间序列的具体预测方法。

第四节 平稳时间序列的平滑与预测

前已述及,平稳时间序列只含有随机成分,对其的分析主要是进行平滑以消除随机波动。常用的预测方法有移动平均法、加权移动平均法和指数平滑法,这些方法也称为平滑法。

一、简单移动平均法

简单移动平均法(moving average)是通过对过去n期观察值的简单平均来预测下一期的数值。用公式表示为:

Ft?1?Yt?Yt?1?Yt?2??Yt?n?1 (9.14)

n1?n?t。式中: Yt表示t时期的实际值,Ft?1表示t?1时期的预测值,n表示移动间隔,

应用移动平均法的关键是确定合理的移动间隔n(也称移动步长),不同的移动间隔预测

的准确性是不同的。均方误差最小的间隔长度是最佳的移动间隔长度。

【例9-9】表9-7是某轮胎生产企业最近16个月的销售情况,试分别取移动间隔n?5与n?7计算各期销量的预测值,并判断哪个步长更合适一些。

表9-7 某轮胎生产企业的销售量 单位:万个 月

销售量 10

月 销售量

1 2 3 4 5 6 7 8 解:取5项移动平均, 9612.7 9765.4 10197.2 10930.1 9116.7 9740.3 11098.3 10325.8 9 10 11 12 13 14 15 16 10176.5 9823.1 9999.2 10211.1 9789.4 10426.7 9136.1 10590.1 第6月的预测值F6=(9612.7+9765.4+10197.2+10930.1+9116.7)/5=9924.42

??????

第17月的预测值F17=(10211.1+9789.4+10426.7+9136.1+10590.1)/5=9912.5。

用Excel进行移动平均预测的步骤如下:

第1步:将表9-7时间序列的值输入Exce的两列,见图9-10; 第2步:顺次点击【工具】、【数据分析】、【移动平均】和【确定】;

第3步:填写对话框:在【移动平均】对话框的【输入区域】中输入数据区域,即B1:B17;勾选【标志】;在【移动间隔】输入移动步长5,在【输出区域】中选择预测结果的输出位置,本例应为C3;见图9-7。单击【确定】,即可得到计算结果,见表9-8的第3栏。

图9-7 填写移动平均对话框

11

表9-8 Excel输出移动平均预测

月 (1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 合计 销售量5期移动平(万个) 均预测值 (2) 9612.7 9765.4 10197.2 10930.1 9116.7 9740.3 11098.3 10325.8 10176.5 9823.1 9999.2 10211.1 9789.4 10426.7 9136.1 10590.1 - (3) 9924.42 9949.94 10216.52 10242.24 10091.52 10232.8 10284.58 10107.14 9999.86 10049.9 9912.5 10030.7 - 预测误差 误差平方 7期移动平(Yt?Ft)2 均预测值 (5) 33900.17 1318731 11942.12 4321.748 72049.3 54568.96 5399.31 100958.7 182192.4 835030.4 459141.8 3078236 (6) 10065.81 10167.69 10226.41 10172.97 10039.99 10196.33 10203.34 10107.4 9937.443 9996.53 - 预测误差 误差平方 Yt?F (4) -184.12 1148.36 109.28 -65.74 -268.42 -233.6 -73.48 -317.74 426.84 -913.8 677.6 - Yt?F (7) 259.9857 8.814286 -403.314 -173.771 171.1143 -406.929 223.3571 -971.3 652.6571 - (Yt?Ft)2 (8) 67592.57 77.69163 162662.4 30196.51 29280.1 165590.9 49888.41 943423.7 425961.3 1874674

按同样的步骤操作可计算移动步长为7的预测值,见表9-8的第6栏。

从表9-8可以看出,5项移动平均与7项移动平均的预测值是不同,为了判断步长取多大更为准确,我们就需要计算并比较它们的均方误差。

用Excel的复制、拖动和求和等功能,计算5项移动平均和7项移动各月的误差平方,分别对其求和,可计算得:

3078236?279839.6 111874674?208297.1 7项移动平均的均方误差MSE?95项移动平均的均方误差MSE?可见,5项移动平均的均方差大于7项移动平均的均方差,所以移动步长选择7能使预测结果更为准确。

二、加权移动平均法

简单移动平均法将各期的数值同等看待,而有时候预测者认为离预测期近的数据比离预测期远的数据更为重要,这时就要用加权移动平均法。通过对不同时期赋予不同的权重,计算加权移动平均数进行预测的方法称为加权移动平均法(weighted moving average)。计算公式为:

Ft?1?

Ytwt?Yt?1wt?1?Yt?2wt?2??Yt?n?1wt?n?1 (9.15)

wt?wt?1?wt?2??wt?n?112

式中,w表示赋予各期的权重。

【例9-10】用3项加权移动平均法预测表9-7中第17月的轮胎销售量。设最近月份的权重为3,第二月份权重为2,第三月的权重为1。

解:利用公式(9.15),第17月轮胎销售量预测值为:

3?10590.1?2?9136.1?1?10426.7F17??10078.2(万个)

3?2?1三、指数平滑法

指数平滑法(exponential smoothing)是根据数据在预测中重要程度呈递减的特点,自动给不同时期数据分别赋予不同权重的预测法。其公式为:

Ft?1???Yt??1????Ft (9.16)

式中,?为平滑系数,0???1。

使用指数平滑法时,关键的问题是确定一个合适的平滑系数?。因为不同的?对预测结果产生不同的影响。?越接近于1,模型对时间序列数值变化的反映越及时,因为它对实际值赋予了比前期预测值更大的权数。同样,?越接近于0,意味赋予预测值更大的权数,因此模型对时间序列变化的反应就越慢。一般而言,当时间序列有较大的随机波动时,宜选用较大的?,以便与变化相适应;反之,当时间序列比较平稳时,宜选用较小的?。实际运用时,还应考虑预测误差,一般应该用预测误差最小的?作为平滑系数。

由于预测t+1期的数值时将用到t期的预测值,顺次追溯到F1,而在开始计算时,我们没有第1个时期的预测值F1(又称为启动值),通常可以设F1为第1期的实际值,即F1=Y1。 【例9-11】根据表9-7某轮胎生产企业销售量的数据,分别用平滑系数?为0.7、0.5和0.3,采用Excel进行指数平滑预测,并用均方误差MSE选择最佳的平滑系数。

解:用Excel进行指数平滑预测的步骤如下:

第1步:将表9-7时间序列的值输入Exce的两列,见图9-8; 第2步:顺次点击【工具】、【数据分析】、【指数平滑】和【确定】;

第3步:填写对话框:在“指数平滑”对话框的【输入区域】中输入数据区域,本例为B1:B17;在【阻尼系数】中输入0.3(=1-?=1-0.7);勾选【标志】;在【输出区域】中选择预测结果的输出位置,本例应为C2;见图9-8。单击【确定】,可得各期的平滑值,见表9-9的第3栏。

13

图9-8 填写指数平滑对话框

用同样的操作可计算?=0.5、?=0.3的预测值。输出结果见表9-9的第5、7栏。

表9-9 Excel输出指数平滑预测

销售量 月 (1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 合计 Fi (α=0.7) (3) 9612.7 9719.6 10053.9 10667.2 9581.9 9692.8 10676.6 10431.1 10252.9 9952.0 9985.0 10143.3 9895.6 10267.4 9475.5 10255.7 误差平方 Fi (5) 9612.7 9689.1 9943.1 10436.6 9776.7 9758.5 10428.4 10377.1 10276.8 10049.9 10024.6 10117.8 9953.6 10190.2 9663.1 10126.6 误差平方 Fi (7) 9612.7 9658.5 9820.1 10153.1 9842.2 9811.6 10197.6 10236.1 10218.2 10099.7 10069.5 10112.0 10015.2 10138.7 9837.9 10063.6 误差平方 Yi (2) 9612.7 9765.4 10197.2 10930.1 9116.7 9740.3 11098.3 10325.8 10176.5 9823.1 9999.2 10211.1 9789.4 10426.7 9136.1 10590.1 (Yi?Fi)2 (α=0.5) (Yi?Fi)2 (4) 23317.3 228111.3 767696.6 2404190.1 25102.1 1975517.2 123089.2 64796.8 184698.5 2225.0 51099.1 125234.4 282104.0 1279748.3 1242382.5 8779313 (6) 23317.3 258216.4 974119.7 1742169.0 1321.8 1795122.7 10524.5 40238.2 205841.2 2575.4 34791.8 107871.0 223806.0 1111041.0 859274.0 2(α=0.3) (Yi?Fi) (8) 23317.3 290186.9 1232062.3 1074149.6 10381.2 1655540.7 16428.8 3549.5 156107.5 10094.8 20041.7 104071.9 169314.8 1005136.3 565811.7 6336195 7390229.972 当平滑系数?分别取0.7、0.5和0.3时,第17月销售量的预测值分别为10255.7、10126.6

14

和10063.6。可见,不同的平滑系数其预测结果也不同。

用Excel的复制、拖动和求和等功能,计算?分别取0.7、0.5和0.3时各月的误差平方,并分别求和,在此基础上可求得:

8779313?585287 157390229.9?492682 ?=0.5的均方误差MSE?156336195?422413 ?=0.3的均方误差MSE?15?=0.7的均方误差MSE?可见,平滑系数?取0.3时预测误差最小,因此预测的效果较好。

第五节 有趋势时间序列的预测

含有趋势成分的时间序列可以分为线性趋势与非线性趋势两大类,如果这种趋势能够延续到未来,就可以利用趋势进行外推预测。有趋势时间序列的预测方法主要有线性趋势预测、非线性趋势预测和自回归模型预测等,本章主要介绍线性趋势的预测方法。

线性趋势是指时间序列的数据随时间的推移而呈现出稳定增长或下降的线性变化规律。如图9-4中,我国1996年至2005年GDP的时间序列具有明显的线性趋势,就可以利用线性趋势外推的方法进行预测。线性趋势方程描述为:

?????t (9.17) Yt01?代表时间序列的预测值,t代表时间,?0代表趋势线在Y轴上的截距,?1代式中,Yt表趋势方程的斜率,表示时间t每变动一个单位预测值的平均变动量。

趋势方程中两个待定系数?0和?1按照最小二乘法求得,其计算公式为:

?1?n?tY??t?Yn?t???t?22 (9.18)

?0?Y??1t (9.19)

式中,Y代表实际值,Y代表实际值的均值,t代表时间变量的均值。

【例9-12】根据表9-1中我国1996年至2005年人均GDP数据,用最小二乘法确定线

性趋势方程、计算各期的预测值,并预测2006年的人均GDP。

解:用Excel计算趋势方程的待定系数?0、?1并进行预测的操作步骤是:

第1步:将时间序列输入到Excel的两列;对相应的时间t取1,2,……;见图9-9; 第2步:顺次点击【工具】、【数据分析】、【回归】和【确定】;

第3步:填写对话框:在【Y值输入区域】中输入人均GDP数据区域,本例为C1:C11;在【X值输入区域】中输入t数据区域,本例为B1:B11;勾选【标志】;在【输出区域】中输入一个单元格,本例为B13;见图9-9。单击【确定】,输出结果见表9-10。

15

图9-9 填写回归对话框

表9-10 Excel输出趋势回归的部分结果

截距 t Coefficients 4189.4 856.7818 标准误差 523.99357 84.449211 t Stat 7.995136 10.14553 P-value 4.39E-05 7.62E-06 根据表9-10数据建立的线性趋势方程为: ?=4189.4+856.8t Yt从统计量分析,趋势方程是线性显著的。

根据趋势方程计算2006年人均GDP的预测值为:

Y2006=4189.4+856.8?11=13614.0(元)

在Excel中也可以用添加趋势线的方法得到线性趋势方程:先根据时间序列数据绘出人均GDP的折线图,然后右键单击折线,选择【添加趋势线】。在添加趋势线对话框中,点击【类型】,在【趋势预测/回归分析类型】中选择【线性L】;然后在【选项】中选择【显示公式】,结果如图9-10。

1600014000120001000080006000400020000y = 856.78x + 4189.412345678910

图9-10 趋势回归图

若时间序列中的趋势成分呈现某种非线性趋势,此时不适合拟合线性趋势方程,需要拟合恰当的趋势曲线。常见的有二次回归模型预测、霍特指数平滑预测与趋势自回归预测法等。这里我们不再做深入的探讨。

16

第六节 含季节成分时间序列的预测

含有季节成分时间序列的预测方法主要有季节性多元回归预测、季节自回归预测以及时间序列分解预测法等。本章介绍时间序列分解预测法。

含有季节成分的时间序列通常伴以趋势成分、循环成分和随机成分。考虑到一般没有足够的数据来发现跨度多年的循环成分,所以不考虑循环成分,故一般采用的分解模型为:

Yt?Tt?St?It。

下面我们用一个例子来说明分解预测法的具体步骤。

【例9-13】根据例9-8中某旅游景点2003年-2005年接待游客数量的数据,用时间序列分解预测法预测各季度的游客人数。

解:从图9-5折叠时间序列图可以看出,游客人数时间序列不但具有明显的季节成分,还有趋势成分。

为了较准确地预测游客人数,首先计算季节指数以确定季节成分,再从时间序列中剔除之,然后根据剔除了季节成分的序列选择并拟合适当的模型并进行预测,最后将预测值乘以季节指数,得到最终的预测结果。以下是具体的分析与计算。

一、计算季节指数,确定时间序列的季节成分

季节指数的计算方法很多,这里我们介绍移动平均趋势剔除法。该方法的基本思想是,用移动平均法测定趋势,再将趋势从时间序列中剔除,之后计算季节指数,使之单纯反映季节成分。步骤如下:

1.测定趋势:将2003年-2005年接待游客数量的数据按时间顺序排列,计算4项移动平均值(若为月份数据移动项数应为12),并将其结果进行“中心化”处理,即把移动平均的结果再进行一次2项移动平均,得出“中心化移动平均值”。“中心化移动平均值”的项数前后比原数列各少2项(若12项移动前后各少6项)。如表9-11第5栏。

2.剔除趋势:用各季度的游客数除以相应的中心化移动平均值得“比值”,如表9-11第6栏。

表9-11 移动平均趋势剔除法计算表 年/季度 (1) 2003/1 2 3 4 2004/1 2 3 4 2005/1 2 3 4 时间t (2) 1 2 3 4 5 6 7 8 9 10 11 12 游客人数(Y) (3) 32 40 61 28 41 51 74 36 57 65 93 57 4项移动平均值 (4) - - 40.25 42.50 45.25 48.50 50.50 54.50 58.00 62.75 68.00 - 中心化移动平均值(CMA) (5) - - 41.38 43.88 46.88 49.50 52.50 56.25 60.38 65.38 - - 比值(Y/CMA) (6) 1.4743 0.6382 0.8747 1.0303 1.4095 0.6400 0.9441 0.9943 3.将“比值”置于表9-12的季节指数计算表中;

17

4.计算平均数:根据表9-12的数据,计算2003年-2005年8个季度(“中心化”处理后只有8个季度数值)的平均数即总平均数和各季度的平均数,见表9-12的第5行;

5.计算季节指数:将各季度的平均数除以总平均数,结果如表9-12最后一行,比如一季度的季节指数=0.9094/0.9944=91.45% 。

表9-12 季节指数计算表

年份 2003 2004 2005 平均数 季节指数(%) 一季度 0.8747 0.9441 0.9094 91.45 二季度 1.0303 0.9443 0.9873 99.28 三季度 1.4743 1.4095 1.4419 145.00 四季度 0.6382 0.64 0.6391 64.27 合计 2.1125 3.9545 1.8884 0.9944 400.00 如果现象没有季节变化,那么各期的季节指数等于100%。如果存在季节变化,则各季度的季节指数或大于100%,或小于100%,但一年四个季度的季节指数之和应为400%,若观察值是月份数据,一年12个月季节指数之和应为1200%。

从季节指数可以看出,该旅游景点的旺季在第3季度,而淡季在第4季度。

二、分离季节成分

计算出季节指数后,用各季度游客人数除以相应的季节指数,将季节成分从时间序列中分离出去,计算结果见表9-13中第5列。

表9-13 游客人数预测表 年/季度 (1) 2003/1 2 3 4 2004/1 2 3 4 2005/1 2 3 4 时间t (2) 1 2 3 4 5 6 7 8 9 10 11 12 游客人数(Y) (3) 32 40 61 28 41 51 74 36 57 65 93 57 季节指数 (4) 0.9145 0.9928 1.4500 0.6427 0.9145 0.9928 1.4500 0.6427 0.9145 0.9928 1.4500 0.6427 分离季节成分 (5)=(3)/(4) 34.99 40.29 42.07 43.57 44.83 51.37 51.04 56.02 62.33 65.47 64.14 88.69 趋势预测值 (6) 32.65 36.49 40.32 44.15 47.98 51.82 55.65 59.48 63.31 67.15 70.98 74.81 最终预测值 (7)=(6)×(4) 29.86 36.22 58.46 28.38 43.88 51.45 80.69 38.23 57.90 66.67 102.92 48.08 三、建立模型预测并预测

将剔除了季节成分后的数据即表9-13第5栏的数据绘制成折线图,如图9-11。

18

100.0080.00游客人数60.0040.0020.000.002003/12004/12005/123423423时间4

图 9-11 分离季节成分后的游客人数趋势图

可以看出,游客人数具有较明显的线性趋势,因此,拟合线性趋势模型。根据第五节介绍的拟合线性趋势模型的方法,利用表9-13中第5列的数据,可以确定剔除季节成分后的线性趋势方程为:

?=28.82+3.83t Yt根据上述趋势方程预测各季度的游客人数,见表9-13中的第6列。

四、计算最终预测值

将表9-13第6列的趋势预测值乘以相对应的季节指数,即表9-13中的第4列,就得到

最后预测值,结果如表9-13中的第7列。

如果预测2006年一季度的游客人数,取t?13代入趋势方程,得

?=28.82+3.83?13=78.65万人 Y13此时预测值只包含趋势成分而不包括季节成分,若考虑季节成分,再乘以一季度的季节

指数91.45%,结果为:

78.65?91.45%?71.92

故2006年一季度的游客人数预计为71.92万人。

思考与练习:

1. 什么是时间序列?

2. 时期指标时间序列和时点指标时间序列有哪些不同的特点? 3. 简述逐期增长量和累积增长量的区别与联系。

4. 什么是发展速度?什么是增长速度?它们有什么区别与联系? 5. 什么是增长1%的绝对值? 6. 简述时间序列的构成成分。

7. 简述平稳时间序列与非平稳时间序列的含义。 8. 简述时间序列的预测程序。 9. 简述指数平滑法的基本含义。

10. 某企业2003年产品库存资料如下:(单位:万件) 日期 库存量 要求:

19

1月1日 60 3月31日 75 6月30日 88 8月31日 56 11月30日 68 12月31日 48 (1)计算2003年上半年平均库存量。 (2)计算2003年全年平均库存量。

11. 某企业2004年上半年有关工人人数以及产值资料如下表: 月份 月末工人数(人) 产值(万元) 1 1000 300 2 1050 320 3 1090 400 4 1070 450 5 1100 480 6 1120 500 已知该企业2003年年底工人人数为960人,试计算该企业2004年上半年月人均产值。

12. 某地区2001年-2005年社会消费品零售总额资料如下: 年份 社会消费品零售总额(亿元) 2000 8255 2001 9383 2002 10985 2003 12238 2004 16059 2005 19710 要求: (1)计算2001年至2005年的平均增长量、平均发展速度与平均增长速度。

(2)列表计算2001年至2005年的逐期增长量、累积增长量、定基发展速度、环比发展速度、定基增长速度和环比增长速度、增长1%的绝对值。

13.下表是一家宾馆过去18个月的营业额数据。 月 1 2 3 4 5 6 7 8 9 营业额(万元) 298 283 322 355 286 379 381 431 424 月 10 11 12 13 14 15 16 17 18 营业额(万元) 473 470 481 449 544 601 587 644 660 要求: (1) 用5期移动平均法对6-18月的营业额进行预测;

(2) 用3期加权移动平均法对4-18月的营业额进行预测。最近时期的权数为5,前一时期的

权数为3,初期的权数为2;

(3) 分别用平滑系数??0.3和??0.6预测各月的营业额,并计算预测误差,说明用哪一

个平滑系数预测更合适;

(4) 绘制时间序列折线图描述其趋势。

(5) 建立直线趋势方程,并根据趋势方程预测第19月的营业额。

14.下表是某百货公司最近几年各季度的销售额数据。 年份 2001 2002 2003 2004 第一季度 5483.2 5123.6 4942.4 5009.9 第二季度 5997.3 6051.0 6825.5 6257.9 第三季度 8776.1 9592.2 8900.1 8016.8 第四季度 8720.6 8341.2 8723.1 7865.6 20

2005 6059.3 5819.7 7758.8 8128.2 要求: (1)绘制时间序列折线图与年度折叠时间序列折线图,判断时间序列的类型。 (2)用移动平均趋势剔除法计算季节指数;

(3)剔除季节变动,并拟合剔除季节变动后的趋势方程; (4)预测2006年第一季度的销售额。

21

本文来源:https://www.bwwdw.com/article/p0jr.html

Top