统计预测与决策论文
更新时间:2024-05-18 08:44:01 阅读量: 综合文库 文档下载
《预测与决策》期末论文
组合预测模型在全国能源消耗总量中的应用
班级:统计1111 学号:20401111108 姓名:郝海芳
成 绩
1 2 3 4 5 6
论文选题(10分) 数据录入(20分) 数据分析(50分) 结论陈述(10分) 整体行文(10分) 总 分
摘要:组合预测理论及建模技术对于信息不完备的复杂经济系统具有一定的实用性,鉴于能源消费系统的复杂性及非线性的特征,本文以我国1978-2008年的全国能源消耗总量数据为基础,建立了ARIMA预测模型、灰色预测模型、三次多项式预测模型和基于这三种模型的组合模型,并进行了精度比较,建立了我国未来能源消费量的组合预测模型能源影响着我国社会经济的稳定持续发展,对未来能源消耗的准确预测具有重要的意义。最后选择最优的组合预测模型对2009-2011年的全国能源消耗总量进行预测。结果表明,该模型可以作为我国未来能源消费量预测的有效工具。
关键词:ARIMA模型;灰色预测模型;三次多项式;组合模型;能源消耗
一、引言
能源是国民经济发展和人民生活水平提高的重要物质基础,能源短缺曾经长期制约我国经济的发展。近几年由于能源工业的发展,短缺局面虽然得到了缓解,但从长远来看能源供需形势仍然非常严峻,因此做好未来能源消费预测分析,为能源规划及政策的制定提供科学的依据,对于保持我国社会经济健康、持续、稳定发展具有重要的理论与现实意义。
本文利用《中国统计年鉴》得到31期全国能源消耗总量y的时间序列如下表一所示:
表一:全国能源消耗总量(单位:万吨标准煤) 年份 y 年份 y 年份 y 年份 y 年份 y 年份 1978 57144 1984 70904 1990 98703 1996 138948 2002 1979 58588 1985 76682 1991 103783 1997 137798 2003 1980 60275 1986 80850 1992 109170 1998 132214 2004 203226.7 1981 59447 1987 86632 1993 115993 1999 1982 62067 1988 92997 1994 122737 2000 1983 66040 1989 96934 1995 131176 2001 133831 138552.6 143199.2 2005 224682 2006 246270 2007 265583 151797.3 174990.3 2008 285000 y 二、预测方法介绍
(一) ARIMA模型的基本原理
ARIMA模型是Box和Jenkins1970年提出的以随机理论为基础的时间序列分析方法,又称为“Box-Jenkins模型”,这以模型在经济领域的预测分析中得到了广泛的应用。时间序列是依赖时间t的一组随机变量,构成该时序的单个序列值虽然具有不确定性,但对整个时间序列来说,它的变化却有一定的规律性,可以用相应的数学模型来近似描述。ARIMA模型有三种基本类型:自回归模型、移动平均模型、单整自回归移动平均模型。
单整是指将一个时间序列有非平稳性变为平稳性所要经过的差分的次数,这是对非平稳时间序列进行时间序列分析的必经步骤。假设一个随机过程含有d个单位根,其经过d次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均模型。模型中AR称为自回归分量,P为自回归分量的阶数;MA为移动平均分量,q为移动平均分量的阶数;I为差分,d
为使时间序列具有平稳性所需要的差分次数。
p阶自回归过程AR(p)的一般表达式为:
Xt??1Xt?1??2Xt?2???pXt?p??t 其中?t白噪声过程。
q阶的移动平均过程MA(q)可以表示为:
Xt??t??1?t?1??2?t?2?Xt??0??1Xt?1??2Xt?2?
(二)灰色预测法
??q?t?q,?t为白噪声过程。 ??pXt?p??t??1?t?1??2?t?2???q?t?q
ARIMA( p,d, q)模型一般表达式为:
灰色预测法是一种对含有不确定因素的系统进行预测的方法。一般是利用时间序列数据,通过建立GM(1,1)模型进行预测。灰色预测模型的预测步骤如下:
1.首先对原始时间序列数据x(0),做一次累加生成,得到新的序列x(1)
dx(1)?ax(1)??,得到参数a和? 2.利用一次累加生成序列拟合微分方程:dt??'(1)3.解微分方程得到预测模型函数:X(k?1)?[X(0)(1)?]e?ak?
aa'(1)'(0)4.将得到的X序列进行一次累减得到预测序列X
5.利用历史数据对数据模型进行精度检验,若通不过检验,则利用残差对原模型进行修正。
6.通过预测方程进行预测。
(三)组合预测模型
不同的预测方法根据相同的信息,往往会提供不同的结果,如果简单的将误差较大的一些方法舍弃掉,将会丢弃一些有用的信息,使得模型的精度不高。组合预测法是指通过建立一个组合预测模型,把多种预测方法所得到的预测结果进行综合。由于组合模型能够较大限度地利用各种预测样本信息,所以它比单项预测模型考虑问题更系统、更全面,因而能够有效地减少单个预测模型受随机因素的影响,可以提高预测的精度和稳定性。
三、全国能源消耗总量的实证分析
(一)建立ARIMA模型
1.平稳化处理
用ARIMA模型拟合的时间序列必须是平稳的,如果序列不平稳,则要通过差分或序列变换等先将序列平稳化。绘制原始序列的时序图得到图形如图一所示:
Y300,000250,000200,000150,000100,00050,0001980198519901995200020052010 图一:y时序图
由图可从直观上看出原始序列存在明显的长期递增趋势,原始序列不平稳。利用软件EViews6.0,运用单位根检验方法对序列进行平稳性检验发现原始序列确定不平稳,因此本文先对该序列取对数,令yl?log(y),然后对yl进行差分,差分两次之后得到平稳的序列ylii。单位根检验结果如下表二所示:
表二:单位根检验结果 原始序列y 取对数后yl 一阶差分yli 二阶差分ylii ADF值 1.758582 0.627517 -2.95825 -4.76543 P值 0.9995 0.988 0.0529 0.0007 临界值a=1% -3.68919 -3.68919 -3.72407 -3.69987 临界值a=5% -2.97185 -2.97185 -2.98623 -2.97626 临界值a=10% -2.62512 -2.62512 -2.6326 -2.62742 由表可知,取对数后再做两次一步差分之后的序列yliiADF检验的p值为0.0007,小于0.05,因此拒绝序列非平稳的原假设,可以接受序列为平稳的备择假设。在此可知ARIMA模型定阶为d=2。也可由图标直观说明序列的平稳性,作出ylii的时序图如图一所示:
表六:三次多项式模型结果 变量 系数 标准差 T统计量 P值 常数项 34209.53 8549.925 4.001150 0.0004 T 10136.88 2277.300 4.451270 0.0001 T^2 -646.4941 163.9748 -3.942644 0.0005 T^3 18.58298 3.371655 5.511531 0.0000 其中模型的F统计量为345.9252,相伴概率为0.00,小于0.05,所以拒绝原假设,即模型是显著的。而且各系数的显著性检验的P值都小于0.05,通过了显著性检验。模型的调整的R2为0.971825,接近于1,说明模型拟合效果好。因此,建立三次多项式模型:y?18.583x3?646.494x2?10136.88x?34209.53
用该模型对2004-2011年全国能源消费总量进行预测得到结果如表七所示:
表七:2004-2011年全国能源消费总量三次多项式预测值 年份 2004 2005 2006 2007 真实值 203226.7 224682 246270 265583 预测值 202380.4 219124.89 237698.4 258212.3 相对误差百分0.41 2.47 3.48 2.77 比(%) 年份 2008 2009 2010 2011 真实值 285000 预测值 280778.2 305507.6 332511.9 361902.6 相对误差百分1.48 比(%) (四)组合模型 以上三种方法有些精度较高,有些精度较低,但由于各自理论的缺陷,会使预测产生系统偏差。为了更充分的提取样本信息,提高预测精度,本文将以上三种预测模型进行组合得到一个组合的预测模型。组合模型的权重有多种,可以等概率取权重,可以采用最小二乘估计法取权重,也可以使权重
wi???i?1mmi??i.i??i?11,其中?i为残差标准差,m为单一模型的个数,或者使权重m?1wi?Di?1?Di?1m?1,其中Di?1为第i个单一模型误差平方和,m为单一模型个数。本文
i采用第三种取取权重的方法,即wi???i?1mmi??i.i??i?11。利用Excel软件求得权重m?1
分别为:w1=0.466858,w2=0.171932824,w3=0.361209557根据预测模型:
yt?w1yt1?w2yt2?w3yt3对2004-2011年的全国能源消耗总量进行预测结果如下表八所示:
表八:2004-2011年全国能源消耗总量组合预测值 年份 2004 2005 2006 2007 真实值 203226.68 224682 246270 265583 预测值 202142.34 219328.12 238544.92 260010.57 相对误差百0.53 2.38 3.13 2.09 分比(%) 年份 2008 2009 2010 2011 真实值 285000 预测值 283571.66 309765.5 338872.9 370931.5 相对误差百0.50 分比(%) 四、模型精度比较及预测 对预测全国能源消耗总量的各个模型进行评价的指标体系采用平均绝对相对误差百分比,其计算公式为:
1nYi?Yi'平均绝对相对误差百分比(MAPE)=??100%
ni?1Yi各种方法预测结果的精度见表九。
表九:四种方法预测结果的平均绝对相对误差 方法 ARIMA(2,2,2) 灰色模型 三次多项式 组合模型 1.73平均绝对相对误(MAPE) 11.19% 7.34% 2.12% % 由表可知,在三个单一的预测模型中,三次多项式预测模型的平均绝对相对误差最低为2.12%,预测精度最高。组合预测模型结合了单一预测模型的优势,其精度大大提高,平均绝对相对误差百分比为1.73%,是四种预测模型中最低的。因此本文采用组合预测模型往后作三期预测,得到2009-2010年全国能源消耗总量的预测值如表十所示:
表十:2009-2010年全国能源消耗总量预测值 年份 2009 2010 2011 309763388737093预测值 5.54 2.92 1.54 五、结论 通过对全国能源消耗总量的实例分析,发现基于ARIMA预测模型、灰色模型和三次多项式的预测模型的组合模型的精度最高,组合模型较大限度地利用各种预测样本信息,考虑问题更系统、更全面。因此,利用组合模型对全国能源消耗总量进行预测,为能源规划及政策的制定提供科学的依据。
参考文献
[1] 中国国家统计局 中国统计年鉴2009
[2] 徐国祥编著.统计预测与决策.上海财经大学出版社,2009
[3] 刘勇,汪旭辉.ARIMA模型在我国能源消费预测中的应用.经济经纬.2007,(5)
[4] 潘志刚,韩颖.组合预测法在我国汽车市场需求预测中的应用.商业研究.2006,(20)
正在阅读:
统计预测与决策论文05-18
两考一评03-27
三大Windows系统故障恢复宝典07-05
领导干部培训班工作总结2000字05-12
你有没有努力去当最后一个人08-02
高考作文的“一材多用”12-13
“十三五”规划重点-非晶态合金生产建设项目建议书(立项报告)09-01
2016年08月15日初中数学组卷11-23
- 高一物理牛顿运动定律全套学习学案
- 水处理一级反渗透加还原剂亚硫酸氢钠后为什么ORP会升高
- 毕业设计(论文)-正文董家口 - 图文
- 荣盛酒店经营管理公司录用通知及入职承诺书II
- 第二讲 大学英语四级快速阅读技巧
- 质量管理体系文件(2015年委托第三方医药物流配送企业专用版本)
- 214071收款办法
- 苏轼对《文选》选文的评价
- 《诊断学基础B》1-8作业
- 广东省东莞市高一数学下学期期末教学质量检查试题
- 海南电网公司VIS推广应用管理办法
- 红星照耀中国习题
- 苏教版小学语文六年级上册期末复习资料之生字词整理
- 局域网组建与应用—王向东
- 税务稽查内部管理文书样式
- 环保社会实践调查表
- 九年级思品第一单元复习
- 2016年全国注册咨询工程师继续教育公路路线设计规范试卷
- 毕业设计-青岛港董家口港区防波堤设计
- 撞背锻炼方法与益处
- 决策
- 预测
- 统计
- 论文