第一章时间序列分析概论
更新时间:2024-05-16 04:52:01 阅读量: 综合文库 文档下载
第一章 时间序列分析概论
人类为了探索周围的世界,常常按照时间顺序进行观测。这种观测数据有着比较独特的特点,即将来的数据通常以某种随机的方式依赖于当前得到的观测数据,而观测数据的这种相依性使得利用过去预测未来成为可能。时间序列是变量按时间间隔的顺序而形成的随机变量序列。大量自然界、社会经济等领域的统计指标都依年、季、月或日统计其指标值,随着时间的推移,形成了统计指标的时间序列。因此,时间序列是某一统计指标长期变动的数量表现。时间序列分析就是估算和研究某一时间序列在长期变动过程中所存在的统计规律性。本章将介绍时间序列分析的基本思想和一般概论。
§1.1 时间序列的定义和例子
在统计研究中,有大量的数据是按照时间顺序排列的,使用数学方法表述即用一组随机序列
?,X1,X2,?,Xt,?
(1.1)
表示随机事件的时间序列,简记为?Xt,t?T?或者?Xt?。
类似于样本与样本观测值的关系,我们可以使用
(1.2) x1,x2,?,xn
表示上述时间序列(1.1)的n个有序观测值,称其为序列长度为n的观测值序列。
在时间序列问题中,数据的时间顺序是重要的,时间序列的一个显著的特征就是记录的相依性。一般来说,关于时间序列?Xt?,对于任意的t,Xt是一个随机变量,且每个随机变量所服从的分布可以不同,对于任意的t,s,Xt与Xs不是相互独立的。时间序列的应用背景十分广泛,依照不同的需要,数据的收集可以按小时、天、周、月或者年等间隔进行,现在更有按照秒为时间间隔的所谓高频时间序列。下面我们介绍一些不同领域中的实际数据例子。 例1. 1820年—1869年的太阳黑子数据(单位:个):太阳黑子是太阳表面上的黑点,它反
映了太阳振动的全部演变,与太阳发电效应的行为有关。1820年—1869年的太阳黑子数依时间划在图1.1中,横轴是时间指标,纵轴表示在时间t的观测值Xt,这种图称为时间序列图。
图1.1 1820年—1869年间太阳黑子数据(单位:个)
例2. 1985年—2007年我国居民消费价格指数(CPI):所谓CPI即为消费者物价指数(Consumer
Price Index),英文缩写CPI,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。如果消费者物价指数升幅过大,
表明通胀已经成为经济不稳定因素。本例给出了我国1985年—2007年的年度数据,具体参见图1.2和附录。
图1.2 1985年—2007年我国居民消费价格指数(CPI)
例3. 1978年—2007年我国GDP数据(单位:亿元):GDP也就是国内生产总值。它是对一
国(地区)经济在核算期内所有常住单位生产的最终产品总量的度量,常常被看成显示一个国家(地区)经济状况的一个重要指标。本例给出我国1978年—2007年GDP数据(单位:亿元),具体参见图1.3和附录。
图1.3 1978年—2007年我国GDP(单位:亿元)
例4. 北京在历史上也是自然灾害频发的地区,在各种自然灾害中,水旱灾害发生的次数最多,危害最大。表1.1列出了北京地区1949年—1964年的洪涝灾害面积数据(单位:万亩)
表1.1 北京地区1949年—1964年的洪涝灾害面积
年份 受灾面积 年份 受灾面积 1949 331.12 1957 25.00 1950 380.44 1958 84.72 1951 59.63 1959 260.89 1952 37.89 1960 27.18 1953 103.66 1961 20.74 1954 316.67 1962 52.99 1955 208.72 1963 99.25 1956 288.78 1964 55.36 我们使用X1表示第一年(1949年)的受灾面积,X2表示第二年(1950年)的受灾面积等等,
X1,X2,?是一列按照时间顺序排列的随机序列,所以是时间序列。x1,x2,?,x16是北京地区1949
年—1964年的洪涝受灾面积,则
x1?331.12,x2?380.44,?,x16?55.36
是时间序列?Xt?的样本观测值,样本容量为16,它是时间序列?Xt?的一次实现的一部分。时间序列?Xt?的样本观测值x1,x2,?,x16可以由图1.4表示
400300200100019501952195419561958196019621964图1.4 北京地区1949年—1964年的洪涝灾害面积 例5. 1992年第一季度至2008年第三季度我国GDP季度数据(单位:亿元):图1.5是我国
1992年第一季度至2008年第三季度 GDP季度数据(单位:亿元),数据见附录。
图1.5 1992年第一季度至2008年第三季度我国GDP(单位:亿元)
例6. 1997年1月—2008年9月美元对人民币汇率的月度数据(单位:元):2005年7月21日中国启动人民币汇率改革以来,不断完善汇率形成机制,人民币对美元汇率总体呈现小幅上扬态势。过去两年多,人民币累计升值近16%。2008年以来,人民币汇率升幅已接近4.5%。
图1.6 1997年1月—2008年9月美元对人民币汇率(单位:元)
例7. 1990年12月19日—2008年11月6日上证指数日数据:上证综合指数的样本股是全
部上市股票,包括A股和B股,从总体上反映了上海证券交易所上市股票价格的变动情况,自1991年7月15日起正式发布。
图1.7 1990年12月19日—2008年11月6日上证指数
例8. 1980年1月—1991年10月澳大利亚红酒的月度销量(单位:公升):时间集T0:{1980.01,
1980.02,??,1991.10},包括共142个时间点。
图1.8 1980年1月—1991年10月澳大利亚红酒的月度销量(单位:公升)
从图1.8中我们可以看到,澳大利亚红酒月度销量存在一个较为明显上升趋势,同时又有季节模式,在每年的1月有一个销售淡季而在每年的7月都有一个销售高峰。 例9. 美国每年罢工总数(1951—1980):1951年—1980年,美国每年发生的罢工次数数据
见图1.9,该图显示了这些数据一种不规律的上下波动。在这里我们从中看不出什么很明显的趋势,至于这一序列是否平稳,还有待于用后面的知识进行进一步的验证。
图1.9 1951年—1980年美国每年罢工总数
例10. 1994年1月1日—1995年12月31日香港环境数据序列:(a) 表示因循环和呼吸
问题前往医院就诊的人数;(b) 表示二氧化硫的日平均水平;(c) 表示二氧化氮的日平均水平;(d) 表示可吸入的悬浮颗粒物的日平均水平。
上述例子涉及到天文学、经济学、金融学、社会学和环境科学等领域,其实有关时间序列数据不仅仅只存在这些领域中,还存在于更多的其他领域之中,更多的实际例子我们将在后面的内容里陆续引入。时间序列分析突出发展从数据获得推断的有效方法,其的目的就是建立一个能很好描述数据的随机模型,使得观测到的时间序列可以看作是该随机模型的一个实现。这个模型应该能够反映内在的动态行为,并且只要模型是合适的,就能够用来预报和控制。
§1.2 时间序列分析方法简介
时间序列分析的目的是不同的,它依赖于应用背景。一般地,时间序列被看作是一个随机过程的实现。分析的基本任务是揭示支配观测到的时间序列的随机规律,通过所了解的这个随机规律,我们可以理解所要考虑的动态系统,预报未来的事件,并且通过干预来控制将来事件。上述即为时间序列分析的三个目的。Box and Jenkins (1970)的专著“Time Series Analysis: Forecasting and Control”是时间序列分析发展的里程碑,他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARIMA模型识别、估计和诊断的系统方法。使ARIMA模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础,这种对ARIMA模型识别、估计和诊断的系统方法简称B-J方法。对于通常的ARIMA的建模过程,B-J方法的具体步骤如下:
第一步、关于时间序列进行特性分析。一般地,从时间序列的随机性、平稳性和季节性三方面进行考虑。其中平稳性和季节性更为重要,对于一个非平稳时间序列,若要建模首先要将其平稳化,其方法通常有三种:(1)差分,一些序列通过差分可以使其平稳化。(2)季节差分,如果序列具有周期波动特点,为了消除周期波动的影响,通常引入季节差分。(3)函数变换与差分的结合运用,某些序列如果具有某类函数趋势,我们可以先引入某种函数变换将序列转化为线性趋势,然后再进行差分以消除线性趋势。
第二步、模型的识别与建立,这是ARMA模型的建模重要一步。首先需要计算时间序列的样本的自相关函数和偏自相关函数,利用自相关函数分析图进行模型识别和定阶。一般来说,
使用一种方法往往无法完成模型识别和定阶,并且需要估计几个不同的确认模型。在确定了模型阶数后,就要对模型的参数进行估计。得到模型之后,应该对模型的适应性进行检验。
第三步、模型的预测与模型的评价。B-J方法通常采用了线性最小方差预测法。一般地,评价和分析模型的方法是对时间序列进行历史模拟。此外,还可以做事后预测,通过比较预测值和实际值来评价预测的精确程度。
时间序列分析早期的研究分为时域分析方法和频域分析方法。所谓频域分析方法,也称为“频谱分析”或者“谱分析”方法,是着重研究时间序列的功率谱密度函数,对序列的频率分量进行统计分析和建模。对于平稳序列来说,自相关函数是功率谱密度函数的Fourier变换。但是由于谱分析过程一般都比较复杂,其分析结果也比较抽象,不易于进行直观解释,所以一般来说谱分析方法的使用具有较大的局限性。时域分析方法是分析时间序列的样本自相关函数,并建立参数模型(例如ARIMA模型),以此去描述序列的动态依赖关系。时域分析方法的基本思想是源于事件的发展通常都具有一定的惯性,这种惯性使用统计语言来描述即为序列之间的相关关系,而这种相关关系具有一定的统计性质,时域分析的重点就是寻找这种统计规律,并且拟合适当的数学模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。时域分析方法最早可以追溯到1927年,英国统计学家G. U. Yule提出了自回归(Autoregressive)模型。后来,英国数学家、天文学家G. T. Walker(1931)在分析印度大气规律时引入了移动平均(Moving Average)模型和自回归移动平均(Autoregressive Moving Average)模型。这些模型奠定了时间序列分析时域分析方法的基础。相对于频域分析方法,时域分析方法具有比较系统的统计理论基础,操作过程规范,分析结果易于解释。随着研究的深入和计算技术的发展,时域方法和频域方法之间的鸿沟已趋消失。但是,相对于频域分析方法,时域分析方法具有比较系统的统计理论基础,操作过程规范,分析结果易于解释。鉴于此,本书主要应用时域方法进行时间序列分析。
计算技术的飞速进步极大地推动了时间序列分析的发展。线性正态假定下的参数模型得到充分地解决,计算量较大的离群值分析和结构变化的识别成为时间序列模型诊断的重要部分。非线性时间序列分析也得到充分的发展,实际上,我们常常会遇到理论上和数据分析上都不属于线性的。在这种情况下,我们需要引入非线性时间序列。Tong(汤家豪,1980)利用分段线性化构造模型的思想提出了门限自回归模型开创了非线性时间序列分析的先河。门限自回归模型的特征恰好刻画了自然界的突变现象,例如在经济领域,许多指标受到多种因素的影响,使某些观测序列呈跳跃变化,在水文、气象等领域中也有诸多类似的现象。Tong and Lim (1980) 认为这类模型是一个非常实用的模型,可以解决很多线性模型不能解决的问题。
在时间序列分析方法的发展历程中,商业、经济、金融等领域的应用始终起着重要的推动作用,时间序列分析的每一步发展都与应用密不可分。随着计算机的快速发展,时间序列分析在商业、经济、金融等各个领域的应用越来越广泛, 经济分析涉及到大量的时间序列数据,如股票市场中的综合指数、个股每日的收盘价等。从经济学的角度来说,个人为了获得最大利益,总是力图对经济变量作出最准确的预期,以避免行动的盲目性。在股票市场上,每个人都想正确地预期到股票将来的价格。由于股票市场属于“不对称信息”(Asymmetric Information)市场,投资者往往无法准确地获取各种充分的信息,只能凭借历史的和不完整的信息来推测,因此,如何准确地分析、预测股票价格变动的方向和程度大小成为股市投资的基础和重点。
在金融时间序列分析中,主要用于以下几个方面的研究: (1). 研究金融过程的动态结构; (2). 探索金融变量之间的动态关系; (3). 对金融数据进行季节或其它形式的周期调整(如日内效应、周效应等); (4). 通过对具有自相关关系的模型误差分析,改进用时间序列进行回归分析的模型; (5). 对均值或波动率进行点预测或区间预测。
金融时间序列建模不仅需要研究时间序列数据,而且要研究时间间隔序列,这些研究使得时间序列分析不仅需要统计方法,同时需要融入更多的随机过程成份。
在现代金融理论中,金融市场上收益的风险和价格的不确定性往往是用方差来度量的。金融市场一般包括货币资金融通市场、有价证券市场、资本和外汇市场等等,其主要数据来源于资金融通市场,如债券市场的利率,股票市场的价格(它反映了收益率)外汇市场的汇率等等。传统的计量经济学模型往往假定样本的方差保持不变,随着金融理论的发展和实证分析工作的深入,越来越发现这一假设的不尽合理性。大量的来自于金融市场的数据分析已表明,用于表示不确定性的风险的方差是随着时间变化的。
金融市场证券价格波动具有随时间变化的特征,有时相对稳定,有时波动异常激烈。金融市场上证券数据从一个时期到另一个时期的变化过程中,常常出现价格波动聚集(Volatity
Clustering)现象,大幅度波动聚集在某一段时间,而小幅度波动聚集在另一些时段上。一般地,描述风险资产(如股票,期权)的价格,需引入随机变量,而且其方差往往也随时间变化的。Engle(1982)在研究英国的通货膨胀时首次提出了ARCH(Autoregressive Conditional Heteroskedasticity)模型,他利用ARCH模型来刻画数据中存在的条件异方差。他认为条件异方差是外生变量,滞后的内生变量,时间,参数和前期残差的函数。从而使得模型能够较为贴切地刻画了金融市场的变化状况,描述金融市场的变化特征。Engle和其合作者还对ARCH 模型进行了很多扩展,比如IGARCH 模型(Bollerslev and Engle, 1986)、FARCH 模型(Engle,1987),对市场微观结构研究的ACD 模型(Engle and Russell,1998;Engle,2000)。另外,很多学者提出了其它类型的ARCH 模型,比如Nelson(1991)的指数ARCH 模型。目前ARCH 模型的研究仍然是计量经济学研究的热门领域,而ARCH在金融学中的应用研究出现了一门的新的学科―金融计量经济学,而这一学科也处在不断的发展之中。
金融高频时间序列分析从二十世纪90年代开始迅速发展,目前已经涉及的内容十分广泛,对于金融高频数据的计量建模就是其中的一个重要研究方向。高频金融时间序列通常是指以天、小时、分钟甚至秒为频率所采集的按时间先后顺序排列的金融类数据以及记录每笔交易的时间序列。从金融高频数据产生至今,对金融高频时间序列分析一直是金融研究领域中一个倍受瞩目的焦点。这可以归结为两个原因:一个是由于对金融高频数据本身所具有的特征值的关注。通常所指的交易数据,除了交易价格外,还包括与交易相连的询价和报价、交易数量、交易之间的时间间隔、相似资产的现价等等。因此,对于金融高频数据的分析,实质上是一个关于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的”复杂多变量问题。这样如何从总体上来分析金融高频数据、又如何处理具体金融交易中高频数据的特殊性,便成为众多金融领域的从业者和研究者所面临的一个有趣而又富有挑战性的课题。由于金融高频数据具有许多新的特征,如波动率日内“U”型走势、波动率具有日历性、价格序列具有极高的峰值、价格序列一阶负相关、宽尾、非正态、波动率聚集、随机不等间隔以及价格离散取值等,这些特征使得传统的模型假设失去了意义,需要探寻新的计量模型来刻画这些数据特征。近年来计量模型研究的核心内容是交易间隔(intratrade duration)与交易特征值,如收益、讯报价差额、交易量等之间的Granger因果关系。它们认为较长的时间间隔意味着缺少交易活动,也代表着一个没有新信息产生的时期,因此,时间间隔行为的动态性中含有关于日内市场活动的有用信息。金融高频时间序列分析对金融市场的计量建模、实证金融、乃至连续金融产生了巨大的挑战和冲击,从而也加速了各个研究领域的融合。
§1.3 时间序列分析软件
计算机技术的进步极大地促进了时间序列分析的发展。目前,许多统计软件都可以用于时间序列分析工作。常用软件S-plus、Matlab、Gauss、TSP、Eviews和SAS软件。
SAS(Statistical Analysis System)软件是由美国北卡来罗纳州立大学(North Carolina State University)的两位教授(A. J. Barr and J. H. Goodnight)共同开发的,这是一个专门用于数学建模和统计分析的软件系统,经过多年的发展,SAS已被全世界120多个国家和地区的近三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在1996
—1997年度被评选为建立数据库的首选产品。SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。
SAS/ETS(经济计量学和时间序列分析模块)编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件。由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势。
由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此其操作至今仍以编程为主,人机对话界面不太友好,并且在编程操作时需要用户最好对所使用的统计方法有较清楚的了解,非统计专业人员掌握起来较为困难。
EViews是美国GMS公司1981年发行第1版的Micro TSP的Windows版本,通常称为计量经济学软件包。EViews是Econometrics Views的缩写,它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、运用模型进行预测、求解模型和运用模型,EViews是完成上述任务得力的必不可少的工具。是当今世界上最流行的计量经济学软件之一。正是由于EViews等计量经济学软件包的出现,使计量经济学取得了长足的进步,发展成为实用与严谨的经济学科。使用 EViews软件包可以对时间序列和非时间序列的数据进行分析,建立序列(变量)间的统计关系式,并用该关系式进行预测、模拟等等。虽然 EViews是由经济学家开发的,并且大多数被用于经济学领域,但并意味着必须限制该软件包仅只用于处理经济方面的时间序列。EViews处理非时间序列数据照样得心应手。实际上,相当大型的非时间序列(截面数据)的项目也能在 EViews中进行处理。Eviews具有数据处理、作图、统计分析、回归建模分析、预测、时间序列ARIMA分析、时间序列的季节调整分析、编程和模拟九大类功能,包括建立数据文件、画图、一系列计假设检验、最小二乘估计、工具变量估计、两阶段最小二乘估计、离散选择模型(tobit、probit、logit、删载、截余、计数等模型)估计、联立方程模型估计、GARCH模型估计、时间序列ARIMA模型估计、向量自回归模型估计、向量误差修正模型估计、自相关检验、异方差检验、多重共线性检验、结构突变检验、单位根(时间序列平稳性)检验、Granger非因果性检验、协积检验、面板数据应用、Eviews编程和蒙特卡罗(Monte Carlo)模拟、主成分分析、时间序列的季节调整等内容。
与SAS相比,操作灵活简便,可采用多种操作方式进行各种计量分析和统计分析,数据管理简单方便。Eviews的界面比较友好,使用简便。为了使学生能够更加深刻地掌握时间序列分析理论和应用,本书在每一章的后面都有一节的内容介绍本章的分析方法在Eviews软件上的实现。另外,本书的所有例题也是以Eviews软件为操作软件实现的。
习题一
1.1 什么是时间序列?请收集几个生活中的观察序列。
1.2 时域方法的特点是什么?
1.3 金融时间序列分析主要研究哪几个方面?
1.4 什么是金融高频时间序列分析?它主要研究哪些内容?
EVIEWS软件简介
Eviews(Econometrics Views),直译为计量经济学观察,通常称为计量经济学软件包。它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、应用模型(结构分析、经济预测、政策评价)。Eviews是完成上述任务比较得力的必不可少的工具。 一、Eviews基本简介 1、Eviews是什么
Eviews是专门开发用以处理时间序列数据的时间序列软件包的新版本。Eviews的前身是1981年第1版的Micro TSP。我们以Eviews5.1版本为例,介绍时间序列分析使用的基本方法和技巧。Eviews处理的基本数据对象是时间序列,每个序列有一个名称,只要提及序列的名称就可以对序列中所有的观察值进行操作,Eviews允许用户以简便的可视化的方式从键盘或磁盘文件中输入数据,根据已有的序列生成新的序列,在屏幕上显示序列或打印机上打印输出序列,对序列之间存在的关系进行统计分析。Eviews具有操作简便且可视化的操作风格,体现在从键盘或从键盘输入数据序列、依据已有序列生成新序列、显示和打印序列以及对序列之间存在的关系进行统计分析等方面。 2、Eviews的窗口简介
利用Eviews5.1安装包按提示安装完成后,使用Windows浏览器或从桌面上“我的电脑”定位Eviews目录,双击“Eviews”程序图标,就进入了Eviews操作界面。
Eviews的窗口上方按照功能划分9个主菜单选项(见图1.10),鼠标左键单击任意选项会出现不同的下拉菜单,显示该部分的具体功能,9个主菜单选项提供的主要功能如下:
图1.10 Eviews5.0软件窗口
File 有关文件(工作文件、数据库、Eviews程序等)的常规操作,如文件的建立(New)、打开(Open)、保存(Save/Save As)、关闭(Close)、读入(Import)、读出(Export)、打印(Print)、打印设置(Print Setup)、程序运行(Run)、退出(Exit)等,选择Exit将退出Eviews软件。
Edit 相关下拉菜单有撤消(Undo)、剪切(Cut)、复制(Copy)、 粘贴(Paste)、删除(Delete)、查找(Find)、替换(Replace)、合并(Merge)等功能,但通常情况下只提供复制功能,选择Undo则撤消上步操作。
Object 提供关于对象的基本操作。包括建立新对象(New Object)、从数据库获取(Fetch from DB)、更新对象(Update from DB)、将工作文件中的对象存储到数据库(Store to DB)、复制对象(Copy Object)、命名(Name)、删除对象(Delete)、打印(Print)、视图选择(View Option)等。
View 和Proc 这两个主菜单的下拉菜单功能项随当前窗口不同而不同,主要涉及变量的多种查看方式和运算过程。
Quick 主要提供快速分析过程,包括常用的统计过程如抽样(Sample)、产生序列(Generate Series)、统计图(Graph)等,描述统计如序列统计量(Series Statistics)、群统计量(Group Statistics)等以及方程估计(Estimate Equation)、估计向量自回归模型(Estimate VAR) 等。
Options 系统参数设定选项。软件运行过程中的各种状态,如窗口的显示模式、字体、视图、表格等都有默认的格式,用户可以根据需要进行选择和修改。
Window 提供多种在打开窗口中进行切换的方式,以及关闭所有窗口(Close All) 和关闭所有对象(Close All Objects)等。
Help 帮助选项。
主窗口的主菜单下空白区域时交互模式下的命令输入区,每次允许键入一个操作命令。主窗口中大面积的空区域是留给其他子窗口显示所用。最下面是状态显示行,有程序路径、数据
库和工作文件名称等相关内容。 3、关闭Eviews
关闭Eviews的方法很多:选择主菜单上的“File”→“Exit”;按ALT-F4键;单击Eviews窗口右上角的关闭按钮;双击Eviews窗口左上角等。Eviews关闭总是警告和给予机会将那些还没有保存的工作保存到磁盘文件中。
二、创建时间序列工作文件( Workfile数据集)
要使用Eviews分析数据,首先要将数据转换成Eviews系统能够分析的Eviews Workfile数据集。 1、创建工作文件
Eviews要求数据的分析处理过程必须在特定的工作文件(Workfile)中进行,所以在录入和分析数据之前,应创建一个工作文件。鼠标左键单击主菜单选项File,在下拉菜单中选择New/Workfile(“/”表示下一步操作),此时屏幕会出现一个工作文件创建(Workfile Create)对话框,对话框中共有3个选项区(见图1.11):工作文件结构类型(Workfile structure type)、日期设定(Date specification)和命名项(Name,可选项)。
图1.11 工作文件创建对话框
图1.12
Workfile structure type选项区中共有3中类型,见图1.12。(1)非结构/非日期型(Unstructured/Undated);(2)日期-规则频率型(Dated-regular frequency);(3)平衡面板型(Balanced Panel)。默认状态是Dated-regular frequency型。在默认状态下,另一选项区Date
specification(日期设定区)有8种可选的日期设定频率,见图1.13,分别是年度的(Annual)、半年的(Semi-annual)、季度的(Quarterly)、月度的(Monthly)、周度的(Weekly)、5天一周以天计的(Daliy-5 day week)、7天一周以天计的(Daliy-7 day week)和整天数计的(Integer date)。需要注意的是,在输入季度、月度和周度数据时,都需要在年度后相应加上Q、M、W和相应的数字,比如数据范围从1999年第一季度到2008年第二季度,起始期(Start)应输入1999Q1,终止期(End)相应输入2008Q2。
图1.13
如果Workfile structure type选项区选择了Unstructured/Undated,对话框就变成图1.14的模式,需要在Date range选择区输入观测值个数,即时间序列长度或样本数据个数。相应地,如果Workfile structure type选项区选择了Balanced Panel,对话框相应变成图1.15的样子,在面板设定区域(Panel specification)有4个选择区。数据频率(Frequency)选择区包含8 种与图2.3的选项。起始期(Start)和终止期(End)分别输入序列数据的开始时间和终止时间。个体个数(Number of cross)选择区要求输入面板数据中所包括的个体个数。按照数据分析要求设定完成后点击OK键,就建立了一个新工作文件。
图1.14
图1.15
2、创建时间序列
工作文件建立之后,应创建待分析处理的数据序列。在主窗口的菜单选项或工作文件窗口的工具栏中选择Object/New Object,屏幕会出现图1.16的对话框。用户可以在左侧列表中选择希望生成的对象类型,对时间序列而言,通常选择Series,同时在右边对话框为新序列命名(默认为Untitled),如命名为a(Eviews软件不区分序列名字的字母大小写表示),定义完毕后单击OK。此时已经建立了一个名为a 的序列,打开它主要由三种方法:(1)双击序列a;(2)选中a,在工作文件窗口选择View/Open Selected/One Window;(3)在工作文件窗口中按Show或在主窗口中选择Quick/Show后,在出现的对话框中输入序列名a,点击OK就建立了一个尚未录入数据的年度时间的时间序列a,序列对象窗口见图1.17。
在给对象命名时需要注意,Eviews软件本身有很多保留字符不能使用:ABS ACOS AR ASIN C CON CNORM COEF COS D DLOG DNORM ELSE ENDIF EXP LOG LOGIT LPT1 LPT2 MA NA NRND PDL RESID RND SAR SIN SMA SQR 和THEN。
图1.16 对象定义对话框
图1.17序列对象窗口
3、时间序列数据录入、调用与编辑
Eviews5.1版本提供了多种导入数据的方法,主要介绍两种: (1)手动录入数据
建立工作文件后,新生成或打开一个序列,都会出现图1.17的序列对象窗口。在工具栏上点击Edit+/-按钮进入编辑状态,用户可输入或修改序列观测值,录入或修改数据完毕后必须再次点击Edit+/-按钮恢复只读状态;Smpl+/-按钮可在显示工作文件时间范围内全部数据和只显示样本数据之间切换;Label+/-按钮在是否显示对象标签两种模式间进行切换。 (2)导入已有数据文件
Eviews5.1允许导入三种格式的数据:Text-ASCⅡ、Lotus和Excel工作表。有三种方式可以导入:(1)主菜单File/Import/Read Text-Lotus-Excel;(2)主菜单Proc/Import/Read Text-Lotus-Excel;(3)工作文件工具栏Proc/Import/Read Text-Lotus-Excel。无论选择哪种导入方式,选择后找到并打开目标文件,对应于不用类型的文件会出现不同的对话框,时间序列分析通常以Excel工作表数据的读入最为常见,但要求Excel工作表中的序列名称一定不能出现汉字,因为Eviews没经过汉化,现举例说明。
例1.有个关于1949-1998年北京市每年最高气温(单位:摄氏度)序列的Excel工作表,见图1.18,现将其读入Eviews。
图1.18 数据的Excel工作表
第一步,按上面所介绍的方法建立一个时间范围为1949到1998年的 工作文件;第二步,按导入数据的三种方法之一找到相关Excel文件存储路径后,双击此文件名,屏幕会出现图1.19的对话框。对话框左上角有两个选项,分别表示数据在Excel工作簿中的排列方式:按观测值排列(By Observation)正如图1.18,每个变量的观测值分别在不同列上;按序列排列(By Series)表示每个特定变量的观测值在一横行上。选项右边Upper-left data cell下的空格应填Excel工作簿中左上方第一个有数据的单元格地址,若把time也作为一个变量的话,第一个数据出现在A2,则把B2改成A2;最右边的选项Excel 5+ sheet name下空格指定读入数据的工作表名称,若不指定,则默认从当前工作表读入数据,我们这里采用默认形式。对话框中间较大空白区域要求输入读入变量的名称或个数,如果采用原序列名,则输入time和temperature(中间用空格隔开)或2;若对序列重新命名,则输入自定义序列名,第一个输入的序列名为原文件的第一列变量。对话框最下面空白是建立工作文件时定义的欲调入序列的时间范围,用户可以修改对应的样本期,如输入1949到1980则生成的序列从1981后均没有观测值。定义完毕后,工作文
件窗口出现新读入的time和temperature序列。
图1.19 读入Excel电子表格对话框
4、新序列的建立
在数据分析时,从原序列选取样本进行分析或利用已有序列生成新序列和修改原序列值都很常见,下面介绍样本的产生和新序列的生成。 (1)产生样本
样本(sample)通常是工作文件序列观测值的一个子集。在建立工作文件时,系统默认为整个观测期。当需要对某段时间按或符合某种条件的观测值分析时,需要更改样本期。有四种实现方式:在工作文件窗口的工具栏点击Sample;在主菜单或工作文件窗口工具栏点击Proc/Set Sample;在主菜单点击Quick/Sample,屏幕会出现如图1.20的对话框。在Sample range pairs下的空白区域需给出成对的日期,每对数值分别表示在新样本期中一个子集的起止点,如输入1949 1970 1980 1989,表示选择1949到1970年和1980到1989年的观测值构成样本进行操作。对话框下半部分If condition是附加条件输入区域,若不需要对序列值进行限制可省略。Eviews5.1将取用户输入的样本区间和附加条件的交集作为最终的样本期。样本期的定义也可用命令完成,格式为:
smpl start1 end1 start2 end2 if_condition
图1.20 样本期定义对话框
(2)生成新序列
建立好工作文件后,在主菜单选择Quick/Generate Series或Object/Generate Series或点击工作文件窗口工具栏中的Object/Generate Series或直接点击工具栏中的Generate按钮,屏幕会出现如图1.21对话框。用户可以在Enter equation编辑区域中输入赋值语句,在下面Sample中输入样本期。比如对例1产生的temperature序列进行一阶差分生成一个新序列x,则可键入如下赋值语句:x=d(temperature),就产生了一个新序列x了。生成或修改一个序列,也可用命令方式,格式为
Series name=formula
比如上面生成的序列x,在命令区域可键入
Series x=d(temperature)
图1.21生成序列对话框
5、创建群
在数据分析时,通常需要针对多个序列操作以观察序列间的关系。和创建序列操作相同,在图1.?种选择Group,命名后就出现图1.22的对话框,输入欲建立的群所包含的序列名称后,点OK。也可以使用命令方式生成群,格式为
Group group-name ser1 ser2 ser3 ser4
图1.22 群定义对话框
三、绘制时间序列图
时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个常数值波动,且波动的范围不大。
例1续.1949-1998年北京市每年最高气温序列(单位:摄氏度)时序图
按照前面介绍的方法建立工作文件和导入外部Excel文件,建立对应的时间序列temperature。点击主菜单Quick/Graph就可作图,共有5个选项,见图1.23,分别是折线图(Line graph)、条形图(Bar graph)、散点图(Scatter)等,也可双击序列名,出现显示电子表格的序列观测值,然后点击工具栏的View/Graph。如果选择折线图,出现图1.24的对话框,在此对话框中键入要做图的序列,我们输入temperature,点击OK则出现折线图,横轴表示时间,纵轴表示最高气温,见图1.25。选择图1.25上工具栏options可以对折线图做相应修饰,比如显示出各数据点并用“*”表示,把背景色调成白色,默认为黄色,点击主菜单的Edit/Copy,然后粘贴到文档就变成了如图1.26的折线图。
图1.23 Eviews作图
图1.24
图1.25
414039centidegree38373635343350556065707580859095TEMPERATURE 图1.26 北京市最高气温折线图
四、查看序列的简单统计量
通过Eviews软件,我们可以非常方便的查看目标序列的相关简单统计量。
例1续.在工作文件中选中并双击目标序列对象temperature,在打开的这一目标序列对话框中,选择左上角的View选项,如图1.27。在下拉菜单中选中“Descriptive Statistics”,在出现的次级菜单中选中“Histogram and Stats”, Eviews就会给出temperature的柱状图以及简单描述统计量,如图1.28。
图1.27
987654321034363840Series: TEMPERATURESample 1949 1998Observations 50Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-BeraProbability 36.98600 37.20000 40.60000 33.40000 1.619273 0.107098 2.458279 0.706962 0.702239 图1.28
在图1.28中显示的有该序列的名称temperature,样本起止点1949-1998,共有50个观测值。以及该序列的均值(Mean),中位数(Median),最大、最小值(Maximum,Minimum),标准差(Std.Dev.),偏度(Skewness),峰度(Kurtosis),J-B统计量(Jarque-Bera)及它的相伴概率(Probability)。
正在阅读:
第一章时间序列分析概论05-16
综合工时申请报告03-13
软件测试报告完整实用03-21
十九大应知应会知识试题100题05-18
初一数学上册第三单元一元一次方程知识06-03
桥梁高墩翻模施工工法12-07
《高分子》作业及答案09-09
2013最新北师大版小学数学二年级上册第1、2、3单元教案09-03
电影《郭明义》观后感5篇12-11
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 时间序列
- 概论
- 分析
- 用马克思主义关于人的本质的学说,批判“人性自私”的错误观点的
- 2017年高考化学微测试系列专题09镁、铝及其化合物(含解析)
- 合同法期末必备单选附答案
- 中国普级单杠市场发展研究及投资前景报告(目录) - 图文
- 北展小学作业库建设实施方案
- 第一章 试卷整理习题(1)
- 基于JSP的网上花店管理系统的设计与实现 毕业论文 - 图文
- 基于SAP NetWeaver EP的单点登录(SSO)
- 2018年山东烟台中考化学试卷
- 初中军训心得体会范文 - 0
- 私募投资基金(公司制、合伙制、契约制)三种组织方式的比较分析
- 国资委《关于企业国有资产评估报告审核工作有关事项的通知》
- erp沙盘模拟实验报告营销总监
- CATIA V5标准件的制作、入库及调用程序 - 图文
- 段建业盲派命理初级班完整资料
- 营改增全面推开后还有哪些应税行为按差额征税
- 中国吸顶式音箱行业市场调查研究报告(目录) - 图文
- 部编版二年级语文生字加偏旁换偏旁组词归类(附练习题)
- 领导力调查问卷
- 二战德国800mm“多拉”列车炮 - 图文