yF 的点预测与区间预测

更新时间:2023-09-27 18:01:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

yF 的点预测与区间预测

yF 的点预测与区间预测:(演示EViews操作

例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系

Y1999的点估计值:Y1999 = 10.77 + 0.005069 ? 1863 = 20.21 Y2000的点估计值:Y2000 = 10.77 + 0.005069 ? 1983 = 20.82

Y1999的置信区间:20.2089?2.26?1.4417 → [16.9507,23.4671] Y2000的置信区间:20.8171?2.26?1.5297 → [17.3600,24.2742]

案例分析

案例一:人均消费性支出与可支配收入关系(课本P38) 案例二:用回归模型预测木材剩余量

整个样本区间预测的EViews操作

基本步骤 : 输出结果 结构分析 统计检验 预测效果

案例二

案例2:用回归模型预测木材剩余物

伊春林区位于黑龙江省东北部。全区有森林面积218.9732万公顷,木材蓄积量为2.324602亿m3。森林覆盖率为62.5%,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式,保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。下面,利用一元线性回归模型预测林区每年的木材剩余物。显然引起木材剩余物变化的关键因素是年木材采伐量。

给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表1。散点图见图1。观测点近似服从线性关系。建立一元线性回归模型如下:

yt = ?0 + ?1 xt + ut

表1 年剩余物yt和年木材采伐

林业局名 乌伊岭 东风 新青 红星 五营 上甘岭 友好 翠峦 乌马河 美溪 大丰 南岔 带岭 朗乡 桃山 双丰 合计

年木材剩余物y(万m3) 年木材采伐量x(万m3) tt

26.13

23.49 21.97 11.53 7.18 6.80 18.43 11.69 6.80 9.69 7.99 12.15 6.80 17.20 9.50 5.52 202.87

61.4 48.3 51.8 35.9 17.8 17.0 55.0 32.7 17.0 27.3 21.5 35.5 17.0 50.0 30.0 13.8 532.00

量xt数据

图2 EViews输出结果

EViews估计结果见图2。在已建立Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击Quick键,选Estimate Equation 功能。在出现的对话框中输入y c x。点击Ok键。立即会得到如图2所示的结果。

下面分析EViews输出结果。先看图2的最上部分。被解释变量是yt。估计方法是最小二乘法。本次估计用了16对样本观测值。输出格式的中间部分给出5列。第1列给出截距项(C)和解释变量xt。第2列给出第1列相应项的

?和??)??。第4列给出相应t值。回归参数估计值(?01。第3列给出相应回归参数估计值的样本标准差(s(?0), s(?1))

第5列给出t统计量取值大于用样本计算的t值(绝对值)的概率值。以t = 12.11266为例,相应概率0.0000表示统计量t取值(绝对值)大于12.1的概率是一个比万分之一还小的数。换句话说,若给定检验水平为0.05,则临界值为t0.05 (14) = 2.15。t = 12.1>2.15落在了H0的拒绝域,所以结论是?1不为零。输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。依纵向顺序,这些统计量依次是可决系数R2、调整的可决系数R2(以后介绍)、回归函?)数的标准差(s.e.,即均方误差的算术根?、残差平方和、对数极大似然函数值(以后介绍)、DW统计量的值(以

后介绍)、被解释变量的平均数(y)、被解释变量的标准差(s(yt))、赤池(Akaike)信息准则(是一个选择变量最优滞后期的统计量,以后介绍)、施瓦茨(Schwatz)准则(是一个选择变量最优滞后期的统计量,以后介绍)、F统计量(以后介绍)的值以及F统计量取值大于该值的概率。

注意:S.D.和s.e.的区别。s.e.和ESS的关系。

根据EViews输出结果(图2),写出OLS估计式如下:

?t= -0.7629 + 0.4043 xt (1.1) y (-0.62) (12.11) R = 0.9129, DW= 1.4819 T=16

2

其中括号内数字是相应t统计量的值。R2是可决系数。R 2 = 0.9129说明上式的拟合情况较好。yt变差的91%由变量xt解释。检验回归系数显著性的原假设和备择假设是(给定? = 0.05)

H0:?1 = 0; H1:?1 ? 0

图3 残差图

因为t = 12.1 > t0.05 (14) = 2.15,所以检验结果是拒绝?1 = 0,即认为年木材剩余物和年木材采伐量之间存在回归关系。上述模型的经济解释是,对于伊春林区每采伐1 m3木材,将平均产生0.4 m3的剩余物。

?t,Residual表示残差u?t。残差图3给出相应的残差图。Actual表示yt的实际观测值,Fitted表示yt的拟合值y图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e.。通过残差图可以看到,大部分残差值都落在了正、

负一个标准差之内。

估计?1的置信区间。由

t = P {

????11s(??1? t0.05 (14) } = 0.95

)???? t0.05 (14) s(??) 得 ?111?1的置信区间是

?), ??)] ?- t0.05 (14) s(??+ t0.05 (14) s(?[?1111[0.4043 - 2.15 ? 0.0334, 0.4043 + 2.15 ? 0.0334]

[0.3325, 0.4761] (2.65)

以95%的置信度认为,?1的真值范围应在[0.3325, 0.4761 ]范围中。

下面求yt的点预测和平均木材剩余物产出量的置信区间预测。假设乌伊岭林业局2000年计划采伐木材20万m3,求木材剩余物的点预测值。

?2000 = - 0.7629 + 0.4043 x2000 y = -0.7629 + 0.4043 ? 20 = 7.3231万m3 (2.66)

EViews通过预测程序计算的结果是

木材剩余物产出量单点的置信区间的估计结果是

?2000 ? t0.05 (14) s(y?2000) = 7.3231 ? 2.15 ? 2.145 = [2.71,11.93] y从而得出预测结果,2000年若采伐木材20万m3,产生木材剩余物的点估计值是7.3231万m3。平均木材剩余物产出量的置信区间估计是在 [2.71,11.93] 万m3之间。从而为恰当安排2000年木材剩余物的加工生产提供依据。 ?t=?EViews预测步骤如下。 怎样用EViews预测。以案例1为例,给定xt = 20,求y(1)点击Procs键选Structure/Resize Current Page功能。在弹出的对话框的End data选择框处改为17。点击OK键。

(2)双击工作文件窗口中的x序列,打开x数据窗口。点击Edit+/-键,使x数据窗口处于可编辑状态。在t =17的x的观测值位置输入20。相当于给定x=20。

(3)打开估计式eq01窗口,点击Forecast键。在S.E. 选择框处填入yfse,表示要yt的预测值(用YF表示)也要yt的预测标准差(用yfse表示)。点击OK键,工作文件窗口中已经出现一个yf序列。双击yf序列,可以看到。y17 = 7.322668。

?没有显著性,去掉截距项 ?0可以吗? 问题:估计结果中?0 答:依据实际意义可知,没有木材采伐量就没有木材剩余物,所以理论上?0是可以取零的。而有些问题就不可以。

例如家庭消费和收入的关系。即使家庭收入为零,消费仍然非零。一般来说,截距项的估计量没有显著性时,也不做剔出处理。

本案例剔出截距项后的估计结果是

?t= 0.3853 xt y (28.3) R = 0.91, s. e. = 2.0

2

点预测值是

?2000 = 0.3853 x2000 = 0.3853 ? 20 = 7.7060万m3 y

案例三:

刻卜勒(J. Kepler)行星运行第三定律

把地球与太阳的距离定为1个单位。地球绕太阳公转一周的时间为1个单位(年)。那么太阳系9个行星绕太阳各公转一周所需时间(T)和与太阳的距离(D)的数据见表: 9个行星与太阳的距离和绕太阳公转一周的时间之间有什么规律?刻卜勒(Johannes Kepler, 1571-1630,德国人)坚信9个行星绕太阳运行,一定有规律可循。经过艰苦的努力,他终于1619年发表了行星运行三定律。其中行星运行第三定律是:“行星在轨道上运行一周的时间的平方与其至太阳的平均距离的立方成正比例。”即T2 = D3。 obs Time DISTANCE T2 D3 水星 0.24 0.387 0.057 0.057 金星 0.615 0.723 0.378 0.377 地球 1 1 1 1 火星 1.88 1.52 3.534 3.512 木星 11.9 5.2 141.6 140.6 土星 29.5 9.54 870.2 868.3 天王星 海王星 84 19.2 7056 7078 165 30.1 27225 27271 冥王星 248 39.5 61504 61630 注:第谷(B. Tycho)的观测数据。 资料来源:《科学发现纵横谈》,王梓坤,上海人民出版社,1978。

用回归分析验证第三定律 (file:6kepler3)

25020015010050DISTANCE005101520253035406TIME543210-1LOG(TIME)LOG(DISTANCE)-2

-101234

log(T) = 1.5 log(D) +

(4492) R2 = 0.999999, N = 9 log(T) = (3/2) log(D) 2 log(T) = 3 log(D) log(T2) = log(D3) T 2 = D 3

案例:恩格尔是怎样发现恩格尔定律的。Murray-book 第1章 (file:food) 1857年,德国德累斯顿市的德国统计学家恩斯特?恩格尔(Engel)使用经Edouard Ducpetiaux收集的198个比利时家庭的收入与食物支出数据(单位:比利时法郎)得出其著名的恩格尔定律:收入越高的家庭将其收入用于食物支出的比例越低。 200016001200FOOD80040000400800120016002000240028003200TOTAL

案例:恩格尔是怎样发现恩格尔定律的。Murray-book 第1章 (file:food) 20002000FOOD vs. TOTAL16001600FOODFOOD1200120080080040040000400800120016002000240028003200TOTAL00400800120016002000240028003200TOTAL food = β0 + β1 (income) + ut = 84.1 +0.53?income (5.1) (32.7) R2=0.85,T=198 食物支出占收入的比例为?0food84.1???1??0.53 incomeincomeincome

食物支出占收入的比例随着收入的增加而递减。

本文来源:https://www.bwwdw.com/article/yl1d.html

Top