计量经济学参考答案

更新时间:2024-05-28 15:23:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章练习题及参考解答

练习题2.1 参考解答:

计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:

计算方法: rXY?n?XiYi??Xi?Yin?X?(?Xi)2iii22n?Yi?(?Yi)222

或 rX,Y?计算结果:

M2 GDP

?(X?X)(Y?Y)?(X?X)?(Y?Y)ii

M2 GDP

1 0.996426148646

0.996426148646 1

经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性

相关程度相当高。

练习题2.2参考解答

美国软饮料公司的广告费用X与销售数量Y的散点图为

说明美国软饮料公司的广告费用X与销售数量Y正线性相关。 相关系数为: x y x 1 0.978148015384 y 0.978148015384 1 说明美国软饮料公司的广告费用X与销售数量Y的正相关程度相当高。

若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型 Yi??1??2Xi?ui 利用EViews估计其参数结果为

经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。

练习题2.3参考解答: 1、 建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地

方预算内财政收入(Y)和GDP的数据表,作散点图

可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt??1??2GDPt?ut 利用EViews估计其参数结果为

??20.4611?0.0850GDP 即 Ytt (9.8674) (0.0033)

t=(2.0736) (26.1038) R2=0.9771 F=681.4064

经检验说明,深圳市的GDP对地方财政收入确有显著影响。R?0.9771,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。

模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。 当2008年GDP 为7500亿元时,地方财政收入的点预测值为:

2??20.4611?0.0850?8000?700.4611(亿元) Y2008区间预测:

为了作区间预测,取??0.05,Yf平均值置信度95%的预测区间为:

2(X?X)1f??t? Y ?f?2?2nx?i利用EViews由GDP数据的统计量得到 则有

6 X?2300.7 7 3 n=18 ?x?2031.2 6?x2i2??x(n?1)?2031.2662?(18?1)?70142706.5669

22 (Xf1?X)?(8000?2300.773)?32481188.3976

??700.4611,t(18-2)=2.120平均值置信度95%的预测区间为: 取??0.05,Y0.0252008 Yf?t?2?^^21(Xf?X)? 2n?xiGDP2008?8000时 700.4611?2.120?27.2602?132481188.3976 ?1870142706.5669 ?700.4611?41.6191(亿元)

Yf个别值置信度95%的预测区间为:

21(Xf?X) Yf?t?2?1?? 2n?xi^^即 700.4611?2.120?27.2602?1? ?700.4611?71.2181(亿元)

132481188.3976 ?1870142706.5669

练习题2.4参考解答:

(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型: Yi??1??2Xi?ui 利用EViews估计参数并检验

回归分析结果为:

??3044.343?0.530112X Ytt(895.4040) (0.00967) t= (3.3999) (54.8208)

R?0.9908 n=30

2??(2)回归估计的标准误差即估计的随机扰动项的标准误差???3580.903, 可决系数为0.9908。 计参数和检验结果得??e2t(n?2),由EViews估

(3)由t分布表可查得t0.025(30?2)?2.048,由于t?2?54.8208?t0.025(28)?2.048 ,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对

最终消费有显著影响。

(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:

??3044.343?0.530112?300670?162433.1180(亿元) Y2008对最终消费的均值置信度为95%的预测区间为:

Yf?t?2?^^21(Xf?X) ?2nx?i由Eviews计算国民总收入X变量样本数据的统计量得:

7 n=30 ?x?68765.51 X?63270. 0则有

?x2i2??x(n?1)?68765.512?(30?1)?137132165601.2429

(Xf?X)2?(300670?63270.07)2?56358726764.0049

??162433.1180,t(30-2)=2.048,已知 ???3580.903,平均值置信取??0.05,Y0.0252008度95%的预测区间为:

Yf?t?2?^^21(Xf?X) ?2nx?i =162433.1180?2.048?3580.903?156358726764.0049 ?30137132165601.2429 =162433.1188?4888.4110(亿元)

练习题2.5参考解答:

美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为

由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系, 利用EViews计算线性相关系数为: X Y X 1 -0.882607 Y -0.882607

建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程: Yi??1??2Xi?ui

利用EViews估计其参数结果为

??6.017832?0.070414即 YXi i (1.017832)(-0.014176)

t=(5.718961) (-4.967254) R2=0.778996 F=24.67361

从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。

这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。

如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为

??6.017832?0.070414 Y(次) ?80?0.384712i

练习题2.6参考解答:

1.分析每股帐面价值和当年红利的相关性 作散布图:

从图形看似乎具有一定正相关性,计算相关系数:

每股帐面价值和当年红利的相关系数为0.708647

2.建立每股帐面价值X和当年红利Y的回归方程:

Yi??1??2Xi?ui

回归结果:

参数?2的t检验:t值为3.7580,查表t0.025(16?2)?2.145

平均说来公司的股票每股红利增加1元,当年帐面价值将增加6.8942元

练习题2.7参考解答:

(1)建立回归模型: Yi??1??2Xi?ui

??用OLS法估计参数: ?2?(X?X)(Y?Y)??xy?(X?X)?xii2iii2i?334229.09?0.7863

425053.73??Y???X?549.8?0.7863?647.88?66.2872 ?12??66.2872?0.7863X 估计结果为: Yii说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。 (2)计算可决系数和回归估计的标准误差 可决系数为:

R

2??y??y22i2i?x)(????y2i2i2??2x?2?i2?y2i

?0.7863?425053.73262796.99??0.999778262855.25262855.25 可得

由 r2?e?1??y2i2i?e2i?(1?R2)?yi2

?e2i?(1?R2)?yi2?(1?0.999778)?262855.25?58.3539

??回归估计的标准误差: ??e2i(n?2)?58.3539(12?2)?2.4157

(3) 对?2进行显著水平为5%的显著性检验

t?*????22?)SE(?2^?????2?)SE(?2?^~t(n?2)

?)?SE(?2^?x?2i2.41572.4157??0.0037 651.9614425053.73 t?*??2?)SE(?2^0.7863?212.5135

0.0037* 查表得 ??0.05时,t0.025(12?2)?2.228

表明?2显著不为0,销售收入对销售成本有显著影响.

(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置

信度为95%的预测区间。

??66.2872?0.7863X?66.2872?0.7863?800?695.3272万元 Yii1(XF?X)2???预测区间为: YF?YF?t?2? 2nx?i1(800?647.88)2Y?695.3272?2.228?2.4157?? F12425053.73

?695.3272?1.9978练习题2.8参考解答:

(1) 分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁

儿童疫苗接种率的数量关系: 1) 人均寿命与人均GDP关系 Yi??1??2X1i?ui 估计检验结果:

2) 人均寿命与成人识字率关系

3) 人均寿命与一岁儿童疫苗接种率关系

(2)对所建立的多个回归模型进行检验

由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.

(3)分析对比各个简单线性回归模型 人均寿命与人均GDP回归的可决系数为0.5261 人均寿命与成人识字率回归的可决系数为0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为0.5379 相对说来,人均寿命由成人识字率作出解释的比重更大一些

练习题2.9参考解答:

没有截距项的过原点回归模型为: Yi??2Xi?u 因为

2?X)2 e?(Y???i?i2i??ei2?X)(?X)??2eX 求偏导 ?2?(Yi???ii2ii???2??ei2?X)(?X)?0 令 ?2?(Yi??2ii???2?????XiYi 而有截距项的回归为?得 ?222X?i对于过原点的回归,由OLS原则:

i?xy?xi2ii

?e?0已不再成立, 但是?eXii?0是成立的。

?)?还可以证明对于过原点的回归 Var(?2?)?而有截距项的回归为 Var(?2 练习题2.10参考解答:

?2?X?22i2i? , ?2?e?2i2in?1

?x? , ?2e??n?2

如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”

万元”,数据变为:

深圳市地方预算内财政收入与国内生产总值

年 份 地方预算内财政收入Y 本市生产总值(GDP)

(亿元)Y1 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 21.70 27.33 42.96 67.25 74.40. 88.02 131.75 142.06 164.39 184.21 221.92 262.49 265.93 290.84 321.47 421.38 500.88 658.06 (万元)Y2 217000 273300 429600 672500 744000 880200 1317500 1420600 1643900 1842100 2219200 2624900 2659300 2908400 3214700 4213800 5008800 6580600 (亿元)GDP1 171.67 236.66 317.32 453.14 634.67 842.48 1048.44 1297.42 1534.73 1804.02 2187.45 2482.49 2969.52 3585.72 4282.14 4950.91 5813.56 6801.57 (万元) GDP2 1716700 2366600 3173200 4531400 6346700 8424800 10484400 12974200 15347300 18040200 21874500 24824900 29695200 35857200 42821400 49509100 58135600 68015700 A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:

??20.46106?0.084965GDP Y1t1t (9.867440) (0.003255)

t=(2.073593) (26.10376) R2=0.977058

B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元” 时:

??20.46106?0.00000850GDP Y1t2t(9.867440)(0.000000325)

t=(2.073593) (26.10376) R2=0.977058

C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元” 时:

??204610.6?849.6520GDP Y2t1t(98674.40) (32.54902)

t=(2.073593) (26.10376) R2=0.977058

D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元” 时:

??204610.6?0.084965GDP Y2t2t(98674.40) (0.0032549)

t=(2.073593) (26.10376) R2=0.977058

可以总结出,变量度量单位对回归影响的一般规律为:

1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况)

2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况)

4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。

第三章练习题及参考解答

练习题3.1参考解答:

(1)由模型估计结果可看出:从经济意义上说明,旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。这与经济理论及经验符合,是合理的。

(2)取??0.05,查表得t0.025(31?3)?2.048

因为3个参数t统计量的绝对值均大于t0.025(31?3)?2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。

(3)取??0.05,查表得F0.05(2,28)?3.34,由于F?199.1894?F0.05(2,28)?3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。

练习题3.2参考解答:

(1) 因为总变差的自由度为14=n-1,所以样本容量:n=14+1=15 因为 TSS=RSS+ESS 残差平方和RSS=TSS-ESS=66042-65965=77 回归平方和的自由度为:k-1=3-1=2 残差平方和RSS的自由度为:n-k=15-3=12

(2)可决系数为:R?2ESS65965??0.998834 TSS6604222n?1?ei15?177 修正的可决系数:R?1??1???0.9986 2n?k?yi15?366042(3)这说明两个解释变量X2和.X3联合起来对被解释变量有很显著的影响,但是还不

能确定两个解释变量X2和.X3各自对Y都有显著影响。 练习题3.3参考解答:

(1)建立家庭书刊消费的计量经济模型: Yi??1??2Xi??3Ti?ui

其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数 (2)估计模型参数,结果为

???50.0162?0.08645即 YXi?52.3703Ti i (49.46026)(0.02936) (5.20217)

t= (-1.011244) (2.944186) (10.06702) R2=0.951235 R?0.944732 F=146.2974

(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:

由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值

2t0.025(18?3)?2.131,同时户主受教育年数参数所对应的P值为0.0000,明显小于

??0.05,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。

(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,平均说来家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,平均说来家庭书刊年消费支出将增加52.37元。

练习题3.4参考解答:

(1)对此模型作估计,并作出经济学和计量经济学的说明。

(2)根据此模型所估计结果,作计量经济学的检验。t检验表明:各参数的t值的绝对值均大于临界值t0.025(13?3)?2.228,从P值也可看出均明显小于??0.05,表明失业率和预期通货膨胀率分别对实际通货膨胀率都有显著影响。

F检验表明: F=34.29559,大于临界值, 其P值0.000033也明显小于??0.05,说明失业率和预期通货膨胀率联合起来对实际通货膨胀率有显著影响。

从经济意义上看:失业率与实际通货膨胀率负相关,预期通货膨胀率与实际通货膨胀率正相关,与经济理论一致。

(3)计算修正可决系数(写出详细计算过程) 由Y的统计量表得Std.Dev=3.041892

?e2i?14.12846

?yR2?1?2i?3.0418922?(13?1)?111.0373

14.12846?1?0.1272?0.8728

111.0373n?113?1 2R?1?(1?R2)?1?(1?0.8728)??0.8473n?k13?3

练习题3.5参考解答:

(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:

Yt??1??2X1t??3X2t?ut (2)估计参数结果

由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值t0.025(11?3)?2.306;而且对应的P值为0.0000,也明显小于??0.05。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。 但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值

t0.025(11?3)?2.306;而且对应的P值为0.3838,也明显大于??0.05。这说明该地区耐

用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响, 这样的结论似乎并不合理。为什么会出现这样的结果呢? 很值得考虑。

说明此模型存在严重的问题(存在严重多重共线性)。

练习题3.6参考解答:

(1)建立能源需求与收入和价格之间的对数需求函数

lnYt??0??1lnX1t??2lnX2t?ut

说明收入GDP指数增加1%时,平均说来能源需求指数将增长0.9969%; 价格指数增加

1%时,平均说来能源需求指数将降低0.3314% 由P值可知, 收入和价格对能源需求的影响是显著的. (2)建立能源需求与收入和价格之间的线性需求函数

Yt??0??1X1t??2X2t?u

说明收入GDP指数增加1个单位时,平均说来能源需求指数将增长0.980849个单位; 价格指数增加1个单位时,平均说来能源需求指数将降低0.258426个单位 由P值可知, 收入和价格对能源需求的影响是显著的.

练习题3.7参考解答:

1)建立线性回归模型:Yt??1??2X2??3X3??4X4??5X5??6X6?ut 预期常住人口和人均收入应与粮食销售量正相关,?2和?3应为正值,而肉、蛋、鱼虾与粮食消费应该负相关,预期?4、?5、?6应当为负值。 2)用OLS法估计参数:

只有?2和?6的符号与预期一致,?3、?4、?5的符号均与预期相反。

3)对模型及各个解释变量的显著性发现:虽然可决系数和修正的可决系数都较高,F=13.5823,检验表明也显著,但是所有的解释变量的t检验却都不显著!? 这种矛盾现象说明此模型存在严重的问题(存在严重多重共线性)。 (本题的目的是让学生提前体验到多重共线性的影响)

第四章练习题及参考解答

4.1 假设在模型Yi??1??2X2i??3X3i?ui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:

Yi??1??2X2i?u1iYi??1??3X3i?u2i

?且???为什么? ?2???3??(1)是否存在?23?会等于??1或??1或两者的某个线性组合吗?(2)? 1??var????var???2?且var??3?? (3)是否有var?23

练习题4.1参考解答:

?????且??。 ?2???3??(1) 存在?23?因为?2??yx???x????yx???x???x???x????xx?i2i23ii3i22i23i22i3i2ix3i?

当X2与X3之间的相关系数为零时,离差形式的

?x2i3ix?0

?有?2??yx???x??yx????x???x??xi2i23ii22i23i2i22i?2 ??? ?3??同理有:?3?会等于??1或??1的某个线性组合 (2) ?1??Y???X???X,且??1?Y???3X3 ?1?Y???2X2,?因为 ?12233?且??,则 ?2???3??由于?23?X?1?Y???2X2?Y?? ?22?X?1?Y???3X3?Y?? ?33???2???3?1Y?? X2?1Y?? X3?1?1Y????Y???X???X?Y?Y???1???1?Y 则 ?X?X3??122332X2X3??var????var???2?且var??3?。 (3) 存在var?23??因为var?2???????x?1?r?22i223?2

??当r23?0时,var?2???x?1?r??x22i223?2??222i?2? ?var????var???3? 同理,有var?3

4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?

练习题4.2参考解答:

??根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。

4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。

表4.11 中国商品进口额、国内生产总值、居民消费价格指数 年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 商品进口额 (亿元) 1257.8 1498.3 1614.2 2055.1 2199.9 2574.3 3398.7 4443.3 5986.2 9960.1 11048.1 11557.4 11806.5 11626.1 13736.4 18638.8 20159.2 24430.3 34195.6 46435.8 54273.7 63376.9 73284.6 国内生产总值 (亿元) 9016.0 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973.0 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 183084.8 211923.5 249529.9 居民消费价格指数(1985=100) 100.0 106.5 114.3 135.8 160.2 165.2 170.8 181.7 208.4 258.6 302.8 327.9 337.1 334.4 329.7 331.0 333.3 330.6 334.6 347.7 353.9 359.2 376.5 资料来源:《中国统计年鉴》,中国统计出版社2000年、2008年。

请考虑下列模型:lnYt??1+?2lnGDPt??3lnCPIt?ui 1)利用表中数据估计此模型的参数。

2)你认为数据中有多重共线性吗? 3)进行以下回归:

lnYt?A1+A2lnGDPt?v1ilnYt?B1+B2lnCPIt?v2ilnGDPt?C1?C2lnCPIt?v3i根据这些回归你能对数据中多重共线性的性质说些什么?

?和??在5%水平上个别地显著,并且总的F检验也是显4)假设数据有多重共线性,但?23著的。对这样的情形,我们是否应考虑共线性的问题?

练习题4.3参考解答: (1) 参数估计结果如下

ln(进口)??3.060?1.657ln(GDP)?1.057ln(CPI) (0.337) (0.092) (0.215)R2?0.992 R2?0.991 F?1275.093(括号内为标准误)

(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。 计算相关系数:

(3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。

(4)分别拟合的回归模型如下:

lnY??4.0907?1.2186ln(GDP) t= (-10.6458) (34.6222)R2?0.9828 R2?0.9820 F?1198.698

lnY??5.4424?2.6637ln(CPI) t= (-4.3412) (11.6809)R2?0.8666 R2?0.8603 F?136.4437

ln(GDP)??1.4380?2.2460ln(CPI) t=(-1.9582) (16.8140)R2?0.9309 R2?0.9276 F?282.7107单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。

(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。

4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?

练习题4.4参考解答:

本题很灵活,主要应注意以下问题:

(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。

(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。

4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:

??8.133?1.059X1?0.452X2?0.121X3Y (8.92) (0.17) (0.66) (1.09) R2?0.95 F?107.37括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的

问题。

练习题4.5参考解答:

从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R?0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:

2t0?8.133?0.91,8.92t1?1.059?6.10,0.17t2?0.452?0.69,0.66t3?0.121?0.111.09除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。

另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。

4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。

表4.12 1985~2007年统计数据

年份 能源消费 y 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 76682 80850 86632 92997 96934 98703 103783 109170 115993 122737 131176 138948 137798 132214 133831 138553 143199 151797 国民 总收入 X1 9040.7 10274.4 12050.6 15036.8 17000.9 18718.3 21826.2 26937.3 35260 48108.5 59810.5 70142.5 77653.1 83024.3 88189 98000.5 108068.2 119095.7 国内生 工业 建筑业 交通运输邮电 人均生活 能源加工 增加值 X5 406.9 475.6 544.9 661 786 1147.5 1409.7 1681.8 2205.6 2898.3 3424.1 4068.5 4593 5178.4 5821.8 7333.4 8406.1 9393.4 电力消费 转换效率 X6 21.3 23.2 26.4 31.2 35.3 42.4 46.9 54.6 61.2 72.7 83.5 93.1 101.8 106.6 118.2 132.4 144.6 156.3 X7 68.29 68.32 67.48 66.54 66.51 67.2 65.9 66.00 67.32 65.2 71.05 71.5 69.23 69.44 69.19 69.04 69.03 69.04 产总值 增加值 增加值 X2 9016 10275.2 12058.6 15042.8 16992.3 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 99214.6 109655.2 120332.7 X3 3448.7 3967 4585.8 5777.2 6484 6858 8087.1 10284.5 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 X4 417.9 525.7 665.8 810 794 859.4 1015.1 1415 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 2003 2004 2005 2006 2007 174990 203227 223319 246270 265583 135174 135822.8 54945.5 7490.8 159586.7 159878.3 65210 8694.3 183956.1 183084.8 76912.9 10133.8 213131.7 211923.5 91310.9 11851.1 251483.2 249529.9 107367.2 14014.1 10098.4 12147.6 10526.1 12481.1 14604.1 173.7 190.2 216.7 249.4 274.9 69.4 70.71 71.08 71.24 71.25 资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。

要求:

1)建立对数多元线性回归模型,分析回归结果。

2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

练习题4.6参考解答:

(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下: 生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7. 作全部变量对数线性多元回归,结果为:

从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。

(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。

解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:

可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下:

A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如

lny?9.932?0.421lnx6 (0.116) (0.026)R2?0.926 R2?0.922 F?261.551B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对

lnX1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下:

一元回归结果:

变量 lnX1 lnX2 0.315 14.62 0.911 0.906 lnX3 0.277 9.718 0.818 0.809 lnX4 0.297 13.22 0.893 0.888 lnX5 0.273 11.717 0.867 0.861 lnX6 0.421 16.173 0.926 0.922 lnX7 8.73 4.648 0.507 0.484 参数估计值 0.316 t统计量 可决系数 调整可决系数 14.985 0.914 0.910 其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:

变量 lnX1 lnX2 lnX3 lnX4 lnX5 lnX6 lnX7 R2

lnX6 lnX1 lnX6 lnX2 lnX6 lnX3 lnX6 lnX4 lnX6 lnX5 lnX6 lnX7 -0.186 (-0.698) -0.251 (-1.021) 0.061 (1.548) -0.119 (-0.897) -0.623 (-7.127) 0.666 (1.891) 0.753 (2.308) 0.341 (5.901) 0.585 (3.167) 1.344 (10.314) 0.391 (11.071) 0.920 0.922 0.927 0.921 0.977 0.924 经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数

的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。

如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:

可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到:

变量 参数估计值 t 统计量 X1 0.7333 26.4698 0.9709 0.9695 X1 6.6399(0.0022) 0.5512 (0.0000) 0.5040 (0.3356) 1.0516 X2 0.7353 0.9684 0.9669 X2 -5.9308 (0.0054) X3 1.6655 0.9393 0.9364 X3 0.4349 (0.0821) X4 X4 13.1909 25.9636 0.9697 0.9683 X5 X5 10.8980 13.5147 0.8969 0.8920 X6 X6 678.0058 22.4229 0.9599 0.9580 X7 X7 19332.30 4.7024 0.5129 0.4897 25.3627 18.0257 R2 R2 X1,X2 X1,X3 X1,X4 X1,X5 以X1为基础加入其他变量, 结果为: R2 0.9785 0.9726 0.9683 0.9766 4.1326 (0.6580) -5.0269 (0.0000) X1,X6 X1,X7 1.0075 (0.0088) 0.7499 (0.0000) (0.013) -255.80 (0.438) -813.44 (0.5988) 0.9684 0.9690 注: 括号中为p值.

可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:

可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。

4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示

表4.13 1978-2007年财政收入及其影响因素数据

建筑业增加受灾面积财政收入农业增加值工业增加值总人口(万最终消费年份 值(亿(千公(亿元)CS (亿元)NZ (亿元)GZ 人)TPOP (亿元)CUM 元)JZZ 顷)SZM 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 37148 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233.0 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062.0 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 4348.95 5218.1 6242.2 7407.99 8651.14 9875.95 11444.08 13395.23 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20 51321.78 6963.8 9572.7 12135.8 14015.4 14441.9 14817.6 14770.0 14944.7 15781.3 16537.0 17381.7 21412.7 22420.0 24040.0 28095.0 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 21899.9 29242.2 36748.2 43919.5 48140.6 51588.2 55636.9 61516 66878.3 71691.2 77449.5 87032.9 96918.1 110595.3 128444.6 48829 55043 45821 46989 53429 50145 49981 54688 52215 47119 54506 37106 38818 41091 48992 (资料来源:《中国统计年鉴2008》,中国统计出版社2008年版) 试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?

练习题4.7参考解答:

(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵

解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:

采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。 取对数再回归,可以减低共线性。

第五章练习题及参考解答

练习题5.1参考解答:

2(1)因为f(Xi)?X2i,所以取W2i?1,用W2i乘给定模型两端,得 X2iYiXu1??1??2??33i?iX2iX2iX2i X2i上述模型的随机误差项的方差为一固定常数,即

Var(

ui1)?2Var(ui)??2X2iX2i

(2)根据加权最小二乘法,可得修正异方差后的参数估计式为

??Y*???X*???X*?12233 ??2W???***2****yxWx?WyxWx?????????2ii2i2i3i2ii3i2i2ix3i?**??W2ix2*2i???W2ix3*2i????W2ix2ix3i?2

??3 其中

W???2i**2****yi*x3i???W2ix2i????W2iyix2i???W2ix2ix3i???W2i*2*2**2ix2i???W2ix3i????W2ix2ix3i?2

*X2?

?WX?W2i2i,*X3??WX?W2i2i3i,Y*??WY?W

2ii2i**x?X?X2i2i2

**x3i?X3i?X3y*?Yi?Y*

练习题5.2参考解答:

(1)该模型样本回归估计式的书写形式为

??9.347522+0.637069XYii t= (2.569104) (32.00881)

R2=0.946423 R2=0.945500 F=1024.564 DW=1.790431 (2)首先,用Goldfeld-Quandt法进行检验。

将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即

n1?n2?22。

分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即

?e?e求F统计量为

2122?603.0148?2495.840

2221e?F??e?2495.84?4.1390603.0148

给定??0.05,查F分布表,得临界值为F0.05(20,20)?2.12。

c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)?2.12,说明该模型的随机误差项存在异方差。

其次,用White法进行检验。具体结果见下表

White Heteroskedasticity Test: F-statistic 6.301373 Probability Obs*R-squared 10.86401 Probability Test Equation:

Dependent Variable: RESID^2 Method: Least Squares

Date: 08/05/05 Time: 12:37 Sample: 1 60

Included observations: 60 Variable Coefficient Std. Error t-Statistic C -10.03614 131.1424 -0.076529 X 0.165977 1.619856 0.102464 X^2 0.001800 0.004587 0.392469 R-squared 0.181067 Mean dependent var Adjusted R-squared 0.152332 S.D. dependent var S.E. of regression 102.3231 Akaike info criterion Sum squared resid 596790.5 Schwarz criterion Log likelihood -361.2856 F-statistic Durbin-Watson stat 0.937366 Prob(F-statistic) 0.003370 0.004374 Prob. 0.9393 0.9187 0.6962 78.86225 111.1375 12.14285 12.24757 6.301373 0.003370 给定??0.05,在自由度为2下查卡方分布表,得?2?5.9915。比较临界值与卡方统计量值,即nR2?10.8640??2?5.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1?

Dependent Variable: Y Method: Least Squares

Date: 08/05/05 Time: 13:17 Sample: 1 60

Included observations: 60 Weighting series: W1 Variable Coefficient Std. Error t-Statistic C 10.37051 2.629716 3.943587 X 0.630950 0.018532 34.04667 Weighted Statistics R-squared 0.211441 Mean dependent var Adjusted R-squared 0.197845 S.D. dependent var S.E. of regression 7.778892 Akaike info criterion Sum squared resid 3509.647 Schwarz criterion Log likelihood -207.2041 F-statistic Durbin-Watson stat 0.958467 Prob(F-statistic) Unweighted Statistics 1,作加权最小二乘估计,得如下结果 XProb. 0.0002 0.0000 106.2101 8.685376 6.973470 7.043282 1159.176 0.000000

R-squared

Adjusted R-squared S.E. of regression Durbin-Watson stat 0.946335 Mean dependent var 119.6667 0.945410 S.D. dependent var 38.68984 9.039689 Sum squared resid 4739.526 0.800564 用White法进行检验得如下结果:

White Heteroskedasticity Test: F-statistic Obs*R-squared

3.138491 Probability 0.050925 5.951910 Probability 0.050999

给定??0.05,在自由度为2下查卡方分布表,得?2?5.9915。比较临界值与卡方统计量值,即nR2?5.951910

??10.3705?0.6309XYt?(3.943587) (34.04667)R2?0.211441 R2=0.197845 DW=0.958467 F=1159.176

练习题5.3参考解答:

解: (1)建立样本回归函数。

??179.1916+0.7195X Y (0.808709)(15.74411) R?0.895260, F=247.8769

(2)利用White方法检验异方差,则White检验结果见下表:

Heteroskedasticity Test: White F-statistic

7.194463 Prob. F(2,28)

0.0030 0.0052 0.0000

2Obs*R-squared Scaled explained SS

10.52295 Prob. Chi-Square(2) 30.08105 Prob. Chi-Square(2)

由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。

(3)用加权最小二乘法修正异方差,分别选择权数w1?111,w2?,w3?2,经XXX过试算,认为用权数w3的效果最好。结果如下:

书写结果为

??787.2847?0.5615XY(4.5325)(10.0747) R2?0.9461,F?101.4992

练习题5.4参考解答:

(1)建立样本回归函数。

??-648.1236+0.0847X Y (-5.485018)(17.34164) R2?0.912050, F=300.7324

从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模型是否存在异方差。

首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在异方差。

其次,用运用Goldfeld-Quanadt检验异方差。 第一,对变量X取值以升序排序。

第二,构造子样本。由于本例的样本容量为31,删除1/4观测值,约7个,余下部分分得两个样本区间:1—12和20—31,它们的样本个数均是12个。

第三,在样本区为1—12,所计算得到的残茶平方和为20—31,所计算得到的残茶平方和为

?e22i21i21i?162899.2;在样本区为

?e22i?981744.6。

?981744.6?6.0267。

162899.2?e第四,根据Goldfeld-Quanadt检验,F统计量为F??e第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临界值为F0.05(10,10)?2.98,因为F?6.0267?F0.05(10,10)?2.98,所以拒绝原假设,表明模型存在异方差。

最后,用ARCH方法检验异方差,则ARCH检验结果见下表:

Heteroskedasticity Test: ARCH

F-statistic Obs*R-squared

6.172299 Prob. F(1,28) 5.418686 Prob. Chi-Square(1)

0.0192 0.0199

由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。

(2)分别用权数w1?111,w2?,w3?2,发现用权数w2求加权最小二乘估计XXX效果最好,即

???706.6986?0.0873XY(?8.0399)(20.1399)

R2?0.8735,F?405.6164

练习题5.5参考解答:

(1)求Y对X的回归,得如下估计结果

???28992.82?0.0323XY(?0.8009)(20.8233) R2?0.9373,F?433.6077用怀特检验的修正方法,即建立如下回归模型

???Y?2?v ei2??1??2Yi3ii通过计算得到如下结果:

注意,表中E2为残差平方et2。 即

??0.0138Y?2 ?i2??6.34(E?09)?65144.33Yeii对该模型系数作判断,运用F或LM检验,可发现存在异方差。

?后,?和具体EViews操作如下:在得到Y的估计Y进一步得到残差平方ei,然后建立ei对Y22?2的线性回归模型。再通过上述回归对Y?和Y?2前的系数是否为零进行判断,从而检验原模Y型中是否存在异方差。在上表界面,按路径:VIEW/COEFFIEICENT TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即

然后“OK”即得到检验结果为

从表中F统计量值和LM统计量值看,拒绝原假设,表明原模型存在异方差。

(2)通过对权数的试算,最后选择权数w?原后的结果)

1,用加权最小二乘法得到如下估计(还lX???9038.875?0.0311XY(?0.5912)(17.6011)

R2?0.9144,F?309.7983,DW?2.0975对该模型进行检验,发现已无异方差。

本文来源:https://www.bwwdw.com/article/1l37.html

Top