山经二专计量经济学课后山财大

更新时间:2023-11-01 22:34:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

思考与练习

1. 随机误差项u包括哪些内容? 2. 一元线性回归模型有哪些基本假定? 3.证明公式(2.16)、公式(2.17)。 4.理解样本决定系数的含义。

5.若我们搜集两个变量的历史资料如下: 广告费x 销售收入y 1 10 2 14 3 18 4 20 5 25 6 28 7 30 8 40 (1)绘制散点图;

(2)x与y之间是否大致呈线性关系?

(3)用最小二乘法求出回归方程; (4)求回归标准误差??;

(5)给出回归系数的置信度为95%的区间估计; (6)给出回归方程的方差分解表; (7)计算x与y的决定系数; (8)对回归方程进行F检验。

6.美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下。

航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 68.5 1.25 资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社。

(1)求出描述投诉率是如何依赖航班按时到达正点率的的回归方程,并进行显著性检验。 (2)对估计的回归方程的斜率作出解释。

(3)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?

7.下面是对某个案例分析的EViews输出结果。该案例的回归分析结果是否理想?为什么? Dependent Variable: Y

Method: Least Squares Date: 05/28/03 Time: 10:25 Sample: 1991 2000

Included observations: 10

Variable

C X

R-squared

Adjusted R-squared S.E. of regression

Coefficient Std. Error t-Statistic

32.22076 0.800953

33.20478 1.260800

0.970365 0.635273

Prob. 0.3603 0.5430 48.40000 65.10368 11.43526

0.048024 Mean dependent var -0.070973 S.D. dependent var 67.37438 Akaike info criterion

1

Sum squared resid Log likelihood Durbin-Watson stat

36314.46 Schwarz criterion -55.17632 F-statistic 2.514737 Prob(F-statistic)

11.49578

0.403572 0.542989

1. 解:一般说来,随机项u来自以下几个方面:

(1)变量的省略。由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量y有一定影响的自变量。

(2)统计误差。数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。

(3)模型的设定误差。如在模型构造时,非线性关系用线性模型描述了;复杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。

(4)偶然性误差。被解释变量还受一些不可控制的众多的、细小的偶然因素的影响。

2. 解:假定1:E(uixi)=0。即随机项ui的条件数学期望(均值)为零。

2Var(uixi)?E{[(ui?E(ui)]}?E(ui)??u (i=1,2,?,n)。假定2:即对于不同的xi,u具

22有相同的方差,也就是说各次观测值所受的随机影响的程度相同。

Cov(ui,uj)?E{[(ui?E(ui)][(uj?E(uj)]}?0(i≠j;i=1,2,?,n;j=1,2,?,n)。假定3:

即在任意两次观测时,ui,uj是相互独立的,不相关的,也就是无序列相关。

假定4:Cov(ui,xi)=0。即解释变量xi与误差项ui同期独立无关。因为如果两者相关,就不可能把x对y的影响和u对y的影响区分开来。

2假定5:ui~N(0,?u)。即对于给定的xi,ui为服从正态分布的随机变量。

3. 证明:(1)因为

??y???x?1?01?n?xyi?x?(xi?x)?(xi?x)2yi??1n(1n?x(xi?x)?(xi?x)2)yi

所以:

?)?Var(?0?Var[(?[1n1n1n21n(xi?x)?(xi?x)222)yi]2n??(?x(xi?x)?(x2i?x)2)Var(yi)2??x2(xi?x)2(?(xi?x))i222?x(xi?x)?(xiii?x)2]?u?[?x2?(x?x)(?(x?x))i?2nx?(x?x)?(x?x)

]?u22?[

?x2?(xi?x)2]?u22

?,??)?E{[???E(??)][???E(??)]}?E[(????)(????)] (2)Cov(?0100110011?x?y?E(??)x][???E(??)]}?E{[y??1111??E(??)]2??xE[?11?)??xVar(?1 ??xσu22?(x?x)x

?,??)??所以:Cov(?01?(x?x)2σu

2

4. 答:ESS是由回归方程确定的,也就是由自变量x变动引起的,又称为回归平方和;RSS是由x之外

的随机项u的波动引起的,又称不可解释平方和。不难看出,回归平方和(可解释平方和)ESS在总平方和TSS中所占比例越大,残差平方和RSS在TSS中所占比重就越小,说明回归的效果就越好,即样本回????x与样本观测值(x,y)拟合得越好。为此我们把回归平方和占总平方和的比重定义为样?i??归线yii01i本决定系数,记为

R?2ESSTSS?1?RSSTSS

显然0?R2?1。R2越接近于1,表示回归直线与样本观测值拟合越好。可见R2可以用来度量回归直线与样本观测值拟合优度。另一方面,若R2大,则解释变量x对被解释变量y的解释程度就高,可以推测总体线性相关关系显著,即总体回归系数?1不会同时为零,回归方程显著。反之,可以推测总体线性相关关系不显著,即?1与零没有显著差异,回归方程不显著。 5. 解:

(1)利用EXCEl绘制xy散点图,如下所示:

散点图50销售收入403020100024广告费6810系列1(2)通过xy的散点图,可以明显的看出x与y之间大致呈线性关系。

??5.714?3.869x (3)利用最小二乘法可以求出回归方程如下:y?u?1.922 (4)回归标准误差?

3

(5)回归系数的置信度为95%的区间:[3.144,4.595] (6)回归方程的方差分解表;

回归分析 残差 总计

(7)计算x与y的决定系数:R2?0.966

(8)对回归方程进行F检验:因为Sig-f=1.25E-5<1%,所以通过α=1%的总体显著性检验(F检验)。

6. 解:(1)描述投诉率是如何依赖航班按时到达正点率的的回归方程及显著性检验如下:

??6.018?0.070xyt?(5.719R2**自由度

1

6 7

平方和 均方和 F值 Sig- F

628.7202 628.7202 170.2714 1.25E-05 22.15476 3.69246 650.875

)(?4.967**)

?0.779,F?24.674通过进行检验,该回归方程总体线性显著性显著,拟合程度良好,解释变量显著。

(2)回归方程的斜率即回归系数0.070表示航班正点率每提高1% ,在其他条件不变的情况下,投诉率将平均的减少0.070次(/10万名乘客)。

??0.418。 (3)航班按时到达的正点率为80%,即令回归方程中的x=80,此时y

7. 解:不理想,从相关的检验数据来看,拟合优度检验R=0.048024,F=0.403572(Sig-f=0.542989),

t=0.635273(P=0.543,一次项回归系数),显然各类检验结果均不理想,说明该模型无论从总体而言还是从单个解释变量而言都是不显著的。

思考与练习

1.写出多元线性回归模型的一般形式。 2.多元线性回归模型的基本假定有哪些? 3.写出?u的无偏估计量的计算公式。

4.如果一个样本回归方程的样本决定系数为0.98,我们能否判定这个样本回归方程就很理想? 5.根据例3.1数据,利用OLS的正规方程组,估计样本回归方程。

6.已知我国1990年~1999年的货运量y、工业总产值x1.农业总产值x2资料如下表所示:

年份 1990 1991 1992 1993 1994 1995 1996 1997 1998

22

货运量(万吨) 970602 985793 1045899 1115771 1180273 1234810 1296200 1278087 1267200 工业总产值(亿元) 23924 26625 34599 48402 70176 91894 99595 113733 119048 4

农业总产值(亿元) 7662.1 8157.0 9084.7 10995.5 15750.5 20340.9 22353.7 23788.4 24541.9 1999 要求计算: 1292650 126111 24519.1 (1)二元线性回归方程

(2)对系数、方程分别进行显著性检验。

(3)当工业总产值达到130000亿元,农业总产值达到25000亿元时,货运量能达到多少?(给定置信水平为95%)

7.以下是某个案例的方差分解结果,填上所缺数据。 ANOVA Model 1 Sum of Squares 42555.461 df Mean Square 6079.352 F 4.785 Sig. .002 Regression Residual Total 71776.951 a. Predictors: (Constant), X8, X6, X1, X7, X2, X5, X3 b. Dependent Variable: Y

8.以下是某个案例的EViews分析结果。你对分析结果满意吗?为什么? Dependent Variable: Y Method: Least Squares Sample(adjusted): 1991 2000

Included observations: 10 after adjusting endpoints

Variable

C X1 X2 X3

R-squared

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

Durbin-Watson stat

答案

1.解: 如果被解释变量(因变量)y与k个解释变量(自变量)x1,x2,?,xk之间有线性相关关系,那么它们之间的多元线性总体回归模型可以表示为

y??0??1x1??2x2????kxk?u

Coefficient Std. Error 4.826789

917366

0.178381 0.308178 0.688030 009899 -022644 0.156400

t-Statistic

0.523663 0.578827 377910 -1.423556

Prob. 0.6193 0.5838 0.0169 0044 41.90000 348783 8.686101 8.807135 11.58741 0.006579

0.852805 Mean dependent var 0.779207 S.D. dependent var 16.11137 Akaike info criterion 1557.457 Schwarz criterion -39.43051 F-statistic 1.579994 Prob(F-statistic)

其中, ?0,?1,?2,?,?k是k+1个未知参数,又称为回归系数;u是随机误差项。

2.解: 多元线性回归模型的基本有:

5

(1)随机误差项ui的条件期望值为零。即E[ui|x1i,x2i,?xki]?0,(i?1,2,?,n). (2)随机误差项ui的条件方差相同。即Var(ui|x1i,x2i,...,xki)??u2,(i?1,2,?,n). (3)随机误差项ui之间无序列相关。即Cov(ui,uj)?0,(i,j?1,2,?,n;i?j). (4)自变量xl与随机误差项ui独立。即Cov(ui,xl)?0,(i?1,2,?,n;l?1,2,?,k). (5)随机误差项ui服从正态分布。即ui~N(0,?u2).

(6)各解释变量之间不存在显著的线性相关关系。即rank(X)?k?1?n,也就是说矩阵X的秩等于参数个数,换句话说就是自变量之间不存在多重共线性.

nn2i?u?Se?3. 解:?u2的无偏估计量的计算公式为: ?22?ei?1?(y?i?1i?i)2?yn?k?1n?k?1

4. 解:如果一个样本回归方程的样本决定系数为0.98,我们不能判定这个样本回归方程就很理想.因为对于多元模型而言,样本决定系数接近1,只能说明模型的拟合度很高,总体线性性显著,但模型中每个解释变量是否是显著的无法判定,所以还需要进行单个解释变量的显著性检验,即t检验.

5.解:根据例3.1数据,得到OLS的正规方程组:

????312.4???629.24?????219.9?12?0120??29.48??????????=?0.597? 求解得到:??=???7114.19?312.4?0?10346.26?1?16816.8?21????????16816.8???33090.37????0.665??11810.51?629.24????012??2?????29.48?0.497x1?0.665x2 所以样本回归方程为:y

6. 解:(1)利用OLS对数据进行回归得到回归方程如下:

?i?879950.3?0.206x1?16.223x2yt?R2(15.657)(0.072)(1.021)

?0.943,F?57.953(2)由上述检验数据可以看出方程总体线性性显著,单单个解释变量并不显著。 (3)因为方程拟合程度较高,总体线性性显著,所以模型可以用来进行预测: 当工业产量达到130000亿元,农业总产值达到25000亿元时,货运量能达到:

?i?879950.3?0.206?130000?16.223?25000?1312305(万吨) y

7. 解:案例的方差分解结果所缺数据如下:

ANOVA

Model 1

Sum of Squares 6

df Mean Square F Sig. Regression Total 42555.461 71776.951 7 23 30 6079.352 1270.502 4.785 .002 Residual 29221.490

8. 解:从该案例的分析数据来看,结果不满意。因为但从模型的拟合优度(R2=0.8528)和总体线性显著性(F=11.5874,F-statistic=0.0066)来看,结果还令人满意,但具体到每个解释变量的显著性时,可以看到x1(t=0.5788,P=0.5838)和x3(t=-1.4236,P=0.1978)甚至都无法通过α=15%的显著性检验,所以这两个解释变量显然不显著。

思考与练习

1.什么是异方差性?举例说明经济现象中的异方差性。 2.考察以下模型

yi??0??1xi?ui (1)

式中的u按下述方式取决于x 式中

viui??2xi?vi2 (2)

是一个独立于x且满足全部古典假定的随机变量。对原模型(1)是否可以利用OLS?为什么? y (a)公司利润 x 净财富 样 本 《财富》前500强 100个发达国家和发展中国家 美国、加拿大和15个拉美国家 1000名经济学家 200名电脑初学者 3.在如下回归中,你是否预期存在异方差?

(b)婴儿死亡率 人均收入 (c)通货膨胀率 货币增长率 (d)收入水平 (e)差错率 年龄 上机时间 4.对某沿海地区家庭每年生活开支和每年收入进行抽样研究,调查了20个家庭,其中每五个家庭收入相同,共分作四组,数据列表如下:

组 1 2 3 1.8 3 4.2 家庭生 活开支( 千元) 2 3.2 4.2 2 3.5 4.5 5.7 2 3.5 5.8 6 家庭收入(千元) 2.1 3.6 5 6.2 5 10 15 20 4 4.8 5 家庭生活开支模型设定为 yi??0??1xi?ui

式中:yi表示家庭生活开支,xi表示家庭收入

⑴利用OLS求回归方程。

⑵做散点图,观察家庭生活开支离差量的变化情况。

⑶把数据分作两个子样本,第一子样本包括收入为5000元与10000元的家庭,即低收入家庭。第二个子样本包括收入为15000元和20000元的家庭,即高收入的家庭。进行Goldfeld?Quandt检验。

222⑷设Var(ui)?kxi,其中k为一非零常数,变换原模型求回归方程。

7

5. 什么是自相关性?自相关在线性回归模型中存在的主要原因有哪些?自相关可能造成哪些后果? 6. 利用以下给定的d统计量进行序列相关检验。 (k=自变量数目,n=样本容量)

(1)d=0.81,k=3,n=21,显著性水平?=5% (2)d=3.48,k=2,n=15,显著性水平?(3)d=1.56,k=5,n=30,显著性水平?(4)d=2.64,k=4,n=35,显著性水平?(5)d=1.75,k=1,n=45,显著性水平?(6)d=0.91,k=2,n=28,显著性水平?(7)d=1.03,k=5,n=26,显著性水平?=5% =5% =5% =5% =5% =5%

7.某子公司的年销售额yt与其总公司年销售额xt的观测数据如下表:

序号 1 2 3 4 5 6 7 8 9 10 x 127.3 130.0 132.7 129.4 135.0 137.1 141.2 142.8 145.5 145.3 y 20.96 21.40 21.96 21.52 23.39 22.76 23.48 23.66 24.10 24.01 序号 11 12 13 14 15 16 17 18 19 20 x 148.3 146.4 150.2 153.1 157.3 160.7 164.2 165.6 168.7 171.7 y 24.54 24.30 25.00 25.64 26.36 26.98 27.52 27.78 28.24 28.78 ⑴用OLS估计yt关于xt的回归方程; ⑵用D?W检验分析随机项的一阶自相关性;

⑶用Durbin两步法估计回归模型的参数; ⑷直接用差分法估计回归模型参数。

8.什么是多重共线性? 多重共线性在多元线性回归模型中普遍存在的主要原因有哪些?多重共线性可能造成哪些不利后果?

23239. 考虑以下模型:yi??0??1xi??2xi??3xi?ui。由于x和x是x的函数,所以它们之间存在

多重共线性,你同意这种说法吗?为什么?

10. 将下列模型用适当的方法消除多重共线性: (1) 消费模型为

C??0??1w??2p?u

其中,C、w、p分别代表消费、工资收入和非工资收入,w与p可能高度相关,但研究表明?2?(2) 需求模型为

Q??0??1x??2p??3ps?u

12?1

其中。Q、x、p、ps分别为需求量、收入水平、该商品价格水平及其替代品价格水平,p、ps可能高度相关。

11. 下表给出因变量y与解释变量x的时间序列数据:

8

时间 1 2 3 4 5 6 7 8 9 10 y x1 40.1 40.3 47.5 49.2 52.3 58.0 61.3 62.5 64.7 66.8 x2 5.5 4.7 5.2 6.8 7.3 8.7 10.2 14.1 17.1 21.3 x3 108 94 108 100 99 99 101 97 93 102 x4 63 72 86 100 107 111 114 116 119 121 6.0 6.0 6.5 7.1 7.2 7.6 8.0 9.0 9.0 9.3 ⑴用适当的方法检验多重共线性。

⑵用逐步回归分析法确定一个较好的回归模型。

12. 利用工具变量法估计模型参数的基本思想是什么? 13. 某经济学家想要估计税收入函数 Tt??0??1(GDP)t?ut 式中: T=政府税收

GDP=国内生产总值

已知GDP有测量误差,为了把注册的汽车数量作为一个工具变量,研究者决定采用工具变量法。有关数据如下表。

年份 税收(y)(百万元) GDP(x)(十亿元) 1966 1967 1968 3 4 2 1 1 5 7 6 1969 1970 6 8 6 4 5 4 注册的汽车(z)(百万辆) 5 (1) 试用OLS估计税收函数;

(2) 用工具变量法估计税收函数,比较这两个估计函数; (3) z是不是 GDP的一个好的工具变量?

思考与练习

1. 解:古典线性回归模型的一个很重要的假定是随机项的同方差性,即对于每个xi,ui的方差都是同一个常数,当此假定不能满足时,则ui的方差在不同次的观测中不再是一个常数,而是取得不同的数值,即

Var(ui|xi)??i≠常数 (i?1,2,?,n)

2则称随机项ui具有异方差性(Heteroscedasticity)。

9

例如,考虑家庭的可支配收入和储蓄的关系,如建立如下模型

yi??0??1xi?ui

其中,yi为第i个家庭的储蓄,xi为第i个家庭的收入。从二者的关系不难看出,当收入增加时,储蓄平均也会随之增加。如果我们对不同收入水平家庭的储蓄进行观察,同样也会发现,低收入的家庭储蓄差异性较小,而高收入的家庭储蓄的差异性较大。这是因为低收入的家庭,其收入中扣除必要的生活支出以外,用于其他支出和储蓄的部分也较少,因此随机项波动的程度小,即方差小;而高收入家庭,其收入中扣除必要的生活支出以外,剩余的就较多,就有更大的使用选择余地,这样储蓄的差异就较大,因而随机项波动的程度就大,即方差大。因此,对于家庭储蓄模型,随机项ui具有异方差性。

22. 解:模型(1)无法使用OLS进行参数估计,因为随机误差项ui??2xi?vi,即随机误差项与解释变量的

平方之间有着显著地相关关系,这样会造成随机误差项的异方差现象,所以OLS不可以使用。

3. 解:

x y (a)公司利润 净财富 (b)婴儿死亡率 人均收入 (c)通货膨胀率 货币增长率 (d)收入水平 年龄 (e)差错率

4. 解:对某沿海地区家庭每年生活开支和每年收入进行抽样研究,调查了20个家庭,其中每五个家庭收

入相同,共分作四组,数据列表如下:

组 1 2 3 4 1.8 3 4.2 4.8 家庭生 活开支( 千元) 2 3.2 4.2 5 2 3.5 4.5 5.7 2 3.5 5.8 6 家庭收入(千元) 2.1 3.6 5 6.2 5 10 15 20 上机时间 样 本 《财富》前500强 100个发达国家和发展中国家 美国、加拿大和15个拉美国家 1000名经济学家 200名电脑初学者 是否存在异方差 存在 不存在 不存在 存在 存在 家庭生活开支模型设定为 yi??0??1xi?ui

式中:yi表示家庭生活开支,xi表示家庭收入

?i?0.89?0.2412xi。 ⑴利用OLS求回归方程: y⑵做散点图,观察家庭生活开支离差量的变化情况。

10

散点图76543210051015家庭收入2025生活开支系列1

由图形可以看出随着收入的增加,家庭生活开支的波动幅度逐渐增大。

⑶把数据分作两个子样本,第一子样本包括收入为5000元与10000元的家庭,即低收入家庭。第二个子样本包括收入为15000元和20000元的家庭,即高收入的家庭。进行Goldfeld?Quandt检验。

⑷设Var(ui)?k2xi2,其中k2为一非零常数,变换原模型求回归方程。

5. 解:在古典假设下,线性回归模型中参数的最小二乘估计量具有线性、无偏和有效性。其中,有效性不仅依赖于古典假设中关于随机项的同方差假定,还依赖与随机项不存在序列自相关假定,即

Cov(ui,uj)?0 (i?j i,j?1,2,?,n)

这表明随机项u在不同观测点下取值不相关。若这个假定违背,Cov(ui,uj)?0,即u在不同观测点下的取值相关联,则称u存在序列相关或叫自相关(Autoregression)。 自相关产生的原因很多,主要有:

(1)被解释变量的自相关,许多经济变量往往会有自相关,使用时间序列数据更是如此,其本期值往往受滞后值的影响。

(2)模型省略了自相关的解释变量。在建立回归模型时,总是要略去某些次要的解释变量。如果略去的解释变量有一些存在自相关,它必然在随机项中反映出来,从而使随机项具有自相关性。

(3)随机项本身存在自相关。在许多情况下,随机因素(如干旱、暴风雨、战争、地震等)所产生的影响,常常持续好长时间。

(4)回归模型的数学形式不正确。若回归模型所采用的数学形式与所研究问题的真实关系不一致,随机项就可能存在自相关。

(5)经济变量的惯性作用。大多数的经济时间序列都有一个明显的特点,就是他们的惯性。由于经济变量的惯性,使得许多经济变量前后期总是相互关联的。

自相关产生的后果,如果模型中的随机项存在自相关,仍然采用普通最小二乘法,会有以下后果: (1)最小二乘估计量仍然是线性的和无偏的,但不具有最小方差性,即不是最优的。

(2)最小二乘估计量的方差估计是有偏的,用来估计随机项的方差和回归参数的方差公式会严重低估真实的方差和标准差,导致t值偏大,使得某些参数显著不为零,即高估了部分参数的显著性。 (3)因变量的预测精度降低。

6. 利用以下给定的d统计量进行序列相关检验。(k=自变量数目,n=样本容量)

11

(1)d=0.81,k=3,n=21,显著性水平?=5%:DL=1.03, DU=1.67,因为d=0.81< DL, 所以存在一阶正自相关。

(2)d=3.48,k=2,n=15,显著性水平?=5%:DL=0.95, DU=1.54,因为d=3.48>4-DL, 所以存在一阶负自相关。

(3)d=1.56,k=5,n=30,显著性水平?=5%:DL=1.07, DU=1.83,因为DL

(4)d=2.64,k=4,n=35,显著性水平?=5%:DL=1.22, DU=1.73,因为(4-DU)

(5)d=1.75,k=1,n=45,显著性水平?=5%:DL=1.48, DU=1.57,因为DU

(6)d=0.91,k=2,n=28,显著性水平?=5%:DL=1.26, DU=1.56,因为d=0.91< DL, 所以存在一阶正自相关。

(7)d=1.03,k=5,n=26,显著性水平?=5%:DL=0.98, DU=1.88,因为DL

?t??0.879?0.173xt 7. 解: ⑴用OLS估计yt关于xt的回归方程为:y⑵用D?W检验分析随机项的一阶自相关性:因为DW=1.662,DL=1.20,DU=1.41,DU

⑶用Durbin两步法估计回归模型的参数;

⑷直接用差分法估计回归模型参数。

8. 解:古典线性回归模型的假定之一是,模型中包含的解释变量的观测值矩阵X(包括常数项)其秩等于模型中解释变量的个数加1,即rk(X)?k?1,此时就称解释变量xj(j?1,2 ,? ,n)之间不存在多重共线性。但如果rk(X)?k?1,说明观测值矩阵X是降秩的,即矩阵X的列向量存在某种线性相关关系,也就是解释变量之间存在某种线性相关,称为存在多重共线性(Multicollinearity)。

多重共线性存在的原因主要是经济活动经济变量之间复杂的相互联系。另外在计量经济学的研究中,将某些解释变量的滞后值作为单独的新解释变量包含在模型中,已得到广泛的应用。这样由于解释变量的前后期数值相关使得产生多重共线性。

后果:

多元线性回归模型中如果存在完全的多重共线性(Complete Multicollinearity,或Exact

Multicollinearity)则参数的最小二乘估计量是不确定的,其标准差为无穷大;如果存在接近的多重共线性(Near Multicollinearity),则参数的最小二乘估计量是确定的,而且具有无偏性,但其方差较大,常产生以下结果:

(1)参数估计值不精确,也不稳定,样本观测值稍有变动,增加或减少解释变量等都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对因变量的影响。

(2)参数估计值的标准差较大,使参数的显著性检验增加了接受零假设的可能,从而舍去对因变量有显著影响的解释变量。

(3)难以区分每个解释变量的单独影响。计量经济研究中经常需要利用回归系数定量分析各个解释变量对因变量的单独影响程度。而在多重共线性的情况下,解释变量的相关性将无法“保持其他变量不变”,从而也难以分离出每个解释变量的单独影响。

12

9. 解:它们之间不存在多重共线性,这是因为虽然x2和x3是x的函数,但它们之间并没有显著地线性相关关系。

10. 解:(1)将?2?121212?1代入原模型得:C??0??1w?pps?1p?u??0??1(w?p)?u

(2)可以考虑将相对价格

?引入模型,建立如下模型:Q??0???1?x??2pps?u

11. 解:(1)利用SPSS对上述数据进行回归得到以下结果:

Model Summary(b)

Std. Error of Model 1 R .990(a) Adjusted R Square R Square .980 .963 the Estimate .23611 a Predictors: (Constant), x4, x3, x2, x1 b Dependent Variable: y

ANOVA(b)

Model 1 Regression Residual Total Sum of Squares 13.422 .279 13.701 df 4 5 9 Mean Square 3.356 .056 F Sig. 60.189 .000(a) a Predictors: (Constant), x4, x3, x2, x1 b Dependent Variable: y

Coefficients(a)

Unstandardized Standardized

Coefficients Coefficients

Model

B

1

(Constant) x1 x2 x3 x4

3.914 .060 .089 -.013 .007

Std. Error

1.952 .048 .037 .018 .018

Beta

.480 .407 -.051 .123

2.005 1.246 2.397 -.693 .420

.101 .268 .062 .519 .692

t

Sig.

Collinearity Statistics Toleranc

e

VIF

.027 36.448 .141 7.074 .738 1.356 .048 20.948

a Dependent Variable: y

13

由多重共线性的经典判断法可以看出该模型拟合优度及总体线性显著性都非常好,但单个解释变量显著性却都不理想,所以模型存在多重共线性。此外从解释变量的方差扩大因子(VIF1=36.448,VIF4=20.948,二者均远大于10)也可以看出解释变量之间存在多重共线性。

(2)利用SPSS中逐步回归分析法确定一个较好的回归模型如下:

Model Summary(c)

Std. Error of Adjusted the Durbin-WatsModel 1 2 R .972(a) .988(b) R Square R Square .945 .975 .938 .968 Estimate .30660 .21995 on 2.264 a Predictors: (Constant), x1 b Predictors: (Constant), x1, x2 c Dependent Variable: y

ANOVA(c)

Sum of

Model 1 2

Regression Residual Total Regressio

n Residual Total

Squares 12.949 .752 13.701 13.362 .339 13.701

df 1 8 9 2 7 9

Mean Square 12.949 .094 6.681 .048

F 137.751 138.106

Sig. .000(a)

.000(b)

a Predictors: (Constant), x1 b Predictors: (Constant), x1, x2 c Dependent Variable: y

Model

1 (Constan

t) x1

2 (Constan

Unstandardized Coefficients B .942 .122

Std. Error

.573 .010 .626 .016 .027

Coefficients(a) Standardized Coefficients

Beta

1.645

.139 .000 .008 .001 .022

t

Sig.

Collinearity Statistics Tolerance

VIF

.972 11.737

.651 .365

3.710 5.220 2.923

1.000 1.000

2.323

t) x1 .082 x2 .080 a Dependent Variable: y

.227 4.411 .227 4.411

14

通过以上分析可以看出,选取x1,x2作为解释变量就可以很好的消除多重共线性,并且各类显著性检验都可以通过,所以我们得到以下回归方程:

?i?2.323?0.028x1i?0.080x2i y

12. 解:工具变量法应用的基本思路是,当解释变量与随机项相关时,则寻找另一个变量,该变量与随机解释变量高度相关,但与随机项不相关,则称该变量为工具变量,用其替代随机解释变量。

工具变量的选择应满足以下条件:工具变量必须具有实际经济意义;工具变量与随机解释变量高度相关,但与随机项不相关;工具变量与模型中的其他解释变量也不相关;模型中多个工具变量之间不相关。

13. 某经济学家想要估计税收入函数

Tt??0??1(GDP)t?ut 式中: T=政府税收

GDP=国内生产总值

已知GDP有测量误差,为了把注册的汽车数量作为一个工具变量,研究者决定采用工具变量法。有关数据如下表。 年份 税收(y)(百万元) 1966 1967 1968 2 1 1 5 7 6 1969 1970 6 8 6 4 5 4 3 GDP(x)(十亿元) 4 注册的汽车(z)(百万辆) 5 (1)利用OLS估计税收函数为:

?t?1.167?0.567xtyt?(3.283)(8.878R2***)

?0.963,F?78.818

(2)用工具变量法估计税收函数:

???1?zy?zx*t*t*t*t?LzyLzx?ztyt???ztxt?1n1n?zt?yt= 0 .5238

?zt?xt??y???x?1.3810 ?01?t?1.3810?0.5238xt 所以得到回归方程为: y(3)z是GDP的一个好的工具变量.

15

16

本文来源:https://www.bwwdw.com/article/ydv2.html

Top