第三章 多元线性回归模型

更新时间:2023-05-30 16:38:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第三章 多元线性回归模型

一、名词解释

1、多元线性回归模型

2、调整的决定系数R2

3、偏回归系数

4、正规方程组

5、方程显著性检验

二、单项选择题

1、在模型Yt 0 1X1t 2X2t 3X3t t的回归分析结果中,有F 462.58,

则表明 ( ) F的p值 0.000000,

A、解释变量X2t对Yt的影响不显著 B、解释变量X1t对Yt的影响显著

C、模型所描述的变量之间的线性关系总体上显著 D、解释变量X2t和X1t对Yt的影响显著

2、设k为回归模型中的实解释变量的个数,n为样本容量。则对回归模型进行总体显著性 检验(F检验)时构造的F统计量为 ( ) A、F

ESSkRSS(n k 1)ESSRSS

B、F

ESS(k 1)RSS(n k)RSSTSS

C、F D、F 1

2

3、已知二元线性回归模型估计的残差平方和为 ei 800,估计用样本容量为n 23, 则随机误差项 t的方差的OLS估计值为 ( ) A、33.33 B、 40 C、 38.09 D 、36.36

4、在多元回归中,调整后的决定系数R2与决定系数R2的关系为 ( ) A、R2 R2 B、R2 R2

C、R2 R2 D、R2与R2的关系不能确定

5、下面说法正确的有 ( ) A、时间序列数据和横截面数据没有差异 B、对回归模型的总体显著性检验没有必要

C、总体回归方程与样本回归方程是有区别的 D、决定系数R2不可以用于衡量拟合优度

6、根据调整的可决系数R2与F统计量的关系可知,当R2 1时,有 ( ) A、F=0 B、F=-1 C、F→+∞ D、F=-∞

(X X) 1X Y。7、线性回归模型的参数估计量 是随机向量Y的函数,即 是 ( )

A、随机向量 B、非随机向量 C、确定性向量 D、常量

8、下面哪一表述是正确的 ( ) A、线性回归模型Yi 0 1Xi i的零均值假设是指

1

n

i

n

i 1

0

B、对模型Yi 0 1X1i 2X2i i进行方程显著性检验(即F检验),检验的零假 设是H0: 0 1 2 0

C、相关系数较大意味着两个变量存在较强的因果关系

D、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系 X X … X e,如果原模型满足线性模型的基本假设则 9、对于Yi 011i22ikkii

s( )(其中s( )是 的标准误差)在零假设 j 0下,统计量 服从 ( ) jjjj

A、t(n k) B、t(n k 1) C、F(k 1,n k) D、F(k,n k 1) 10、下列说法中正确的是 ( ) A、如果模型的R2很高,我们可以认为此模型的质量较好 B、如果模型的R2很低,我们可以认为此模型的质量较差 C、如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D、如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量

三、多项选择题

1、残差平方和是指 ( ) A、随机因素影响所引起的被解释变量的变差 B、解释变量变动所引起的被解释变量的变差

C、被解释变量的变差中,回归方程不能作出解释的部分 D、被解释变量的总离差平方和回归平方之差 E、被解释变量的实际值与拟合值的离差平方和

2、回归平方和是指 ( ) A、被解释变量的观测值Yi与其均值Y的离差平方和 B、被解释变量的回归值Y i与其均值Y的离差平方和 C、被解释变量的总体平方和 Yi与残差平方和 ei之差

2

2

D、解释变量变动所引起的被解释变量的离差的大小 E、随机因素影响所引起的被解释变量的离差大小

3、对模型满足所有假定条件的模型Yi 0 1X1i 2X2i i进行总体显著性检验,如果

检验结果总体线性关系显著,则很可能出现 ( ) A、 1 2 0 B、 1 0, 2 0 C、 1 0, 2 0 D、 1 0, 2 0 E、 1 0, 2 0

4、设k为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F统计量可以表示为 ( )

A、

C、

Y)/(n k 1)(Yii

2

e

22

2

i

/k

Y)/k(Y B、 e/(n k 1)

2

i

i

2i

R/k

(1 R)/(n k 1)R/(n k 1)(1 R)/k

2

2

D、

(1 R)/(n k 1)

R/k

2

2

E、

5、在多元回归分析中,调整的可决系数R2与可决系数R2之间 ( ) A、R2 R2 B、R2 R2 C、R2只可能大于零 D、R2可能为负值 E、R2不可能为负值

四、判断题

1、满足基本假设条件下,样本容量略大于解释变量个数时,可以得到各参数的唯一确定的 估计值,但参数估计结果的可靠性得不到保证 ( ) 2、在多元线性回归中,t检验和F检验缺一不可。 ( ) 3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零 ( ) 4、多元线性回归中,可决系数R2是评价模型拟合优度好坏的最佳标准。 ( ) 5、多元线性回归模型中的偏回归系数,表示在其他解释变量保持不变的情况下,对应解释 变量每变化一个单位时,被解释变量的变动。 ( )

五、简答题

1、多元线性回归模型与一元线性回归模型有哪些区别?

2、为什么说最小二乘估计量是最优线性无偏估计量?对于多元线性回归最小二乘估计的正

规方程组,能解出唯一的参数估计量的条件是什么?

六、计算分析题

1、某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为 R=0.214

式中,edu为劳动力受教育年数,sibs为劳动力家庭中兄弟姐妹的个数,medu与fedu

edui 10.36 0.094sibsi 0.131medui 0.210fedui

2

分别为母亲与父亲受到教育的年数。问

(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受

教育水平减少一年,需要sibs增加多少? (2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另

一个的父母受教育的年数均为16年,则两人受教育的年数预期相差多少年?

2、考虑以下方程(括号内为标准差):

8.562 0.364P 0.004P 2.560U Wttt 1t

(0.080) (0.072) (0.658) n 19 R2 0.873

其中:Wt——t年的每位雇员的工资

Pt——t年的物价水平

Ut——t年的失业率

要求:(1)进行变量显著性检验;

(2)对本模型的正确性进行讨论,Pt 1是否应从方程中删除?为什么?

3、以企业研发支出(R&D)占销售额的比重(单位:%)为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个容量为32的样本企业的估计结果如下:

Yi 0.472 0.32lnX1i 0.05X2i

(1.37)

2

(0.22)(0.046)

R 0.099

其中,括号中的数据为参数估计值的标准差。

(1)解释ln(X1)的参数。如果X1增长10%,估计Y会变化多少个百分点?这在经济上

是一个很大的影响吗?

(2)检验R&D强度不随销售额的变化而变化的假设。分别在5%和10%的显著性水平

上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

4、假设你以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。假设你看到如下的回归结果(括号内为标准差),但你不知道各解释变量分别代表什么。

10.6 28.4X 12.7X 0.61X 5.9X RYi1i2i3i4i

2

0.63 n 35

(2.6) (6.3) (0.61) (5.9)

试判定各解释变量分别代表什么,说明理由。

5、下表给出一二元模型的回归结果。

(2)R2和R?

(3)检验假设:解释变量总体上对Y无影响。你用什么假设检验?为什么? (4)根据以上信息,你能确定解释变量各自对Y的贡献吗?

6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型:

Yi 0 1X1i 2X2i 3X3i i

2

求:(1)样本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?

你想检验的虚拟假设是H0: 1 2 2 1。

, 的方差及其协方差求出Var( 2 )。 (1)用 1212

(2)写出检验H0: 1 2 2 1的t统计量。

(3)如果定义 1 2 2 ,写出一个涉及 0、 、 2和 3的回归方程,以便能直接得

到 估计值 及其样本标准差。

7、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:

125.0 15.0X 1.0X 1.5X R2 0.75 方程A:Yi1i2i3i

123.0 14.0X 5.5X 3.7X R2 0.73 方程B:Yi1i2i4i

其中:Yi——第i天慢跑者的人数

X1i——第i天降雨的英寸数 X2i——第i天日照的小时数

X3i——第i天的最高温度(按华氏温度) X4i——第i天的后一天需交学期论文的班级数

请回答下列问题:

(1)这两个方程你认为哪个更合理些,为什么?

(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?

8、考虑以下预测的回归方程:

120 0.10F 5.33RS RYttt

2

0.50

其中:Yt为第t年的玉米产量(吨/亩);Ft为第t年的施肥强度(千克/亩);RSt为第t年的降雨量(毫米)。要求回答下列问题:

(1)从F和RS对Y的影响方面,说出本方程中系数0.10和5.33的含义; (2)常数项 120是否意味着玉米的负产量可能存在?

(3)假定 F的真实值为0.40,则 F的估计量是否有偏?为什么?

(4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计,

则是否意味着 RS的真实值绝对不等于5.33?为什么?

9、已知描述某经济问题的线性回归模型为Yi 0 1X1i 2X2i i ,并已根据样本容

量为32的观察数据计算得

2.5

1.3 2.2

1.34.4 0.8

1

(X X)

4 2.2

0.8,X Y 2 ,e e 5.8,TSS 26

5.0 2

查表得F0.05(2,29) 3.33,t0.005(29) 2.756。 (1)求模型中三个参数的最小二乘估计值 (2)进行模型的置信度为95%的方程显著性检验 (3)求模型参数 2的置信度为99%的置信区间。

10、下表为有关经批准的私人住房单位及其决定因素的4个模型的估计和相关统计值(括号

内为p值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数

housing 0 1density 2value 3income 4popchang

据。模型如下:

5unemp 6localtax 7statetax

式中:housing——实际颁发的建筑许可证数量;density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元);income——平均家庭的收入(单位:千美元);popchang——1980~1992年的人口增长百分比;unemp——失业率;localtax——人均交纳的地方税;statetax——人均缴纳的州税。

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择

p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?

(2)在模型A中,在5%水平下检验联合假设H0: i =0(i=1,5,6,7)。说明被择假设,计

算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。

(3)哪个模型是“最优的”?解释你的选择标准。

(4)说明你对最优模型中参数符号的预期并解释原因,确认其是否为正确符号。

本文来源:https://www.bwwdw.com/article/5t64.html

Top