一元线性回归模型(习题与解答)

更新时间:2023-07-24 02:02:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一元线性回归模型(习题与解答)

第二章 一元线性回归模型

一、习题

(一)基本知识类题型 2-1.解释下列概念: 1) 总体回归函数 2) 样本回归函数 3) 随机的总体回归函数 4) 线性回归模型

5) 随机误差项(ui)和残差项(ei) 6) 条件期望 7) 非条件期望 8) 回归系数或回归参数 9) 回归系数的估计量 10) 最小平方法

2-2.判断正误并说明理由:

1) 随机误差项ui和残差项ei是一回事

2) 总体回归函数给出了对应于每一个自变量的因变量的值 3) 线性回归模型意味着变量是线性的

4) 在线性回归模型中,解释变量是原因,被解释变量是结果 5) 随机变量的条件均值与非条件均值是一回事

2-3.回答下列问题:

1) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 2) 总体方差与参数估计误差的区别与联系。 3) 随机误差项ui和残差项ei的区别与联系。

4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的

11) 最大似然法 12) 估计量的标准差 13) 总离差平方和 14) 回归平方和 15) 残差平方和 16) 协方差 17) 拟合优度检验 18) t检验 19) F检验

一元线性回归模型(习题与解答)

拟合优度问题?

5) 为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准? 6) R2检验与F检验的区别与联系。 7) 回归分析与相关分析的区别与联系。

8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9) 为什么要进行解释变量的显著性检验?

10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?

2-2.下列方程哪些是正确的?哪些是错误的?为什么?

t=1,2,L,n ⑴ yt=α+βxt

⑵ yt=α+βxt+μtt=1,2,L,n

$x+μ$+β⑶ yt=αtt$x+μ$+β$t=α⑷ ytt$x$+β⑸ yt=αt$x$+β$t=α⑹ yt$x+μ$+β$t⑺ yt=αt$x+μ$+β$t$t=α⑻ yt

t=1,2,L,n t=1,2,L,n t=1,2,L,n t=1,2,L,n

t=1,2,L,n t=1,2,L,n

其中带“^”者表示“估计值”。

2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。

因变量

GNP 个人储蓄 小麦产出 美国国防开支 棒球明星本垒打的次数 总统声誉

学生计量经济学成绩 日本汽车的进口量

利率 利率 降雨量 前苏联国防开支 其年薪 任职时间 其统计学成绩 美国人均国民收入

自变量

(二)基本证明与问答类题型

一元线性回归模型(习题与解答)

2-4.对于一元线性回归模型,试证明: (1)E(yi)=α+βxi (2)D(yi)=σ

(3)Cov(yi,yj)=0 i≠j

2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性和有效性?

2-6.对于过原点回归模型Yi=

2

β1Xi+ui ,试证明

Var(β1)=

2-7. 试证明: (1)(2)(3)

σu2

X

2

i

∑e

i

=0,从而:e=0

i

∑ex

i

=0

∑eY

i

∧i

=0;即残差ei与Yi的估计值之积的和为零。

2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证

1n∧2

明:σ的ML估计量为σ=∑σi ,并且是有偏的。

ni=1

2

2

~

2-9.熟悉t统计量的计算方法和查表判断。

2-10.证明:R=(ryx) ;其中R2是一元线性回归模型的判定系数,ryx是y与x的相关

2

2

系数。

2-11. 试根据置信区间的概念解释t检验的概率意义,即证明:对于显著性水平α,当

ti>tα时,bi的100(1-α)%的置信区间不包含0。

2-12.线性回归模型

yt=α+βxt+μt

t=1,2,L,n

1

的0均值假设是否可以表示为

n

∑μ

t=1

n

t

=0?为什么?

2-13.现代投资分析的特征线涉及如下回归方程:rt=

β0+β1rmt+ut;其中:r表示股票

一元线性回归模型(习题与解答)

或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据1956~1976年间240个月的数据,Fogler和Ganpathy得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

rt=0.7264+1.0598rmt r2=0.4710

(0.3001) (0.0728)

要求:(1)解释回归参数的意义;(2)如何解释r2?(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t检验进行检验(α=5%)。 证明:估计量α可以表示为:α=2-14. 已知模型Yi=α+βxi+ui,

1

( xWi)yi 这∑ni=1

n

里Wi=

xi

∑x

i

2

,i=1,2,…,n。 2-15.已知两个量X和Y的一组观察值(xi,yi)证明:Y的真实值和拟合值有共同的均值。

因为散点图上的点(Ci,Yi)2-16.一个消费分析者论证了消费函数Ci=a+bYi是无用的,不在直线Ci=a+bYi上。他还注意到,有时Yi上升但Ci下降。因此他下结论:Ci不是Yi的函数。请你评价他的论据(这里Ci是消费,Yi是收入)。

2-17.证明:仅当R2=1时,y对x的线性回归的斜率估计量等于x对y的线性回归的斜率估计量的倒数。

∧Sx

2-18.证明:相关系数的另一个表达式是:r=β 其中β为一元线性回归模型一次项

Sy

系数的估计值,Sx、Sy分别为样本标准差。

2-19.对于经济计量模型:Yi=b0+b1Xi+ui ,其OLS估计参数b1的特性在下列情况下会受到什么影响:(1)观测值数目n增加;(2)Xi各观测值差额增加;(3)Xi各观测值近似相等;(4)E(u2)=0 。

2-20.假定有如下的回归结果:Yt=2.6911 0.4795Xt,其中,Y表示美国的咖啡的消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。

一元线性回归模型(习题与解答)

要求:

(1)这是一个时间序列回归还是横截面序列回归?做出回归线; (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?

(4)根据需求的价格弹性定义:弹性=斜率×(X/Y),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? (三)基本计算类题型

2-21.下面数据是对X和Y的观察值得到的。 ∑Yi=1110; ∑Xi=1680; ∑XiYi=204200 ∑Xi2=315400; ∑Yi2=133300

(2)b1和b2的标准差?(3)假定满足所有的古典线性回归模型的假设,要求:(1)b1和b2?r2?(4)对B1、B2分别建立95%的置信区间?利用置信区间法,你可以接受零假设:B2=0吗?

2-22.假设王先生估计消费函数(用模型Ci=a+bYi+ui表示),并获得下列结果:

Ci=15+0.81Yi,n=19

(3.1) (18.7) R2=0.98 这里括号里的数字表示相应参数的T比率值。

要求:(1)利用T比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方差;(3)构造b的95%的置信区间,这个区间包括0吗?

2-23.下表给出了每周家庭的消费支出Y(美元)与每周的家庭的收入X(美元)的数据。

每周收入(X)

100 120 140 160 180 200 220 240 260

每周消费支出(Y)

55,60,65,70,75 65,70,74,80,85,88 79,84,90,94,98

80,93,95,103,108,113,115 102,107,110,116,118,125 110,115,120,130,135,140 120,136,140,144,145

135,137,140,152,157,160,162 137,145,155,165,175,189 150,152,175,178,180,185,191

要求:

,即条件期望值; (1)对每一收入水平,计算平均的消费支出,E(Y︱Xi)

一元线性回归模型(习题与解答)

(2)以收入为横轴、消费支出为纵轴作散点图; (3)在散点图中,做出(1)中的条件均值点;

(4)你认为X与Y之间、X与Y的均值之间的关系如何?

(5)写出其总体回归函数及样本回归函数;总体回归函数是线性的还是非线性的? 2-24.根据上题中给出的数据,对每一个X值,随机抽取一个Y值,结果如下:

要求:

(1)以Y为纵轴、X为横轴作图,并说明Y与X之间是怎样的关系? (2)求样本回归函数,并按要求写出计算步骤;

(3)在同一个图中,做出样本回归函数及从上题中得到的总体回归函数;比较二者相同吗?为什么?

2-25.下表给出了1990~1996年间的CPI指数与S&P500指数。

年份

CPI

S&P500指数

资料来源:总统经济报告,1997,CPI指数见表B-60,第380页;S&P指数见表B-93,第406页。

要求:(1)以CPI指数为横轴、S&P指数为纵轴做图;

(2)你认为CPI指数与S&P指数之间关系如何?

根据表中的数据运用OLS(3)考虑下面的回归模型:(S&P)t=B1+B2CPIt+ut,估计上述方程,并解释你的结果;你的结果有经济意义吗?

2-26.下表给出了美国30所知名学校的MBA学生1994年基本年薪(ASP)、GPA分数(从1~4共四个等级)、GMAT分数以及每年学费的数据。

学校 ASP/美元

GPA GMAT 学费/美元

Harvard 102630 3.4 650 23894 Stanford 100800 3.3 665 21189 Columbian 100480 3.3 640 21400 Dartmouth 95410 3.4 660 21225

一元线性回归模型(习题与解答)

Northwestern 84640 3.3 640 20634 Chicago 83210 3.3 650 21656 MIT 80500 3.5 650 21690 Virginia 74280 3.2 643 17839 UCLA 74010 3.5 640 14496 Berkeley 71970 3.2 647 14361 Cornell 71970 3.2 630 20400 NUY 70660 3.2 630 20276 Duke 70490 3.3 623 21910 Carnegie Mellon North Carolina

59890 69880

3.2 3.2

635 621

20600 10132

Michigan 67820 3.2 630 20960 Texas 61890 3.3 625 8580 Indiana 58520 3.2 615 14036 Purdue 54720 3.2 581 9556 Case Western

57200

3.1

591

17600

Georgetown 69830 3.2 619 19584 Michigan State Penn State Southern Methodist

41820 49120 60910

3.2 3.2 3.1

590 580 600

16057 11400 18034

Tulane 44080 3.1 600 19550 Illinois 47130 3.2 616 12628 Lowa 41620 3.2 590 9361 Minnesota 48250 3.2 600 12618 Washington 44140 3.3 617 11436

要求:(1)用双变量回归模型分析GPA是否对ASP有影响?

(2)用合适的回归模型分析GMAT分数是否与ASP有关?

(3)每年的学费与ASP有关吗?你是如何知道的?如果两变量之间正相关,是否意味着进到最高费用的商业学校是有利的;

(4)你同意高学费的商业学校意味着高质量的MBA成绩吗?为什么? 2-27.从某工业部门抽取10个生产单位进行调查,得到下表所列的数据:

单位序号

年产量(万吨)y

工作人员数(千人)x

7.031 7.018 6.991 6.974

一元线性回归模型(习题与解答)

7.953 6.927 6.302 6.021 5.310

要求:假定年产量与工作人员数之间存在线性关系,试用经典回归估计该工业部门的生产函数及边际劳动生产率。

2-28.下表给出了1988年9个工业国的名义利率(Y)与通货膨胀率(X)的数据:

国家

澳大利亚 加拿大 法国 德国 意大利 墨西哥 瑞典 英国 美国

Y(%)

X(%)

11.9 7.7 9.4 4.0 7.5 3.1 4.0 1.6 11.3 4.8 66.3 51.0 2.2 2.0 10.3 6.8 7.6 4.4

资料来源:原始数据来自国际货币基金组织出版的《国际金融统计》

要求:

(1)以利率为纵轴、通货膨胀率为横轴做图; (2)用OSL进行回归分析,写出求解步骤;

(3)如果实际利率不变,则名义利率与通货膨胀率的关系如何? (四)自我综合练习类题型

2-29.综合练习:自己选择研究对象,收集样本数据(利用我国公开发表的统计资料),应用计量经济学软件(建议使用Eviews3.1)完成建立计量经济学模型的全过程,并写出详细的研究报告。(通过练习,能够熟练应用计量经济学软件Eviews3.1中的最小二乘法)

二、习题参考答案

2-1.答:

⑴总体回归函数是指在给定Xi下的Y的分布的总体均值与Xi有函数关系。 ⑵样本回归函数指对应于某个给定的X的Y值的一个样本而建立的回归函数。 ⑶ 随机的总体回归函数指含有随机误差项的总体回归函数,形如:

一元线性回归模型(习题与解答)

Yi=β1+β2Xi+ui

⑷线性回归模型指对参数β为线性的回归,即β只以它的1次方出现,对X可以是或不是线性的。

⑸随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。 ⑹残差项是一随机变量,针对样本回归函数而言。

⑺条件期望又称条件均值,指X取特定Xi值时的Y的期望值。 ⑼回归系数(或回归参数)指β1、β2等未知但却是固定的参数。

⑽回归系数的估计量指用β1、β2等表示的用已知样本所提供的信息去估计出来的量。 ⒀估计量的标准差指度量一个变量变化大小的标准。

⒁总离差平方和用TSS表示,用以度量被解释变量的总变动。

⒂回归平方和用ESS表示,用以度量由解释变量变化引起的被解释变量的变化。 ⒃残差平方和用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的。

⒄协方差用Cov(X,Y)表示,是用来度量X、Y二个变量同时变化的统计量。

2-2.答:错;错;错;错;错。(理由见本章其他习题答案) 2-3.答:

⑴线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。

⑸判定系数R=

2

ESSRSS

,含义为由解释变量引起的被解释变量的变化占被解=1

TSSTSS

释变量总变化的比重,用来判定回归直线拟合的优劣。该值越大说明拟合得越好。

⑽不是。 2-8.证明:

=由于 β1

∑XY

X

t

t

2t

,因此

一元线性回归模型(习题与解答)

)=Var(Var(β1

XtYtXt2

=Var(∑

XtXt

Y)=∑ 2t X2Xt t

Var(β1Xt+μt)

2

22XσXt2∑tμ2

=∑== μσVar()tμ22222

(Xt)(Xt)Xt

2-9.证明: ⑴根据定义得知,

∑e=∑(Y

i

i

Yi)=∑(Yi β1 β2Xi)=∑Yi nβ1 β2∑Xi

=n nβ1 nβ2=n( β1 β2)

Q=β1+β2

∴∑ei=0

e从而使得:=

n

证毕。 ⑵

i

=0

i)(Xi )=∑(YiXi i XiY + i)Q∑eiXi=∑(Yi Y

=∑[YiXi i (Yi ei)Xi+(Yi ei)]=∑(YiXi i YiXi+eiXi+i ei=∑(eiXi ei)=∑ein 1)=0

∴∑eiXi=0

证毕。 ⑶

∑eY =∑e(β+β

=β∑e+n∑e

ii

i

1

1

i

2

2

Xi)=β1∑ei+β2∑eiXi

i

=0

证毕。

2-14.答:线性回归模型:yt=α+βxt+μt中的0均值假设E(u2)=0不可以表示为:

一元线性回归模型(习题与解答)

1n

∑μ

t=1

n

t

因为前者表示取完所的可能的样本组合后的平均状态,而后者只是一个样本的=0,

平均值。 2-16.证明:

= = βα∑

i=1

n

yi

n

&y&∑x

ii=1n

n

i

2i

&∑x

i=1

&iy&i=∑x&i(yi =∑x&iyi ∑x&i=∑x&iyi Q∑x

i=1

i=1

i=1

i=1

i=1

nnnnn

=∑α

i=1

n

yi

n

&∑x

i=1n

2i

1

&(xy= ∑∑iii=1i=1n

nn

&∑x

i=1n

2

i

)yi

证毕。

2-17.证明:

x)=0 满足正规方程 +β 和βQα∑yi (αi

i=1

n

[]

x +β i=αyi

i)=0即表明Y的真实值与拟合值有共同的均值。 ∴∑(yi y

i=1

n

证毕。

2-18.答:他的论据是错误的。原因是他忽略了随机误差项ui,这个随机误差项可取正值和负值,但是E(ui)=0,将Ci与Yi的关系表达为Ci=α+βYi是不准确的,而是一个平均关系。 2-19.证明:

0+α 1xi, i=α设:y

+β y, i=βx01i

&iy&i)2&iy&i)2(x((x2

&i=由于:R= =1 ∑x222

&&&xiyiyi

2

一元线性回归模型(习题与解答)

1=线性回归的斜率估计量:α

证毕。 2-20.证明:

&y&∑x

&x

i2i

i

=

11

=2&iy&i)/y&iβ1(x

β=

&y&x

又∵ &x

2

Sx=

&x

2

n 1

, Sy=

y

2

n 1

S

∴βx=

Sy

&y&x

n 1&&xy

2

&x

2

2

=

&y&x&y&x

2

2

=r

n 1

证毕。 2-22.解:

⑴这是一个横截面序列回归。(图略)

⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯; ⑶不能;

⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。 2-23.解:

X ⑴Q=

n

i

=168,Y=

n

i

=111

∴∑(Xi )(Yi =∑(XiYi i Yi+)=204200 1680×111 168×1110+10×168×111

=17720

又Q∑(Xi )2=∑(Xi2 2Xi+2)=∑Xi2 2×102+102=315400 10×168×168=33160∴β2=

∑(X Y =17720=0.5344

33160(X )

i

ii

一元线性回归模型(习题与解答)

β1= β2=111 0.5344×168=21.22

⑵σ

2

e=

2i

n 2

(Y=

i

)2 Yi

10 2

(Y

=

2

i

+Y 2) 2YiYii

8

i=21.22+0.5344Xi QY

i+Y i2)=∑(Yi2 2×21.22Yi 2×0.5344XiYi+β12+β22Xi2+2β1β2Xi)∴∑(Yi2 2YiY

=133300 2×21.22×1110 2×0.5344×204200+10×21.22×21.22

+0.5344×0.5344×315400+2×21.22×0.5344×1680=620.81

620.81 2=∴σ=77.60

8

Xσ∴Var(β)=

n(X )

2i

2

1

i

2

=

77.60×315400

=73.81,se(β1)=73.81=8.5913

10×33160

Var(β2)=

σ2

x

2i

=

77.60

=0.0023,se(β2)=0.0023=0.0484

33160

2i

2

⑶r=1

2

(Y

2

∑e

i

)

Q∑ei2=620.81,

又Q∑(Yi =133300 123210=10090

∴r2=1

620.81

=0.9385

10090

⑷Qp(t≤2.306)=95%,自由度为8

21.22 β1

解得:1.4085≤β1≤41.0315为β1的95%的置信区间。 ≤2.306,

8.5913

0.5344 β2

同理,∴ 2.306≤≤2.306,解得:0.4227≤β2≤0.646为β2的95%的置

0.0484∴ 2.306≤

信区间。

由于β2=0不在β2的置信区间内,故拒绝零假设:β2=0。 2-24.解:

⑴由于参数估计量β的T比率值的绝对值为18.7且明显大于2,故拒绝零假设

H0:β=0,从而β在统计上是显著的;

⑵参数α的估计量的标准方差为15/3.1=4.84,参数

β的估计量的标准方差为

一元线性回归模型(习题与解答)

0.81/18.7=0.043;

⑶由⑵的结果,β的95%的置信区间为:

(0.81 t0.975(n 2)0.043,0.81+t0.975(n 2)0.043)=(0.81 0.091,0.81+0.091),显

然这个区间不包括0。 2-25.解:

⑴E(YXi=80)=65 E(YXi=120)=89 E(YXi=160)=113 E(YXi=200)=137 E(YXi=240)=161

E(YXi=100)=77

E(YXi=140)=101 E(YXi=180)=125 E(YXi=220)=149 E(YXi=260)=173

本文来源:https://www.bwwdw.com/article/iekm.html

Top