计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

更新时间:2024-05-08 11:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章 经典单方程计量经济学模型:一元线性回归模型

一、内容提要

本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析

例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为

kids??0??1educ??

1

(1)随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答:

(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。

例2.已知回归模型E????N??,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释?和?。

?满足线性性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?(3)对参数的假设检验还能进行吗?简单陈述理由。 解答:

(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为?,因此?表示没有接受过教育员工的平均起始薪金。?是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。

?满足线性性、无偏性及有效性,因为这些性质的的成立无需?和仍?(2)OLS估计量?随机扰动项?的正态分布假设。

(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在?的正态分布假设之上的。

例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:

首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则

2

E?E*?100????N??

由此有如下新模型

E*?(?/100)?(?/100)N?(?/100)

或 E*??*??*N??*

这里?*??/100,?*??/100。所以新的回归系数将为原始模型回归系数的1/100。 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是

E????N??????(N*/12)??

或 E???(?/12)N*??

可见,估计的截距项不变,而斜率项将为原回归系数的1/12。

例4、对没有截距项的一元回归模型

Yi??1Xi??i

称之为过原点回归(regrission through the origin)。试证明

(1)如果通过相应的样本回归模型可得到通常的的正规方程组

?e?0

?eX?0iii 则可以得到?1的两个不同的估计值:

~???XY??1?YX, ??ii1??X?。

2i?均为无偏估计量。 (2)在基本假设E(?i)?0下,?1与?1~~?X通常不会经过均值点(X,Y),但拟合线Y??? (3)拟合线Y??1X则相反。 1?是?的OLS估计量。 (4)只有?11解答:

(1)由第一个正规方程

~?et?0得

或 求解得

~(Y???t1Xt)?0 ~Y???t1?Xt

?1?Y/X

3

~

由第2个下规方程

?Xt?X)?0得 (Yt??1t

?XYtt2???1?Xt

??(求解得 ?1~?XY)/(?Xtt2t)

(2)对于?1?Y/X,求期望

11~E(?1)?E(YX)?E[(?1Xt??t)]Xn?X1 ?[E{1t)?E(?t)]

XnX??1??1X这里用到了Xt的非随机性。

??( 对于?1?XY)/(?Xtt2t),求期望

?)?E(XY/X2)E(??tt?t1?(?(11)E(XY)?()E[Xt(?1Xt??t)]tt2?2?XX?t?t112)?(X)?()XtE(?t)??11?t22?XX?t?t

?X??X必须等于Y。但??X通过点(X,Y),????(3)要想拟合值Y111?XY?Xt2ttX,

?X上。 ???通常不等于Y。这就意味着点(X,Y)不太可能位于直线Y1???X经过点(X,Y)。 相反地,由于?1X?Y,所以直线Y1(4)OLS方法要求残差平方和最小

Min RSS?~~?e2t?X)2 ??(Yt??1t?求偏导得 关于?1

?RSS?X)(?X)?0 ?2?(Yt??1tt???1即

?Xt?X)?0 (Yt??1t???XY???ii1

??X?

2i4

?是OLS估计量。 可见?1例5.假设模型为Yt????Xt??t。给定n个观察值(X1,Y1),(X2,Y2),?,

(Xn,Yn),按如下步骤建立?的一个估计量:在散点图上把第1个点和第2个点连接起来

并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜

?,即?的估计值。 率;最后对这些斜率取平均值,称之为??的几何表示并推出代数表达式。 (1)画出散点图,给出??的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解(2)计算?释理由。

(3)证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。 解答:

(1)散点图如下图所示。

(X2,Y2) (Xn,Yn)

(X1,Y1)

首先计算每条直线的斜率并求平均斜率。连接(X1,Y1)和(Xt,Yt)的直线斜率为

(Yt?Y1)/(Xt?X1)。由于共有n-1条这样的直线,因此

1t?nYt?Y1???] ?[n?1t?2Xt?X1(2)因为X非随机且E(?t)?0,因此

E[Yt?Y1(???Xt??t)?(???X1??1)???1]?E[]???E[t]??

Xt?X1Xt?X1Xt?X1这意味着求和中的每一项都有期望值?,所以平均值也会有同样的期望值,则表明是无偏的。

(3)根据高斯-马尔可夫定理,只有?的OLS估计量是最付佳线性无偏估计量,因此,

?的有效性不如?的OLS估计量,所以较差。 这里得到的?

5

例6.对于人均存款与人均收入之间的关系式St????Yt??t使用美国36年的年度数据得如下估计模型,括号内为标准差:

??384.105?0.067YStt(151.105)R2

(0.011)

??19.092 3=0.538 ?(1)?的经济解释是什么?

(2)?和?的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?

(3)对于拟合优度你有什么看法吗?

(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?

解答:

(1)?为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此?符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期?的符号为正。实际的回归式中,?的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。

(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。

(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09,截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。

三、习题

6

(一)基本知识类题型 2-1.解释下列概念: 1) 总体回归函数 2) 样本回归函数 3) 随机的总体回归函数 4) 线性回归模型

5) 随机误差项(ui)和残差项(ei) 6) 条件期望 7) 非条件期望 8) 回归系数或回归参数 9) 回归系数的估计量 10) 最小平方法

2-2.判断正误并说明理由:

1) 随机误差项ui和残差项ei是一回事

2) 总体回归函数给出了对应于每一个自变量的因变量的值 3) 线性回归模型意味着变量是线性的

4) 在线性回归模型中,解释变量是原因,被解释变量是结果 5) 随机变量的条件均值与非条件均值是一回事

2-3.回答下列问题:

1) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 2) 总体方差与参数估计误差的区别与联系。 3) 随机误差项ui和残差项ei的区别与联系。

4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的

拟合优度问题?

5) 为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准? 6) R2检验与F检验的区别与联系。 7) 回归分析与相关分析的区别与联系。

7

11) 最大似然法 12) 估计量的标准差 13) 总离差平方和 14) 回归平方和 15) 残差平方和 16) 协方差 17) 拟合优度检验 18) t检验 19) F检验

8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9) 为什么要进行解释变量的显著性检验?

10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?

2-2.下列方程哪些是正确的?哪些是错误的?为什么?

t?1,2,?,n ⑴ yt????xtt?1,2,?,n ⑵ yt????xt??t?x?????⑶ yt??tt?x??????t??⑷ ytt?x???⑸ yt??t?x????t??⑹ yt?x??????t⑺ yt??t?x??????t?t??⑻ ytt?1,2,?,n t?1,2,?,n t?12,,?,n t?12,,?,n

t?1,2,?,n t?1,2,?,n

其中带“^”者表示“估计值”。

2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。

因变量 GNP 个人储蓄 小麦产出 美国国防开支 棒球明星本垒打的次数 总统声誉 学生计量经济学成绩 日本汽车的进口量 利率 利率 降雨量 前苏联国防开支 其年薪 任职时间 其统计学成绩 美国人均国民收入 自变量

(二)基本证明与问答类题型

2-4.对于一元线性回归模型,试证明: (1)E(yi)????xi (2)D(yi)??

8

2(3)Cov(yi,yj)?0 i?j

2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性和有效性?

2-6.对于过原点回归模型Yi??1Xi?ui ,试证明

Var(?1)?2-7. 试证明: (1)(2)(3)

??u2?Xi2

?ei?0,从而:e?0 ?0

?0;即残差ei与Yi的估计值之积的和为零。

?exiii?i?eY2

2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证

1n?2明:σ的ML估计量为????i ,并且是有偏的。

ni?12~2-9.熟悉t统计量的计算方法和查表判断。

2-10.证明:R?(ryx) ;其中R2是一元线性回归模型的判定系数,ryx是y与x的相关

22系数。

2-11. 试根据置信区间的概念解释t检验的概率意义,即证明:对于显著性水平α,当

ti?t?时,bi的100(1-α)%的置信区间不包含0。

22-12.线性回归模型

yt????xt??tt?1,2,?,n

1的0均值假设是否可以表示为

n??t?1nt?0?为什么?

2-13.现代投资分析的特征线涉及如下回归方程:rt??0??1rmt?ut;其中:r表示股票或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据1956~1976年间240个月的数据,Fogler和Ganpathy得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

9

rt?0.7264?1.0598rmt r2?0.4710

(0.3001) (0.0728)

要求:(1)解释回归参数的意义;(2)如何解释r2?(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t检验进行检验(α=5%)。 2-14. 已知模型Yi????xi?ui,证明:估计量α可以表示为:??????(n?xW)y 这

iii?1n1里Wi?xi?xi?

22-15.已知两个量X和Y的一组观察值(xi,yi),i=1,2,?,n。 证明:Y的真实值和拟合值有共同的均值。

2-16.一个消费分析者论证了消费函数Ci?a?bYi是无用的,因为散点图上的点(Ci,Yi)不在直线Ci?a?bYi上。他还注意到,有时Yi上升但Ci下降。因此他下结论:Ci不是Yi的函数。请你评价他的论据(这里Ci是消费,Yi是收入)。

2-17.证明:仅当R2=1时,y对x的线性回归的斜率估计量等于x对y的线性回归的斜率估计量的倒数。

?Sx2-18.证明:相关系数的另一个表达式是:r?? 其中?为一元线性回归模型一次项

Sy?系数的估计值,Sx、Sy分别为样本标准差。

2-19.对于经济计量模型:Yi?b0?b1Xi?ui ,其OLS估计参数b1的特性在下列情况下会受到什么影响:(1)观测值数目n增加;(2)Xi各观测值差额增加;(3)Xi各观测值近似相等;(4)E(u2)=0 。

2-20.假定有如下的回归结果:Yt?2.6911?0.4795Xt,其中,Y表示美国的咖啡的消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。 要求:

(1)这是一个时间序列回归还是横截面序列回归?做出回归线; (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?

? 10

验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的?2分布为检验统计量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。

二、典型例题分析

例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

edu?10.36?0.094sibs?0.131medu?0.210fedu

R2=0.214

式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?

(2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 解答:

(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为 10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)

R2?0.099其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

21

解答:

(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即?Y=0.32?log(X1)?0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:?1?0,检验原假设H0:?1?0。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。

(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。

例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:

housing??0??1density??2value??3income??4popchang??5unemp??6localtax??7statetax??

式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的地方税,statetax——人均缴纳的州税 变量 C Density Value Income Popchang Unemp Localtax Statetax RSS R2 模型A 813 (0.74) 0.075 (0.43) -0.855 (0.13) 110.41 (0.14) 26.77 (0.11) -76.55 (0.48) -0.061 (0.95) -1.006 (0.40) 4.763e+7 0.349 1.488e+6 1.776e+6 模型B -392 (0.81) 0.062 (0.32) -0.873 (0.11) 133.03 (0.04) 29.19 (0.06) -1.004 (0.37) 4.843e+7 0.338 1.424e+6 1.634e+6 模型C -1279 (0.34) 0.042 (0.47) -0.994 (0.06) 125.71 (0.05) 29.41 (0.001) 4.962e+7 0.322 1.418e+6 1.593e+6 模型D -973 (0.44) -0.778 (0.07) 116.60 (0.06) 24.86 (0.08) 5.038e+7 0.312 1.399e+6 1.538e+6 ?2 ?AIC

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?

22

(2)在模型A中,在10%水平下检验联合假设H0:?i =0(i=1,5,6,7)。说明被择假设,计

算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。

(3)哪个模型是“最优的”?解释你的选择标准。 (4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认

其是否为正确符号。 解答:

(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。

(2)针对联合假设H0:?i =0(i=1,5,6,7)的备择假设为H1:?i =0(i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为

F?(RSSR?RSSU)/(kU?kR)(5.038e?7?4.763e?7)/(7?3)??0.462

RSSU/(n?kU?1)(4.763e?7)/(40?8)显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)

的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以βi(i=1,5,6,7)是联合不显著的。

(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。

(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期β3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A是这种情况,但它们的影响却非常微弱。

4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:

Y??0??1X1??2X2??3X3??

你想检验的虚拟假设是H0:?1?2?2?1。

??2??)。 ?,??的方差及其协方差求出Var(? (1)用?1212 (2)写出检验H0:?1?2?2?1的t统计量。

(3)如果定义?1?2?2??,写出一个涉及?0、?、?2和?3的回归方程,以便能直接得到?估计值??及其标准误。 解答:

23

(1)由数理统计学知识易知

Var(??1?2??2)?Var(??1)?4Cov(??1,??2)?4Var(??2) (2)由数理统计学知识易知

t???1?2??2?1?se(??,其中se(??2??)为(???2??)的标准差。 1?2??12122) (3)由?1?2?2??知?1???2?2,代入原模型得

Y??0?(??2?2)X1??2X2??3X3????0??X1??2(2X1?X2)??

3X3??这就是所需的模型,其中?估计值??及其标准误都能通过对该模型进行估计得到。

三、习题

(一)基本知识类题型 3-1.解释下列概念:

1) 多元线性回归 2) 虚变量 3) 正规方程组 4) 无偏性 5) 一致性

6) 参数估计量的置信区间 7) 被解释变量预测值的置信区间 8) 受约束回归 9) 无约束回归 参数稳定性检验

3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1) Y3i??0??1Xi??i 2) Yi??0??1logXi??i

24

3)

logYi??0??1logXi??i

4) Yi??0??1(?2Xi)??i 5) Yi??0??i ?1Xi?6) Yi?1??0(1?Xi1)??i

7) Yi??0??1X1i??2X2i10??i

3-3.多元线性回归模型与一元线性回归模型有哪些区别?

3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?

3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用? 3-6.请说明区间估计的含义。

(二)基本证明与问答类题型

3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:

yi??0??1x1i??2x2i????kxki?ui,i?1,2,?,n的正规方程组,及其推导过程。

3-8.对于多元线性回归模型,证明: (1)(2)

?ei?0

0??e??(??yii?x?????x)e?0 ??11ikkii3-9.为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?

3-10.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否

有等价的作用?

3-11.设有模型:y??0??1x1??2x2?u,试在下列条件下: (1)?1??2?1 (2)?1??2

分别求出?1和?2的最小二乘估计量。

25

本文来源:https://www.bwwdw.com/article/uhwg.html

Top