计量经济学作业-第四五章

更新时间:2023-03-15 04:42:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第四章上机习题

C4.1 如下模型可以用来研究竞选支出如何影响选举结果:

voteA??0??1ln?expendA???2ln?expendB???3prtystrA?u

其中,voteA表示候选人A得到的选票百分数,expendA和expendB表示候选人A和B的竞选支出,而则是对A所在党派实力的一种度量(A所在党派在最近一次总统选举中获得的选票百分比)。 (1)如何解释?1? 解 在回归方程

voteA??0??1ln?expendA???2ln?expendB???3prtystrA?u

中,保持ln?expendB?、prtystrA 不变,可得:

?voteA??1?ln?expendA?.

因为100??ln?expendA??%?expendA,所以

?voteA??1?ln?expendA????1100???100??ln?expendA?? ???1100???%?expendA?所以?1100表示当expendA变动1%时vote变动多少个百分点。 注意:%?x?x2?x1?100,%?x表示x的百分数变化。 x1(2)用参数表示如下虚拟假设:A的竞选支出提高1%被B的竞选支出提高1%所抵消。

解 虚拟假设可以表示为

H0:?1???2或者H0:?1??2?0

(3)利用VOTE1.RAW中的数据估计上述模型,并以通常的方式报告结论。A的竞选支出或影响结果吗?B的竞选支出呢?你能用这些结论来检验第(2)部分中的假设吗?

解 估计方程为

voteA?45.079?6.083ln(expendA)?6.615ln(expendB)?0.152prtystrA??3.926??0.382?n?173,SSR?10052.14,R2?0.793?0.379??0.062?

从回归结果可知,ln?expendA?的系数估计值等于6.083,标准误等于0.382,t统计量为15.919,p值为0.0000。ln?expendB?的系数估计值等于-6.615,标准误等于0.379,t统计量为-17.463,p值为0.0000。由此可以看出ln?expendA?和ln?expendB?的斜率系数在非常小的显著性水平下都是统计上显著异于零,所以A的竞选支出和B的竞选支出都会影响竞选结果。在保持其他因素不变的情况下,若A的竞选支出增加10%,则A得到的选票百分数将提高约0.608个百分点;若B的竞选支出增加10%,则A得到的选票百分数将下降约0.662个百分点.

从以上叙述中我们知道,?1和?2的符号相反且都符合预期,重要程度相当,但是我们不能根据这些结论得出?1??2的标准误差,也就不能计算相应的t统计量,所以不能用这些结论来检验(2)中的假设。

(4)估计一个模型,使之能直接给出检验第(2)部分中假设所需要的t统计量。你有什么结论?(使用双侧对立假设)

解 令???1??2,则?1????2,把它代入原始的回归方程可得:

????voteA??0??ln?expendA???2?ln?expendB??ln?expendA????3prtystrA?u

利用VOTE1.RAW的数据重新估计以上方程,得到的估计方程为

voteA?45.079?0.532ln?expendA??6.615?ln?expendB??ln?expendA???0.152prtystrA??3.926??0.533?n?173,SSR?10052.14,R2?0.793??0.379??0.062????????0.532,se????0.533, 从回归结果可知,?的t统计量为-0.998,p值为0.3196,??所以对?所做的估计在5%的显著性水平下是不显著的,我们不能在5%的显著性水平上拒绝虚拟假设H0:?1??2?0。

比较(3)和(4)可以看到:两估计方程截距、prtystrA的斜率估计值及其标准误都

是相同的,(4)中新变量ln?expendB?-ln?exp(3)中ln?eendA?的系数和标准误与xpendB??2的系数和标准误相同,两估计方程的SSR,R都是相同的。此外,(3)中的?1也可以根

据?2和?计算得出。

C4.2 本题要用到LAWSCH85.RAW中的数据。

(1)使用与习题3.4一样的模型,表述并检验虚拟假设:在其他条件不变的情况下,法学院排名对起薪中位数没有影响。

解 由题意可知,我们构造回归模型如下

??ln?salary???0??1rank??2lsat??3gpa??4ln?libvol???5ln?cost??u

则虚拟假设可以表述为H0:?1?0

利用LAWSCH85.RAW的数据可得估计方程为

ln?salary??8.343?0.00333rank?0.00470lsat?0.248gpa??0.533??0.000348??0.0333?n?136,R2?0.842?0.00401??0.090?

?0.0950ln?libvol??0.0376ln?cost??0.0321????从回归结果可以看出,rank斜率估计值?1??0.00333,se??1??0.000348,t统计

???量为-9.541,p值等于0.0000,由此可知rank即使是在很小的显著性水平上也是统计显著的,所以我们完全有理由拒绝H0。

(2)新生年级的学生特征(lsat,gpa)对解释salary而言是个别或者联合显著的吗?

解 从(1)的估计方程可知,lsat的t统计量为1.171,p值等于0.2437;gpa的t统计量为2.749,p值等于0.0068。所以在5%的显著性水平上只有gpa是个别显著的。

为了说明lsat,gpa是不是联合显著的,我们做如下的虚拟假设:

H0:?2?0,?3?0

其对立假设为H1:?2,?3不全为零。(1)已经给出了不受约束模型的估计方程,受约束模型的估计方程如下:

ln?salary??9.880?0.00417rank?0.129ln?libvol??0.0265ln?cost???0.343??0.000298?n?141,R2?0.822?0.0325??0.0295?

两个模型的样本容量不同,是由lsat,gpa的数据缺失造成的。不受约束模型中

22Rur?0.841,受约束模型的Rr?0.822,n?136,k?5,q?2,由此可得:

q0.841?0.822130ur?RrF????7.767 21?0.8412??1?Rurn?k?1??R22??分子自由度为2,分母自由度为130,显著性水平为5%的F统计量的临界值为3.00,,所以lsat,gpa在5%的显著性水平上是联合显著的。

(3)检验要不要在方程中引入入学年级的规模(clsize)和教职工的规模(faculty);只进行一个检验。

解 回归模型如下

ln?salary???0??1rank??2lsat??3gpa??4ln?libvol???5ln?cost???6clsize??7faculty?u再次利用LAWSCH85.RAW的数据得到其估计模型为

ln?salary??8.416?0.00343rank?0.00558lsat?0.266gpa??0.552??0.000357??0.0404?n?131,R2?0.844?0.00418??0.0932??0.000154??0.00040??0.0552ln?libvol??0.0296ln?cost??0.000134clsize?0.0000675faculty

?0.0347? 回归样本容量为131,这是受到clsize和faculty数据缺失的影响。

从回归结果可知,clsize和faculty的t统计量的值分别为0.875、0.169,p值分别为 0.383、0.866。由此可知,在5%,甚至是10%的显著性水平上clsize和faculty在统计上都不显著。

以(1)中的模型为受约束模型,本题中的模型为不受约束模型,就可以检验clsize和

22faculty的联合显著性了。Rur?0.844,受约束模型的Rr?0.842,n?131,k?7,

q?2,由此可得:

q0.844?0.842123ur?RrF????0.788 21?0.84421?Rur?n?k?1???R22?? 分子自由度为2,分母自由度为123,显著性水平为5%的F统计量的临界值为3.00,,lsat,gpa在5%的显著性水平上是联合显著的,所以不应该把clsize和faculty放进模型中。

(4)还有哪些因素可能影响到法学院排名,但又没有被包括在薪水回归中? 解 教师质量、性别差异、种族差异、学生能力测试成绩等。 C4.3 参考习题3.14,现在我们使用住房价格的对数作为因变量:

ln?price???0??1sqrft??2bdrms?u

(1)你想在住房增加一个150平方英尺的卧室的情况下,估计并得到price变化百分比的一个置信区间。以小数形式表示就是?1?150?1??2。使用HPRICE1.RAW中的数据去估计?1。

解 使用HPRICE1.RAW中的数据得到估计方程为

ln?price??4.766?0.000379sqrft?0.0289bdrms??0.097??0.0000432?n?88,SSR?3.3,R2?0.588???0.0296?

由以上回归结果可知,?1?0.000379,?2?0.0289,所以

?1?150?0.000379?0.289?0.08575

这意味着增加一个150平方英尺的卧室的情况下,price预期大约增长8.6%。 (2)用?1和?1表达?2,并代入ln?price?的方程。

解 ?1?150?1??2??2??1?150?1,代入方程可得:

?

ln?price???0??1sqrft???1?150?1?bdrms?u??0??1?sqrft?150bdrms???1bdrms?u?

(3)利用第(2)步中的结果得到?1的标准误,并使用这个标准误构造一个95%的置信区间。

解 新的估计方程为

?sqrft?150bdrms??0.0858bdrmsln?price??4.766?0.000379?0.097??0.0000432?n?88,SSR?3.3,R2?0.588???由以上回归结果可知,?1?0.0858,se??1??0.0268,所以?的一个95%的置信区

?????0.0268?

???间可以表示为??1.96se???。代入数据,该置信区间约为?0.0333,0.138?。

??C4.4 在例题4.9中,可以使用样本中所有1388个观测数据去估计约束模型。使用所有观测值计算bwght对cigs,parity和faminc回归的R,并与例4.9中约束模型所报告的R相比较。

解:使用样本中所有1388个观测数据得到的约束模型的估计方程为

22?bwght?114.214?0.477cigs?1.616parity?0.098faminc??1.469??0.092??0.604?2?0.029?

n?1388,SSR?554615.2,R2?0.0348 例4.9中运用1191个观测值在估计受约束模型得到R=0.0364,本题运用1388个观测值估计的受约束模型得到R=0.0348,R下降了。在例题4.9如果我们错误的应用了本题中的R,我们将得到F?2220.0387?0.03481185??2.531,他将在10%的显著性水平上

1?0.03872(临界值为2.30)拒绝例题4.9中的H0,这结果刚好与正确结论相反。 C4.5 本题要用到MLB1.RAW中的数据。

(1)使用方程(4.31)中所估计的模型,并去掉变量rbisyr。hrunsyr的统计显著性会怎么样?hrunsyr的系数大小又会怎么样?

解 方程(4.31)如下

ln(salary)?11.19?0.068years?0.0126gamesyr??0.29??0.0121??0.00110??0.0026??0.0161??0.0072?

?0.00098bavg?0.0144hrunsyr?0.0108rbisyrn?353,SSR?183.186,R2?0.6278去掉变量rbisyr后得到的估计方程为

ln(salary)?11.021?0.068years?0.016gamesyr?0.0014bavg?0.0359hrunsyr??0.266??0.0121??0.00156??0.00107??0.00724?

n?353,SSR?184.3749,R2?0.6254从回归结果可知,新估计方程中hrunsyr的t统计量的值为4.964,又因为显著性水平为5%时t的临界值为1.96,所以hrunsyr在统计上非常显著。

比较以上两个估计方程中hrunsyr的系数可知,新估计方程hrunsyr的系数比(4.31)增加了大约23%。

(2)在第(1)部分的模型中增加变量runsyr(每年垒得分),fldperc(防备率),sbasesyr(每年盗垒数)。这些因素中哪一个是个别显著的?

解 增加变量runsyr,fldperc,sbasesyr后所得的估计方程如下:

ln?salary??10.408?0.070years?0.008gamesyr?0.00053bavg??2.003??0.012??0.0086??0.0027??0.0051??0.0011??0.0020??0.0052?

?0.023hrunsyr?0.017runsyr?0.00104fldperc?0.00064sbasesyrn?353,SSR?177.6651,R2?0.639 从回归结果可知,变量runsyr,fldperc,sbasesyr的t统计量分别为3.434、0.516、-1.238,p值分别为0.007、0.6059、0.2165,在5%的显著性水平下只有runsyr是个别显著的。

(3)在第(2)部分的模型中,检验bavg,fldperc,sbasesyr的联合显著性。

解 为了检验bavg,fldperc,sbasesyr的联合显著性,我们做如下的虚拟假设:

H0:?3?0,?6?0,?7?0,

其对立假设为:

H0:?3,?6,?7中至少有一个异于零.

我们把(2)中的模型作为不受约束模型的估计方程,则受约束模型的估计方程为

ln?salary??11.531?0.070years?0.0087gamesyr?0.028hrunsyr?0.014runsyr??0.118??0.012??0.0026??0.0075??0.0039?

n?353,SSR?178.7233,R2?0.937n?353,k?7, 不受约束模型中SSR受约束模型的SSRr?178.7233,.6651,ur?177q?3,由此可得:

F??SSRr?SSRur?q?178.7233?177.6651?345?0.685 SSRur?n?k?1?177.66513 分子自由度为3,分母自由度为345,显著性水平为10%的F统计量的临界值为2.08,而0.685远小于临界值,所以即使是在10%的显著性水平上也是不显著的,所以我们没有足够的理由拒绝原假设。所以变量bavg,fldperc,sbasesyr是联合不显著的,它们对

ln(salary)的影响并不重要,可以从模型中去掉。

C4.6 本题要用到WAGE2.RAW中的数据。 (1)考虑一个标准的工资方程

ln?wage???0??1educ??2exper??3tenure?u

表述虚拟假设:多一年工作经历与现在的岗位上多工作一年对ln?wage?具有相同影响。

解 虚拟假设为H0:?2??3

(2)在5%的显著性水平上,相对于双侧对立假设,通过构造一个95%的置信区间来检验第(1)部分中的虚拟假设。你的结论是什么?

解 为了检验(1)中的虚拟假设,定义一个新参数???2??3,(1)中的虚拟假设就

等价于H0:??0,对立假设为H1:??0。

???2??3??2????3,代入标准工资方程得到新的方程如下:

ln?wage???0??1educ??exper??3?exper?tenure??u

利用wage2.raw的数据得到其估计方程为

ln?wage??5.497?0.075educ?0.00195exper?0.013?exper?tenure???0.111??0.007??0.00474??0.0026?

n?935,SSR?139.9610,R2?0.155??? 从回归结果可知,?的估计值??0.00195,标准误se????0.00474,t统计量为

???0.412,p值为0.68,所以没有理由拒绝虚拟假设。

本题中自由度为931,足够大,可以使用标准正态分布的近似值,所以在5%的显著性

???水平上对于?的一个95%的置信区间可以表示为??1.96se???,代入数据,该置信区间约

????。显然0是在该区间内的,这进一步说明了我们没有理由拒绝H0。为??0.00734 ,0.01124C4.7 参考4.4中所有的例子,你将使用数据集TWOYEAR.RAW。

(1)变量phsrank表示一个人的高中百分位等级(数字越大越好,比如90意味着你的排名比所在班级中国90%的同学更高),求出样本中phsrank的最小、最大和平均值

(phsrank)、解 在EViews中分别应用@mean@max?phsrank?、@min?phsrank?可得,样本中phsrank的最小值等于0.000,最大值等于99.000,平均值等于56.157。

或者是直接在statstable中查看phsrank的统计性质:

(2)在方程(4.26)中增加变量phsrank,并照常报告OLS估计值。phsrank在统计上

显著吗?高中排名提高10个百分点,能导致工资增加多少?

解 增加变量phsrank后模型变为

ln?wage???0??1jc??2totcoll??3exper??4phsrank?u

其估计方程为

ln?wage??1.459?0.00931jc?0.0755totcoll?0.00494exper?0.0003phsrank??0.0236??0.00697??0.00256?n?6763,SSR?1250.246,R2?0.223?0.000158??0.000239?

由回归结果可知,phsrank的t值为1.27,p值为0.204,所以可以看到在5%,甚至是15%的显著性上phsrank都是统计上不显著的。高中排名phsrank提高10个百分点,可以导致工资增长约0.003%。

(3)在方程(4.26)中增加变量phsrank显著改变了2年制和4年制大学教育回报的结论了吗?请解释。

解 与方程(4.26)相比,jc系数从-0.0102变为-0.00931,其标准误基本上没变,这就使得jc的t统计量从-1.468变到-1.336,在绝对值上变小了。但是在这些变化都是很小的,没有改变jc在统计上不显著的事实,也就没有显著改变2年制和4年制大学教育回报的结论。

(4)数据集中包含了一个被称为id的变量。你若在方程(4.17)或者(4.26)中增加id,预计它在统计上不会显著,解释为什么?双侧检验的p值是多少?

解 id代表身份证号码,它是随机分配的,它不应该与任何变量做回归,它对其他变量(包括wage)的影响是非常小的。所以,若把它添加到方程(4.17)或者(4.26)中,预计它在统计上不会显著。

下面是把id加到4.26中得到的估计方程

ln?wage??1.468?0.01022jc?0.0769totcoll?0.00495exper?0.0000000114id??0.0228??0.00693??0.00231?n?6763,SSR?1250.489,R2?0.223?0.000158??0.0000000209?

从回归结果可知变量id的t值为0.544,双侧检验的p值为0.587,这说明了只有当显著性水平要高到58%,id才会是统计上显著的。

C4.8 数据集401ksubs.raw包含了净金融财富(nettfa)、被调查者年龄(age)、家庭年收入(inc)和家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入以千美元记。对于这里的问题,都是用单身者数据。 (1)数据集中的有多少个单身者?

解 在EViews中通过x?@sum(fsize?1)可统计出共有2017个单身者。 (2)利用OLS估计模型

nettfa??0??1inc??2age?u

并以常用的格式报告结果,解释斜率系数,斜率估计值有惊人之处吗?

解 估计方程为

nettfa??60.697?0.953inc?1.031age??2.596??0.025?n?9275,R2?0.169?0.059?

inc的斜率系数表明当家庭年收入增加一个单位时,净金融财富将增加0.953个单位;

age的斜率系数表明被调查者年龄每增长1岁,净金融财富将增加1.030个单位,这些变量

的符号都是正确的,家庭年收入越多、被调查者年龄越大,积累的净金融财富就越多,但是

age的系数超过1了,这似乎也太大了点,因为除了inc和age外还有其他重要的原因影响

nettfa。从回归结果可知,inc和age的t统计量分别为37.716、17.435,在统计上都是极

为显著的。

(3)第(2)部分中的回归截距有重要意义吗?请解释。

解 该回归截距表示的是当inc和age都取零时nettfa的取值为-60.697,但是被调查者年龄和家庭年收入都不可能为零,且年龄为零或者家庭年收入为零自然也不可能有净金融财富或者负的净金融财富,所以,该回归截距没有重要意义。

(4)1%的显著性水平上,针对H1:?2?1检验H0:?2?1,求出p值。你能拒绝H0吗?

???解 由(2)的回归结果可知,?2?1.030,se??2??0.059,所以

???t??2?1???se??2?????1.030?1?0.508

0.059p?P?T?0.508?2,本来可以计算出p值来判断是否能够拒绝H0,但是老师,十分对不

起,我还没有学会使用Stata来计算PT?0.508,所以请原谅我只能用t统计量判断。该回归中样本容量足够大,在1%的显著性水平上t统计量的临界值为2.326,所以我们不能拒绝H0。

(5)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(2)部分的估计值有很大不同吗?为什么?

解 nettfa对inc进行简单回归得到的估计方程为

??nettfa??20.179?0.99991inc??1.176??0.026?

n?9275,R2?0.142 该回归模型的inc斜率估计值比(2)中的估计值增加了0.049,这个差异相当小,且两个模型中inc斜率估计值的标准误几乎是相等的,所以两模型中的inc斜率估计值没有很大的不同。产生这种现象的原因是变量inc和age之间的相关程度很低(相关系数0.1056),所以age在不在模型中都不会对inc产生太大的影响。 C4.9 利用DISCRIM.RAW中的数据回答下面的问题。

???3prppov?u,(1)利用OLS估计模型ln?psoda???0??1prpblck??2ln?income以常用的形式报告结果,在5%的显著性水平上,相对一个双侧对立假设,?1统计显著异于零吗?在1%的水平上呢?

解 估计方程如下

???0.380prppovln?psoda???1.463?0.073prpbick?0.137ln?income?0.294??0.0307?n?401,SSR?2.628,R2?0.0870??0.0268??0.133?

?????1?0.073,se??1??0.0307,?1的t统计量的值为2.373,p值为0.0181,所以在5%???的显著性水平上?1是统计显著异于零,但是在1%的显著性水平上?1并不统计显著。 (2)ln?income?和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧

??p值。

解 通过EViews软件可以计算出ln?income?和prppov的相关系数等于-0.838 由(1)的回归结果可知ln?income?和prppov的双侧p值分别为0.0000、0.0044,所以这两个变量在很小的显著性水平上都是统计显著的。

(3)在第(1)部分的回归中增加变量ln?hseval?。解释其系数,并报告H0:?ln?hseval??0的双侧p值。

解 增加变量ln?hseval?后得到的估计方程如下

?ln?psoda???0.842?0.098prpblck?0.053ln?income?0.292??0.0292??0.134??0.0375?

??0.052prppov?0.121ln?hseval??0.0177?n?401,SSR?2.349,R2?0.184ln?hseval?的系数估计值等于0.121,它表明当hseval提高1%时psoda将提高大约0.121%。由回归结果可得ln?hseval?的双侧p值等于0.0000,这说明ln?hseval?在很小

很小的显著性水平下都会是统计显著的。

?和prppov的个别统计显著性有何变化?这些变(4)在第(3)部分的回归中,ln?income量联合显著吗?(计算一个p值),你如何解释你的答案?

?和prppov的t统计量的值分别等于-1.412、0.386,解 在(3)的回归中,ln?income?和prppov的p值分别为0.1587、?和prppov在5%的0.6986,所以ln?incomeln?income?和prppov也都不显显著性水平上都不显著。即使是在15%的显著性水平下,ln?income著。

为了检验ln?income?、prppov、ln?hseval?是不是联合显著的,我们做如下虚拟假设

H0:?2?0,?3?0

其对立假设为

H1:?2,?3不全为零

(3)中已经给出不受约束模型的估计方程,受约束模型的估计方程如下:

ln?psoda???1.043?0.129prpblck?0.090ln?hseval???0.127??0.022?n?401,SSR?2.391,R2?0.169?0.0106?

不受约束模型中SSRr?2.391,n?401,k?5,q?2,ur?2.349,受约束模型的SSR由此可得:

F??SSRr?SSRur?q?2.391?2.349?396?3.54

SSRur?n?k?1?2.3492分子自由度为2,分母自由度为396,显著性水平为5%的F统计量临界值为3.00,所以在

5%的显著性水平上要拒绝虚拟假设,ln?incom?e和prppov是联合显著的。又因为

?和prppov在所以其p值大约等于0.03,这进一步说明了ln?incomeP?F?3.54??0.03,

5%的显著性水平上是显著的。

?和prppov的相关系数等于-0.838,也就是说ln?income? 在(2)中已经知道ln?income和prppov是高度相关的,所以在这两个变量之间很可能存在多重共线性,这也解释了为什

?和prppov个别不显著但是却联合显著。 么 ln?income(5)给定前面的回归结果,在确定一个邮区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?

解 (3)中的回归模型包括了大多数变量,且prpblck和ln?hseval?都是个别显著的,

pblck?和prppov是联合显著的,这个回归相对而言应该是更可靠的。(3)中prln?income斜率系数的估计值等于0.098,它表明如果邮区的blacks增加0.1,则当地的posda将增加

0.98%。

C4.10 利用ELEM94_95.RAW中的数据回答本题。所得到的结论可以与表4.1中的结论进行对比。因变量lavgsal表示教师平均薪水的对数,(以bs表示平均福利与平均薪水的比率学校为单位)。

(1)将lavgsal对bs进行简单回归。斜率估计值在统计上显著异于零吗?它在统计上显著的异于-1吗?

解 将lavgsal对bs进行简单回归得到的估计方程为

lavgsal?10.748?0.795bs??0.051??0.150?

n?1848,SSR?98.673,R2?0.015从上述估计方程可以看到,在不控制其他变量的情况下,bs的斜率估计值等于-0.795,标准误等于0.150,t统计量的值为-5.313,p值为0.0000,所以bs的斜率估计值在统计上

是显著异于零的。又因为

?1?1???se??1??????0.795?1?1.367,且显著性水平为5%时t的临界值

0.150为1.96,所以在5%的显著性水平上斜率估计值在统计上不是显著异于-1的。

(2)在第(1)部分的回归中增加变量lenrol和lstaff。bs的系数有何变化?这种情形与表4.1中的情形相比如何?

解 增加变量lenrol和lstaff后的估计方程为

lavgsal?13.953?0.605bs?0.032lenrol?0.714lstaff??0.107??0.109??0.0085?n?1848,SSR?51.891,R2?0.482?0.0178?

保持其他条件不变的情况下,与(1)相比较,bs系数的绝对值变小了,标准误差也变小了。但是其系数的t统计量等于-5.564,p值仍为0.0000,所以bs的系数仍然是统计上显著的。再与4.1中的模型二相比较,bs的系数估计值在数值是相同的,但是本题中的标准误要小于表4.1中的标准误,这可能是样本容量增大导致的。

(3)第(2)部分中bs系数的标准误为何比第(1)部分中的标准误要小?

解 我们知道,在方程中增加与我们所关心的解释变量(bs)没有多大关系的其他解

释变量时,能使我们得到关于我们所关心的解释变量更为精确的信息,也可以减小其误差方差。在(2)中的模型中我们增加了心的解释变量lenrol和lstaff,这两个解释变量与bs没有什么直接的关系,它们之间也不会存在严重的多重共线性,在这样的情况下,由(2)中的模型所得到的bs系数估计值的误差方差就会比(1)中的小。 (4)lstaff的系数为什么为负?它的绝对值算大吗?

解 lstaff是指平均每千名学生所拥有的教师数量的对数,(2)中估计方程表明,当

staff提高1%时,教师的平均薪水将下降0.714%。每千名学生所拥有的教师规模提升,

教师平均薪水下降,也即lstaff的系数为负,这有可能是因为新上岗的教师都是职位比较低的,或者是工作经验不多、刚走上工作岗位的年轻人,他们的工资都不太高,所以使得教师的平均工资下降。另一个原因就是当老师规模增大后,每位老师负责的学生数量减少,老师负担减轻,相应工资就会低一些,所以平均薪水也就低了。当我们只是看staff提高1%时教师的平均薪水将下降0.714%,可能会认为0.714这个数字不是很大。但是当我们考虑

staff提高100%,也就是说每千名学生拥有的教师数量在现有规模上增加一倍,那么教师

的薪水将下降74.1%,这个下降幅度是非常大,不是很符合事实。

(5)在回归中再添加变量lunch。保持其他条件不变,教师会因教育那些家庭条件不好的学生而得到补偿吗?请解释你的结论。

解 (按照我的理解,lunch表示符合吃免费午餐条件的学生所占的比例,也就是家庭条件不好的学生所占的比例,如果理解错误这个小题也就错了)

再添加变量lunch后得到的估计方程为

lavgsal?13.831?0.516bs?0.028lenrol?0.691lstaff?0.000758lunch??0.1097??0.109??0.0085?n?1848,SSR?51.277,R2?0.488?0.0184??0.000161?

从估计方程中可以看到,lunch的系数估计值为负数,也就是说家庭条件不好的学生所占的比例越多,教师的平均薪水将降低,但是降低的幅度很小,可以不用考虑。但是这也说明教师是不能因教育家庭条件不好的学生而得到补偿。

(6)总之,你利用ELEM94_95.RAW得到的结论,与表4.1在形式上一致吗?

解 把以上结论写成表4.1的形式如下

因变量:lavgsal

自变量

(1) -0.795(0.150)

- - -

10.748(0.051)

1848 0.015

(2) -0.605(0.109) -0.032(0.0085) -0.714(0.0178)

-

13.953(0.107)

1848 0.482

(4) -0.516(0.109) -0.028(0.0085) -0.691(0.0184) -0.000758(0.00016) 13.831(0.1097)

1848 0.488

bs

lenrol

lstaff lunch

截距 观测次数

R2

从表的第一列可以看到,不控制其他因素,bs的OLS系数为-0.795。在(1)中我们检验虚拟假设H0:?1??1时的t统计量

?1?1???se??1??????0.795?1?1.367,所以简单回归不能拒绝

0.150H0。在引入学校规模lenrol和教师规模lstaff后,bs的系数估计值就变为-0.605.现在检

验?1??1的t统计量约为3.624,因此,H0相对双侧对立假设而在5%的显著性水平上被拒绝。变量lenrol和lstaff在(2)中的t统计量分别为-3.726、-40.119,在(4)中的t统计量分别为-3.360、-37.615,都是极为统计显著的。总之,利用ELEM94_95.RAW得到的结论与表4.1在形式上是一致的。

第五章上机作业题

C5.1 本题要利用WAGE1.RAW的数据。 (1)估计方程

wage??0??1educ??2exper??3tenure?u

保留残差并画出其直方图。

解 利用数据得到的估计方程为

wage??2.873?0.599educ?0.022exper?0.169tenure??0.729??0.0513?2??0.0121??0.0216?

n?526,R?0.306,??3.0845为了便于比较,我们把正态分布的图形与残差直方图画在同一个图形上。在EViews中打开

resid,再点击view中的graph,对图像进行设置,可以得到图形如下:

RESID.24.20.16Density.12.08.04.00-20-15-10-505101520HistogramNormal (2)以ln?wage?作为因变量重做第(1)部分。

解 以ln?wage?作为因变量得到的估计方程为

ln?wage??0.284?0.092educ?0.0041exper?0.0221tenure??0.104??0.00733??0.00172?n?526,R?0.316,??0.4412??0.0031?

同样的方法,在EViews中得到残差的直方图以及正态分布的图形如下:

RESID1.21.00.8Density0.60.40.20.0-3-2-101Normal23Histogram (3)你认为是水平值—水平值模型还是对数—水平值模型更接近于满足假定MLR.6? 解 从两个小题的残差图中可以明显的看出,(1)中水平值—水平值模型有较多的残差非常大,且残差图明显左偏,(2)中对数—水平值模型的残差图与正态分布吻合的比较好,对数—水平值模型更接近于满足假定MLR.6。

本文来源:https://www.bwwdw.com/article/chft.html

Top