第8讲 工具变量

更新时间:2023-12-27 21:55:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第8讲 单方程工具变量回归(完)

OLS能够成立的假设之一是解释变量与扰动项不相关。否则,OLS估计量将是不一致的,即无论样本容量多大,OLS估计量都不会收敛到真实的总体参数。然而,解释变量与扰动项相关的例子却很多1,解决方法之一就是本讲介绍的工具变量法。

从历史上看,工具变量估计和联立方程系统是同时教授的,更老的教科书仅在联立方程中描述工具变量估计。然而在最近的几十年,内生性的处理和工具变量估计已经呈现出更广阔的前景,而对于联立方程完整系统设定的兴趣已经减弱。最新的教材,如Cameron & Trivedi (2005),Davidson & MacKinnon (1993, 2004)和Wooldridge (2010, 2013),把工具变量估计看作现代经济学家的工具包中不可或缺的一部分,用更长的篇幅介绍它,而缩短对联立方程的讨论。

在回归方程中,一个有效(valid)的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关; (2)外生性:工具变量与扰动项不相关。

但是,工具变量的这两个条件常常矛盾,即与内生解释变量相关的变量往往与扰动项也相关。故在实践上,寻找合适的工具变量通常比较困难,需要一定的创造性与想象力。寻找工具变量的步骤大致可以分为两步:

(1)列出与内生解释变量相关的尽可能多的变量的清单(较容易) (2)从这一清单中剔除与扰动项相关的变量(较困难)

传统的工具变量法一般通过“两阶段最小二乘法”(2SLS)来实现,顾名思义,即作两个回归。可以证明,在扰动项的经典假定下,由2SLS得到的工具变量线性组合是所有线性组合中最渐近有效的2。这个结论类似于小样本理论中的高斯—马尔可夫定理。

第一阶段回归:用内生解释变量对工具变量回归,得到内生解释变量的拟合值。

12

在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。 在条件同方差的情况下,最优GMM还原为2SLS,而最优GMM是渐近有效的。

1

第二阶段回归:用被解释变量对第一阶段回归的拟合值进行回归,得到被解释变量的拟合值。

ivregress — Single-equation instrumental-variables regression 命令语法:

ivregress estimator depvar [varlist1] (varlist2= varlistiv) [if] [in] [weight] [, options]

estimator 2sls liml gmm 描述 两阶段最小二乘法(2SLS) 有限信息最大似然法(LIML) 广义矩估计(GMM)

命令描述:

ivregress拟合被解释变量depvar对varlist1和varlist2的线性回归,使用varlistiv作为varlist2的工具变量,varlist1和varlistiv是外生(解释)变量,varlist2是内生(解释)变量。ivregress可以利用两阶段最小二乘法(2SLS),有限信息最大似然法(LIML)和广义矩估计(GMM)执行工具变量估计。

备注和示例

ivregress执行工具变量回归和加权工具变量回归。对于工具变量的一般讨论,请参见Baum (2006),Cameron和Trivedi (2005;2010,第6章),Davidson和MacKinnon (1993,2004),Greene (2012,第8章),以及Wooldridge (2010,2013)。参见Hall (2005)对于GMM估计的明晰介绍。Angrist和Pischke (2009,第4章)非正式而全面地介绍了工具变量估计量,包括他们在估计处理效应的使用。

ivregress的语法假设从方程系统拟合一个方程,或拟合一个不用指定剩余方程的函数形式的方程。为了拟合一个完整的方程系统,使用2SLS equation-by-equation或三阶段最小二乘法,请参阅[R] reg3。ivregress的一个优点是,可以拟合多方程系统中的一个方程,而不用指定剩余方程的函数形式。

形式上,由ivregress拟合的模型是:

2

yi = ziβ1 + x1iβ2+ ui (1) zi = x1iΠ1 + x2iΠ2 + vi (2) 其中yi是第i个观测值的因变量,zi表示内生回归元(varlist2),x1i表示包括的外生回归元(varlist1),x2i表示排除的外生回归元(varlistiv)。x1i 和x2i统称为工具。ui和vi是零均值误差项,ui和vi元素的相关性假设是非零。

2SLS and LIML estimators

最常用的工具变量估计量是2SLS。 例1:2SLS estimator

我们有从1980年以来的州人口普查数据,包括自有住房价值的中位数(hsngval)和每月总租金的中位数(rent)。我们想构建rent为hsngval和生活在城市地区的人口比例(pcturban)的函数:

renti =β0 +β1hsngvali+β2pcturbani+ ui 其中i表示各个州,ui是误差项。

因为随机冲击影响一个州的租金价格,也可能会影响房屋价值,所以我们把hsngval看作是内生的。我们相信hsngval和u的相关性不等于零。另一方面,我们没有理由相信pcturban和u的相关性不为零,所以我们假设pcturban是外生的。

因为把hsngval当作内生回归元,所以必须有一个或多个与hsngval相关但与u不相关的其他变量。此外,这些排除的外生变量不能直接影响rent,因为如果它们影响rent的话,就应该包含在前面指定的回归方程中。另外,家庭收入变量(faminc)和地区变量(region),与hsngval相关但与误差项u不相关。总之,pcturban,faminc和因子变量2.region,3.region和4.region构成了一套工具变量。

为了拟合方程,我们指定了因变量和包括外生变量的自变量。在括号中,我们指定了内生回归元,一个等号,和排除的外生变量。其他外生变量必须指定在等号的右边;出现在回归方程中的外生变量自动纳入工具变量。

use hsng,clear

ivregress 2sls rent pcturban (hsngval = faminc i.region)

正如所期望的,具有更高房屋价值的州有更高的租金价格。生活在城市地区的州人口比例对租金没有显著影响。

3

技术说明

在联立方程的框架下,写出前面拟合的模型为:

hsngvali=π0 +π1faminci +π22.regioni+π33.regioni+π44.regioni+ vi renti =β0 +β1hsngvali+β2pcturbani+ ui

方程系统是递归的,因为hsngval出现在rent的方程中,但rent并没有出现在hsngval的方程中。然而,在一般情况下,联立方程系统不是递归的。由于系统是递归的,我们可以用OLS分别拟合这两个方程,如果我们愿意假设u和v是独立的。

例2:LIML estimator

理论和Monte Carlo模拟表明,LIML估计量比2SLS估计量可能会得到更小的偏差,并且置信区间的覆盖率更好。

use hsng,clear

ivregress liml rent pcturban (hsngval = faminc i.region)

这些结果与2SLS结果定性相似,尽管hsngval的系数比2SLS的系数高19%左右。

例3:GMM estimator

在扰动项的经典假定下,2SLS是最有效率的。但如果扰动项存在异方差或自相关,则存在更有效的方法,即“广义矩估计”(Generalized Method of Moments,GMM)。在某种意义上,GMM之于2SLS,正如GLS之于OLS。

从Hansen (1982)的著名论文以来,GMM已成为了经济学和金融学的常用估计方法,它非常适用于工具变量估计。对于更一般的GMM估计量,参见[R] gmm。gmm不限定拟合单个的线性方程,尽管语法更复杂。

use hsng,clear

ivregress gmm rent pcturban (hsngval = faminc i.region) , wmatrix(robust) (wmatrix(robust)是默认选项。指定wmatrix(robust)项要求一个最优加权矩

4

阵,当误差项存在异方差时。)

例4:GMM estimator with clustering

有关于年轻女性的1968年—1988年NLS(National Longitudinal Survey)工资调查数据,我们想要拟合一个工资模型,工资是年龄、年龄的平方、工作任期、出生年份和教育水平的函数。我们认为影响女性工资水平的随机冲击,也会影响她的工作任期,所以我们把tenure看作内生的。额外的工具变量包括,是否加入工会,在过去的一年工作周数,婚姻状况。因为每名女性都有多个观测值(对应于多年的跟踪调查),所以我们要为每个人进行聚类。

use nlswork,clear

ivregress gmm ln_wage age c.age#c.age birth_yr grade (tenure = union wks_work msp), wmatrix(cluster idcode)

工作任期和教育年限对工资有显著的正效应。

有关GMM估计更多的内容,参见Baum (2006);Baum,Schaffer和Stillman (2003, 2007);Cameron & Trivedi (2005);Davidson & MacKinnon (1993, 2004);Hayashi (2000);Wooldridge (2010)。参见Newey & West (1987),Wang & Wu (2012)对于HAC协方差矩阵估计的介绍。

例5:Mincer收入方程遗漏变量的处理

Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。使用美国面板调查数据(NLS)中的年轻男子组,采用工具变量法处理遗漏变量的问题。

该数据集包括以下变量:lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledge of the World of Work\测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。这是一个两期面板数据。

use grilic,clear correlate iq s

5

(智商(在一定程度上可视为“能力”的代理变量)与受教育年限具有较强的正相关关系(相关系数为0.51))

regress lw s expr tenure rns smsa,r

(先用OLS回归作为一个参照系,并使用稳健标准差。)( 回归结果显示,教育投资的年回报率为10.26%,而且在1%的水平上显著地不为0。这意味着,多受一年教育,则未来的工资将高出10.26%,这个教育投资回报率似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育年限正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。)

regress lw s iq expr tenure rns smsa,r

(引入智商(iq)作为“能力”的代理变量,再进行OLS回归。)( 加入“能力”的代理变量iq后,教育投资的回报率下降为9.28%,变得更为合理些,但仍然显得过高。)

ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),r

(由于用iq来度量能力存在“测量误差”,故iq是内生变量,考虑使用变量(med, kww,mrt, age)作为iq的工具变量,进行2SLS回归,并使用稳健标准差。)( 在此2SLS回归中,教育回报率反而上升到13.73%,而智商(iq)对工资的贡献居然为负,似乎并不可信。使用工具变量法的前提是工具变量的有效性。为此,进行过度识别检验,考察是否所有工具变量均外生,即与扰动项不相关。)

estat overid

( 结果强烈拒绝“所有工具变量均外生”的原假设(p值为o.oooo),即认为某些(或某个)工具变量不合格(invalid),与扰动项相关。)

ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first

(考虑仅使用变量((med, kww)作为iq的工具变量,再次进行2SLS回归,同时显示第一阶段的回归结果。)( 上表显示,教育投资回报率降为6.08%,比较合理;而且iq的贡献也重新变为正。)

estat overid

(再次进行过度识别检验。)( 由于p值为0.7,故接受原假设,认为(med, kww)外生,与扰动项不相关。)

estat firststage ,all forcenonrobust

6

(进一步考察有效工具变量的第二个条件,即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出,工具变量(med, kww)对内生变量iq均有较好的解释力,p值都小于0.01。)( 从以上结果可以看出,虽然Shea's partial R2,不到0.04,但F统计量为13.40(超过10),而且F统计量的p值为0.0000。我们知道,虽然2SLS是一致的,但却是有偏的,故使用2SLS会带来“显著性水平扭曲” (size distortion),而且这种扭曲随着弱工具变量而增大。上表的最后部分显示,如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”(nominal size)为5%的沃尔德检验,假如可以接受“真实显著性水平’' (true size)不超过15%,则可以拒绝“弱工具变量”的原假设,因为最小特征值统计量为14.91,大于对应的临界值11.59)

ivregress liml lw s expr tenure rns smsa (iq=med kww),r

(总之,我们有理由认为不存在弱工具变量。但为了稳健起见,使用对弱工具变量更不敏感的有限信息最大似然法(LIML))( 结果发现,LIML的系数估计值与2SLS非常接近,这也从侧面印证了“不存在弱工具变量”。)

quietly reg lw iq s expr tenure rns smsa estimates store ols

quietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store iv

hausman iv ols,constant sigmamore

(使用工具变量法的前提是存在内生解释变量。为此须进行豪斯曼检验,其原假设为“所有解释变量均为外生”,即不存在内生变量。)( 上表显示,可以在5%的显著性水平上拒绝“所有解释变量均为外生”的原假设,即认为iq为内生变量。由于传统的豪斯曼检验建立在同方差的前提下,故在上述回归中均没有使用稳健标准差(没有用选择项“r”)。)

estat endogenous

(由于传统的豪斯曼检验在异方差的情形下不成立,所以进行异方差稳健的DWH检验)(DWH检验的p值小于0.05,故可认为iq为内生解释变量(在5%的显著性水平上)。)

ivregress gmm lw s expr tenure rns smsa (iq=med kww)

7

(如果存在异方差,则GMM比2SLS更有效率。为此,进行最优GMM估计。)(两步最优GMM的系数估计值与2SLS很接近。)

estat overid

(进行过度识别检验。由于p值为0.7,故认为所有工具变量均为外生。考虑迭代GMM)

ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm (容易看出,迭代GMM与两步GMM的系数估计值相差无几。)

如果希望将以上各种估计法的系数估计值及其标准差列在同一张表中(有时,在论文中也采用类似的表格,便于对各种估计法的结果进行比较。),可使用以下命令:

quietly reg lw s expr tenure rns smsa,r estimates store ols_no_iq

quietly reg lw iq s expr tenure rns smsa,r estimates store ols_with_iq

quietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r estimates store tsls

quietly ivregress liml lw s expr tenure rns smsa (iq=med kww),r estimates store liml

quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww) estimates store gmm

quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm estimates store igmm

estimates table ols_no_iq ols_with_iq tsls liml gmm igmm

8

本文来源:https://www.bwwdw.com/article/74kx.html

Top