第六讲 工具变量回归

更新时间:2023-06-07 06:33:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

工具变量回归

差项彼此之间不相关。

OLS经典假设 所有的解释变量Xi与随机误

Cov(ui, Xi ) 0若解释变量Xi和ui相关,则OLS估计量是非一 致的,也就是即使当样本容量很大时,OLS估 计量也不会接近回归系数的真值。 当解释变量和随机误差项相关时,模型存在着 内生性问题。

在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。

造成误差项与回归变量相关(内生性)的原 因很多,但我们主要考虑如下几个方面: 遗漏变量偏差 变量有测量误差 双向因果关系。

遗漏变量偏差

变量有测量误差测量数据正确时:假设方程为:

Yi 0 1 Xi ui当存在测量误差时:方程为:

Yi 0 1 Xi vi所以我们有:

Yi 0 1 Xi vi 0 1 Xi [ 1( Xi Xi ) ui ]

vi 1( Xi Xi ) ui可知,误差项中包含 所以可以得到:如果

Xi Xi Cov( Xi Xi, Xi ) 0

则回归结果有偏,非一致 我们假设 则有

Xi Xi wi 1 p 2

2

x 2 w

x

1

结论:1。由于

2x 1 2 2 x w

2。回归的性质决定于w的标准差

x p 1 w 2 1 0 2 x w2 2 p

x p 1 w 2 1 1 2 x w2 2 p

双向因果关系之前我们假定因果关系是从回归变量到因变 量的(X导致了Y)。但如果因果关系同时也 是从因变量到一个或多个回归变量(Y导致 了X)的呢?如果是这样的话,因果关系是 向前的也是“向后” 的,即存在双向因果 关系,如果存在双向因果关系,则OLS回归 中同时包含了这两个效应,因此OLS估计量 是有偏的、非一致的。

可以推导出:

Cov( Xi, ui) r1

2

u

/ (1 r1 1)

遗漏变量偏差可采用在多元回归中加入遗漏变 量的方法加以解决,但前提是只有当你有遗漏 变量数据时上述方法才可行。 双向因果关系偏差是指如果有时因果关系是从 X到Y又从Y到X时,此时仅用多元回归无法消 除这一偏差。同样, 变量有测量误差也无法用我们前面学过的方法 解决。 因此我们就必须寻找一种新的方法。

工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:

我们假设ui与Xi相关,则OLS估计量一定是 有偏的

和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。

我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。

工具变量的选取一个有效的工具变量必须满足称为工具变量相关 性和工具变量外生性两个条件:即

(1)工具变量相关性:工具变量与所替代 的随机解释变量高度相关;

Cov( Zi, Xi) 0(2)工具变量外生性:工具变量与随机误差 项不相关;

Cov(ui, Zi ) 0

两阶段最小二乘估计量若工具变量Z满足工具变量相关性和外生性的 条件,则可用称为两阶段最小二乘(TSLS)的 IV估计量估计系数ß1。 两阶段最小二乘估计量分两阶段计算: 第一阶段把X分解成两部分:即与回归误差项 相关的一部分以及与误差项无关的一部分。 第二阶段是利用与误差项无关的那部分进行估 计。

一般IV回归模型

1. 因变量 Yi。 2. 外生解释变量 W1i、 W2i、… Wri。

3. 内生解释变量 X1i、 X2i、… Xki。4. 我们引入工具变量Z1i、 Z2i、… Zmi 。

第一阶段回归:利用OLS建立每个内生变量 ( X1i、 X2i、… Xki)关于工具变量( Z1i、 Z2i、… Zmi)和外生变量(W1i、 W2i、… Wri) 的回归,并得到所有回归结果的拟合值Xi_hat。 第二阶段回归:用Xi_hat取代原有的Xi,与原有 的外生变量Wi一起进行第二次回归,得到TSLS 统计量β TSLS。 注意:工具变量出现在第一阶段回归,但不出 现在第二阶段回归。

引入工具变量的个数假设我们有n个内生解释变量,引入了m个工 具变量,n和m的关系是什么? n=m 恰好识别 n<m 过度识别 n>m 不可识别 只有恰好识别和过度识别才能用IV方法估计。

两阶段最小二乘法的stata命令: ivregress 2sls depvar [varlist1] (varlist2 =instlist),r,first 其中,“depvar”为被解释变量,varlist1 为外生解释变量,varlist2为所有的内生解 释变量集合,instlist为工具变量集合。 选择项r表示使用异方差稳健的标准误,选 择项“first”表示显示第一阶段的回归。

工具变量有效性的检验工具变量相关性 工具变量相关性越强,也就是工具变量能解释越多 的X变动,则IV回归中能用的信息就越多,因此利用 相关性更强的工具变量得到的估计量也更精确。 弱工具变量:如果虽然

Cov( Zi, Xi ) 0 0

但是 Cov( Zi, Xi ) 弱工具变量几乎不能解释X的变动。

本文来源:https://www.bwwdw.com/article/bli1.html

Top