第7章 模型选择:标准与检验

更新时间:2023-11-02 10:03:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

本科教学课件 计量经济学基础 第7章 模型选择:标准与检验

第7章 模型选择:标准与检验

本章主要讲授以下内容:

7.1 “好的”模型具有的性质

7.2 设定误差的类型

7.3 设定误差的诊断与检验

7.1 “好的”模型具有的性质

著名的计量经济学家哈维(A. C. Harvey)列出了模型判断的一些标准: (1)简约性(parsimony)。即模型应尽可能地简单。

(2)可识别性(identifiability)。对于给定的一组数据,估计的参数值必须是惟一的。 (3)拟合优度(goodness of fit)较好。拟合优度R2(矫正的拟合优度R2)越高,模型越好。 (4)理论的一致性(theoretical consistency)。即回归结果要与理论分析结果一致。

(5)预测能力(predictive power)。即预测值与实际经验所验证的结果越接近越好。

7.2 设定误差的类型

模型设定误差主要有遗漏相关变量、包括不必要的变量、采取了不正确的函数形式和测量误差

等方面,下面来具体进行分析。 1.遗漏相关变量:“过低拟合”模型

考虑如下回归模型:

Yi?B1?B2X2i?B3X3i??i (1)

其中,Y=婴儿死亡率,X2=人均GNP,X3=女性识字率。

假如采取了下列错误的估计模型:

Yi?A1?A2X2i??i (2)

由于遗漏了变量X3,可能会产生如下后果:

(1)如果遗漏变量X3与模型中变量X2相关,则a1和a2是有偏的。 事实上,可以证明:

E(a2)?B2?B3bX2X3

E(a1)?B1?B3(X3?bX2X3X2)

其中,bX2X3是遗漏变量X3对模型中变量X2回归的斜率系数。

(2)a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失。 (3)如果X3与X2不相关,则bX2X3为0。这时a1仍然是有偏的。

(4)根据错误模型得到的误差方差是真实误差方差的有偏估计量。 (5)通常估计的a2的方差是真实估计量b2方差的有偏估计量。

48

本科教学课件 计量经济学基础 第7章 模型选择:标准与检验

E[var(a2)]?var(b2?x)?(n?2)?xB3223i22i

(6)通常的置信区间和假设检验过程不再可靠。 例:婴儿死亡率的决定因素 正确模型的回归结果是:

?CM?263.6416?0.0056PGNPi?2.2316FLRi R?0.7077

(11.5932)(0.0019)(0.2099)2ise?错误模型的回归结果是:

?CM?157.4244?0.0114PGNPi R?0.1662

(9.8455)(0.0032)2ise?显然,两个模型存在较大的不同。 2.包括不必要的变量:“过度拟合”模型

如果模型中包括了不相关变量,会提高R的值(若增加变量系数的t值大于1,则R2也会增加),进而提高模型的预测能力。但它会导致不相关变量偏差。

假设正确的模型为:

Yi?B1?B2X2i??i (3)

2

但研究者却加入了多余的变量X3,即将模型设置为:

Yi?A1?A2X2i?A3X3i??i (4)

这样,设定错误的模型会出现下列后果:

(1)“不正确”模型的OLS估计量是无偏的(也是一致的),即E(a1)?B1,E(a2)?B2,

E(a3)?0。

(2)从过度拟合的模型中得到的σ2的估计量是正确的。

(3)建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的。

(4)过度拟合方程中的估计量a1、a2的方差,比真实模型估计量b的方差大。即估计量不是有效的。

从上面的讨论似乎可以得出这样一个结论:包括不相关变量比遗漏相关变量要好。但是,增加不必要的变量,会损失估计量的有效性,也可能会导致多重共线性问题,更不用说对自由度的消耗了。

3.采取了不正确的函数形式

考虑如下两种模型设定:

Yi?B1?B2X2i?B3X3i??i lnYi?A1?A2lnX2i?A3lnX3i??i

例:利用美国进口货物支出(Y)与个人可支配收入(X)数据,得出下列两个回归结果:

49

本科教学课件 计量经济学基础 第7章 模型选择:标准与检验

???751.4651?0.5756X?19.0095TimeYttt?(?5.6271)(8.6846)(5.4316)

R?0.9648;R22?0.9607;F?233.3405模型中时间代表了趋势变量,开始年取1,依次取2、3、??,等等。

?lnYt??22.0135?3.6649lnXt?0.0458Timet?(?4.1720)(5.1025)(?2.3176)

R?0.9676;R22?0.9638;F?254.2761 上述模型哪一个更好,后面再介绍检验方法。

4.测量误差

(1)被解释变量中的测量误差

如果仅仅是被解释变量中的度量误差,则导致如下后果:

①OLS估计量是无偏的。

②OLS估计量的方差也是无偏的。

③估计量的估计方差比没有测量误差时的大。因为被解释变量中的误差加入到了误差项中。 (2)解释变量中的测量误差 在这种情况下的后果如下: ①OLS估计量是有偏的。

②OLS估计量也是不一致的。即使样本容量足够大,OLS估计量仍然是有偏的。

显然,解释变量中的测量误差是一个严重问题。当然,如果被解释变量和解释变量中都存在测量误差,则问题更为严重。

(3)解释变量中存在测量误差的解决方法:工具(替代)变量法

具有如下特征的变量为工具变量:与原始的变量高度相关,但与测量误差和回归误差项无关。

7.3 设定误差的诊断与检验

1.诊断非相关变量的存在

假定模型包括下列变量:

Yi?B1?B2X2i?B3X3i?B4X4i??i

假定模型中的X4无法确定它是否属于模型。可以通过下列方法进行检验:

(1)t检验 如果X4系数t检验的结果显著,则该变量可能属于模型。否则,可能属于多余变量。

(2)F检验 比如,检验X3和X4是否是与模型相关的变量。用有约束的最小二乘法,检验假设H0:B3=B4=0。

F?(Rur?Rr)/m(1?Rur)/(n?k)222~F(m,n?k)

m为约束个数,k为解释变量个数。

如果F统计量较大,则拒绝零假设H0,即两变量X3和X4对被解释变量有很强的影响,两者是模型的相关变量。

2.对遗漏变量和不正确函数形式的检验

假如预期工资变化率(Y)与失业率(X)负相关,但下列哪种函数关系正确呢?

Yt?B1?B2Xt??t B2<0

50

本科教学课件 计量经济学基础 第7章 模型选择:标准与检验

lnYt?B1?B2lnXt??t B2<0

Yt?B1?B21Xt??t B2>0

首先根据理论或调查以及先前的经验,建立一个自认为抓住了问题本质的模型。然后,对模型进行检验:

(1)判定系数情况(R和R2)。 (2)估计的t值。

(3)估计系数的符号。

如果上述检验结果并不令人满意,则对残差进行检验。如果残差显示出一些系统模型,则可能是排除了某些变量。

3.在线性和对数线性模型之间选择:MWD检验(J. Mackinnon, H. White, and R. Davidson)

H0:线性模型:Y是X的线性函数

H1:对数线性模型:lnY是X或lnX的线性函数 MWD检验步骤如下:

?。 (1)估计线性模型,得到Y的估计值,Yi2

(2)估计线性对数模型,得到lnY的估计值,lnYi。 ??(lnY)。 (3)求Z1i?lnYii(4)做Y对X和Z1i的回归。

如果根据t检验Z1i的系数是统计显著的,则拒绝H0。 ?。 (5)求Z2i?antilog(lnYi)?Yi(6)做Y对X或logX和Z2i的回归。 如果Z2i的系数是统计显著的,则拒绝H1。

4.回归误差设定检验:RESET(拉姆齐检验)

为了诊断出遗漏变量或不正确的函数形式,拉姆齐建立了模型设定检验的一般方法。 零假设H0:原模型设定正确

备择假设H1:原模型设定不正确 假设原模型形式为:

Yi?B1?B2Xi??i

RESET检验步骤如下:

?。 (1)根据原模型估计出Y值,Yi?的高次幂Y?之间的系统关系。即考虑?2,Y?3等纳入模型,以获取残差和Y(2)回到模型,把Yiiii如下新模型:

?2?BY?3?? Yi?B1?B2Xi?B3Yi4ii 51

本科教学课件 计量经济学基础 第7章 模型选择:标准与检验

22(3)令从新方程得到的R2为Rnew,从原方程得到的R2为Rold。然后利用下式进行检验:

F?(Rnew?Rold)/新增回归量个数(1?Rnew)/(n?新模型中参数个数222)

(4)如果在所选显著水平下计算的F值是统计显著的,则认为原始模型是设定错误的。

52

本文来源:https://www.bwwdw.com/article/22t2.html

Top