第6章 虚拟变量回归模型

更新时间:2023-10-16 09:05:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

本科教学课件 计量经济学基础 第6章 虚拟变量回归模型

第6章 虚拟变量回归模型

本章讲授的主要内容:

6.1 虚拟变量的性质 6.2 虚拟变量的引入方式 6.3 虚拟变量的设置原则 6.4 虚拟变量的特殊应用

6.5 因变量为虚拟变量的情形:线性概率模型(LPM)

6.1 虚拟变量的性质

1.虚拟变量概述

虚拟变量(dummy variable),又称为定性变量(qualitative variables)或指标变量、二元变量、分类变量和二分变量。

许多经济变量是可以定量度量的,但有些影响经济的因素,如职业、性别、民族、地区、文化程度、季节、战争、自然灾害等因素,无法定量度量。为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们量化,这种“量化”是通过引入“虚拟变量”来完成的。虚拟变量通常记为D。

根据定性因素的属性,一般赋予它们“0”或“1”的人工变量。一般地,在虚拟变量的设置中,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。 2.虚拟变量模型

同时含有一般解释变量与虚拟变量的模型,称为虚拟变量模型。如:

Yi?B1?B2Xi?B3Di??i

3.方差分析模型(analysis-of-variance models,ANOVA)

Yi?B1?B2Di??i

其中,B1为截距,B2为差别截距系数。

以男性和女性对食品支出影响为例,

Di=1 女性 Di=0 男性

男性食品支出的期望:

E(Yi|Di?0)?B1?B2(0)?B1

女性食品支出的期望:

E(Yi|Di?1)?B1?B2(1)?B1?B2

这里的B2,反映男女食品支出的差别,所以称为差别截距系数。 4.虚拟变量的作用

(1)可以描述和测量定性(或属性)因素的影响。

(2)能够正确反映经济变量之间的相互关系,提高模型的精度。 (3)便于处理异常数据。

44

本科教学课件 计量经济学基础 第6章 虚拟变量回归模型

6.2 虚拟变量的引入方式

虚拟变量作为解释变量引入模型,有加法和乘法两种基本方式。此外,还有两者相结合的混合方式。

1.加法方式

在模型中,将虚拟变量以相加的形式引入模型。从计量经济模型的意义看,其作用是改变了设定模型的截距水平。

例如 家庭的教育费用支出,除了受收入水平的影响外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6~21岁),教育费用支出就多。因此,为了反映“子女年龄结构”这一定性因素,设置虚拟变量:

?1有适龄子女 Di??0无适龄子女?将家庭教育费用支出函数写成:

Y Yi?B1?B2Xi?B3Di??i

无适龄子女家庭平均教育费用支出:E(Yi|Di?0)?B1?B2Xi

有适龄子女家庭平均教育费用支出:E(Yi|Di?1)?(B1?B3)?B2Xi

X 图6-1 平行回归 如图6-1所示。 2.乘法方式

在模型中,将虚拟变量与其他解释变量相乘作为新的解释变量,以达到其调整模型斜率系数的目的。

以乘法形式引入虚拟变量的主要作用在于:(1)两个回归模型之间的比较;(2)因素之间的交互影响分析;(3)提高模型对现实经济现象的描述精度。

例如 消费水平主要取决于收入水平,但在一个较长时期,人们的消费倾向会因某些因素(如自然灾害、战争等)的影响而发生变化。为了反映消费倾向的变化,可以用乘法方式引入虚拟变量来考察。设

Y ?1Di???0则消费模型可建立如下:

正常年份反常年份

Yi?B1?B2Xi?B3DiXi??i

图6-2 并发回归 正常年份的平均消费水平:E(Yi|Di?1)?B1?(B2?B3)Xi 反常年份的平均消费水平:E(Yi|Di?0)?B1?B2Xi 如图6-2所示。

3.混合方式:加法方式和乘法方式同时使用

模型中,虚拟变量以加法和乘法两种方式同时引入,即

Yi =B1 + B2Di +B3Xi +B4(DiXi) + ui

例如,对于食物支出

Y X X 图6-3 相异回归 45

本科教学课件 计量经济学基础 第6章 虚拟变量回归模型

平均食物支出,男性 (Di=0):

E(Yi|Di=0)=B1+B3Xi

平均食物支出,女性(Di=1):

E(Yi|Di=1)=(B1+B2)+(B3+B4)Xi

如图6-3所示。

6.3 虚拟变量的设置原则

1.基本原则

在具有共同截距的模型中,如果定性变量有m个属性(类别),只需在模型中引入m-1个虚拟变量。

例如 冷饮的销售量除受k种定量变量的影响外,还受春、夏、秋、冬四季变化的影响。要考察该四季的影响,只需引入三个虚拟变量即可:

?1D1t???0春季其他

?1D2t???0?1D3t???0则冷饮销售量的模型为:

夏季其他秋季其他

Yt?B1?B2X2t??BkXkt?A1D1t?A2D2t?A3tD3t??t

因为冬季属性取0值,它被反映在共同截距(B1)中。 注意:如果模型中没有共同的截距(B1),那么,还需要设置一个虚拟变量来反映冬季的影响。 2.虚拟变量陷阱

假如不遵守上述原则,即在定性变量有m个属性(类别)的模型中引入m个虚拟变量。那么,将会导致完全多重共线性现象的出现而无法估计模型,这种现象被称为虚拟变量陷阱。

6.4 虚拟变量的特殊应用

1.调整季节波动

例如 冰箱的销售量与季节性

把第一季度作为基准季度,取值为0;引入第二、三、四季度三个虚拟变量,取值为1。通过引入虚拟变量来消除季节波动。

Y 2.分段回归

在实际经济问题的研究中,有些经济关系需要用分段回归加以描述。当解释变量X低于某个已知临界水平X*时,Y与X之间是某种线性相关关系;而当X>X*时,两者之间又是另一种相关关系。

X 对于上述现象,虽然可以将样本数据划分成XX*两个样本分X* 段进行回归,但样本容量减小会降低模型的精度。利用虚拟变量可以很好图6-4 分段曲线 地解决分段回归问题。

46

本科教学课件 计量经济学基础 第6章 虚拟变量回归模型

取虚拟变量为:

?1D???0并将分段回归模型设置成:

X?X* *X?XYt?B1?B2Xt?B3(X?X*)Dt??t

其中,X*是已知的临界水平。

这样,用OLS法估计得到各段函数为:

??B?BX 当X?X时,Dt?0,Yt12t*??(B?BX*)?(B?B)X 当X?X时,Dt?1,Yt1323t*如图6-4所示。

6.5 因变量为虚拟变量的情形:线性概率模型(LPM)

1. 线性概率模型(LPM)概念

考虑如下模型:

Yi?B1?B2Xi??i

如果该模型中的被解释变量Y只能取0或1两个值。则称该模型为线性概率模型(linear probability model, LPM)。

2.线性概率模型(LPM)的特征

(1)虽然Y只能取0或1两个值,但无法保证估计的Y值介于0和1之间;

(2)由于Y是一个二分变量,所以误差项也是一个二分变量,所以ui不服从正态分布; (3)可以证明误差项是异方差的;

(4)由于Y只能取0或1两个值,所以惯用的R2没有实际意义。

47

本文来源:https://www.bwwdw.com/article/f7df.html

Top