《计量经济学》word版

更新时间:2023-03-21 03:54:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1 / 1

第六章 虚拟变量的回归模型

第一部分 学习目标和要求

本章主要介绍虚拟变量的基本概念及其应用。需要掌握并理解以下内容:

(1) 虚拟变量的基本概念、虚拟变量分别作为解释变量和被解释变量的情形、虚拟

变量回归模型的类型和解释变量个数选取规则;

(2) 定量变量与不同数量定性变量(一对一、一对多和多对多)虚拟变量模型;

(3) 应用虚拟变量改变回归直线的截距或斜率;

(4) 分段线性回归;

(5) 应用虚拟变量检验回归模型的结构稳定性、传统判别结构稳定性的方法及存在

的缺陷、虚拟变量法比较两个回归方程的结构方法。

第二部分 练习题

一、解释下列概念:

1.虚拟变量

2.方差分析模型(ANOVA )

3.协方差模型(ANOCVA )

4.基底

5.级差截距系数

6.虚拟变量陷阱

二、简要回答下列问题:

1.虚拟变量在线性回归模型中的作用是什么?举例说明。

2.回归模型中虚拟变量个数的选取原则是什么?为什么?

3.如果现在有月度数据,在对下面的假设进行检验时,你将引入几个虚拟变量?

A) 一年中的每月均呈现季节性波动趋势;

B) 只有双数月份呈现季节性波动趋势。

4.如果现在让你着手检验上海和深圳两个股票市场在过去5年内的收益率是否有显著差异,如何使用虚拟变量进行?

三、考虑如下模型:

12i i i Y D u ββ=++

其中,i D 对前20个观察值取0,对后30个观察值取1。已知2

()300i Var u =。

(1) 如何解释1β和2β?

(2) 这两组的均值分别是多少?

(3) 已知12()15Cov ββ∧∧+=-。如何计算12()ββ∧∧+的方差?

四、考虑如下模型:

12i i i i Y D X u ααβ=+++

其中Y 代表一位大学教授的年薪;

X 为从教年限;

D 为性别虚拟变量。

考虑定义虚拟变量的三种方式:

(1)D 对男性取值1,对女性取值0;

(2)D 对女性取值1,对男性取值2;

(3)D 对女性取值1,对男性取值-1;

对每种虚拟变量定义解释上述回归模型。是否有某个方法比另外的更好?说明你的理由。

五、下表给出了1983年至1986年期间服装季度销售额的原始数据(单位:百万元):

考虑如下两个模型:

(A )1223344t t t t t S D D D u ββββ=++++

(B )11223344t t t t t t S D D D D u ββββ+=+++

其中,11D =:第一季度

22D =:第二季度

33D =:第三季度

44D =:第四季度

S Sales =

回答以下问题:

(1) 估计模型(A );

(2) 解释1β,2β,3β,4β;

(3) 如何消除模型(A )中的季节性?

(4) 模型(B )与模型(A )有什么区别?

(5) 估计模型(B );

(6) 比较两个模型的结果。

六、考虑如下关于期望工作时间的对1543对夫妇调查后的回归结果(t 比率放在括号内): 234567891286104.970.026 1.200.6919.47266.06118.64110.61t i i i i i i i i Y X X X X X X X X ∧=+-++-+--(4.67)

(3.70)( 3.80)(0.24)(0.08)(0.40)(6.94)( 3.04)( 6.14)t =---- 20.383R = 1543n =

其中Y 为妻子希望每年花在工作上的小时数,以每年工作的小时数加上花在找工作上的时间之和计算;

2X :妻子税后真实时薪;

3X :丈夫在上一年度税后真实收入;

4X :妻子的年龄;

5X :妻子的受教育年数;

6X :态度变量。若被调查者愿意工作而且其丈夫也同意其工作则取值1,否则为0; 7X :态度变量。若被调查者的丈夫支持其工作则取值1,否则为0;

8X :年龄低于6岁的子女数;

9X :年龄在6~13岁的子女数;

回答以下问题:

(1) 各非虚拟回归元系数的符号有经济含义吗?说明你的观点。

(2) 如何解释虚拟变量6X 和7X ?这些虚拟变量统计显著吗?

(3) 在这项研究中,一位妇女的年龄和受教育程度不是影响其劳动力参与决策的显

著因素,你认为这是为什么?

七、设有1n 个高中毕业生和2n 个大学毕业生构成总数为12n n n =+的总样本。考虑如下回归模型:

12i i i Y D u ββ=++

其中,Y 表示以美元度量的小时工资;D 为虚拟变量,对大学毕业生取值为1,对高中毕业生取值为0。试利用OLS 公式,证明1h Y β∧-=和2c h Y Y β∧--

=-。其中下标具有如下含义:h 表示高中()highschool 毕业生,c 表示大学()college 毕业生。

八、在51个学生(其中男生36人,女生15人)的体重(W )对身高(H )的回归分析中,得到下面的结果:

1.232.06551 5.5662i i w H ∧

=-+

( 5.2066)

(8.6246)t =-

2.122.962123.8238 3.7402i i i w S D H ∧

=-++ ( 2.5884)

(4.0149)(5.1613)t =-

3.107.9508 3.5105 2.00730.3263i i i w Hi S D HD ∧

=-+++ ( 1.2266)

(2.6087)(0.0187)(0.2035)t =-

其中体重的单位为磅,身高的单位为英寸,D 为乘积或差别斜率虚拟变量,S 为性别虚拟变量:

10S ?=?

?

,男生

(性别),女生 参考下面的相关矩阵,回答问题(1)-(6)。解释:例如,身高和性别的相关系数是0.6276,

性别和交互虚拟变量的相关系数是0.9971

10.62760.6752

0.627610.99710.67520.9971

1

H

S D

H S D

(1) 你将选择哪个回归?1还是2,为什么?在模型2与3中呢? (2) 如果实际较为理想的回归是2,那么选择1说明犯了什么错误? (3) 回归2中的性别虚拟变量说明了什么?

(4)

回归模型2中差别截距是统计显著的,但在模型3中差别斜率却是统计不显著的。如何解释这种变化?

(5) 在模型2与3中,变量身高的系数几乎相等,但性别虚拟变量的系数相差很大。对

此你有什么想法?

九、Paul W. Bauer 和Thomas J. Zlatoper 在研究决定开往Cleveland 的直接机票的因素中得到下面的回归结果(表的形式)用以解释单程头等舱、二等舱和经济舱机票(因变量是单程机票)的价格。

数据来源:Paul W. Bauer 和Thomas J. Zlatoper《经济评论》(Economic Review), Cleveland联邦储备银行,第25卷,第一期,1989年,表2、3、4,第6~7页。

解释变量定义如下:

Carriers 飞机数量

Pass 总乘客人数

Miles 从出发地到Cleveland的距离

Pop 出发地人口

INC 出发地人均收入

Corp 潜在商业交通代理

Slot

1,

?

?

?

虚拟变量,其他

Stop 中转站数

Meal

1

?

?

?

,供餐,其他

Hub

1

?

?

?

,若出发地有中转站,其他

EA

1

?

?

?

,向东航线,其他

CO

1

?

?

?

,洲际航线,其他

(1)在这个模型中,引入变量载客人数和载客人数的平方为解释变量的理论依据是什么?载客人数符号为负和载客人数平方符号为正表明了什么?

(2)引入距离和距离的平方为解释变量的理论依据是什么?观察到的这些变量的符号有经济意义吗?

(3)观察到的人口变量符号为负,这有什么含义?

(4)为什么在所有的回归结果中人均收入变量符号都是负的?

(5)为什么“Stop”变量在“头等舱”和“二等舱”回归方程中的符号为正?而在“经济舱”回归方程中符号为负?

(6)虚拟变量“洲际航线”的符号始终为负。这表明了什么?

(7)估计每个回归系数的显著性,分别用单边和双边检验。

(8)为什么虚拟变量“Slot”仅仅在“经济舱”回归方程中是统计显著的?

(9)由于“头等舱”和“经济舱”的观察值的个数相同,能否将他们加总起来(646个)作一个回归方程?如果可以,如何区别“二等舱”和“经济舱”的观察值?

(10)对上表中的回归结果进行评价。

十、1966年的第四季度,当时的英国劳工党政府放松了国民保险法案的原则,以统一收费率和救济金与先前收入相关相结合的混合体系取代原来短期失业救济金的统一收费率体系,从而提高了失业救济金水平。根据以下数据:

说明:上表中1971年数据为初步估计值。

资料来源:Damodar Gujarati, “The Behavior of Unemployment and Unfilled Vacancies: Great Britain, 1958-1971,

” The Economic Journal, vol. 82, March 1972, p. 202.

考虑如下的回归结果:

2.7491 1.1507 1.52940.8511()t t t t t UN D V D V =+-- (26.896)(

3.6288)(12.5552)( 1.9819)t =--

2

0.9128R = 其中UN =失业率,% V =岗位空缺率,%

1,196601966D ?=??对年第四季度之后的期间

,对年第四季度之前的期间

t=时间,以季度度量

(1) 失业率和岗位空缺率的关系有何先验预期?

(2) 保持岗位空缺率不变,在从1966年第4季度开始的期间内,平均失业率为多少?

它与1966年第4季度之前的期间有显著差异吗?

(3) 1966年第4季度之前和之后的斜率在统计上不同吗?

(4) 根据这项研究,能断定慷慨的失业救济金导致更高的失业率吗?经济上是否讲

得通?

(5) 根据表中得数据,检验1958-Ⅳ至1966-Ⅲ和1966-Ⅳ至1971-Ⅱ两个子区

间误差方差相同的假设。

十一、下表是美国1985年第1季度至1991年第4季度给出的税后公司利润和净利润(亿美元)的季度数据。

资料来源:U.S. Department of Commerce, Bureau of Economic Analysis, Business Statistics, 1963-1991, dividend and after-tax profits are in billions of dollars and are obtained from p.A-110.

(1) 做红利Y 对税后利润X 的回归。二者之间是否相关?

(2) 如果红利支付呈现出季节变动的趋势,引入一个适当的虚拟变量并对其进行估计。

在建立的模型当中,如何考虑截距和斜率会随季节的不同而变化?

(3) 在不考虑季节因素时,何时作Y 对X 的回归?

第三部分 参考答案

一、解释概念:

1.虚拟变量:虚拟变量、定性变量、指标变量、名义变量和二分变量都指的是一种取值为0或1的变量。在现实经济生活中,有一类变量如季节、民族、性别等都可能成为影响某个因变量的重要因素,但这些变量反映的并不是数量,而是某种性质或属性,要纳入定量性质的回归模型,必须先定量化。因此我们可以构造一种特殊变量,只有1和0两种取值,并且规定当变量值取1是,表明具有某种性质或属性,取0时则表明不存在。由于这种变量是人为虚构出来的,所以称为虚拟变量。

2.方差分析模型(ANOVA ):一个只含有虚拟变量或定性解释变量的回归模型称为方差分析模型(Analysis-of-Variance ,简记为ANOVA )。例如,在研究性别与收入关系i Y 时,可以定义虚拟变量

10i D ?=??表示男性表示女性,线性回归模型i i i Y D αβε=++ (2

~(0,)i N εσ)就是一个方差分析模型。

3.协方差模型(ANOCVA ):同时包含定量和定性解释变量的回归模型叫做协方差分析模型(Analysis-of-co-Variance ,简记为ANCOVA )。例如,将上例更改为如下形式:

12i i i i Y D X ααβε=+++

其中i X 表示工龄,其他含义不变。该协方差模型含有一个定量变量和一个定性变量。

4.基底:虚拟变量被富裕0值的那个类别通常被称为基底,主要是因为它是用以和其他类别做比较的基础。例如,上述模型中,女性就是被用来做基底的,截距项1α就是基底类的截距。这是因为对0i D =进行回归时,截距是1α。需要注意的是,不管用哪一类作为基底,都不过是一种选择的结果,这种选择有时是根据某种事先考虑而做出的。

5.级差截距系数:附着于虚拟变量i D 的系数2α,称为级差截距系数,表示取值为1的类别的截距值和基底类的截距值相比有多少差别。

6.虚拟变量陷阱:引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,就是通常说的虚拟变量陷阱。

二、简答题:

1.考虑到回归分析中定性变量的作用,引入虚拟变量后可以让线性回归模型成为一种

极其灵活的工具。例如,在研究性别与收入关系

本文来源:https://www.bwwdw.com/article/3ole.html

Top