计量经济学:课程实验方法与案例汇编(新)

更新时间:2023-08-26 16:12:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《计量经济学》:试验方法与案例汇编(2011年03)

实验一 一元线性回归模型分析

某市城市居民年人均鲜蛋需求量(Y:公斤),年人均可支配收入(X:元)的例子。通过抽样调查,得到1988—1998年的样本观测值。其数值结果如下:

解:

ΣX2=15325548.8 ΣY2=3055.25 ΣXY=213349.96 n=11 ΣX=12601.67 ΣY=182.30,离差形式:

x

2

X nX 15325548.8 11

2

2

12601.67

11

2

2

888903.8

y Y

2

2

nY 3055.25 11

2

182.3 11

35.04

xy XY nxy 213349.96 11

解:

12601.67182.3

4539.63 1111

(1)计算一元线性回归模型参数估计量及建立模型

b

nxy xyn x ( x)

2

2

11 213349.96 12601.67 182.311 15325548.8 12601.67

2

0.0051

yx182.312601.67a y bx b 0.0051 10.72则

n

n

11

11

直线回归方程为:

Y a bX 10.72 0.0051X

(请注意:如果样本数据较大,也可以采用离差形式的公式计算出参数估计量)

xy即:b 2

x

4539.63

0.0051

888903.8

182.312601.67

0.0051 10.72 1111

a Y bx

结果与用基本公式完全相等。 (2)样本决定系数(或可决系数) r2=(Σy2-Σe2)/Σy2

=1-(Σe2/Σy2)=1-(11.89/35.04)=1-0.3393=0.6607 其中,残差平方和:

Σe2=Σy2- bΣxy=35.04-0.0051*4539.63=11.89 (3)参数估计量的方差、标准差 S2(a)= (Σe2ΣX2)/[n(n-2) Σx2]

=(11.89*15325548.8/11*9*888903.8)=2.0736 S2(b)=(Σe2)/[ (n-2)Σx2]=11.89/9*888903.8=0.00000148 则S(a)=1.44,S(b)=0.0012 (4) 参数估计量的显著性检验

T(a)=a/S(a)=10.72/1.44=7.44,T(b)=b/S(b)=0.0051/0.0012=4.25 得知T(a)>Tα/2(n-2)=2.26, T(b)>Tα/2(n-2)=2.26

即a、b均显著不为零,说明解释变量X对Y有显著影响。 (5)方程显著性检验

F检验:F=(Σy2-Σe2)/( Σe2/n-2)

=(35.04-11.89)/(11.89/11-2)=17.523

查表得F临界值:Fα(1,n-2)= F0.05(1,9)=5.12,故F>Fα,通过F检验,说明Y与X线性显著。

实验二 多元线性回归模型

(为了便于同学们理解,现以二元线性回归模型为例)

模型形式:

Y b bX

i

1

1i

b2X2i

i

1、参数估计量公式:

X X ( X1X2) Y Y b X X ( X1X2)

1

2

22

1

2

2

1

1

2

2

22

1

2

1

b

1Y2 2Y12

2

2

2

b

Y

b

1

X1

bX

2

2

2、随机误差项方差估计量

2

2

t

n k 1

3、残差平方和

e

2

t

(Y Y)

2

b

1

(X1

X1)(Y Y)

b (X

2

2

X

2

)(Y Y)

练习题:

1、若回归模型为Y=a+b X+ε,并且已经根据X和Y的16组样本数据,计算出下列各值:

ΣX2=5089.84 ΣY2=1111.01 ΣXY=2367.19 n=11 ΣX=240.78 ΣY=114.22 求:(1)模型参数的估计量;(2)总离差平方和、残差平方和;(3)样本决定系数; (4)参数估计量的标准差。

2、 已知Y和X之间存在线性因果关系,并已经获得如下数据

请利用一元线性回归模型进行分析(参数估计、显著性检验、);预测当X=90时,Y的预测值。

3、自己动手查找某个国家、地区或地方的收入和消费数据,模仿本章的例题,进行线性回归分析(参数估计、模型检验及解释参数经济意义),并对结果进行讨论。

4、令Y表示一名妇女生育孩子的生育率,X表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为:Y= b0+b1X+μ 问:

(1)随机误差项μ包含哪些未引入模型中的因素,它们可能与教育水平相关吗? (2)上述简单回归模型能够准确揭示教育对生育率在其他条件不变下的影响吗?请说明。

5、对于人均存款(S)与人均收入(I)之间的关系

S=b0+b1I+μ,使用美国32年的年度数据,得到如下估计模型(括号内为标准差) S=384.105+0.067I

(151.105) (0.011) R2=0.538 试回答:

(1)b1的经济意义是什么?

(2)b0和b1的符号应该怎样的?为什么?实际的符号与你的直觉是一样吗?如果有冲突的话,你可以说明原因吗? (3)你对拟合良度有什么看法?

(4)对回归得到的两个参数估计量进行检验。(显著性水平为0.01)

教材P98(6) 6、某地区家庭人均鸡肉年消费量(Y),家庭月平均收入X(元),肌肉价格P1(元/kg),

检验)。

实验三 异方差性检验与处理

一、异方差的处理方法

如果预测模型通过检验证实随机项存在异方差,则可以采用两种方法对模型参数进行校正,也就是重新对其进行估计。而处理异方差,其关键问题是找出异方差的具体形式,为了简单起见,我们仅以一元线性回归模型为例,对于异方差形式提出两种假定。 一元线性回归模型为

Y b bX

i

1

i

i

假定1:随机误差项的方差与解释变量Xi的平方成正比。 即:E(

2i

)

2

X

2i

,式中,σ2为常数

对一元线性回归模型进行转换:用解释变量Xi分别去除一元模型两端各项得:

X

ii

bXX

1

i

ii

b1 b0

1

X

i

i

式中,

X

=i

Xi

ii

2

E

(

2i

) 1 E(2)

X

i

E( i)=

2

2

证明转换后的新模型具有等方差性。需要强调的是原模型中的常数项b0成了转换后模型中

1

X

i

的系数,原模型中Xi的系数b1成了转换后模型的常数项。

对经过转换后的新模型应用普通最小二乘法(即OLS法),即可得到

X

ii

1

X

i

的回归方程:

X

ii

bbX

1

1

i

参数估计值

bb

1

得到,则可以建立预测模型

YbbX

i

1

i

假定2:随机误差项的方差与解释变量Xi成正比, 即E(

2i

)

2

X

i

,式中,σ2为常数

在此,克服异方差的方法类似于假定1,但原模型两端不是用xi去除了,而改为用

i

i

去除两端各项。则经过转换后的模型:

X

i

X

i

XX

1i

ii

2

i

ii

X

bX VX

1

i

i

i

式中,Vi

i

Xi

1

EV

(

2i

E()

)

X

i

E

(

2i

)

1

X

i

2

Xi

2

同样,转换以后的新模型也克服了异方差,具有等方差性。对模型

X

i

i

bX VX

1

i

i

采用OLS法回归,得到因变量为i

X

i

,自变量为

i

1

X

1

i

X

i

的二元回归方程:

X

i

i

XbX

0i

1

i

,则原模型回归参数

bb

得到,即可写出预测模型方程:

YbbX

i

1

i

二、举例:异方差判断、处理

在研究某地区居民储蓄倾向时,得到了如下数据资料。判断用线性回归模型

研究居民储蓄倾向时,误差项是否存在异方差,并给出处理方法。

第一步,进入软件操作系统,并创建工作文件

即:FILE(文件)/NEW(新文件)/workfile(工作文件),然后根据对话框提示的数据类型和样本范围进行选择,再加以确定(OK);

第二步,输入数据。可以通过菜单或命令“data+变量名”,输入上述表中数据; 第三步,作散点图。点中两组数据名称,并用graph命令或菜单操作(quick/qraph/scatter/with regression line)

根据两个变量间数据分布情况,可以认为两者之间存在明显的线性关系,但从数据的分布也可以看出异方差存在的可能性。(可通过回归残差e序列分布情况来判断模型随机项存在递增异方差) 回归可以得到直线回归模型:LS C Y X 下面,进一步采用G-Q检验法进行确认异方差。

因为X已经按照大小顺序存在,可以删除中间c=n/4=31/4=7个数据,将前后各12组数据分别构成两个子样本并进行回归,得到两个回归直线模型

Y 738.184 0.088X

e

2

1

144771.5

Y 1141.07 0.029X

e

22

769899.2

根据两个回归模型的残差平方和计算F统计量为: F=769899.2/144711.5=5.32

给定显著性水平为0.05,查两个自由度均为12-1-1=10的F分布表的临界值F0.05(10,10)=2.98。因为F> F0.05(10,10),说明原模型存在明显的异方差。

由于根据残差序列图可以看出,回归残差的绝对值有随着X线性增长的趋势,因此考虑

对一元线性回归模型进行转换:用解释变量Xi分别去除一元模型两端各项得:

X

ii

bXX

1

i

ii

b1 b0

1

X

i

i

然后再用最小二乘法,以Y/X为被解释变量,以1/X为解释变量进行参数估计,可得回归直线模型: 生成两个新序列: genr y1=Y/X genr x1=1/X

Y 648.12 0.0847X

经进一步检验,模型结果得到了明显改善。

第四章 异方差性:软件实现(重要归纳内容)

本章的重点内容总结:异方差检验及修正

一、异方差的检验

方法一:图示法 步骤:

首先,对被解释变量和解释变量进行回归:LS Y C X

其次,在主菜单中,点击Quick/Graph 得到对话框“Series List”,

在对话框中现列出横坐标X, 同时列出纵坐标Y,点击“OK”, 出现“Graph”对话框,再点击“Show Options”出现对话框“Graph Options” ,在左上角图形类型Graph Type 下拉列表里选择“Scatter Diagram,在右下角散点图项目下选择“Regression Line,再点击“OK”,即可得到X 、Y之间的散点图。 这是随机误差项存在异方差的初步经验证据。

此外,同理也可以做出解释变量X与残差e2之间的散点图。

方法二:G-Q检验法(详细内容参见教科书及本章案例)

注意:该方法适用于样本容量较大,且异方差为单调递增或单调递减的情况。另外,G-Q检验需要按某一被认为有可能引起异方差的解释变量观测值的大小排序,因此,可能需要对各个解释变量进行轮流试验。

构造一个G-Q检验的F统计量与F临界值的实现方法: 操作如下: 以截面数据n=20为例(去掉中间4个观察值,即c=4) Smpl 1 8 LS Y C X Scalar sig1=@SE Smpl 13 20 LS Y C X Scalar sig2=@SE

构造G-Q统计量

建立检验结果的储存向量: COEF(2)GQ

第一个放置F统计量: GQ(1)=(sig2^2/sig1^2) 第二个放置F临界值: GQ(2)=@QFDIST(.95,6,6)

以上操作步骤结束后,在当前工作簿中便出现αgq标志,双击此标志即可显示出F统计量和F临界值的计算结果。

方法三:怀特(White)检验

优点:怀特检验异方差不需要对解释变量进行排序,且对任何形式的异方差都适用。

1.首先,对二元线性回归模型作普通最小二乘回归,并得到残差平方(e2)序列

2.其次,作如下辅助回归方程:

2 2 2 x x 011i22i34exx 5x1ix2i i

i

1i

2i

若 nR2>χ

2

(h)

(注意: h为模型中卡方分布的解释变量个数,上述

辅助回归模型中h=5),则表明二元线性回归模型存在异方差性。 注:在多元回归中,由于辅助回归方程中可能有太多的解释变量(x1 x2 x12 x22 x1 x2……) ,从而使自由度减少, 有时可以去掉交叉项。

二、异方差的修正

1.加权最小二乘法(Weighted Least Squares)

基本思想:在采用最小二乘法时,对较小的残差平方(e2)赋予

较大的权数,而较大的残差平方赋予较小的权数,对残差所提供的信息的重要程度作一番修正,以提高参数估计的精确度。

注意:在同方差假定条件下,加权最小二乘法与普通最小二乘法是一致的,即模型不存在异方差情况下, 加权最小二乘法与普通最小二乘法两者是通用的. 实现步骤:

点击主菜单中的Quick/Estimate Equation,在Equation Specification对话框中,点击右下角的Option键,得到对话框,选中Weighted LS/Tsls前面的单选框,输入加权变量字母(残差绝对值的倒数

1

),再点击“OK”,便回到方程对话框,再点击 “OK”即可abs(e)

得到加权最小二乘法的结果。 点击“OK”得到回归结果

课堂练习题

异方差:案例分析(31个地区)(P61)

上表是2007年我国各省份全年税收Y与国内生产总值(GDP)X的数据。要求:

(1)作出散点图,检验模型是否存在异方差,说明是单调递增还是单调递减异方差;

(2)采用G-Q方法检验模型是否存在异方差?若存在异方差,采用加权最小二乘法(WLS)进行模型估计(即修正异方差) (3)采用怀特(White)检验法检验模型是否存在异方差性 (4)对修正异方差后所建立的方程进行检验(经济学检验、统计学检验:拟合良度、变量显著性检验) (5)解释方程斜率的经济含义。

实验四 自相关性检验与处理

一、广义差分法:

基本步骤:

1、建立模型:LS Y C X

2、检验自相关:德宾—沃森检验(D—W检验) 3、若存在自相关,则采取广义差分法进行修正: 操作步骤:

(1)进行广义差分变换(见P134之(6.7)式),生成两个新序列

y y y

t

t

*

t 1,

x x x

t

t

*

t 1

软件操作:

Genr Y2=Y-ρ*Y(-1),ok(按回车键) Genr X2=X-ρ*X(-1),ok(按回车键)

(2)以上述两个新生成的序列为变量,建立新的回归模型(见P134之公式(6.8)求得b0,b1参数估计值,其中,

A

b0 1 ,b1 b1

(3)对新模型再次进行自相关检验,方法同第2步 二、Durbin(杜宾)两步法 第一,估计自相关系数,见P135

y b(1 ) y

t

t 1

b1xt b

1

x

t 1

t

其中,yt 1前面的回归系数恰好为

第二,再用 的估计值进行广义差分(同广义差分法) 自相关举例:

下表资料为某国消费(C)和可支配收入(I)(单位:百万美元)

(1)试求其残差,并利用图示法检验随机项是否存在自相关; (2)若存在自相关,应用迭代法对原模型自相关进行处理。

解:第一步,求出模型估计值的残差e,并检验随机项自相关(利用图示法) 数据录入后,在命令行输入LS Y C X,运行显示结果。

Y 984.6433 0.8892X

(4.003) (77.657) R2=0.9983 d=0.933 第二步,生成Y的估计值Y^和残差值 e两个新数列: genr y1=984.6433+0.8892*X

genr e=Y-Y1

第三步,绘制出残差数列趋势图,可以看出随机项呈现正自相关。

以上所做的三个步骤是为了检验模型随机项自相关问题,接下来是对自相关进行克服或处理。

采用迭代法对原模型进行处理

首先输入命令:LS Y C X AR(1)可以得到ρ^(即AR(1)对应的参数值) 或者采用残差值e 与其滞后值e(-1)进行回归,也可以得到ρ^ 然后,采取广义差分法生成两个新数列,即, genr Y2=Y-ρ*^Y(-1) genr X2=X-ρ*^X(-1)

LS y2 c x2得到新模型:Y2=A+ b1*X2 其中,b0=A/1-ρ^, b1=b1*

则克服自相关以后得到模型:Y=b0+b1X

练习与思考题

1、若一个含有三个解释变量的多元线性回归模型,用样本容量为100的数据回归得到DW值为1.05,能得出什么结论(即是否可以表明存在一阶自相关)?若DW值等于2.35, 结论又是怎样?

2、上述资料为日本1971—1990年20年间税收Y与国民生产总值X数据。

t值、R2以及DW。(2)检验所估计的模型是否存在自相关性。

实验五 多重共线性检验与处理

一、多重共线性举例:

某地区1991—2000年服装消费量、可支配收入、流动资产、服装价格、相关商品价格等资料,试分析变量之间的多重共线性。

利用Eviews 软件来完成整个分析过程。 第一步,进入软件操作系统,并创建工作文件

即:FILE(文件)/NEW(新文件)/workfile(工作文件),然后根据对话框提示的数据类型和样本范围进行选择,再加以确定(OK);

第二步,输入数据。可以通过菜单或命令“data+变量名”,输入上述表中数据; 第三步,作散点图。点中两组数据名称,并用graph命令或菜单操作(quick/qraph/scatter/with regression line)

第四步,在建立了工作文件和输入数据基础上,只要直接输入命令“LS Y C X”就可以得到一元回归结果。

而多元线性回归直接输入命令“LS Y C X1 X2 X3 X4”即可得到输出结果。 输出结果得:

Y 13.5335 0.0970X1 0.0151X2 0.1991X3 0.3401X4

(-1.801) (3.660) (0.306) (-2.207) (2.272)

R2=0.9980 d=3.3826 F=15.6 查F统计表F0.05(5)=5.19 因为F=15.6 > F0.05(5)=5.19,说明回归方程是显著的。

第五步,求简单相关系数:点击主菜单中的“Quick/Group Statistics/Correlation”,其弹出一个窗口,输入“x1 x2 x3 x4”,点击”ok”后,显示出相关系数的结果得:

r12=0.9883 r13=0.9804 r14=0.9877 r23=0.9700 r24=0.9695 r34=0.9918

由此可以看出,解释变量之间的共线性是严重的,为了查明多重共线性的影响,采用逐步回归法。

第六步,求出四个基本回归方程: (1)LS Y C X1

1.2456 0.1178YX1

(-3.310) (42.071) R2=0.9955 d=2.6271 (2)LS Y C X2

2.1182 0.3269YX2

(2.586) (5.276) R2=0.9670 d=0.4684 (3)LS Y C X3

38.5190 0.5164YX3

(-9.168) (12.534) R2=0.9516 d=2.4013 (4)LS Y C X4

53.6508 0.6632YX4

(-14.771) (18.682) R2=0.9775 d=2.1720

由四个基本回归方程和经济理论可知,X1(收入)是最重要的解释变量,所以选定第一个基本回归方程作为分析的第一步。

本文来源:https://www.bwwdw.com/article/dm1i.html

Top