计量经济学的基本问题

更新时间:2024-05-02 05:06:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章 计量经济学的基本问题习题与答案

一、基本概念:

(1)经济计量学 (2)数理经济学 (3)时间序列数据 (4)横截面数据 (5)面板数据 二、简答题

1、什么是计量经济学?

2、计量经济学方法与一般经济数学方法有什么区别? 3、计量经济学的研究的对象和内容是什么? 4、简述建立计量经济学模型的步骤? 5、几种常用的样本数据有哪些?

6、一般计量经济学模型应当通过哪几种检验? 一、基本概念:

1、经济计量学(Econometrics)就是经济的计量。经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。经济计量学运用数理统计知识分析经济数据,对构建于数理经济学基础之上的数学模型提供经验支持,并得出数量结果。

2、数理经济学(mathematical economics)主要关心的是用数学公式或数学模型来描述经济理 论,而不考虑对经济理论的度量和经验解释。而经济计量学主要是对经济理论的经验确认。 3、(1) 时间序列数据;(2) 横截面数据;(3) 面板数据 (时间序列数据与横截面数据的联合) 二、简答题

1、答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为

内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。

2、答:计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加

以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。

3、答:计量经济学的研究对象是经济现象,是研究经济现象中的具体数量规律(或者说,

计量经济学是利用数学方法,根据统计测定的经济数据,对反映经济现象本质的经济数量关系进行研究)。

4、答:第一步:设计理论模型,包括确定模型所包含的变量、确定模型的数学形式、拟定模型中的待估参数的符号和大小的理论期望值。第二步:收集数据样本,要考虑数据的完整性、准确性、可比性和一致性; 第三步:估计模型参数;第四步:模型检验,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5、答:(1) 时间序列数据;(2) 横截面数据;(3) 虚拟变量数据

6、模型检验主要包括经济意义检验、统计检验、计量经济学检验和模型预测检验四个方面。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号和大小是否与根据人们的经验的经济分析拟定的期望值相符合;在统计检验中,需要检验模型参数

值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机干扰性的序列相关性检验、异方差检验,解释变量的多重共线性检验,模型设定的偏差性检验等;模型的预测检验主要检验模型参数估计量稳定性及样本容量发生变化时的灵敏度,以确定所建立的模型时都可用于样本观测值以外的范围。

第二章 一元线性回归模型习题与答案

1、为什么模型中要引入随机扰动项?

2、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为:

kids??0??1educ??

(1)随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 3、已知回归模型E????N??,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释?和?。

?满足线性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?(3)对参数的假设检验还能进行吗?简单陈述理由。

??2.69?0.48X,4、假定有如下的回归结果:Y其中,Y表示墨西哥的咖啡消费量(每tt天每人消费的杯数),X表示咖啡的零售价格(单位:美元/杯),t表示时间。 问:(1)这是一个时间序列回归还是横截面序列回归?做出回归线。

(2)如何解释截距的意义?它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?

(4)根据需求的价格弹性定义:弹性=斜率×X/Y,依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?

5、选择一个经济问题,建立一元线性回归模型,利用EViews软件进行回归分析,写出详细的分析步骤。

6、令Y表示一名妇女生育孩子的生育率,X表示该妇女接受教育的年数。生育率对教育年数的简单回归模型为: Y??0??1X??

(1)随机干扰项?包含什么样的因素?他们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其它条件不变下的影响吗?请解释?

?????Y??,使用美国36年的年度7、对于人均存款与人均收入之间的关系式Sttt数据,得到如下估计模型(括号内为标准差)

??384.105?0.067Y Stt (151.105) (0.011) R?0.538 (1)?的经济解释是什么? (2)?和?的符号是什么?为什么?

2(3)你对于拟合优度的看法?

答:1、随机扰动项是模型中表示其它多种因素的综合影响。引入随机扰动项的原因有:第一,当经济变量之间的关系大多为非确定性因果关系时,在上式中引入随机扰动项,就表示了Yi的非确定性;第二,在经济定量分析过程中,计量经济学模型不可能包含所有的变量,次要变量不可避免的被省略;第三,在确定模型数学形式时,没有确定的方法,经济变量间关系十分复杂,所以,确定模型数学形式会造成误差;第四,建立模型时,使用的样本数据也会有测量误差;第五,一些客观存在的随机因素,如天气、季节、战争等影响无法列入模型。

2、(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。

3、(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为?,因此?表示没有接受过教育员工的平均起始薪金。?是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。

?满足线性性、无偏性及有效性,因为这些性质的的成立无需随?和仍?(2)OLS估计量?机扰动项?的正态分布假设。

(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在

?的正态分布假设之上的。

4、(1) 这是一个时间序列回归。 (2) 截距2.6911表示咖啡零售价在每磅0美元时,美国平均咖啡消费量为每天每人2.6911杯,这个数字没有明显的经济意义;斜率—0.4795表示咖啡零售价与消费量负相关,表明咖啡价格每上升1美元,则平均每天每人消费量减少0.479 5杯,即约半杯。(3)不能。原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的。(4)不能,在同一条需求曲线上不同点的价格弹性不同,须给出具体的X值与之对应的Y值。

6、(1)收入、年龄、家庭状况、政府所谓相关政策也是影响生育率的重要原因,在上述简单回归模型中,他们被包含在了随机干扰项中。有些因素可能与教育水平相关,如收入水平与教育水平往往呈正相关,年龄大小与教育水平呈负相关。(2)当归结在随机干扰项中的重要影响因素与模型中的教育水平X相关时,上述回归模型不能够揭示教育对生育率在其它条件不变下的影响,因为这时出现解释变量与随机干扰项相关的情形,违背了基本假设。

7、(1)?为收入的边际储蓄倾向,表示人均收入每增加一美元时人均储蓄的预期平均变化量。 (2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此?符号应为负。储蓄是收入的一

部分,且会随收入的增加而增加,因此预期?的符号为正。 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度表明收入的变化可以解释储蓄中53.8%的变动。

第三章 多元线性回归模型习题与答案

1、极大似然估计法的基本思想

2、多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?

3、以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)

R2?0.099其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

4、1960-1982年美国对子鸡的需求。为了研究美国每人的子鸡消费量,我们提供如下的数据:

表1 1960-1982年子鸡的消费情况 年份 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982

Y 27.8 29.9 29.8 30.8 31.2 33.3 35.6 36.4 36.7 38.4 40.4 40.3 41.8 40.4 40.7 40.1 42.7 44.1 46.7 50.6 350.1 51.7 52.9

X2 X3 397.5 413.3 439.2 459.7 92.9 528.6 560.3 624.6 666.4 717.8 768.2 843.3 911.6 931.1 1021.5 1165.9 1349.6 1449.4 1575.5 1759.1 1994.2 2258.1 2478.7

42.2 38.1 40.3 39.5 37.3 38.1 39.3 37.8 38.4 40.1 38.6 39.8 39.7 52.1 48.9 58.3 57.9 56.5 63.7 61.6 58.9 66.4 70.4

X4 50.7 52.0 54.0 55.3 54.7 63.7 69.8 65.9 64.5 70.0 73.2 67.8 79.1 85.4 94.2 123.5 129.9 117.6 130.9 129.8 128.0 141.0 168.2

X5 78.3 79.2 79.2 79.2 77.4 80.2 80.4 83.9 85.5 93.7 106.1 104.8 114.0 124.1 127.6 142.9 143.6 139.2 165.5 203.3 219.6 221.6 232.6

X6 65.8 66.9 67.8 69.6 68.7 73.6 76.3 77.2 78.1 84.7 93.3 89.7 100.7 113.5 115.3 136.7 139.2 132.0 132.1 154.4 174.9 180.8 189.4

资料来源:Y数据来自城市数据库;X数据来自美国农业部。 注:实际价格是用食品的消费者价格指数去除名义价格得到的。

其中Y=每人的子鸡消费量,磅

X2=每人实际可支配收入,美元 X3=子鸡每磅实际零售价格,美分 X4=猪肉每磅实际零售价格,美分 X5=牛肉每磅实际零售价格,美分

X6=子鸡替代品每磅综合实际价格,美分。这是猪肉和牛肉每磅实际零售价格的加权平均。

其权数是在猪肉和牛肉的总消费量中两者各占的相对消费量。 现考虑下面的需求函数:

lnYt=α1+α2 lnX2t +α3lnX3t+ut lnYt=r1+r2 lnX2t+r3lnX3t+r4lnX4t+ut lnYt=λ1+λ2 lnX2t+λ3lnX3t+λ4lnX5t+ut

lnYt=θ1+θ2 lnX2t+θ3lnX3t+θ4lnX4t+θ5lnX5t +ut lnYt=β1+β2 lnX2t+β3lnX3t+β4lnX6t+ut

由微观经济学得知,对一种商品的需求通常较依赖消费者的实际收入,该商品的实际价格,以及互替和互补商品的实际价格。按照这些思考,回答以下问题。

(1)从这里列举的需求函数中你会选择哪一个并且为什么? (2)你怎么理解这些模型中的lnX2和lnX3的系数? (3)模型的设定(2)和(4)有什么不同

(4)如果你采用设定4,你会见到什么问题:(提示:猪肉和牛肉价格都同子鸡价格一道被引进)

(5)因为设定(5)中含有牛肉和猪肉的综合价格,你会认为需求函数5优于函数4?为什么?

(6)猪肉和(或)牛肉是子鸡的竞争或替代产品吗?你怎样知道?

(7)假定函数5是“正确的需求函数。估计此模型的参数。”算出它们的标准误,以及R

2

, 和修正的R 2 解释你的结果

(8)现假设你选那个了“不正确”的模型2,通过考虑r2和r3值分别同?2和 ?3的关系,来

评估这一错误设定的后果。

5、某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为:

Y?10.36?0.094X1?0.131X2?0.210X3 R2?0.214

其中,Y为劳动力受教育年数, X1为该劳动力家庭中兄弟姐妹的人数,X2和X3分别为母亲与父亲受教育的年数,问:X1是否具有预期的影响?为什么?X2和X3 保持不变,为了使预测的受教育水平减少一年,需要增加X1多少? (2)请对X2的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?

6、下表列出了某地区家庭人均鸡肉年消费量Y与家庭月均收入X,鸡肉价格P,1(元/千克)猪肉价格P2(元/千克)与牛肉价格P3(元/千克)的相关数据。

表2 某地区家庭消费肉类情况表

年份 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

Y/千克 2.78 2.99 2.98 3.08 3.12 3.33 3.56 3.64 3.67 3.84 4.04 4.03 4.18 4.04 4.07 4.01 4.27 4.41 4.67 5.06 5.01 5.17 5.29

X/元 397 413 439 459 492 528 560 624 666 717 768 843 911 931 1021 1165 1349 1449 1575 1759 1994 2258 2478

P1

4.22 3.81 4.03 3.95 3.73 3.81 3.93 3.78 3.84 4.01 3.86 3.98 3.97 5.21 4.89 5.83 5.79 5.67 6.37 6.16 5.89 6.64 7.04

P2

5.07 5.2 5.4 5.53 5.47 6.37 6.98 6.59 6.45 7 7.32 6.78 7.91 9.54 9.42 12.35 12.99 11.76 13.09 12.98 12.8 14.1 16.82

P3

7.83 7.92 7.92 7.92 7.74 8.02 8.04 8.39 8.55 9.37 10.61 10.48 11.4 12.41 12.76 14.29 14.36 11.76 13.09 12.98 12.8 14.1 16.82

(1) 求出该地区关于家庭鸡肉消费需求的如下模型:

lnY??0??1lnX??2lnP1??2lnP2??3lnP3??

(2) 请分析鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 答案:

1、在极大似然估计中,假定样本是固定的,n个观测值都是独立观测的,这个样本可以有各种不同的总体生成,而每个总体都有自己的参数。那么在可供选择的总体中,哪个总体最可能生成所观测到的n个样本值?为此,需要估计每个可能总体取得这n个观测值联合概率,选择其参数能使观测样本值的联合概率最大的那个总体。

2、多元线性回归模型的基本假设仍然是针对随机干扰项与针对解释变量两大类的假设。针对随机干扰项的假设有:零均值,同方差,无序列相关且服从正态分布。针对解释变量的假设有:解释变量应具有非随机性,如果是随机的,则不能与随机干扰项相关,各解释变量之间不存在(完全)线性相关关系。

在证明最小二乘估计量的无偏性中,利用了解释变量非随机或与随机干扰项不相关的假定;在有效性的证明中,利用了随机干扰项同方差且无序列相关的假定。

3、(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即 系数值 标准差 t值 R

2

??1

2.030 0.119 17.10 0.980

??2

0.481 0.068 7.058

??3

-0.351 0.079 -4.416

??4

-0.061 0.130 -0.470

?Y=0.32?log(X1)?0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:?1?0,检验原假设H0:?1?0。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。

(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。

4、(1)模型五,它包含了所有的经济上相关的变量,而模型四中会产生多重共线性问题,而其他的模型包含的信息不够。

(2)前者是收入弹性系数,后者是价格弹性系数。

(3)模型(2)仅把猪肉作为替代品,模型(4)则把猪肉和牛肉都作为替代品。 (4)多重共线性问题。

(5)是的,多重共线性问题得到消除。

(6)作为一种食物,它们同子鸡相互竞争或替代。

22R?0.980,R?0.977,MODIFIEDR?0.810 (7)

2

其中交叉价格弹性相关系数统计上与零无异,P=0.6440。 (8)估计值可能是有偏的。

5、(1)预期X1对劳动者受教育的年数有影响。因为在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,

X1前的参数估计值-0.094表明,在 其他条件不变的情况下,每增加1个兄弟姐妹,受教

育年数会减少0.094年, 因此,要减少1年受教育的时间,兄弟姐妹需增加约11个。 (2) X2的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的受教育机会。 (3)首先计算两人受教育的年数分别为

10.36+0.131x12+0.210x12=14.452 10.36+0.131x16+0.210x16=15.816

因此,两人的受教育年限的差别为: 15.816—14.452=1.364 6、(1)用EViews软件做回归,有如下的回归方程:

???0.7315?0.3463X?0.5021lnYPP2?0.0872P3 1?0.1469 (-0.297) (4.182) (-4.569) (1.483) (0.873)

R2?0.9786 F=252.26 RSS=0.0135

(2)猪肉的价格与牛肉的价格是否对鸡肉的消费需求有影响可用假设检验的方法。

H0:?3??4?0,对Y关于X,P1做回归取得如下的回归方程: ???1.1258?0.4515X?0.3727P lnY1 (-12.73) (18.38) (-5.90)

R2?0.9786 F=497.28 RSS=0.0153

为了检验原假设,求F统计量:F=1.2

在5%的显著性水平下,自由度为(2,18)的F分布的临界值为F0.05(2.18)?3.55,因此,没有理由拒绝原假设,即该地区猪肉与牛肉的价格确实对家庭的鸡肉消费需求不产生显著影响。

第四章 线性模型的扩展习题与答案

1、研究某些经济问题时,在建立回归模型时为什么要引入虚拟变量?

2、为了评价从1979年7月起联邦放宽利率管制政策以来的影响,我的一名学生S兰格对1975年Ⅲ季度至1983年Ⅱ季度时期估计得到如下模型:

Yt = 8.5871-0.1328 Pt-0.7102 Unt-0.2389 Mt+0.6592 Yt-1+2.5831 Dumt

Se (1.9563) (0.0992) (0.1909) (0.0727) (0.1036) (0.7549) R=0.9156

其中 Y=3个月的国库券利率

P=预期通货膨胀率

Un=经季节调整的失业率 M=基础货币的变化 Dum=虚拟变量,

对从1979年7月1日开始的观测值取1 (1)解释这些结果

(2)放宽利率管制有何效果?这些结果有经济意义吗? (3)Pt,,,Unt和Mt的系数都是负的,你能作出经济上的解释吗?

2

3、如果一个定性变量含有k个类别,为什么不能设k个虚拟变量?

??2.69?0.48X,4、根据11年的观察值,得到回归模型:se=(0.1216) (0.1140) Yt模型A:??0.7774?0.253lnx R2?0.6628 lnYt模型B:se=(0.0152) (0.0494) R?0.7448

其中Y表示每人每天消费咖啡的杯数,X表示咖啡的价格(美元/磅)。 (1)解释这两个模型的斜率系数。

(2)已知Y的平均值为2.43,X的平均值为1.11,根据这些值估计模型A的价格弹性。 (3)求模型B的价格弹性。

(4)从估计弹性看,你认为咖啡的需求对价格的弹性是缺乏弹性的吗? (5)如何解释模型B的截距。

5、一个由容量为209的样本估计的解释CEO薪水的方程为:

2??4.59?0.257lnX?0.011X?0.158D?0.181lnYD2?0.283D3 121(15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)

其中,Y表示年薪水平(单位:万元),X1表示年收入(单位:万元),X2表示公共股票收益(单位:万元);D1D2D3均为虚拟变量,分别表示金融业、消费品工业和公共事业,假设对比产业为交通运输业。

(1)解释三个虚拟变量参数的经济含义。

(2)保持X1和X2不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。这个差异在1%的显著性水平上是统计显著的吗?

(3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?

6、下表给出了1965—1970年美国制造业利润和销售额的季度数据。假定利润不仅与销售额有关,而且和季度因素有关。 1965(1) (2) (3) (4) 1966(1) (2) (3) (4) 1967(1) (2) (3) (4) 利润Y 10503 12092 10834 12201 12245 14001 12213 12820 11349 12615 11014 12730 销售额X 114862 123968 121454 131917 129911 140976 137828 145645 136989 145126 141536 151776 1968(1) (2) (3) (4) 1969(1) (2) (3) (4) 1970(1) (2) (3) (4) 利润Y 12539 14849 13203 14947 14151 15949 14024 14315 12381 13991 12174 10985 销售额X 12539 14849 13203 14947 14151 15949 14024 14315 12381 13991 12174 10985

要求对下列两种情况分别估计利润模型:

(1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量? (2)如果认为季度影响使利润对销售额的变化率发生变异,如何引入虚拟变量? 答案:

1、在建立回归模型过程中,被解释变量不仅受到定性解释变量的影响,有时还受到一些非定量解释变量(如职业、性别、地区、季节等)的影响,他们不能用数值计量,称为虚拟变量,习惯上,其取值通常为0或1。虚拟变量是一种离散结构的量,是用来描述所研究变量的发展或变异而建立的一类特殊变量。

2、(1) 虚拟变量的设定将使不同的商店的差别保存固定。如连锁商店将是折扣商店的10倍,简易商店将是折扣商店的100倍。这个种设定并不是合适的。 (2)不同商店类型的参数不是显著异于零的,其p值为0.55。

通过样本,我们发现:与我们预期的一样,有优质标志比没有优质标志的可乐贵;小瓶装的要比大瓶的贵。这个模型解释了每盎司可乐价格变异的60.33%。 (3) 虚拟变化很好解释了小瓶装和大瓶装的对可乐价格的影响。

3、答:如果一个定性变量含有k个类别,一般只能设k?1个虚拟变量,以避免多重共线性。 4、(1)模型A斜率表示若咖啡价格上升1美元,每人每天消费杯数将下降0.4795杯。模型B的斜率给出消费杯数对咖啡价格的弹性。 (2) 0.2190(3)-0.253(4)是缺乏弹性。(5)截距表示咖啡价格为1时,每人每天消费EXP0.774杯。

5、(1)D1的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的CEO要比交通运输业的CEO多获15.8个百分点的薪水。其它两个可类似解释。

(2)公共事业和交通运输业之间估计薪水的近似百分比差异就是以百分数的解释的D3的参数,即为:28.3%。由于参数t的统计值为-2.895,它大于1%的显著水平下自由度为203的t分布的临界值1.96,因此这种差异是统计上显著的。

(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%与18.1%,因此他们之间的差异为:18.1%-15.8%=23.%。

6、(1)对利润函数Y??0??1X??按加法方式引入虚拟变量:D1D2D3:

Y??0??1D2??2D3??2D4??1X??

其中D1=(1=第二季度,0=其它季度) D2=(1=第三季度,0=其它季度)

D3=(1=第四季度,0=其它季度)

运用EWievs软件即有如下的估计模型:

??6685Y.8?1322.5D2?218.2D3?182.2D4?0.0038X

(3.81) (2.07) (-0.35) (0.28) (3.33)

R2?0.5256,F=5.26, D.W.=0.388

回归结果表明,只有销售额与第二季度对利润有显著影响。

由于其它季度的影响不显著,故可引入第二季度虚拟变量D2,得如下回归:

??6513Y.1?1331.6D2?0.0393X

(4.01) (2.7) (3.72)

R2?0.5156 F=11.17, D.W.=0.470

(2)如果季度因素对利润产生影响,则可按乘法方式引入虚拟变量:

Y??0??1D2X??2D3X??2D4X??1X??,运用EWievs软件运算结果可以看

出,仍然是第二季度对利润有影响,其它季度的影响不显著,因此只引入第二季度虚拟变量,得如下回归结果:

??6839Y.2?0.0087D2X?0.0372X

(4.23) (2.76) (3.51)

R2?0.5208,F=11.41, D.W.=0.485

由此可知,在其它季度,利润为0.0372。第二季度则增加到0.0459。

第五章 异方差性习题与答案

1、产生异方差的后果是什么?

2、下列哪种情况是异方差性造成的结果? (1)OLS估计量是有偏的

(2)通常的t检验不再服从t分布。 (3)OLS估计量不再具有最佳线性无偏性。 3、已知模型:Yi??0??1X1i??2X2i?ui

式中,Yi为某公司在第i个地区的销售额;X1i为该地区的总收入;X2i为该公司在该地区投入的广告费用(i=0,1,2??,50)。

(1)由于不同地区人口规模Pi可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项ui是异方差的。假设?i依赖于总体Pi的容量,逐步描述你如何对此进行检验。需说明:A、零假设和备择假设;B、要进行的回归;C、要计算的检验统计值及它的分布(包括自由度);D、接受或拒绝零假设的标准。

(2)假设?i??Pi。逐步描述如何求得BLUE并给出理论依据。 4、下表数据给出按学位和年龄划分的经济学家的中位数工薪:

表1 经济学家的工资表

年 龄 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69

中位数工薪(以千美元计算) 硕士 8.0 9.2 11.0 12.8 14.2 14.7 14.5 13.5 12.0

博士 8.8 9.6 11.0 12.5 13.6 14.3 15.0 15.0 15.0

(1)有硕士学位和有博士学位经济学家的中位数工薪的方差相等么? (2)如果相等,你会怎样检验两组平均中位数工薪相等的假设?

(3)在年龄35至5岁之间的经济学家,有硕士学位的比有博士学位的赚更多的钱,那么你会怎样解释这一发现?

5、为了解美国工作妇女是否受到歧视,可以用美国统计局的“当前人口调查”中的截面数据,研究男女工资有没有差别。这项多元回归分析研究所用到的变量有: W—雇员的工资率(美元/小时) 1表示雇员为女性, 0表示女性意外的雇员。ED:受教育的年数。AGE:年龄

对124名雇员的样本进行的研究得到回归结果为:(括号内为估计的t值)

???6.41?2.76sex?0.99ED?0.12AGE R2?0.867 E?23.2 W求:(1)该模型调整后的决定系数R (2)各估计值的标准差为多少?

(3)检验美国工作妇女是否受到歧视,为什么?(4)按此模型预测一个30岁受教育16年的美国男性的平均每小时的工作收入为多少美元?

6、下表给出了2000年中国部分省市城镇居民每个家庭平均全年可支配收入X与消费支出Y的统计数据。

(1)试用OLS法建立居民人均消费支出与可支配收入的线性模型。 (2)检验模型是否存在异方差性;

2地区 可支配收入 X 消费性支出Y 地区 可支配收入 X 消费性支出Y 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 答案:

10349.69 8140.50 5661.16 4724.11 5129.05 5357.79 4810.00 4912.88 11718.01 6800.23 8493.49 6121.04 4348.47 3941.87 3927.75 4356.06 4020.87 3824.44 8868.19 5323.18 浙江 山东 河南 湖北 湖南 广东 陕西 甘肃 青海 新疆 9279.16 6489.97 4766.26 5524.54 6218.73 9761.57 5124.24 4916.25 5169.96 5644.86 7020.22 5022.00 3830.71 4644.50 5218.79 8016.91 4276.67 4126.47 4185.73 4422.93 1、(1)参数估计量仍然是线性无偏的,但不是有效的。(2)建立在t分布和F分布之上的检验失效。(3)估计量的方差增大,预测精度下降。

2、第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS估计量出现偏误。

3、(1)如果?i依赖于总体Pi的容量,则随机扰动项的方差?i2依赖于Pi2。因此,要进行

2的回归的一种形式为?i2??0??1Pi??i。于是,要检验的零假设H0:?1?0,备择假

设H1:?1?0。检验步骤如下:

~2; 第一步:使用OLS方法估计模型,并保存残差平方项ei~2对常数项C和P2的回归 第二步:做eii第三步:考察估计的参数?1的t统计量,它在零假设下服从自由度为2的t分布。 第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值,

?1的t统计值大于该临界值,则拒绝同方差的零假设。 如果估计的参数?YiXXu1??0??11i??22i?iPiPi22Pi2PiPi由于Var(ui/Pi)??i/Pi??,所以在该变换模型中可以使用OLS方法,得出BLUE估

计值。方法是对Yi/Pi关于1/Pi、X1i/Pi、X2i/Pi做回归,不包括常数项。

4、(1) 用Bartlett检验,?检验统计量时0.0019,?值是0.965,因此样本方差在统计上是相等的

(2) 因为两个变量没有统计上的不同,要检验两组的平均薪水是否统计上相同,可以用t检验。计算得出的t值时0.437,鉴定的t值是t(0.05,16)?2.120,因此,两个样本薪水平均在统计上相等的

(3) 有很多因素可以解释这些,关键因素可能是雇主的特性。

2(2)假设?i??Pi时,模型除以Pi有:

5、(1) R2?1?(1?R2)(2) 估计值 t-值 标准差 n?1123?1?(1?0.867)?0.86n?k120-2.76 -4.61 0.60 0.99 8.54 0.12 0.12 4.63 0.026 -6.41 -3.38 1.90 (3)考虑零假设:美国工作妇女没有受到歧视,检验统计量t=-4.61,根据自由度为120的t-分布临界值表,检验统计量的值大于0.1%的水平下的临界值3.16,因此,我们有足够的证据拒绝零假设,认为美国工作妇女受到性别歧视。 (4)E(w)??6.41?2.76?0?0.99?16?0.12?30?13.03 6、(1)运用EWives软件计算得模型为: Y=0.755125X+272.3635

(2)在5%的显著水平下,自由度为(6,6)的F分布的临界值为F0.05(6,6)?4.28。拒绝无异方差性假设,表明原模型存在异方差性。

第六章 序列相关性习题与答案

1、对于线性回归模型,随机扰动项u产生序列相关的原因有哪些? 2、DW检验的局限性主要有哪些? 3、检验序列相关性的方法思路是什么?

4、在研究生产中的劳动在加值(value added)中所占分额(即劳动份额)的变动时,古扎拉蒂考虑如下模型:

模型A: Yt=β0+β1t+ut 模型B:Yt=α0+α1t+α2t+ ut

其中Y=劳动份额,t=时间。根据1949—1964年数据,对初级金属工业得到如下结果: 模型A: Yt= 0.4529—0.0041t R2=0.5284 d=0.8252 (-3.9608) 模型B:Yt=0.4786-0.0127t+0.0005t R2=0.6629 d=1.82 其中括弧中的数字是t比率。

(1) 模型A中有没有序列相关?模型B呢? (2) 怎样说明序列相关?

(3) 你会怎样区分“纯粹”自相关和设定偏误? 5、判明一下陈述的真伪,简单地申述你理由。

(1)当自相关出现时,OLS估计量时偏误的和非有效的, (2)德宾—沃森d检验假定误差项ui的方差有同方差性。 (3)用一阶差分变换消除自相关时,假定自相关系数Ρ为-1。

(4)如果一个是一阶差分形式的回归,而另一个是水平形式的回归,那么,这两个模

2

2

型的R2值是不可直接比较的。

(5)一个显著的德宾—沃森d不一定意味着一阶自相关。

(6)在自相关出现时,通常计算的预报值的方差和标准误就不是有效的。 (7)把一个(或多个)重要的变量从回归模型排除出去可能导致一个显著的d值。 (8)在AR(1)模式中,假设Ρ=1即可通过贝伦布鲁特—韦布g统计量,也可通过德宾—沃森d统计量来检验。

(9)如果在Y的一阶差分对X的一阶差分的回归中有一常数项和一元线性趋势项,就意味着在原始模型中有一个线性和一个二次趋势项。

6、中国1980—2000年投资总额X与工业总产值Y的统计资料如表所示,问: (1)当设定模型为lnYt??0??1lnXt??t时,是否存在序列相关性? (2)若按一阶自相关假设?t???t?1??t,试用杜宾两步法估计原模型。

表1 中国1980—2000年投资总额与工业总产值资料

年份

全社会固定资产投资X

1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990

910.9 961.0 1230.4 1430.1 1832.9 2543.2 3120.6 3791.7 4753.8 4410.4 4517.0

工业增加值 Y 1996.5 2048.4 2162.3 2375.6 2789.0 3448.7 3967.0 4585.8 5777.2 6484.0 6858.0

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 年份

全社会固定资产投资X 5594.5 8080.1 13072.3 17042.1 20019.3 22913.5 24941.1 28854.7 29854.7 32917.7

工业增加值 Y 8087.1 10284.5 14143.8 19359.6 24718.3 29082.6 32412.1 33087.2 35087.2 39570.3

答案:1、(1)在构造模型时,一些不太重要的解释变量被略去,这些被略去的解释变量的影响全部包含在了随机项u中,而往往是这些被排除的解释变量有些存在着序列相关,因而随机项u自相关。(2)在构造模型时,可能会错误的确定模型的形式。(3)随机项u本身序列相关。(4)内插统计值。

2、该方法仅适用于解释变量为非随机变量,随机扰动项的产生机制是一阶自相关,回归含有截距项,回归模型不把滞后被解释变量当作解释变量,没有缺失数据。

3、各种检验序列相关方法的思路大致相同,即先采用OLS方法估计远模型,得到随机干扰项的“近似估计值”,然后通过分析这些“近似估计值”之间的相关性已达到判断随机扰动项是否具有 序列相关性的目的。

'd?1.11;du?1.37。4、(1) 在n=16,k=1,??0.05, L因此,模型A中的d值为0.8252,

所以有一个正的,一阶自相关存在。

'在n=16,k=2,??0.05, D.W.值是:

dl?0.98,du?1.54,4?dl?3.02,4?du?2.46

因此,在模型B中的d值是1.82,没有一阶自相关。

(2) 自相关也许可以归咎于模型A的不规范,除了时间的平方外。

(3)对于函数的形式应该有一个事先的认识,也应该对检验不同的函数形式。 5、(1)错。估计量将是无偏的。 (2)正确。

(3) 错误。假定是相关系数是+1。 (4)正确,模型有不同的因变量。 (5)错误,D.W.检验显示一阶自相关。 (6) 正确。

(7) 正确。这会导致偏误。

(8)正确。注意D.W.检验统计量d值给出了一个p的近似值。

6、(1)运用软件可得D.W.值为0.45,小于显著水平为5%下,样本容量为21的D.W.分布的下限临界值1.22,因此,可以判定模型存在一阶序列相关。 (2)按杜宾法估计的模型:

lnYt?0.4456?0.6319lnYt?1?0.4704lnXt?0.132lnXt?1

(2.95)

(7.49) (6.04) (-1.16)

R2?0.9986

第七章 多重共线性习题与答案

1、多重共线性产生的原因是什么?

2、检验多重共线性的方法思路是什么?有哪些克服方法? 3、考虑一下模型: Yt=?1+?2Xt+?3Xt?1+?4Xt?2+?5Xt?3+?6Xt?4+ut

其中Y=消费,X=收入,t=时间。上述模型假定了时间t的消费支出不仅是时间t的收入,而且是以前多期的收入的函数。例如,1976年第一季度的消费支出是同季度收入合1975年的四个季度收入的函数。这类模型叫做分布滞后模型(distributed lag models)。我们将在以后的一掌中加以讨论。

(1) 你预期在这类模型中有多重共线性吗?为什么? (2)如果预期有多重共线性,你会怎么样解决这个问题?

4、已知回归模型E????N??,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释?和?。

?满足线性性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?(3)对参数的假设检验还能进行吗?简单陈述理由。

5、根据1899—1922年在美国制造业部门的年度数据,多尔蒂(Dougherty)获得如下回归结果:

LogY=2.81 - 0.53logK+ 0.91logL + 0.047t Se=(1.38)(0.34) (0.14) (0.021) R2=0.97 F=189.8

其中Y=实际产生指数,K=实际资本投入指数,L=实际劳力投入指数,t=时间或趋势。利用同样数据,他又获得一下回归:

(1)回归中有没有多重共线性?你怎么知道?

(2)在回归(1)中,logK的先验符号是什么?结果是否与预期的一致?为什么或为什么不?

(3)你怎样替回归的函数形式(1)做辩护:(提示:柯柏—道格拉斯生产函数。) (4)解释回归(1)在此回归中趋势变量的作用为何? (5)估计回归(2)的道理何在?

(6)如果原先的回归(1)有多重共线性,是否已被回归(2)减弱?你怎样知道? (7)如果回归(2)被别看作回归(1)的一个受约束形式,作者施加的约束是什么呢?(提示:规模报酬)你怎样知道这个约束是否正确?你在哪一种检验?说明你的计算。

两个回归的R值是可比的么?为什么或为什么不?如果它们现在的形式不可比,你会怎样使得它们可比?

答案:1、(1)样本的原因,比如样本中的解释变量个数大于观测次数。(2)经济变量变化的相同趋向。(3)模型中引入滞后变量。(4)经济变量的本质特征。

2、检验多重共线性的方法思路:用统计上求相关系数的原理,如果变量之间的相关系数较大则认为它们之间存在多重共线性。克服多重共线性的方法主要有:排除引起共线性的变量,差分法,减少参数估计量的方差,利用先验信息改变参数的约束形式,增加样本容量,岭回归法等。

3、(1) 不能。因为变量X与成线性关系 (2)X3i2ii2i2i2X3i,X3i=X+1

2i???321=X+1带入模型,Y=+(+2) X+ui

我们发现模型中有三个参数,不能估计出?2,?3的值。

???N为接受过N年教育的员工的总体平均起始薪金。4、(1)当N为零时,平均薪金为?,

因此?表示没有接受过教育员工的平均起始薪金。?是每单位N变化所引起的E的变化,

?满足线性性、?和仍?即表示每多接受一年学校教育所对应的薪金增加值。(2)OLS估计量?无偏性及有效性,因为这些性质的的成立无需随机扰动项?的正态分布假设。(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在?的正态分布假设之上的。

5、(1)由于R很高,F显著,可以知道可能有多重共线性的存在。

2(2)logK的先验符号应该为正,但是却不是,可能与共线性有关。 (3)方程1的模型是:

?2?3?4tY??KLe;因此,函数的形式应该就像所述的一样。 1

(4)平均来说,真实劳动的1%的增长会带来真实产出的0.91%的增长。产出每年增长0.047,模型揭示了真实产出的97%的变异。

(5)方程2就是方程1(YK的的基础上作了修改。假设有一个固定的回报比例,?????1?t模型应该是L??1(L)2L12e?2??3?1)

4。

(6)题目给出资本-劳动比率是统计上不显著,这表示问题没有得到解决。 (6)题意假设固定的回报比例,由(c)可知。可以用

2F8.7.10来检验这个约束。尽管如此,因

变量不同,必须首先使R相一致。读者需要一列数据来完成检验。 (7)不是.给出数据,读者可以用7.8和8.7所提到的方法。

第八章 随机解释变量习题与答案

1、假使两种物品的误差异曲线方程是:

Yi =β1+β2 Xi

你会怎样估计此模型的参数?你将模型应用于下列数据并评述你所得的结果: 消费品X: 消费品Y: 1 4 2 3.5 3 2.8 4 1.9 5 0.8 2、随机解释变量问题的后果是什么? 答案: 1、 系数值 标准差 t值 R

2

3.2827 1.2599 2.6055 0.6935

??1 ??2

1.1009 0.6817 1.615.

斜率系数在92%的水平上是统计显著的。

2、随机解释变量带来什么后果取决于它与随机误差项是否相关。(1)随机解释变量与随机误差项不相关,这时采用普通最小二乘法估计模型参数,得到的参数估计量仍然是无偏估计量。(2)随机解释变量与随机误差项在小样本下相关,在大样本下渐近无关。(3)随机解释变量与随机误差项高度相关。(4)滞后被解释变量被作为解释变量,并与随机误差项相关。

第九章 滞后变量模型习题与答案

1、什么是滞后变量模型?

2、列举常用到的内生滞后变量模型。

3、假设货币需求关系式为Mt????Yt???Rt,式中,Mt为时间t的实际现金余额;Yt?为时间t的“期望”实际收入;Rt为时间t的利率。根据适应规则,

Yt???Yt?1?(1??)Y?t?1??t,0???1修改期望值。已知Yt,Mt,Rt的数据,但Yt?的

数据未知。

(1)建立一个可以用于推导?,?,?和?估计值的经济计量模型。

(2)假设E(?t)?0,E(?t2)??2,E(?t?t?s)?0,s?0;Yt?1,Rt,Mt?1和Rt?1与?t都不相关。OLS估计值是1)无偏的;2)一致的吗?为什么? (3)假设?t=??t?1??t,?t的性质类似(2)部分。那么,本例中OLS估计值是(1)无

偏的;(2)一致的吗?为什么?

4、下表给出了1970—1991年美国制造业固定厂房设备投资Y和销售量X的相关数据。

表1 1970—1991年美国制造业固定厂房设备投资和销售量资料 年份 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 厂房开支Y 36.99 33.60 35.42 42.35 52.48 53.66 68.53 67.48 78.13 95.13 112.60 销售量X 52.805 55.906 63.027 72.931 84.79 86.589 98.797 113.201 126.905 143.936 154.391 年份 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 厂房开支Y 128.68 123.97 117.35 139.61 152.88 137.95 141.06 163.45 183.80 192.61 182.81 销售量X 168.129 163.351 172.547 190.682 194.538 194.657 206.326 223.547 232.724 239.459 235.142 (1) 以Yt?代表理想的或长期的建厂房设备企业开支,估计模型Yt???0??1Xt??t。 (2) 如果模型设定为Yt???0Xt2et,请用存量调整模型进行估计。

答案:

1、所谓滞后变量模型是指在某一回归模型中,如果把滞后变量作为解释变量,则称此模型为滞后变量模型。

2、考依克模型、适应性期望模型、局部调整模型 3、(1)由于

??Mt????Yt???Rt (1) Yt???Yt?1?(1??)Y?t?1??t (2)

本文来源:https://www.bwwdw.com/article/8h4g.html

Top