stata学习笔记

更新时间:2024-06-23 09:57:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

经济数据的特点与类型。

1、横截面数据:多个经济个体的变量在同一时间点上的取值,如2012年中国各省的GDP 2、时间数列数据:指的是某个经济个体的变量在不同时点上的取值,如1978-2012年山东省每年的GDP

3、面板数据:多个经济个体的变量在不同时点上的取值,如1978-2012年中国各省的GDP

小样本OLS(最小二乘法):单一方程线性回归最常见方法

条件:解释变量与扰动项正交、扰动项无自相关、同方差。 拟合优度:衡量线性回归模型对样本数据的拟合程度(R2),越高说明模型拟合程度越好。

单系数T检验:对回归方程扰动项的具体概率进行假设

显著性水平进行检验

F检验:整个回归方程是否显著 STATA操作简介:

如果数据中包含1949-10-01或1949/10/01的时间变量,导入stata后可能会被视为字符串,因此对于日度数据,可以使用命令gen newvar=date(varname,YMD),将其转换为整数日期变量,其中YMD说明原始数据的格式为年月日,如果原始数据的格式为月日年则使用MDY;对于月度数据则gen newvar=monthly(varname,YM)。

.describe:数据的概貌 .drop keep:删除和保留 .su:统计特征 Pwcorr:变量之间相关系数 Star(.05):5%显著性水平 gen:产生 g intc=log(tc):取自然对数. reg:OLS回归 .Vce:协方差矩阵 reg。。。,noc表示在进行回归时不要常数项

大样本OLS:只要求解释变量与同期的扰动项正交即可

Robust:稳健标准误,如果存在异方差,则应使用稳健标准误

最大似然估计法:如果回归方程存在非线性,则使用最大似然估计法(MLE)或非线性最小二乘法(NLS)

三类在大样本下渐进等价的统计检验:Wald test LR(似然比检验) LM 操作步骤如下:sysuse auto(调用数据集)

Hist mpg,normal(画变量mpg的直方图,并与正态密度比较)

.1Density.020.04.06.081020Mileage (mpg)3040

直方图显示,变量mpg的分布于正态分布有一定差距。 变量可以取对数解决非正态分布的问题。

异方差与GLS(广义最小二乘法)

异方差的检验:看残差图、怀特检验(white test)、BP检验(Breusch and Pagan) 异方差的处理:1、OLS+稳健标准误(最好的) 2、广义最小二乘法(GLS) 3、加权最小二乘法(WLS) 实例操作:

1、 使用数据:use nerlove.dta,clear

2、 reg intc inq inpl inpk inpf(进行回归) 3、

Source SS df MS Number of obs = 145 F( 4, 140) = 437.90 Model 269.524728 4 67.3811819 Prob > F = 0.0000 Residual 21.5420958 140 .153872113 R-squared = 0.9260 Adj R-squared = 0.9239 Total 291.066823 144 2.02129738 Root MSE = .39227 intc Coef. Std. Err. t P>|t| [95% Conf. Interval] inq .7209135 .0174337 41.35 0.000 .6864462 .7553808 inpl .4559645 .299802 1.52 0.131 -.1367602 1.048689 inpk -.2151476 .3398295 -0.63 0.528 -.8870089 .4567136 inpf .4258137 .1003218 4.24 0.000 .2274721 .6241554 _cons -3.566513 1.779383 -2.00 0.047 -7.084448 -.0485779 4、 画残差图:rvfplot

2Residuals-101-20Fitted values24

上图可以发现当拟合值较小时,扰动项方差较大,继续考察残差与解释变量inq的散点图:rvpplot inq,结果与上图几乎一致,可能存在异方差,即扰动项的方差随着观测值而变。

5、 完成回归后,进行怀特检验:estat imtest,white

White's test for Ho: homoskedasticity against Ha: unrestricted heteroskedasticity chi2(14) = 73.88 Prob > chi2 = 0.0000Cameron & Trivedi's decomposition of IM-test Source chi2 df p Heteroskedasticity 73.88 14 0.0000 Skewness 22.79 4 0.0001 Kurtosis 2.62 1 0.1055 Total 99.29 19 0.0000

P值显著,认为存在异方差 6、完成回归后,进行BP检验:estat hettest,iid estat hottest,rhs iid estat hottest inq,iid

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: inq inpl inpk inpf chi2(4) = 36.16 Prob > chi2 = 0.0000

三种形式的检验都强烈拒绝同方差的原假设,存在异方差(这里只放一个形式的检验结果) 7、 处理异方差

自相关 :扰动项之间自相关

自相关的例子:1、时间序列数据中通常具有某种连续性和持久性,如相邻两年的GDP增长率;2、截面数据中相邻的观测单位之间可能存在溢出效应,如相邻地区的农业产量收到类似天气变化的影响;3、对数据的人为处理如数据中包含移动平均数等;4、如果模型设定中遗漏了某个自相关的解释变量并被纳入到扰动项中,则会引起扰动项的自相关。

自相关的检验:1、画图(不推荐)2、BG检验estat bgodfrey 3、BOX-Pierce Q检验 4、DW检验 estat dwatson. 检验都要在OLS做完后才能做。

自相关的处理:1、使用OLS+异方差自相关稳健的标准误;2、OLS+聚类稳健的标准误;3、使用可行广义最小二乘法(FGLS);4、修改模型设定

自相关处理实例:1、使用数据 icecream 然后进行回归

. reg consumption temp price income Source SS df MS Number of obs = 30 F( 3, 26) = 22.17 Model .090250523 3 .030083508 Prob > F = 0.0000 Residual .035272835 26 .001356647 R-squared = 0.7190 Adj R-squared = 0.6866 Total .125523358 29 .004328392 Root MSE = .03683 consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0004455 7.76 0.000 .0025426 .0043743 price -1.044413 .834357 -1.25 0.222 -2.759458 .6706322 income .0033078 .0011714 2.82 0.009 .0008999 .0057156 _cons .1973149 .2702161 0.73 0.472 -.3581223 .752752 BG检验

. estat bgodfreyBreusch-Godfrey LM test for autocorrelation lags(p) chi2 df Prob > chi2 1 4.237 1 0.0396 H0: no serial correlation显著 拒绝了原假设无自相关,则认为存在自相关 Q检验(略)、DW检验如下

. estat dwatsonDurbin-Watson d-statistic( 4, 30) = 1.021169DW=1.02 距离2很远 可以认为存在自相关。

由以上的检验可以看出扰动项之间存在自相关,因此OLS提供的标准误是不准确的,应

四分之一

使用异方差自相关稳健标准误,由于样本为30个,n=2.34,故取NEWey-West估计量的滞后值为P=3,结果如下:

. newey consumption temp price income,lag(3)Regression with Newey-West standard errors Number of obs = 30maximum lag: 3 F( 3, 26) = 27.63 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0004002 8.64 0.000 .0026357 .0042811 price -1.044413 .9772494 -1.07 0.295 -3.053178 .9643518 income .0033078 .0013278 2.49 0.019 .0005783 .0060372 _cons .1973149 .3378109 0.58 0.564 -.4970655 .8916952

上图显示标准误与OLS标准误无多大区别,因此将滞后阶数增加为6,

. newey consumption temp price income,lag(6)Regression with Newey-West standard errors Number of obs = 30maximum lag: 6 F( 3, 26) = 52.97 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0003504 9.87 0.000 .0027382 .0041787 price -1.044413 .9821798 -1.06 0.297 -3.063313 .9744864 income .0033078 .00132 2.51 0.019 .0005945 .006021 _cons .1973149 .3299533 0.60 0.555 -.4809139 .8755437

从上图可以看到无论截断参数是3还是6,标准误都变化不大,比较稳健。

此外,前面提到自相关存在可能是因为模型设定不正确,因此考虑在解释变量中加入temp的滞后值,然后再进行OLS回归:

. reg consumption temp L.temp price income Source SS df MS Number of obs = 29 F( 4, 24) = 28.98 Model .103387183 4 .025846796 Prob > F = 0.0000 Residual .021406049 24 .000891919 R-squared = 0.8285 Adj R-squared = 0.7999 Total .124793232 28 .004456901 Root MSE = .02987 consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp --. .0053321 .0006704 7.95 0.000 .0039484 .0067158 L1. -.0022039 .0007307 -3.02 0.006 -.0037119 -.0006959 price -.8383021 .6880205 -1.22 0.235 -2.258307 .5817025 income .0028673 .0010533 2.72 0.012 .0006934 .0050413 _cons .1894822 .2323169 0.82 0.423 -.2899963 .6689607然后使用BG检验是否存在自相关:

. estat bgoBreusch-Godfrey LM test for autocorrelation lags(p) chi2 df Prob > chi2 1 0.120 1 0.7292 H0: no serial correlation

结果显示无自相关,而后DW值也改进为1.58,因此修改模型后扰动项基本不再存在自相关。

模型设定与数据问题

遗漏变量:被解释变量可能被加入到扰动项中

解决方式:加入尽可能多的控制变量;使用代理变量;工具变量法;使用面板数据;随机试验或自然实验。

其中代理变量应满足两个条件:多余性,仅通过影响遗漏变量而作用于被解释变量;剩余独立性,遗漏变量中不受代理变量影响的剩余部分与所有解释变量均不相关。

多重共线性:某一解释变量可以由其他解释变量线性表出,即存在多重共线性。 检测:先回归,然后estat vif VIF低于10即不存在多重共线性。

工具变量,2SLS与GMM

工具变量的适用条件:OLS成立的最重要条件是解释变量与扰动项不相关,如出现相关可以使用工具变量法来解决。其中在计量经济学中,将所有与扰动项相关的解释变量成为内生变量,一个有效的工具变量应满足一下两个条件:1、工具变量与内生解释变量相关;2、工具变量与扰动项不相关。

过程:传统的工具变量法一般通过二阶段最小二乘法(2SLS或TSLS)来实现:1、用内生解释变量对工具变量进行回归,得到拟合值Pt(Pt实际上是内生变量中的外生部分,而另一部分是与扰动项相关);2、用被解释变量对第一阶段的拟合值Pt进行回归。 工具变量的检测:1、不可识别检验;2、弱工具变量检验;3、过度识别检验(estat overid)。 豪斯曼检验:原假设为所有解释变量均为外生变量,若拒绝假设的话应该使用工具变量法,若接受的话使用OLS。 豪斯曼过程:reg X1 x2

Estimates store ols(存储OLS的结果)

Ivregress 2sls y x1(x2=z1 z2)(假设怀疑X2为内生变量) Estimates store iv(存储2SLS结果)

Hausman iv ols,constant sigmamore(根据存储的结果进行豪斯曼检验)

若存在异方差的问题,则可以使用杜宾-吴-豪斯曼检验。它在异方差的情况下也适用。

在球形扰动项的假定下,2SLS最有效,但如果扰动项存在异方差或自相关,则存在GMM广义矩估计这一更有效的方法:首先使用2SLS得到残差,然后GMM,但是在实际操作中使

用迭代法。

GMM的命令:

ivregress gmm y x1(x2=z1 z2) 两步最优GMM

ivregress gmm y x1 (x2=z1 z2),igmm 迭代GMM estat overid 过度识别检验

工具变量法的STATA命令和实例: Use grilic.dta,clear Sum

然后考察智商和受教育年限的相关关系(本文研究的是工资与受教育年限的关系)

. pwcorr iq s,sig iq s iq 1.0000 s 0.5131 1.0000 0.0000

具有较强的正相关关系。

然后作为一个参照系,进行OLS回归并使用稳健标准误。

. reg lw s expr tenure rns smsa,rLinear regression Number of obs = 758 F( 5, 752) = 84.05 Prob > F = 0.0000 R-squared = 0.3521 Root MSE = .34641 Robust lw Coef. Std. Err. t P>|t| [95% Conf. Interval] s .102643 .0062099 16.53 0.000 .0904523 .1148338 expr .0381189 .0066144 5.76 0.000 .025134 .0511038 tenure .0356146 .0079988 4.45 0.000 .0199118 .0513173 rns -.0840797 .029533 -2.85 0.005 -.1420566 -.0261029 smsa .1396666 .028056 4.98 0.000 .0845893 .194744 _cons 4.103675 .0876665 46.81 0.000 3.931575 4.275775

教育投资率10.26%,显然过高,可能是遗漏了变量能力,使得能力对工资的贡献也被纳入教育的贡献。

因此使用iq作为能力的代理变量,再进行OLS回归,可以发现加入iq作为能力的代理变量后,教育投资回报率降低了一些,但还是过高。(如下图)

. reg lw s iq expr tenure rns smsa,rLinear regression Number of obs = 758 F( 6, 751) = 71.89 Prob > F = 0.0000 R-squared = 0.3600 Root MSE = .34454 Robust lw Coef. Std. Err. t P>|t| [95% Conf. Interval] s .0927874 .0069763 13.30 0.000 .0790921 .1064826 iq .0032792 .0011321 2.90 0.004 .0010567 .0055016 expr .0393443 .0066603 5.91 0.000 .0262692 .0524193 tenure .034209 .0078957 4.33 0.000 .0187088 .0497092 rns -.0745325 .0299772 -2.49 0.013 -.1333815 -.0156834 smsa .1367369 .0277712 4.92 0.000 .0822186 .1912553 _cons 3.895172 .1159286 33.60 0.000 3.667589 4.122754

使用iq来度量能力存在测量误差,因此iq为内生变量,考虑使用med kww mrt age作为iq的工具变量,进行2SLS回归 ,并使用稳健标准误。

. ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),rInstrumental variables (2SLS) regression Number of obs = 758 Wald chi2(6) = 355.73 Prob > chi2 = 0.0000 R-squared = 0.2002 Root MSE = .38336 Robust lw Coef. Std. Err. z P>|z| [95% Conf. Interval] iq -.0115468 .0056376 -2.05 0.041 -.0225962 -.0004974 s .1373477 .0174989 7.85 0.000 .1030506 .1716449 expr .0338041 .0074844 4.52 0.000 .019135 .0484732 tenure .040564 .0095848 4.23 0.000 .0217781 .05935 rns -.1176984 .0359582 -3.27 0.001 -.1881751 -.0472216 smsa .149983 .0322276 4.65 0.000 .0868182 .2131479 _cons 4.837875 .3799432 12.73 0.000 4.0932 5.58255 Instrumented: iqInstruments: s expr tenure rns smsa med kww mrt age

受教育年限回报上升,而iq竟然是负相关,因此不可信,使用工具变量法需要验证其工具变量的有效性因此进行过度识别来检验所有工具变量是否外生。

. estat overid Test of overidentifying restrictions: Score chi2(3) = 51.5449 (p = 0.0000)

上图显示有些工具变量不合格,与扰动项相关。怀疑mrt和age不满足外生性,因此仅适用med和kww作为iq的工具变量,再次进行2SLS回归,同时显示第一阶段的回归结果。

. ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r firstFirst-stage regressions Number of obs = 758 F( 7, 750) = 47.74 Prob > F = 0.0000 R-squared = 0.3066 Adj R-squared = 0.3001 Root MSE = 11.3931 Robust iq Coef. Std. Err. t P>|t| [95% Conf. Interval] s 2.467021 .2327755 10.60 0.000 2.010052 2.92399 expr -.4501353 .2391647 -1.88 0.060 -.9196471 .0193766 tenure .2059531 .269562 0.76 0.445 -.3232327 .7351388 rns -2.689831 .8921335 -3.02 0.003 -4.441207 -.938455 smsa .2627416 .9465309 0.28 0.781 -1.595424 2.120907 med .3470133 .1681356 2.06 0.039 .0169409 .6770857 kww .3081811 .0646794 4.76 0.000 .1812068 .4351553 _cons 56.67122 3.076955 18.42 0.000 50.63075 62.71169 Instrumental variables (2SLS) regression Number of obs = 758 Wald chi2(6) = 370.04 Prob > chi2 = 0.0000 R-squared = 0.2775 Root MSE = .36436 Robust lw Coef. Std. Err. z P>|z| [95% Conf. Interval] iq .0139284 .0060393 2.31 0.021 .0020916 .0257653 s .0607803 .0189505 3.21 0.001 .023638 .0979227 expr .0433237 .0074118 5.85 0.000 .0287968 .0578505 tenure .0296442 .008317 3.56 0.000 .0133432 .0459452 rns -.0435271 .0344779 -1.26 0.207 -.1111026 .0240483 smsa .1272224 .0297414 4.28 0.000 .0689303 .1855146 _cons 3.218043 .3983683 8.08 0.000 2.437256 3.998831 Instrumented: iqInstruments: s expr tenure rns smsa med kww

如上图,第一部分回归是使用内生解释变量对工具变量进行回归,第二部分用被解释变量对第一阶段回归的拟合值进行回归。

上图中教育回报率较为合理,而且iq系数也为整数,再次进行过度识别检验。

. estat overid Test of overidentifying restrictions: Score chi2(1) = .151451 (p = 0.6972)

结果没有拒绝外生的原假设。

然后使用logit进行估计:

结果显示所有系数的联合显著性很高,继续使用稳健标准误进行logit回归:

对比以上两个表格显示标准误相差不大,因此不用担心模型设定问题。 二值选择模型中的异方差问题:hetprob y x1 x2 x3,het(varlist),如果接受原假设则为同方差。 此外,二值选择模型中一般都没有扰动项的存在。

二值选择模型中的异方差问题可以进行似然比检验(LR):hetprob y x1 x2 x3,het(varlist)(这是在异方差情况下进行Probit估计的stata命令,het(varlist)制定对扰动项方差有影响的所

有变量,如het(age married children)),LR检验原假设为同方差。

多值选择模型

个体面临的选择有时是多值的,因此可能需要使用到多项probit或多项logit,或者在有某项条件时需要用到条件logit,还有在不随方案而变的多项logit模型和解释变量随方案而变的条件logit模型混合的logit模型。

举例来说,问卷调查将受访者职业分为五类(OCC),解释变量为是否白人、受教育年限、工龄,解释变量都依赖于个体而不依赖于方案,因此使用多项logit或多项probit回归:

进行多项logit回归:

上述结果说明白人更不可能选择服务业或工匠;是否白人对选择蓝领或白领没显著影响。。。

排序与计数模型

1、 泊松回归:被解释变量只能取非负整数,即0,1,2….,这时常用泊松回归。

Poisson y x1 x2 x3,r irr

Poisson y x1 x2 x3,r exposure(x1) Poisson y x1 x2 x3,r offset(x1)

其中,r为稳健标准误,irr为显示发生率比,exposure表示把inx1作为解释变量并使其系数为1,offset表示将x1作为解释变量并使其系数为1.

2、 负二项回归:泊松回归的局限是泊松分布的期望与方差一定相等,但如果被解释变量的

方差明显大于期望,即存在过度分散,这时候可以使用负二项回归。 Nbreg y x1 x2 x3,r exposure(x1)

Nbreg y x1 x2 x3,r dispersion(constant) offset(x1) 其中dispersion(constant)表示使用NB1模型。

3、 零膨胀泊松回归与负二项回归:如计数数据中包含大量0值,则可以使用零膨胀泊松回

归或零膨胀负二项回归。如果vuong统计量很大为正数,则应该使用零膨胀泊松回归,如果统计量很小为负数,则使用零膨胀负二项回归。 Zip y x1 x2 x3,inflate(varlist) vuong(零膨胀泊松回归)

Zinb y x1 x2 x3,inflate(varlist) vuong(零膨胀负二项回归),其中inflate(varlist)不可缺少列出所有变量。

如果研究者只关注参数的估计值,则泊松回归。 Stata举例:

被解释变量narr86(1986年被逮捕的次数),被解释变量为计数数据,尽管如此,还是使用OLS回归进行观察:

R的平方为0.07,但大多数解释变量都显著,下面进行泊松回归,并使用稳健标准误:

(nolog)表示不显示迭代记录。上俩图可以看出虽然OLS和泊松的系数相差很大,但两者并不具有可比性,为方便比较,计算泊松回归的平均边际效应:

可以看出,泊松模型的平均边际效应与OLS的回归系数很接近,为便于解释系数,下面计算发生率比:

可以看出黑人被逮捕次数比白人多93.6%。此外使用泊松回归的前提之一是被解释变量的期望与方差相等,因此考察被解释变量的统计特征:

结果显示样本方差几乎是样本均值的两倍,为放松此假定进行负二项回归(NB2):

上图中alpha的置信区间为0.7-1.24,因此可在5%的显著性水平下拒绝过度分散参数

alpha=0的原假设,也因此应使用负二项回归。

短面板

面板数据指的是一段时间内跟踪同一组个体数据,它既有横截面的维度又有时间维度。其中,如果每个时期在样本中的个体完全一样,则称为平衡面板数据,反之为非平衡面板数据。 固定效应还是随机效应:当不存在异方差的时候,使用hausman检验,如果假设成立,则

使用随机效应,如果拒绝假设,则使用固定效应。

而当存在异方差时候,使用辅助回归然后聚类稳健标准误来检验,

如果接受假设,则使用随机效应模型。

短面板的stata命令及实例:

Xtset panelvar timevar(xt说明数据为面板数据,panelvar取值必须为整数且不重复,相当于

进行编号,timevar为时间变量,假如panelvar为字串符,如国家,则使用encode country,gen(cntry))

Xtdes 显示面板的结构,是否为平衡面板 Xtsum 显示组内,组间与整体的统计指标

Xttab varname 显示组内,组间与整体的分布频率,tab指的是tabulate 交通死亡率:首先设定state与year为面板变量及时间变量。

上图显示这是一个平衡的面板数据(每个时期在样本中的个体完全一样),然后显示数据集

的结构:

n=48,T=7,n大而T小,说明这是一个短面板,然后作为参照系,首先进行混合回归: reg y x1 x2 x3,vce(cluster id)其中id用来确定每个个体的变量,vce(cluster state)表示

使用以state为聚类变量的聚类稳健标准误

由于每个州的情况不一样,可能存在不随时间变化的遗漏变量,故考虑使用固定效应: Xtreg y x1 x2 x3,fe r

LSDV法的stata命令为:reg y x1 x2 x3 i.id,r

其中r为使用聚类稳健标准误,vce(cluster id)也能达到这种效果,id表示用来确定个体的

变量,i.id表示根据变量id而生成的虚拟变量。

首先使用组内估计量:

在选择随机还是固定时:使用hausman检验:xtreg y x1 x2 x3,fe(固定效应估计)

Estimates store fe(存贮)

Xtreg y x1 x2 x3,re(随机效应估计) Estimates store re(存储) Hausman fe re,constant sigmamore(豪斯曼检验)

长面板与动态面板

在长面板中,T可能会比较大,因此可能存在组间异方差,组内自相关或组间同期相关的问题,主要有两种处理方式:1、使用OLS即LSDV来估计系数,只对标准误差进行矫正(即面板矫正误差);3、对异方差或自相关的具体形式进行假设,然后使用可行广义最小二乘法FGLS进行估计。

1、 矫正标准误差

即使扰动项存在组间异方差或组间同期相关等,LSDV也依然有效,此时,只要使用组间异方差、组间同期方差稳健的标准误差即可,即面板校正标准误差PCSE: Xtpvse y x1 x2 x3,hetonly,其中hetonly表示存在组间异方差,但不存在组间同期相关;

举例:inc为被解释变量,由于n=10,T=30,因此是一个长面板。为了考虑时间效应,生成时间趋势变量t,然后用LSDV法估计双向固定效应模型(作为对比先不考虑异方差等)

下图可以看出有些州虚拟变量显著,即存在固定效应,而时间效应则不太显著,p值为0.19.然后下表未考虑组间异方差等,因此使用面板校正标准误进行估计(下下图)

命令xtpcse与命令reg的估计系数完全一样,只是标准误不同。 2、 仅解决组内自相关的FGLS:xtpcse y x1 x2,corr(ar1)。无论是使用prais-winsten

还是OLS方法都在组间异方差与组间同期相关的情况下成立。

继续使用以上数据,考虑组内自相关的情形,但要求各组的自回归系数相同 3、 组间异方差的检验:如果拒绝假设,则存在组间异方差。

Ssc install xttest3(下载安装命令) Quietly xtreg lnc lnp i.state t,r fe xttest3

Quietly xtgls lnc lnp i.state t Xttest3

4、 组内自相关检验:如果拒绝假设,则存在组内自相关

Net install st0039

Xtserial y x1 x2 x3,output

5、 组间同期相关的检验:如果拒绝假设,即存在组间同期相关。

Ssc install xtest2

Quietly xreg inc inp inpmin iny t,fe Xttest2

非线性面板

对于面板数据,如果被解释变量为虚拟变量、计数变量、受限变量等,则为非线性面板。 1、 如果被解释变量为虚拟变量,则称为面板二值选择模型。一般采用混合、固定或随机效

应模型。

混合回归:如果不存在个体效应,则使用混合回归 Probit y x1 x2 x3,vce(cluster id) 混合probit回归

Logit y x1 x2 x3,vce(cluster id) 混合logit回归 其中Id为确定面板单位的变量 随即效应模型: Xtprobit x1 x2 x3, Xtlogit y x1 x2 x3,再次输出结果中,包含了对原假设的LR检验结果,如拒绝则使用随机,

接受则使用混合

固定效应模型:xtlogit y x1 x2 x3,fe

Stata实例:被解释变量为是否起义uprising,由于面板probit无固定效应模型,因此使

用面板logit模型。

首先进行固定效应面板logit估计:

如下图所示,第二行有一个朝代未发生企业,因此在估计固定效应时应被去掉。

然后进行混合回归logit模型,为保持与固定效应样本一样,在混合回归中也去掉了dyn=2

的朝代:

本文来源:https://www.bwwdw.com/article/nf23.html

Top