练习题1

更新时间:2023-10-25 05:59:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

练习题

从1949到1998年的内蒙人口数据有年份YEAR,人口数Y两个变量。设模型为:

LY=a+b*YEAR+c*LY(-1)+d*LY(-2)

其中LY=log(Y)。(注:LY(-1)表示LY的一期滞后值)

(1)估计模型,进行参数和方程的显著性检验,并预测1999年和2000年的人口数;

(2)检验模型的基本假设是否成立,如果违背,请选择方法纠正;

(3)对1960年的数据异常,你用什么办法处理?(提示:在模型中引进虚拟变量,比如引进表示1960年的虚拟变量D60,使得60年取1,其他年份取0)

表4 内蒙古1951-1998年人口数 YEAR 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966

Y 687 716 758 801 843 897 936 986 1063 1191 1163 1172 1215 1254 1296 1330 YEAR 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 Y 1371 1411 1460 1491 1555 1603 1651 1705 1738 1769 1798 1823 1852 1876 1903 1942 YEAR 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 Y 1970 1993 2016 2041 2066 2094 2122 2163 2184 2207 2232 2260 2284 2307 2325 2344 解:(1)令y1=lgY,LY(-1),(-2)分别表示相对于LY前一年和前两年的数据,分别设YEAR=x,LY(-1)=x1,LY(-2)=x2. 因为1951年前一期值未知,1952年前两期值未知,故应该去掉1951年与1952年,对1953年以后的数据开始分析。

用SPSS进行y1对x,x1,x2,的线性回归,得到结果如下:

Anova 模型 1 回归 残差 总计 平方和 .880 .002 .882 df 3 42 45 均方 .293 .000 F 5764.344 Sig. .000 ab a. 预测变量: (常量), x2, x, x1。 b. 因变量: y1 系数 非标准化系数 模型 1 (常量) x x1 x2 a. 因变量: y1 B -.296 .000 .935 -.005 标准 误差 .520 .000 .151 .145 标准系数 试用版 t -.570 .026 .979 -.005 .878 6.208 -.034 Sig. .572 .385 .000 .973 共线性统计量 容差 VIF a .068 .002 .002 14.811 431.359 433.576 由以上数据可以看出,y1对x,x1,x2的回归方程为y1=-0.296+0.935x1-0.005x2 当x=1999时,x1?lg2344?3.3700 ,x2?lg2325?3.3668 ,y=2370.50 当x=2000时,x1?lg2370.5?3.3748 ,x2?lg2344?3.3700

,y=2396.955

i在显著性水平??0.05的条件下x1的sig.=0.385>0.05,x2的sig.=0.973>0.05说明y对x1,x2的线性回归不显著。 (2) 模型汇总 标准 估计的误模型 1 R .999 abR 方 .998 调整 R 方 .997 差 .00713 Durbin-Watson 2.030 a. 预测变量: (常量), x2, x, x1。 b. 因变量: y1 用杜宾沃特森进行自变量间自相关的检验,得到DW=2.03,显著性水平

??0.05,当n=46,k=3时,查DW检验上下界标得 1.43?dl?1.46

,162?du?1.63。由于2.37=4-dl>DW=2.03>1.63,从而随机误差项之间不存在自相关。

用方差扩大因子法和特征根判定法检验自变量间是否存在多重共线性,得到结果如下:

系数 非标准化系数 模型 1 (常量) x x1 x2 a. 因变量: y1 B -.296 .000 .935 -.005 标准 误差 .520 .000 .151 .145 标准系数 试用版 t -.570 .026 .979 -.005 .878 6.208 -.034 Sig. .572 .385 .000 .973 共线性统计量 容差 VIF a .068 .002 .002 14.811 431.359 433.576

共线性诊断 方差比例 模型 1 维数 1 2 3 4 a. 因变量: y1 特征值 3.998 .002 2.522E-6 1.737E-6 条件索引 1.000 45.941 1259.150 1517.009 (常量) .00 .00 .00 1.00 x .00 .00 .01 .99 x1 .00 .00 1.00 .00 x2 .00 .00 .97 .03 a

从以上输出结果可以看到,x的方差扩大因子VIF=14.811,x1的方差扩大因子VIF=431.359,x2的方差扩大因子VIF2?433.576,x1,x2的方差扩大因子远远大于10,说明自变量间存在着严重的多重共线性。从条件数看到,

k

1?45.941k3?1259.150,k4?1517.009,说明自变量间存在着严重的多重共

线性,这与方差扩大因子的结果一致。

用后退法选择变量,结果如下:

Anovab 模型 1 回归 残差 总计 a. 预测变量: (常量), x1。 b. 因变量: yi 平方和 .880 .002 .882 df 1 44 45 均方 .880 .000 F 17787.991 Sig. .000a 系数a 非标准化系数 模型 1 (常量) x1 a. 因变量: yi B .158 .954 标准 误差 .023 .007 标准系数 试用版 t 6.919 .999 133.372 Sig. .000 .000

由上图可知,逐步回归法剔除了变量x和x2余下变量x1,y对x1的回归方程

i为y??0.158?0.954x。

i

用等级相关系数法检验异方差性,得到结果如下:

相关系数 Spearman 的 rho ei 相关系数 Sig.(双侧) N x 相关系数 Sig.(双侧) N ei 1.000 . 46 -.524** .000 46 x -.524** .000 46 1.000 . 46 **. 在置信度(双测)为 0.01 时,相关性是显著的。

得到等级相关系数rs??0.524,sig=0.000,认为残差绝对值与自变量x中度相关,存在异方差。

残差图为

(3)在模型中引进虚拟变量,比如引进表示1960年的虚拟变量D60,使得60年取1,其他年份取0,得到新的数据,由于第二份中可以看出,存在很严重的多重共线性,故利用逐步回归法对新的数据进行回归分析;

2 模型 1 (常量) LAGS(LY,1) (常量) LAGS(LY,1) D60 a. 因变量: LY

B .158 .954 .140 .959 .032 系数 非标准化系数 标准 误差 .023 .007 .017 .005 .005 标准系数 试用版 t 6.919 .999 133.372 8.086 177.124 5.994 Sig. .000 .000 .000 .000 .000 a 1.004 .034

已排除的变量 共线性统计量 模型 1 year LAGS(LY,2) D60 2 year LAGS(LY,2) Beta In .026 .009 .034 .032 .234 bbaaact .889 .058 5.994 1.512 1.994 Sig. .379 .954 .000 .138 .053 偏相关 .134 .009 .675 .227 .294 容差 .068 .002 .972 .068 .002 a. 模型中的预测变量: (常量), LAGS(LY,1)。 b. 模型中的预测变量: (常量), LAGS(LY,1), D60。 c. 因变量: LY

R方=0.999接近于1,说明方程拟合的效果较好,并且LY(-1)的参数估计的p值和D60参数估计的p值都接近于0,通过参数的显著性检验。

模型 1 2 R .999 .999 ba 模型汇总 标准 估计的误R 方 .998 .999 调整 R 方 .997 .999 差 .00703 .00525 a. 预测变量: (常量), LAGS(LY,1)。 b. 预测变量: (常量), LAGS(LY,1), D60。

本文来源:https://www.bwwdw.com/article/oqz2.html

Top