应用回归分析 - 第9章课后习题答案
更新时间:2023-10-09 11:30:01 阅读量: 综合文库 文档下载
第9章 含定性变量的回归模型
思考与练习参考答案
9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么?
答:假如这个含有季节定性自变量的回归模型为:
Yt??0??1X1t???kXkt??1D1t??2D2t??3D3t??t
其中含有k个定量变量,记为xi。对春夏秋冬四个季节引入4个0-1型自变量,记为Di,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:
?1??1?1(X,D)???1?1??1?X11?Xk1X12?Xk2X13?Xk3X14?Xk4X15?Xk5X16?Xk61000??0100?0010??0001?0100??1000????0?????1?β??????????k?
??1?????2?α????3??????4?显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。
当某自变量xj对其余p-1个自变量的复判定系数R2j超过一定界限时,SPSS软件将拒绝这个自变量xj进入回归模型。称Tolj=1-Rj为自变量xj的容忍度(Tolerance),SPSS软件的默认容忍度为0.0001。也就是说,当R2>0.9999时,自变量xj将被自动拒绝在回归方程之j外,除非我们修改容忍度的默认值。
2而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。
9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?
答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
9.3 研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表9.8,试建立y对公司规模和公司类型的回归。 表9.8
i 1 2 3
y 17 26 21
x1 151 92 175
公司类型 互助 互助 互助
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
30 22 0 12 19 4 16 28 15 11 38 31 21 20 13 30 14
31 104 277 210 120 290 238 164 272 295 68 85 224 166 305 124 246
互助 互助 互助 互助 互助 互助 互助 股份 股份 股份 股份 股份 股份 股份 股份 股份 股份
解:对定型变量“公司类型”进行数量化处理:
引入虚拟变量x2:公司类型为“互助”时,x2=1,为“股份”时, x2=0。
则表9.5中数据转换成以下数据:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
y 17 26 21 30 22 0 12 19 4 16 28 15 11 38 31 21 20 13 30 14
x1 151 92 175 31 104 277 210 120 290 238 164 272 295 68 85 224 166 305 124 246
公司类型
1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
建立回归方程 y=b0+b1x1+b2x2+ε
用SPSS软件作线性回归,得到输出结果如下:
Model SummaryModel1R.946aR Square.895AdjustedR Square.883Std. Error ofthe Estimate3.221a. Predictors: (Constant), 公司类型, x1 R检验:拟合优度R2=0.883,接近1,说明回归拟合的效果较好。
ANOVAbModel1Sum ofSquares1504.413176.3871680.800df21719Mean Square752.20710.376F72.497Sig..000aRegressionResidualTotala. Predictors: (Constant), 公司类型, x1b. Dependent Variable: y F检验:F值=72.497,Sig.值为0,说明回归方程通过F检验。
CoefficientsaUnstandardizedCoefficientsBStd. Error41.9302.010-.102.009-8.0551.459StandardizedCoefficientsBeta-.911-.439Model1(Constant)x1公司类型t20.859-11.443-5.521Sig..000.000.000a. Dependent Variable: y T检验:回归系数通过t检验,回归方程为:
y= 41.930-0.102 x1-8.055 x2
说明:若引入虚拟变量x2,当公司类型为“互助”时,x2=0,为“股份”时, x2=1。 则回归方程为:
y= 33.874-0.102x1 + 8.055x2
CoefficientsaUnstandardizedCoefficientsBStd. Error-.144.662-.006.012-.136.191StandardizedCoefficientsBeta-.137-.193Model1(Constant)x1x2t-.218-.510-.715Sig..831.619.487a. Dependent Variable: ppi ??=-0.144-0.006x1-0.136x2 由SPSS输出系数表结果得到回归方程:p 则还原后logistic回归方程为:
?=pexp(?0.144?0.006x1?0.136x2)
1?exp(?0.144?0.006x1?0.136x2)由方差分析表知F值=0.386,P值=0.687,大于5%,说明回归方程不显著;
由系数表知回归参数的t检验均没有通过,因为P值都大于5%,说明回归参数未通过显著性检验。
由于logistic回归模型存在异方差,所以采用加权最小二乘法重新拟
合,权重:?i?nipi(1?pi)
SPSS输出结果如下:
ANOVAb,cModel1Sum ofSquares8.39312.67621.069df21315Mean Square4.197.975F4.304Sig..037aRegressionResidualTotala. Predictors: (Constant), x2, x1b. Dependent Variable: ppic. Weighted Least Squares Regression - Weighted by wi Coefficientsa,bUnstandardizedCoefficientsBStd. Error.146.309.002.005-.331.116StandardizedCoefficientsBeta.086-.617Model1t.472.398-2.858(Constant)x1x2Sig..645.697.013a. Dependent Variable: ppib. Weighted Least Squares Regression - Weighted by wi ??=0.146?0.002x1?0.331x2 由输出结果得到回归方程:p?=还原后的回归方程:pexp(0.146?0.002x1?0.331x2)
1?exp(0.146?0.002x1?0.331x2)由方差分析表结果知:F值=4.304,P值=0.037,小于5%,说明回归方程显著;
由系数表知x1对应的回归系数相应的P值=0.697,大于5%,说明x1对应的回归系数没有通过检验,不显著;
x2对应的回归系数相应的P值=0.013,小于5%,说明x2对应的回归
系数通过检显著性验,且该回归系数为-0.331,,表明文化程度越高越不害怕。
(2) 把公民的年龄x1、文化程度x2作为定性型变量,引入6个0-1变量表示年龄x1
?22,x1?22?37,x1?37?53,x1?53x11??,x12??,x13???0,x1?22?0,x1?37?0,x1?53 ?1,x2?0?1,x2?1?1,x2?2x21??,x22??,x23???0,x2?0?0,x2?1?0,x2?2
1) 直接进行y与6个虚拟变量的未加权的logistic回归,SPSS输出结果如下:
由方差分析表知F=2.472,P值=0.106,大于5%,说明回归方程不显著;且除了x12外,其它自变量对应的回归系数都没通过检验。
ANOVAbModel1Sum ofSquares4.7435.27710.020df41115Mean Square1.186.480F2.472Sig..106aRegressionResidualTotala. Predictors: (Constant), x13, x2, x12, x11b. Dependent Variable: ppi CoefficientsaModel1(Constant)x2x11x12x13UnstandardizedCoefficientsBStd. Error-1.044.417-.136.155.220.4901.273.490.969.490StandardizedCoefficientsBeta-.193.120.697.530t-2.505-.881.4492.6001.979Sig..029.397.662.025.073a. Dependent Variable: ppi 下面通过后退法选择变量对上述模型改进。 SPSS输出结果如下表:
ANOVAdModel1Sum ofSquares4.7435.27710.0204.6475.37410.0204.2745.74610.020df411153121521315Mean Square1.186.4801.549.4482.137.442F2.472Sig..106a23RegressionResidualTotalRegressionResidualTotalRegressionResidualTotal3.459.051b4.835.027ca. Predictors: (Constant), x13, x2, x12, x11b. Predictors: (Constant), x13, x2, x12c. Predictors: (Constant), x13, x12d. Dependent Variable: ppi CoefficientsaModel123(Constant)x2x11x12x13(Constant)x2x12x13(Constant)x12x13UnstandardizedCoefficientsBStd. Error-1.044.417-.136.155.220.4901.273.490.969.490-.934.326-.136.1501.163.410.859.410-1.139.2351.163.407.859.407StandardizedCoefficientsBeta-.193.120.697.530-.193.636.470.636.470t-2.505-.881.4492.6001.979-2.865-.9122.8382.097-4.8462.8572.110Sig..029.397.662.025.073.014.380.015.058.000.013.055 后退法的过程中剔除了x11,x2,留下了x12,x13,但是x13对应的回归系数未通过检验,将其剔除,最后留下了x12;而且回归方程显著,
2) 加权回归:用后退法选择变量,由输出结果(如下)可知最后只留下了x2。
a. Dependent Variable: ppiANOVAe,fModel1Sum ofSquares9.97911.09021.0699.52611.54321.0698.87012.19921.0698.23812.83121.069df41115312152131511415Mean Square2.4951.0083.175.9624.435.9388.238.916F2.475Sig..106a234RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalRegressionResidualTotal3.301.058b4.726.029c8.989.010da. Predictors: (Constant), x13, x2, x11, x12b. Predictors: (Constant), x13, x2, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2e. Dependent Variable: ppif. Weighted Least Squares Regression - Weighted by wi
Coefficientsa,bUnstandardizedCoefficientsBStd. Error-.092.425-.344.118.263.392.379.389.376.402.131.258-.332.115.132.122.129.156.177.248-.334.113.089.109.220.240-.335.112StandardizedCoefficientsBeta-.641.490.737.570-.620.257.195-.623.173-.625Model1234(Constant)x2x11x12x13(Constant)x2x12x13(Constant)x2x12(Constant)x2t-.217-2.901.671.975.936.510-2.9021.086.826.713-2.950.820.915-2.998Sig..832.014.516.351.370.619.013.299.425.489.011.427.375.010a. Dependent Variable: ppib. Weighted Least Squares Regression - Weighted by wi 从上表可以看出,最后只保留了变量x2(P值小于0.05),回归方程
???0.22?0.335x2 为:pModel SummaryModel1234R.688.672b.649c.625daR Square.474.452.421.391AdjustedR Square.282.315.332.348Std. Error ofthe Estimate1.00408.98078.96870.95732a. Predictors: (Constant), x2, x13, x11, x12b. Predictors: (Constant), x2, x13, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2 从模型概要表中可以看出模型四的回归方程的拟合优度不佳。 (3)对回归的效果不满意。变量x1在不同的回归方法下显著性不同,对该变量的显著性判定还有待改进。如果能获得年龄的准确值做Logistic回归的极大似然估计,可能会改进回归效果。
Model SummaryModel1234R.688.672b.649c.625daR Square.474.452.421.391AdjustedR Square.282.315.332.348Std. Error ofthe Estimate1.00408.98078.96870.95732a. Predictors: (Constant), x2, x13, x11, x12b. Predictors: (Constant), x2, x13, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2 从模型概要表中可以看出模型四的回归方程的拟合优度不佳。 (3)对回归的效果不满意。变量x1在不同的回归方法下显著性不同,对该变量的显著性判定还有待改进。如果能获得年龄的准确值做Logistic回归的极大似然估计,可能会改进回归效果。
正在阅读:
应用回归分析 - 第9章课后习题答案10-09
生活中的大事作文06-18
未来6年中国股市预测与揭密07-29
历年(2009-2012)山东省属事业单位考试真题107-24
八年级生物上册 17.2 动物的行为学案1(新版)苏科版04-16
解读赵盼儿形象05-25
基于Allegro16.5 - PCB - SI 一步一步学会前仿真 - 图文10-16
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 课后
- 习题
- 回归
- 答案
- 应用
- 分析
- 练成胎息谈体验
- 机械制造工艺学试卷及答案
- 珠江三角洲环境保护规划纲要2004-2020年实施方案
- 烟草公司客户经理个人先进事迹(1)
- 八年级物理第三章物态变化单元测试题及答案 - 图文
- 中国当代文学2014年7月试题与答案
- 自招必备 - 华师大二附中高中物理自主招生内部讲义
- 民族体育--摔跤
- 管理会计实践心得3篇(完整版)
- 动力配套题
- 企业画册文案
- 建筑起重机械安装拆卸合同(示范文本)052-2
- 数学广角练习 四年级下册
- 2002-2013年注册岩土工程师考试历年真题对应各规范的题量分布
- 南邮通达2015微机第一阶段试卷及答案
- 商业部 招商1-招商方向 考试题目(卷A1)参考资料
- 2015年度安全知识竞赛试题及答案6.15
- 2013年国内网络安全领域十大事件 - 图文
- 情景模拟教学案例样章
- 峡江县库区移民职业教育和技能培训规划