第7章 5逻辑回归分析讲义
更新时间:2023-08-18 08:00:01 阅读量: 资格考试认证 文档下载
7.5 逻辑回归分析
统计学上的定义和计算公式
定义:逻辑回归分析是对定性变量的回归分析。
现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1 表示。买汽车回受到家庭、收入等因素的影响,但最终的结果只能是两个:买或不买。如果我们采用多个因素对0-1 表示的某种现象进行因果关系解释,就可能应用到logistic 回归。例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯等。自变量既可以是连续的,也可以是分类的。通过logistic回归分析,就可以大致了解到底哪些因素是胃癌的危险因素。
可用于处理定性因变量的统计分析方法有:判别分析(Discriminant analysis)、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是Logistic回归分析。Logistic回归分析根据因变量取值类别不同,又可以分为Binary Logistic回归分析和Multi-nominal Logistic回归分析。
Binary Logistic回归模型中因变量只能取两个值1和0(虚拟因变量),而Multinomial Logistic回归模型中因变量可以取多个值。本节将只讨论Binary Logistic回归,并简称Logistic回归(与7.5节曲线估计中介绍的Logistic曲线模型相区别)。Logistic函数的形式为
实例操作
在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y=0表示主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。
试建立y与自变量间的Logistic回归,数据如表所示。数据“上下班交通调查表.sav” 表:使用交通工具上下班情况
(22.0版本)
Step 1
(22.0版本)
Step 2
(22.0版本)
Step 3
(22.0版本)
结果分析:
(1)第一部分输出结果有两个表格,第一个表格说明所有个案(10个)都被选入作为回归分析的个案。
个案处理摘要
未加权的个案 选定的个案
已包括在分析中的个案 缺少个案 总计
未选定的个案 总计
a
数字
10 0 10 0 10
百分比
100.0
.0 100.0
.0 100.0
a. 如果权重有效,那么请参见分类表了解个案总数。
(22.0版本)
(2)第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。
因变量编码 原始值 主要骑自行车上下班 主要乘坐公共汽车上下班
内部值 0 1
(22.0版本)
(3)迭代过程
(4)Classification Table分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有100%的准确性;对于y=1,有0%准确性,因此对于所有个案总共有70%的准确性。
Variables in the Equation表格列出了Step 1中各个变量对应的系数,以及该变量对应的Wald 统计量值和它对应的相伴概率。从该表格中可以看出x3相伴概率最小,Wald统计量最大,可见该变量在模型中很重要。
方程式中没有的变量
a
步骤 0
变量
x1 x2 x3
得分 8.423 .601 .476
自由度
1 1 1
显著性
.004 .438 .490
a. 由于冗余,未计算残差卡方。
(22.0版本)
(5)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。
模型系数的 Omnibus 检验
步骤 1
步长(T) 块 模型
卡方 12.217 12.217 12.217
自由度
3 3 3
显著性
.007 .007 .007
(22.0版本)
(6)Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。
模型摘要 Cox & Snell R 平
步长(T) 1
-2 对数似然
.000
a
Nagelkerke R 平
方
方
.705
1.000
a. 估算在迭代号 20 终止,因为检测到完美拟合。此解决方案并非唯一。
(22.0版本)
(7)Hosmer and Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。
Hosmer 和 Lemeshow 检验的列联表
上下班方式 = 主要乘坐公共汽车上
上下班方式 = 主要骑自行车上下班
下班
观测值
0 0 0 0 0 0 0 1 2
期望值(E)
.000 .000 .000 .000 .000 .000 .000 1.000 2.000
总计
1 1 1 1 1 1 1 1 2
步骤 1
1 2 3 4 5 6 7 8 9
观测值
1 1 1 1 1 1 1 0 0
期望值(E)
1.000 1.000 1.000 1.000 1.000 1.000 1.000 .000 .000
(22.0版本)
(8)逻辑回归的最后一个输出表格是Casewise List,列出残差大于2的个案,由下表可知没有这样的个案。
个案列表a
a. 由于找不到界外值,未生成 casewise 绘图。
(22.0版本)
正在阅读:
第7章 5逻辑回归分析讲义08-18
吉隆坡富丽华国际管理大酒店(Furama Bukit Bintang, Kuala Lumpu04-16
质量自控体系 - 图文12-10
赞美感恩诗歌大全03-30
2015定额说明计算规则11-06
工业和信息化局最新工作总结和2022年工作计划范文04-04
毛衣好评评语02-24
学校办公室安全管理制度12-12
2014年山东省日照市中考数学试卷05-28
- 梳理《史记》素材,为作文添彩
- 2012呼和浩特驾照模拟考试B2车型试题
- 关于全面推进施工现场标准化管理实施的通知(红头文件)
- 江西省房屋建筑和市政基础设施工程施工招标文件范本
- 律师与公证制度第2阶段练习题
- 2019-2020年最新人教版PEP初三英语九年级上册精编单元练习unit6训练测试卷内含听力文件及听力原文
- 小升初数学模拟试卷(十四) 北京版 Word版,含答案
- 认识创新思维特点 探讨创新教育方法-精选教育文档
- 00266 自考 社会心理学一(复习题大全)
- 多媒体在语文教学中的运用效果
- 派出所派出所教导员述职报告
- 低压电工作业考试B
- 18秋福建师范大学《管理心理学》在线作业一4
- 中国铝业公司职工违规违纪处分暂行规定
- 13建筑力学复习题(答案)
- 2008年新密市师德征文获奖名单 - 图文
- 保安员培训考试题库(附答案)
- 银川市贺兰一中一模试卷
- 2011—2017年新课标全国卷2文科数学试题分类汇编 - 1.集合
- 湖北省襄阳市第五中学届高三生物五月模拟考试试题一
- 讲义
- 逻辑
- 回归
- 分析
- 经典歌曲凤凰传奇
- 对外经济贸易大学金融硕士好考吗——复习经验介绍
- 2018年6月大学生英语四级真题试卷及答案(第三套)
- 莎士比亚及其作品介绍
- 养老院可行性研究报告
- 人教版七年级数学下册8.2—加减消元法解二元一次方程组_(第一课时)
- 08成文信息控制程序
- 2013.4.6段西亚 沈妮娜 婚礼策划预案
- 中国能源价格改革寻找时间窗口
- 新型汽车起动机功率电子开关+说明书(2)
- 银监会行政许可业务准入流程图
- 运动控制程课程设计任务书
- 平定营镇新气象
- 物理练习册答案
- 16.2 分式的加减乘除混合运算1
- 笔记本选购之硬件篇
- 房屋建筑和市政基础设施工程施工图设计文件审查管理办法(住房城乡建设部令第13号)
- 高中数学怎么学-怎样学好高中数学
- PHC管桩技术交底
- 初中地理(中考)会考模拟试题五