第7章 5逻辑回归分析讲义

更新时间：2023-08-18 08:00:01 阅读量：资格考试认证文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

杨羽芸熙的小说最强神婿全文免费阅读第7章推荐度：
相关推荐

7.5 逻辑回归分析

统计学上的定义和计算公式

定义：逻辑回归分析是对定性变量的回归分析。

现实中的很多现象可以划分为两种可能，或者归结为两种状态，这两种状态分别用0和1 表示。买汽车回受到家庭、收入等因素的影响，但最终的结果只能是两个：买或不买。如果我们采用多个因素对0－1 表示的某种现象进行因果关系解释，就可能应用到logistic 回归。例如，想探讨胃癌发生的危险因素，可以选择两组人群，一组是胃癌组，一组是非胃癌组，两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌，即“是”或“否”，为两分类变量，自变量就可以包括很多了，例如年龄、性别、饮食习惯等。自变量既可以是连续的，也可以是分类的。通过logistic回归分析，就可以大致了解到底哪些因素是胃癌的危险因素。

可用于处理定性因变量的统计分析方法有：判别分析（Discriminant analysis）、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中，应用最多的是Logistic回归分析。Logistic回归分析根据因变量取值类别不同，又可以分为Binary Logistic回归分析和Multi-nominal Logistic回归分析。

Binary Logistic回归模型中因变量只能取两个值1和0（虚拟因变量），而Multinomial Logistic回归模型中因变量可以取多个值。本节将只讨论Binary Logistic回归，并简称Logistic回归（与7.5节曲线估计中介绍的Logistic曲线模型相区别）。Logistic函数的形式为

实例操作

在一次关于某城镇居民上下班使用交通工具的社会调查中，因变量y =1表示居民主要乘坐公共汽车上下班；y=0表示主要骑自行车上下班；自变量x1表示被调查者的年龄；x2表示被调查者的月收入；x3表示被调查者的性别（x3=1为男性，x3=0为女性）。

试建立y与自变量间的Logistic回归，数据如表所示。数据“上下班交通调查表.sav” 表:使用交通工具上下班情况

（22.0版本）

Step 1

（22.0版本）

Step 2

（22.0版本）

Step 3

（22.0版本）

结果分析：

（1）第一部分输出结果有两个表格，第一个表格说明所有个案（10个）都被选入作为回归分析的个案。

个案处理摘要

未加权的个案选定的个案

已包括在分析中的个案缺少个案总计

未选定的个案总计

数字

10 0 10 0 10

百分比

100.0

.0 100.0

a. 如果权重有效，那么请参见分类表了解个案总数。

（22.0版本）

（2）第二个表格说明初始的因变量值（0，1）已经转换为逻辑回归分析中常用的0、1数值。

因变量编码原始值主要骑自行车上下班主要乘坐公共汽车上下班

内部值 0 1

（22.0版本）

（3）迭代过程

（4）Classification Table分类表说明第一次迭代结果的拟合效果，从该表格可以看出对于y=0，有100%的准确性；对于y=1，有0%准确性，因此对于所有个案总共有70%的准确性。

Variables in the Equation表格列出了Step 1中各个变量对应的系数，以及该变量对应的Wald 统计量值和它对应的相伴概率。从该表格中可以看出x3相伴概率最小，Wald统计量最大，可见该变量在模型中很重要。

方程式中没有的变量

步骤 0

变量

x1 x2 x3

得分 8.423 .601 .476

自由度

1 1 1

显著性

.004 .438 .490

a. 由于冗余，未计算残差卡方。

（22.0版本）

（5）Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。

模型系数的 Omnibus 检验

步骤 1

步长(T) 块模型

卡方 12.217 12.217 12.217

自由度

3 3 3

显著性

.007 .007 .007

（22.0版本）

（6）Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。

模型摘要 Cox & Snell R 平

步长(T) 1

-2 对数似然

.000

Nagelkerke R 平

方

.705

1.000

a. 估算在迭代号 20 终止，因为检测到完美拟合。此解决方案并非唯一。

（22.0版本）

（7）Hosmer and Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。

Hosmer 和 Lemeshow 检验的列联表

上下班方式 = 主要乘坐公共汽车上

上下班方式 = 主要骑自行车上下班

下班

观测值

0 0 0 0 0 0 0 1 2

期望值(E)

.000 .000 .000 .000 .000 .000 .000 1.000 2.000

总计

1 1 1 1 1 1 1 1 2

步骤 1

1 2 3 4 5 6 7 8 9

观测值

1 1 1 1 1 1 1 0 0

期望值(E)

1.000 1.000 1.000 1.000 1.000 1.000 1.000 .000 .000

（22.0版本）

（8）逻辑回归的最后一个输出表格是Casewise List，列出残差大于2的个案,由下表可知没有这样的个案。

个案列表a

a. 由于找不到界外值，未生成 casewise 绘图。

（22.0版本）

本文来源：https://www.bwwdw.com/article/mwrj.html

相关文章：

正在阅读：

第7章 5逻辑回归分析讲义08-18

吉隆坡富丽华国际管理大酒店(Furama Bukit Bintang, Kuala Lumpu04-16

质量自控体系 - 图文12-10

赞美感恩诗歌大全03-30

2015定额说明计算规则11-06

工业和信息化局最新工作总结和2022年工作计划范文04-04

毛衣好评评语02-24

交通建设工程安全生产监督管理信息化建设探究12-23

学校办公室安全管理制度12-12

2014年山东省日照市中考数学试卷05-28

上一篇：标准田字格模板-word打印版12 下一篇：2013年7月自学考试《现代公司管理》试题及答案