第11章_相关与回归分析
更新时间:2023-08-05 19:18:01 阅读量: 实用文档 文档下载
管理统计学 清华大学出版社 课件
第11章 相关与回归分析
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
内容摘要 变量间的统计关系 一元线性回归 多元线性回归 可线性化的非线性回归
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
变量间的统计关系 变量之间的关系:确定型的函数关系和不确定性的 函数关系 确定型 /自变量 /因变量 不确定型 /相关关系
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
回归分析——研究随机变量之间的相关关系的一种统计 方法。
相关关系
线性相关 正相关
非线性相关
完全相关
不相关
负相关
正相关
负相关
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
相关关系的特点1.变量间关系不能用函数关系精确表达 2.一个变量的取值不能由另一个变量唯一确定 3.当变量取某个值时,变量的取值可能有几个 4.各观测点分布在直线周围
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
(a)
(b)
2
1
0
y
-1
y
-1
0
1
2
正相关-2 -1 x 0 1 2
-2
不相关
-3
-2
-1 x
0
1
2
(c)
-2
(d)
2
1
y
0
y
-1
2
4
6
8
相关但无 线性关系-3 -2 -1 0 x 1 2 3
-2
-2
-1
0 x
1
2
负相关北京理工大学管理与经济学院
0
管理统计学 清华大学出版社 课件
相关系数——对变量之间关系密切程度的度量
( x x )( y y ) r ( x x ) * n( y ) ( y )2 2
2
r 的取值范围是 [-1,1]:
完全相关 /完全正相关 /完全负相关 /不存在线性相关关系 /负相关 /正相关北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
对相关系数的显著性检验– 提出假设 H 0 : =0 – 计算检验的统计量
r
n 2 1 r 2
~ t (n - 2)
– 确定显著性水平 ,并作出决策 若 t > t 2 / ,拒绝; 若 t < t 2 / ,接受北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
例11.1 设有10个厂家的投入和产出如下,根据这 些数据,我们可以认为投入和产出之间存在相关 性吗?厂家 1 2 3 4 5 6 7 8 9 10
投入产出
2030
4060
2040
3060
1030
1040
2040
2050
2030
3070
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
决定系数——说明自变量解释因变量变化百分比 的度量 回归分析——一组样本数据出发,确定变量之间 的数学关系式,对这些关系式的可信程度进行各 种统计检验,并从影响某一特定变量的诸多变量 中找出哪些变量的影响显著,哪些不显著。然后 利用所求的关系式,根据一个或几个变量的取值 来预测或控制另一个特定变量的取值,并给出这 种预测或控制的精确程度。
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
相关分析与回归分析的区别– 分析对象的相互地位不同 – 分析对象的变量类型不同 – 两者的目的不同
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
一元线性回归 一元线性回归(Linear regression),只研究一个 自变量与一个因变
量之间的统计关系。 对于只涉及一个自变量的简单线性回归模型可表 示为:
y b0 b1 x e
其中,b0和b1称为模型的参数;e是误差项, 有 e N 0, 2 。 描述y的平均值或期望值如何依赖于x的方程称为 回归方程对于一个给定的x值,y的期望值为:E y b0 b1x北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
简单线性回归方程的形式为 y b0 b1 x e , 也称为直线回归方程。其中,b0是回归直线在y轴 上的截距,是当x=0时y的期望值; b1是直线的斜 率,称为回归系数,表示当x每变动一个单位时, y的平均变动值。 总体回归参数b0和b1是未知的,必需利用样本数 据去估计。用样本统计量b0和b1代替回归方程中 的未知参数b0和b1 ,就得到了估计的回归方程:
y b0 b1x 其中, b0是估计的回归直线在轴上的截距, b1是 直线的斜率。北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
参数b0和b1的最小二乘估计 对例11.1中的两个变量的数据进行线性回归,就 是要找到一条直线来适当地代表图中的那些点的 趋势。 首先需要确定选择这条直线的标准。这里介绍最 小二乘回归法(least squares regression),就是寻 找一条直线,使得所有点到该直线的垂直距离的 平方和最小。用数据寻找一条直线的过程也叫做 拟合一条直线。
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
设简单线性回归模 y b0 b1 x e 中, b0和b1是 b0和b1的估计值 。则y的估计值用 y b0 b1x 表示。 我们要求出这样的待估参数b0和b1,使因变量的观 察值与估计值之间的离差平方和达到最小,即使 2 2 2 Q yi y e i yi b0 b1 x 极小。为此,分 别求Q对b0和b1的偏导,就可就可以求出符合要求 的待估参数b0和b1:b1 n xy x y n x ( x )2 2
,
b0
y b x y b x 1
n
1
n
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
看例11.1,试用最小二乘法来得到一个表示厂家 投入与产出关系的线性方程。当厂家的投入为20 时,它的预测产出是多少?b1 n xy x y n x 2 ( x) 21
10 10800 220 450 1.1842 2 10 5600 (220)
b0
y b x 45-1.1842 22=18.9476 y b x n1
故回归方程为 y 18.9476+1.1842x 预测值是将x值代入直线回归方程解得的值。若投 入为20,他的预测产出应该为: y 18.9476+1.1842 20=42.6316北京理工大学管理与经济学院
n
管理统计学 清华大学出版社 课件
同理可以计算出其他情况下的预测产出,每组数 据的预测值列出在下表中第3列:80 70 60 50 40 30 20 10 0 0 10 20 投入 30 40 50
产出北京理工大学管理与经济学院
散点图及回
归直线
管理统计学 清华大学出版社 课件
残差分析 真实值与预测值的差就是 回归直线在每个给定点上 的误差,我们称之为残差 (residual)。 从几何上讲,残差是回归 直线到样本数据点之间的 垂直距离,确定斜率和截 距的方程使回归直线位于 样本点之间。这样,从回 归直线到样本点之间的垂 直距离相互抵消,使总和 为0。80 70 60 50 40 30 20 10 0 0 10 20 30 x 投入 40Y 预测 Y 线性 (预测 Y)
y值与预测值
50
包含残差的散点图
北京理工大学管理与经济学院
管理统计学 清华大学出版社 课件
通过对残差进行检验,我们对回归直线与数据点 的拟合情况有进一步了解。– 在投入与产出的例子中,残差值(绝对值)最大为 15.5264,最小为0.7896。用回归直线预测的第10个厂 家(投入为30)的产出值误差为15.5264万元,而第5个 厂商(投入为10)的误差为0.7896万元,这两个分别是 预测的最差和最好的情况。
有时残差也用来确定异常点(outliers),异常点 就是与其他点偏离,与总体趋势不符的数据点。 异常点往往使残差幅度加大,在散点图中很容易 识别。回归直线方程会受到计算中每个点的影响, 因此,异常点的存在可能会使回归直线向异常点 偏离。北京理工大学管理与经济学院
正在阅读:
第11章_相关与回归分析08-05
五年级地方课程工作总结03-18
POS机应答码解释08-07
2019员工见习期自我鉴定01-07
生态纺织品认证07-03
汽车工业转型升级的思路与目标 - 图文01-25
未来的家乡作文400字04-01
宜昌夷陵长江大桥中塔柱横梁施工工艺07-10
对口单招高二英语期末试卷(附答案)10-02
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 回归
- 分析
- 相关
- 解除社区矫正通知书
- 黑马程序员——集合框架
- 春雨的色彩教案
- 历史趣谈唐太宗李世民为何要亲手砸掉魏征的墓碑?
- 华为U8800ROM刷机教程--非常实用的
- HP Compaq 515 内置有声音 耳机不能切换改电路经典维修案例
- 管理会计课后习题答案
- 拟投入的主要物资计划
- MHDD硬盘修复详细技术教程
- 出口退税单证备案的规定
- 高中英语语人称代词
- 猴哥SAT2300填空词汇表(最新版)下载
- 中国最美的地方--排行榜
- 写在2010年末-搜索引擎营销:SEM行业和职业
- 广东省六校联盟2015届高三第三次联考生物试题 Word版含答案
- 2019模拟面试活动总结及个人总结
- 铜鼓县“雨露计划”浇开农民幸福路
- 报价单(英汉对照)
- 随机过程习题答案
- 常用修辞手法及其运用举例