六西格玛黑带培训教材13
更新时间:2023-05-24 19:13:01 阅读量: 实用文档 文档下载
13部 回归分析(Regression)
LGENT SIX SIGMA TASK TEAM
什么是回归分析1. 什么是回归分析 想要改善问题情况,掌握相关变量(具有连续反应值特性)之间的相互相关性,这种方法用的情况多. (有/无相互相关性,可以提供问题解决Point)
这种相关性用某种数学方程来表示及分析叫回归分析。即对从属变量 Y与独立变量X的关系用如下的数学方程式来表示. Y = a + bχ + error where, a = constant , b = slope
2. 回归方程式的种类 单纯回归分析 : Y因子和X因子各1个的情况 中回归分析 : X有2个以上的情况 曲线回归分析 : 独立变量(X)1个,从属变量(Y)1个构成的情况 (2次以上的高次函数)
3. Data收集是 ? 为了推定变动最小的偏移, 使用因子X的最低界限值到最高界限值为止的 大范围Data.
为了减少收集数据时因时间变迁所产生的潜在变量,最好是无序法来确定 X因子的水平后再做试验。 13 -1/16 LG Electronics / LGENT 6σTASK TEAM
回归方程式y不能说明的 变动误差项 SSE
(xi, yj)
y = a + bx
总变动 (SST)
y
能够说明的变动 (回归引起的变动) SSR
xi· a = y - bx· b =
x
S (xy ) S (xx )
Σ xy = Σ x 13 -2/162
Σ xΣ y
n(Σ x )2
nLG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析根据Lot大小(X)预测生产人数(Y) ,利用Random(随机法)抽出数据进行回归分析.
1. 首先画Graph Minitab Menu : Graph / PlotX 10 20 30 40 40 50 60 60 70 80 Y 20 29 50 60 70 85 90 95 109 120
可以大致推测两个变量的关系在一条直线上. 13 -3/16 LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析2. 进行回归分析 Minitab Menu : Stat / Regression /Regression
为了将Fit / Residual保存在Data窗里
为了判断Fitting方程式恰当与否而使用
13 -4/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析
Regression Analysis: Y versus X
The regression equation is Y = 4.71 + 1.48 XPredictor Constant X S = 4.270 Coef 4.712 1.48018 SE Coef 3.242 0.06408 T 1.45 23.10 P 0.184 0.000
R-Sq = 98.5%
R-Sq(adj) = 98.3%
Analysis of Variance Source Regression Residual Error Total DF 1 8 9 SS 9727.7 145.9 9873.6 MS 9727.7 18.2 F 533.55 P 0.000
Fits 是从因子各个测定Data开始,通过回归方程式的计算,随着X的实测值的 Y的推测值. Y = 4.71 + 1.48X Residual(残差)的Error表示是 实际反应值上,把预想的反应值,从各测定值上减掉的值, 上面例题是 C3 = C2 - C4 13 -5/16 LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析3. 分析残差(Residual) - 正态性检验 Minitab Menu : Stat / Regression /Regression
13 -6/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析3. 分析残差(Residual) - 正规性检验 别的 Minitab Menu : Stat / Basic Statistics / Normalit
y TestHistogram of the Residuals(response is Y)3
Normal Probability Plot of the Residuals(response is Y)
1
Frequency
Normal Score-6 -4 -2 0 2 4 6
2
0
1
0
-1
Residual
-5
Normal Probability PlotResidual
0
5
.999
残差(Residual)是检验回归方程法是否适用 的一种Tool.其判断依据如下: 1) 残差的平均应始终为 ‘0’ 2) 残差应正态分布 3) 残差要Random分布 (不能有倾向性)
.99 .95
Probability
.80 .50 .20 .05 .01 .001 -5 0 5Anderson-Darling Normality Test A-Squared: 0.414 P-Value: 0.269
RESI1Average: 0 StDev: 4.02569 N: 10
13 -7/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析4. 分析残差(Residual) - 散点图 Minitab Menu : Stat / Regression / Regression
13 -8/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析4. 分析残差(Residual) - 散点图 Minitab Menu : Stat / Regression / Regression
Residuals Versus the Fitted Values(response is Y)
5
Residual
0
-5 20 70 120
Fitted Value
残差的值上/下的平均值为 ‘0’, Data是Random分布的 因此残差是正规性的. 13 -9/16 LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析5. 最后画回归线 Minitab Menu : Stat / Regression / Fitted Line Plot
13 -10/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-单回归分析5. 最后画回归线 Minitab Menu : Stat / Regression / Fitted Line Plot
Regression PlotY = 4.71171 + 1.48018 X S = 4.26989140
R-Sq = 98.5 %
R-Sq(adj) = 98.3 %
120
100
80
Y60 40
Regression20
95% CI 95% PI10 20 30 40 50 60 70 80
0
X
得出结论 Lot的大小是影响生产人数(Y)的因子 因R-Sq = 98.5 %,可以定为做了相当的贡献 (一般推荐(Recommend)为R-Sq 的值为65 % 以上) 13 -11/16 LG Electronics / LGENT 6σTASK TEAM
回归分析例题-中回归分析(1)
对二个以上独立变数的回归分析虽然独立变数很多,但求函数式的基本原理与单个变数的相同。 即,找出函数式和实际值的差异. 用minitab求函数式时,选择独立变数的个数, 能得出的函数式和其分析结果。举例如下 Minitab Menu : Stat / Regression / Regression…序号 1 2 3 4 5 6 7 8 9 10 x1 4 8 9 8 8 12 6 10 6 9 x2 4 10 8 5 10 15 8 13 5 12 y 9 20 22 15 17 30 18 25 10 20
9 11
13 -12/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-中回归分析(1) 实行结果The regression equation is y = - 0.65 + 1.55 x1 + 0.760 x2 Predictor Constant x1 x2 S = 2.278 Coef SE Coef -0.651 2.908 1.5515 0.6462 0.7599 0.3968 R-Sq = 90.1% T -0.22 2.40 1.91 P 0.829 0.047 0.097
R-Sq(adj) = 87.3%
我们要找的函数式是?
Analysis of Variance Source Regression Residual Error Total 9 Source x1 x2 DF 1 1 DF SS MS 2 332.07 166.04 7 36.33 5.19 368.40 Seq SS 313.04 19.03 F 32.00 P 0.000
对各独立变数的假设检证结果是? ANOVA分析结果,对于已知的 函数式的假设
检证结果是?
Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 21.671 0.831 ( 19.706, 23.637) ( 15.934, 27.409) LG Electronics / LGENT 6σTASK TEAM
13 -13/16
回归分析例题-中回归分析(2) 几个独立变数中找出最佳的函数式有几个独立变数时,或与从属变数有相关关系,或与从属变数没有相关关系。 但根据选择的独立变数不同,我们可以作成的函数式相当多, 如果作成的是最简单最有信赖性的函数式的话, 很容易应用在业务上。利用以下已知的data找出最好的函数式。(但,假设为线型) Minitab Menu : Stat / Regression / Stepwise…ò Å Ð º 1 2 3 4 5 6 7 8 9 10 11 12 13 x1 7 1 11 11 7 11 3 1 2 21 1 11 10 x2 26 29 56 31 52 55 71 31 54 47 40 66 68 x3 6 15 8 8 6 9 17 22 18 4 23 9 8 x4 60 52 20 47 33 22 6 44 22 26 34 12 12 y 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4
13 -14/16
LG Electronics / LGENT 6σTASK TEAM
回归分析例题-中回归分析(2) 实行结果Stepwise Regression: y versus x1, x2, x3, x4 Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15 Response is y on 4 predictors, with N = 13 Step Constant x4 T-Value P-Value x1 T-Value P-Value x2 T-Value P-Value S R-Sq R-Sq(adj) C-p 8.96 67.45 64.50 138.7 2.73 97.25 96.70 5.5 1 117.57 -0.738 -4.77 0.001 2 103.10 -0.614 -12.62 0.000 1.44 10.40 0.000 3 71.65 -0.237 -1.37 0.205 1.45 12.41 0.000 0.416 2.24 0.052 2.31 98.23 97.64 3.0 1.47 12.10 0.000 0.662 14.44 0.000 2.41 97.87 97.44 2.7 4 52.58
找出最好的函数式的方法 上面分析结果当中,我们利用S,R-Sq R-Sq(adi),C-p值找出最好的函数式。 S是函数式具有的标准偏差,值越小 越是好的函数式。 R-Sq和R-Sq(adi)是决定系数,因此 其值越大函数式越好。 C-p是所选定的独立变数+1的值, 因此与其值最近似的最好
选择最佳函数式:1)只想选择一个独立变数的时候,从分析结果可选择X4,但是在S值或者决定系数 上有问题,因此不能算是一个好的函数式;2)想选择二个独立变数的时候,可以选择X4、X1, 或者X1、X2,比较二个式子,决定系数与S没有多大的差异,但是C-p值差异很大,因为独立变数 为两个,C-p值近似3,因此可以选X1、X2比较好;3)想选择三个独立变数的时候,可以选择 X4、X1、X2;4)总体上看,选二个独立变数与三个独立变数没有多大差异,因此选择X1和X2作为 函数式是最佳的;故最终所选择的函数式如下: Y=52.58+1.47X1+0.662X2 13 -15/16 LG Electronics / LGENT 6σTASK TEAM
回归分析例题-中回归分析(2) 可能性高的函数式的几种组合相互比较时,Minitab Menu : Stat / Regression / Best Subset
Best Subsets Regression: y versus x1, x2, x3, x4 Response is y xxxx Vars R-Sq R-Sq(adj) C-p S 1234 1 67.5 64.5 138.7 8.9639 X 1 66.6 63.6 142.5 9.0771 X 2 97.9 97.4 2.7
2.4063 X X 2 97.2 96.7 5.5 2.7343 X X 3 98.2 97.6 3.0 2.3087 X X X 3 98.2 97.6 3.0 2.3121 X X X 4 98.2 97.4 5.0 2.4460 X X X X
从前面解释的方法中,独立变数一个增加 到两个的时候,决定系数值虽急增,但从 三个开始无法看其差异。 所以最佳是选择X1和X2。 对于从属变数Y和X1,X2的函数式: Y=52.6=1.47X1+0.662X2
13 -16/16
LG Electronics / LGENT 6σTASK TEAM
正在阅读:
六西格玛黑带培训教材1305-24
CloudSim - 云计算模拟09-29
教师招聘《教育学》基础精讲班讲义04-11
实验小学学校2021年教学工作计划08-22
对公司产品研发体系和管理制度进一步深化改革的意见09050606-24
农行面试自我介绍(通用3篇)03-23
2017-2022年中国阻燃剂市场产销调研及十三五投资动向研究报告(05-22
大型及超大型空分---中安空分装置介绍07-28
安全风险分级管控与隐患排查治理体系培训考试卷(四套,含答案)04-22
游石栀岩记作文800字06-18
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 黑带
- 六西格玛
- 培训教材
- 具有季节性特点的时间序列的预测
- 第03章微观经济学(11国贸双)
- 各种标牌制作方法1
- 六年级数学教学设计 数的意义
- 八年级下册英语第五单元学案
- 上海市大气中PM10浓度的统计分析
- 语文学科校本课程
- 某某公司营销总监述职报告20120105
- 臂丛神经损伤术后康复护理
- 弱电系统集成 应用 技术 方案
- 人身伤亡事故现场应急处置方案
- 1.4 采集与制作标本
- Matlab图像处理函数汇总
- 小学五年级上册数学列方程解应用题练习题(分类)
- 辽宁省大连市普兰店市第三十八中学2021届高三第一学期开学考试英语试卷
- 海参营养及人工配合饲料的研究现状
- FMEA潜在失效模式及分析标准表格模版
- 影视后期制作实习报告
- 电气照明工程预算编制
- 2011中山大学专业学位研究生入学统一考试-333-《教育综合》考试科目命题指导意见