六西格玛黑带培训教材13

更新时间:2023-05-24 19:13:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

13部 回归分析(Regression)

LGENT SIX SIGMA TASK TEAM

什么是回归分析1. 什么是回归分析 想要改善问题情况,掌握相关变量(具有连续反应值特性)之间的相互相关性,这种方法用的情况多. (有/无相互相关性,可以提供问题解决Point)

这种相关性用某种数学方程来表示及分析叫回归分析。即对从属变量 Y与独立变量X的关系用如下的数学方程式来表示. Y = a + bχ + error where, a = constant , b = slope

2. 回归方程式的种类 单纯回归分析 : Y因子和X因子各1个的情况 中回归分析 : X有2个以上的情况 曲线回归分析 : 独立变量(X)1个,从属变量(Y)1个构成的情况 (2次以上的高次函数)

3. Data收集是 ? 为了推定变动最小的偏移, 使用因子X的最低界限值到最高界限值为止的 大范围Data.

为了减少收集数据时因时间变迁所产生的潜在变量,最好是无序法来确定 X因子的水平后再做试验。 13 -1/16 LG Electronics / LGENT 6σTASK TEAM

回归方程式y不能说明的 变动误差项 SSE

(xi, yj)

y = a + bx

总变动 (SST)

y

能够说明的变动 (回归引起的变动) SSR

xi· a = y - bx· b =

x

S (xy ) S (xx )

Σ xy = Σ x 13 -2/162

Σ xΣ y

n(Σ x )2

nLG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析根据Lot大小(X)预测生产人数(Y) ,利用Random(随机法)抽出数据进行回归分析.

1. 首先画Graph Minitab Menu : Graph / PlotX 10 20 30 40 40 50 60 60 70 80 Y 20 29 50 60 70 85 90 95 109 120

可以大致推测两个变量的关系在一条直线上. 13 -3/16 LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析2. 进行回归分析 Minitab Menu : Stat / Regression /Regression

为了将Fit / Residual保存在Data窗里

为了判断Fitting方程式恰当与否而使用

13 -4/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析

Regression Analysis: Y versus X

The regression equation is Y = 4.71 + 1.48 XPredictor Constant X S = 4.270 Coef 4.712 1.48018 SE Coef 3.242 0.06408 T 1.45 23.10 P 0.184 0.000

R-Sq = 98.5%

R-Sq(adj) = 98.3%

Analysis of Variance Source Regression Residual Error Total DF 1 8 9 SS 9727.7 145.9 9873.6 MS 9727.7 18.2 F 533.55 P 0.000

Fits 是从因子各个测定Data开始,通过回归方程式的计算,随着X的实测值的 Y的推测值. Y = 4.71 + 1.48X Residual(残差)的Error表示是 实际反应值上,把预想的反应值,从各测定值上减掉的值, 上面例题是 C3 = C2 - C4 13 -5/16 LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析3. 分析残差(Residual) - 正态性检验 Minitab Menu : Stat / Regression /Regression

13 -6/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析3. 分析残差(Residual) - 正规性检验 别的 Minitab Menu : Stat / Basic Statistics / Normalit

y TestHistogram of the Residuals(response is Y)3

Normal Probability Plot of the Residuals(response is Y)

1

Frequency

Normal Score-6 -4 -2 0 2 4 6

2

0

1

0

-1

Residual

-5

Normal Probability PlotResidual

0

5

.999

残差(Residual)是检验回归方程法是否适用 的一种Tool.其判断依据如下: 1) 残差的平均应始终为 ‘0’ 2) 残差应正态分布 3) 残差要Random分布 (不能有倾向性)

.99 .95

Probability

.80 .50 .20 .05 .01 .001 -5 0 5Anderson-Darling Normality Test A-Squared: 0.414 P-Value: 0.269

RESI1Average: 0 StDev: 4.02569 N: 10

13 -7/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析4. 分析残差(Residual) - 散点图 Minitab Menu : Stat / Regression / Regression

13 -8/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析4. 分析残差(Residual) - 散点图 Minitab Menu : Stat / Regression / Regression

Residuals Versus the Fitted Values(response is Y)

5

Residual

0

-5 20 70 120

Fitted Value

残差的值上/下的平均值为 ‘0’, Data是Random分布的 因此残差是正规性的. 13 -9/16 LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析5. 最后画回归线 Minitab Menu : Stat / Regression / Fitted Line Plot

13 -10/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-单回归分析5. 最后画回归线 Minitab Menu : Stat / Regression / Fitted Line Plot

Regression PlotY = 4.71171 + 1.48018 X S = 4.26989140

R-Sq = 98.5 %

R-Sq(adj) = 98.3 %

120

100

80

Y60 40

Regression20

95% CI 95% PI10 20 30 40 50 60 70 80

0

X

得出结论 Lot的大小是影响生产人数(Y)的因子 因R-Sq = 98.5 %,可以定为做了相当的贡献 (一般推荐(Recommend)为R-Sq 的值为65 % 以上) 13 -11/16 LG Electronics / LGENT 6σTASK TEAM

回归分析例题-中回归分析(1)

对二个以上独立变数的回归分析虽然独立变数很多,但求函数式的基本原理与单个变数的相同。 即,找出函数式和实际值的差异. 用minitab求函数式时,选择独立变数的个数, 能得出的函数式和其分析结果。举例如下 Minitab Menu : Stat / Regression / Regression…序号 1 2 3 4 5 6 7 8 9 10 x1 4 8 9 8 8 12 6 10 6 9 x2 4 10 8 5 10 15 8 13 5 12 y 9 20 22 15 17 30 18 25 10 20

9 11

13 -12/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-中回归分析(1) 实行结果The regression equation is y = - 0.65 + 1.55 x1 + 0.760 x2 Predictor Constant x1 x2 S = 2.278 Coef SE Coef -0.651 2.908 1.5515 0.6462 0.7599 0.3968 R-Sq = 90.1% T -0.22 2.40 1.91 P 0.829 0.047 0.097

R-Sq(adj) = 87.3%

我们要找的函数式是?

Analysis of Variance Source Regression Residual Error Total 9 Source x1 x2 DF 1 1 DF SS MS 2 332.07 166.04 7 36.33 5.19 368.40 Seq SS 313.04 19.03 F 32.00 P 0.000

对各独立变数的假设检证结果是? ANOVA分析结果,对于已知的 函数式的假设

检证结果是?

Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 21.671 0.831 ( 19.706, 23.637) ( 15.934, 27.409) LG Electronics / LGENT 6σTASK TEAM

13 -13/16

回归分析例题-中回归分析(2) 几个独立变数中找出最佳的函数式有几个独立变数时,或与从属变数有相关关系,或与从属变数没有相关关系。 但根据选择的独立变数不同,我们可以作成的函数式相当多, 如果作成的是最简单最有信赖性的函数式的话, 很容易应用在业务上。利用以下已知的data找出最好的函数式。(但,假设为线型) Minitab Menu : Stat / Regression / Stepwise…ò Å Ð º 1 2 3 4 5 6 7 8 9 10 11 12 13 x1 7 1 11 11 7 11 3 1 2 21 1 11 10 x2 26 29 56 31 52 55 71 31 54 47 40 66 68 x3 6 15 8 8 6 9 17 22 18 4 23 9 8 x4 60 52 20 47 33 22 6 44 22 26 34 12 12 y 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4

13 -14/16

LG Electronics / LGENT 6σTASK TEAM

回归分析例题-中回归分析(2) 实行结果Stepwise Regression: y versus x1, x2, x3, x4 Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15 Response is y on 4 predictors, with N = 13 Step Constant x4 T-Value P-Value x1 T-Value P-Value x2 T-Value P-Value S R-Sq R-Sq(adj) C-p 8.96 67.45 64.50 138.7 2.73 97.25 96.70 5.5 1 117.57 -0.738 -4.77 0.001 2 103.10 -0.614 -12.62 0.000 1.44 10.40 0.000 3 71.65 -0.237 -1.37 0.205 1.45 12.41 0.000 0.416 2.24 0.052 2.31 98.23 97.64 3.0 1.47 12.10 0.000 0.662 14.44 0.000 2.41 97.87 97.44 2.7 4 52.58

找出最好的函数式的方法 上面分析结果当中,我们利用S,R-Sq R-Sq(adi),C-p值找出最好的函数式。 S是函数式具有的标准偏差,值越小 越是好的函数式。 R-Sq和R-Sq(adi)是决定系数,因此 其值越大函数式越好。 C-p是所选定的独立变数+1的值, 因此与其值最近似的最好

选择最佳函数式:1)只想选择一个独立变数的时候,从分析结果可选择X4,但是在S值或者决定系数 上有问题,因此不能算是一个好的函数式;2)想选择二个独立变数的时候,可以选择X4、X1, 或者X1、X2,比较二个式子,决定系数与S没有多大的差异,但是C-p值差异很大,因为独立变数 为两个,C-p值近似3,因此可以选X1、X2比较好;3)想选择三个独立变数的时候,可以选择 X4、X1、X2;4)总体上看,选二个独立变数与三个独立变数没有多大差异,因此选择X1和X2作为 函数式是最佳的;故最终所选择的函数式如下: Y=52.58+1.47X1+0.662X2 13 -15/16 LG Electronics / LGENT 6σTASK TEAM

回归分析例题-中回归分析(2) 可能性高的函数式的几种组合相互比较时,Minitab Menu : Stat / Regression / Best Subset

Best Subsets Regression: y versus x1, x2, x3, x4 Response is y xxxx Vars R-Sq R-Sq(adj) C-p S 1234 1 67.5 64.5 138.7 8.9639 X 1 66.6 63.6 142.5 9.0771 X 2 97.9 97.4 2.7

2.4063 X X 2 97.2 96.7 5.5 2.7343 X X 3 98.2 97.6 3.0 2.3087 X X X 3 98.2 97.6 3.0 2.3121 X X X 4 98.2 97.4 5.0 2.4460 X X X X

从前面解释的方法中,独立变数一个增加 到两个的时候,决定系数值虽急增,但从 三个开始无法看其差异。 所以最佳是选择X1和X2。 对于从属变数Y和X1,X2的函数式: Y=52.6=1.47X1+0.662X2

13 -16/16

LG Electronics / LGENT 6σTASK TEAM

本文来源:https://www.bwwdw.com/article/qiv4.html

Top