数据挖掘课程设计

更新时间:2023-11-05 02:02:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

试验设计及数据挖掘技术课程设计

(2011年11月10日)

一、均匀设计试验方案的构造(10/每小项,共20分)

已知一试验有四个因素,他们的试验范围及因素水平见表1: 表1、因素水平表 NO. X1 X2 X3 X4 1 20 80 200 120 2 25 85 250 125 3 30 90 300 130 4 35 95 350 135 5 40 400 140 6 45 450 145 7 50 150 8 55 155 9 60 160 10 65 165 11 70 170 12 75 1、请给出12拟水平的因素水平表 NO. X1 X2 X3 X4

2、请给出12拟水平的试验方案 NO. X1 X2 X3 X4

二、回归分析建模(15分/每小项,共30分)

表2、试验方案及结果 No. 1

1 20 80 200 120 2 25 80 200 125 3 30 80 250 130 4 35 85 250 135 5 40 85 300 140 6 45 85 300 145 7 50 90 350 150 8 55 90 350 155 9 60 90 400 160 10 65 95 400 165 11 70 95 450 170 12 75 95 450 170 1 20 85 350 165 2 25 95 250 150 3 30 85 450 135 4 35 95 300 120 5 40 85 200 170 6 45 95 400 155 7 50 80 250 140 8 55 90 450 125 9 60 80 350 170 10 65 90 200 160 11 70 80 400 145 12 75 90 300 130 X1 15 X2 40 X3 25 1

X4 45 X5 160 Y 527

2 3 4 5 6 7 8 9 10 15 20 20 25 25 30 30 35 35 60 100 20 40 80 100 20 60 80 35 20 30 40 20 30 40 25 35 55 40 55 40 50 35 50 35 45 150 140 130 120 160 150 140 130 120 453 481 462 614 557 682 562 556 538 表2为一个试验的试验方案及结果,请对表2的数据进行数据中心化的回归分析建模并对所得的回归方程进行F显著性检验,要求如下:

1、用一次项加交叉项的模型建模,如有不显著项须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程及其系数进行F显著性检验。

一次模型加上交叉项模型:

Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1*X2+A7*X1*X3+A8*X1*X4+A9*X1*X5+A10*X2*X3+A11*X2*X4+A12*X2*X5+A13*X3*X4+A14*X3*X5+A15*X4*X5 参数:

N=16, M=10, B1=5, T2=1 > 回归分析结果: I=1 B=3.89295774647887

F=39453.829110832

I=2 B=-9.50704225352109E-02 F=376.478873266637 I=3 B=5.02394366197183

F=65708.1591596774

I=4 B=-6.60140845070422 F=113449.605172517 I=5 B=2.83239436619718

F=83540.5277055669

I=8 B=-.754866310160428 F=56931.8445755423 I=10 I=12

B=-3.87700534759358E-02 F=2400.11415542456 B=9.54545454545455E-02

F=3904.68750028214

剔除F2

剔除后保留的6个变量项: 回归分析结果: I=1 B=3.82584921292461 I=3 B=5.16561723280862

F=42.4793566222967 F=87.1202672010196

I=4 B=-6.45973487986744 F=136.239845488711

2

I=5 B=2.79884009942005 F=90.9365341824574

I=8 B=-.682283105022831 F=64.3454168594943 I=12

B=.143607305936073

F=16.2893368976606

R=.996608742535172

BO=557.203196347032 S=9.95102629716467

F=73.3441801574753 FO=1.54

J Y Y* Y-Y* A/% 1 527 520.371958854929 6.62804114507082 1.25769281690148 2 453 459.688956732606 -6.68895673260624 -1.47659089020005 3 481 484.602297102518 -3.60229710251843 -.748918316531899 4 462 452.668565786338 9.33143421366236 2.01979095533817 5 614 619.295396337196 -5.29539633719594 -.862442400194778 6 557 563.339306859151 -6.33930685915118 -1.13811613270219 7 682 676.098557501334 5.90144249866648 .865314149364587 8 562 561.575785089262 .424214910737533 7.54830802024079E-02 9 556 557.76766427196 -1.76766427196003 -.317925228769789 10 538 536.591511464705 1.40848853529451 .261800842991544 > 回归方程:

Y*=557.203196347032+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.682283105022831)*(X3-30)*(X4-45)+(.143607305936073)*(X1- 25)*(X5- 140) II、对方程各项进行F检验 f1= 1, f2= M-2=10-2=8

F12=16.289>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。 III、对整个方程(或者总方程)进行F检验 f1=N*-1=6, f2=M-N*=10-6=4

F= 73.34 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

3、二次全模型(一次项,二次项加上交叉项)建模,如有不显著须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程其系数进行F显著性检验。 二次全模型(一次项,二次项加上交叉项)建模:

3

Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1^2+A7*X2^2+A8*X3^2+A9*X4^2+A10*X5^2+A11*X1*X2+A12*X1*X3+A13*X1*X4+A14*X1*X5+A15*X2*X3+A16*X2*X4+A17*X2*X5+A18*X3*X4+A19*X3*X5+A20*X4*X5 参数:

N=21, M=10, B1=5, T2=2 剔除后保留的6个变量项: > 回归分析结果: I=1 B=3.82584921292461 I=3 B=5.16561723280862

F=86.7697973506949 F=177.954859283416

I=4 B=-6.45973487986744 F=278.288202179139 I=5 B=2.79884009942005 I=10 I=13

F=185.750097699096

B=-.131901408450704 F=36.4010641102972 B=-1.20464788732394 F=151.811777236324

F=150.336666495772

R=.99834120225772 S=6.96261766428546

BO=581.62676056338 FO=1.54

J Y Y* Y-Y* A/% 1 527 520.756420878211 6.24357912178937 1.18473987130728 2 453 459.164871582436 -6.16487158243575 -1.3608988040697 3 481 482.907622203811 -1.90762220381117 -.396595052767395 4 462 456.721623860812 5.27837613918803 1.14250565783291 5 614 617.076636288318 -3.07663628831824 -.501080828716326 6 557 561.120546810273 -4.12054681027348 -.739775010821092 7 682 680.151615575808 1.8483844241922 .271024109119092 8 562 559.881110190555 2.11888980944468 .377026656484819 9 556 557.24357912179 -1.24357912178971 -.223665309674408 10 538 536.975973487987 1.02402651201317 .190339500374194 > 回归方程:

Y*=581.62676056338+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.131901408450704)*(X5-140)^2+(-1.20464788732394)*(X3- 30)*(X4- 45) II、对方程各项进行F检验

4

f1= 1, f2= M-2=10-2=8

F10=36.40>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。 III、对整个方程(或者总方程)进行F检验 f1=N*-1= 6, f2=M-N*=10-6=4

F= 41.05093 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

三、优化计算寻优(10分/每小项,其20分)

一个试验的试验范围及所得的数学模型(回归方程)如下:

Y = 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2 -5.2094E-03*(X2- 3)*(X3- 800)

X1:20~40;X2:2.0~4.0;X3:700~900,实验得到的最大值为Y= 90.2 1、用网格优化法寻优求Y的最大值,给出相应的程序及优化结果 程序 :

10 INPUT\20 INPUT\

30 S1=(40-20)/G:S2=(4!-2!)/G:S3=(900-700)/G 40 FOR X1= 20 TO 40 + S1/2 STEP S1 50 FOR X2= 2! TO 4! + S2/2 STEP S2 60 FOR X3= 700 TO 900 + S3/2 STEP S3

70 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2 80 Y2= -5.2094E-03*(X2- 3)*(X3- 800) 90 Y=Y1+Y2

100 D1=ZM-.2:D2=ZM+.2

110 IF Y< D1 OR Y>D2 THEN 140

120 PRINT tab(1) \130 PRINT tab(47)\140 NEXT X3, X2,X1 150 END 运行结果:

5

本文来源:https://www.bwwdw.com/article/nfa2.html

Top