第三部分 试验设计与数据分析方法

更新时间:2023-11-30 21:58:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第三部分 试验设计与数据分析方法

对于化工、化学、制药、生物、材料等学科专业,经常要通过实验与观测来找寻研究对象的变化规律,通过对规律的研究来达到各种目的,如提高产量、提高性能、降低各类消耗等。通过科学的试验设计,能够用较少的试验次数达到预期的试验目的,大大节省人力和物力的消耗;随之进行合理的分析和处理伴随试验过程所产生的大量数据,才能获得研究对象的变化规律,达到科研和生产的目的。本章在《分析化学》的基本实验数据处理的基础上,重点介绍最常用的正交试验设计法和正交实验数据的两种基本分析方法:极差分析法、方差分析法。 一、正交试验设计

在科学研究和工业生产实践中往往需要考虑众多影响因素,需要研究多个因子对试验指标值的效应。通常因素的水平数常多于2个,尽管多因素完全方案可以综合研究各因子的简单效应、主效应及因子间的交互效应,但是,当试验因子数增多或因子的水平数增加时,往往会使试验方案的规模过大而难以全面实施,当各因素的水平数相同,均为m时,因素数k与试验次数n的关系为n=m,例如对于3因素4水平的试验如果进行每个因素的每个水平均进行水平组合进行全面试验至少要做4=64次试验,如果是5因素4水平的试验,进行全面试验至少为4=1024次试验,随着因素数的增加,试验次数增加的更快,同时带来大量的待分析试验数据。

实践证明,正交试验设计(简称正交设计)就是在保证因素水平搭配均衡的前提下,利用已经制成的一系列正交表从完全方案中选出若干个处理组合以构成部分实施方案,从而减小试验规模,并保持效应综合可比之特点。在实际操作中,通过利用正交表科学安排设计试验,在不影响全面了解对象中诸多因素对其性能指标影响的条件下,大大减少试验次数,同时也减少了统计分析的工作量,达到了提高试验效率的目的。 1. 正交表类型和特点 (1) 正交表的格式

在正交试验设计中,常把正交表写成表格的形式。为使用方便,便于记忆,正交表的名称一般简记为

Ln(m1×m2×…×mk),

其中L为正交表代号,n代表正交表的行数或试验处理组合数,即利用该正交表安排试验时,应实施的试验处理组合数;m1×m2×…×mk表示正交表共有k列(最多可安排的因素数),每列的水平数分别为m1,m2,…,

5

3

kmk。任何一个名为Ln(m1×m2×…×mk)的正交表都有一个对应的表格,用于安排试验方案和分析试验结果。

(2) 正交表的类型

正交表是一种特殊的表格,它是正交设计中安排实验和分析测试结果的基本工具,可分为两种表格,分别是等水平正交表、混合水平正交表。 ① 等水平正交表

在Ln(m1×m2×…×mk)中,若m1=m2=…=mk,则称为等水平正交表,简记作Ln(m),其中L为正交表代号,

kn为正交表横行数(需要做的试验次数),m为水平数,k为因素数正交表纵列数(能安排的最多因素数)。

常用的等水平正交表如下:

二水平正交表:L4(2),L8(2),L16(2),… 三水平正交表:L9(3),L27(3),L81(3),… 四水平正交表,L16(4),L64(4),… 五水平正交表:L25(5),L125(5),… 如表3-1是一个常用的等水平正交表。

表3-1 正交表L9(3)

试验号 1 2 列号 1 1 1 2 1 2 3 1 2 4 1 2 4

6

31

5

21

4

13

41

3

7

15

3 4 5 6 7 8 9

1 2 2 2 3 3 3 3 1 2 3 1 2 3 3 2 3 1 3 1 2 3 3 1 2 2 3 1 表3-1中L9(3)表示4因素3水平试验,按照正交表设计试验次数为9次,如果进行全面试验至少要做64次,可见正交设计大大减少了试验次数。 ② 混合水平正交表

表3-2 正交表L8(4×2)

试验号 1 2 3 4 5 6 7 8 列号 1 1 1 2 2 3 3 4 4 2 1 2 1 2 1 2 1 2 3 1 2 1 2 2 1 2 1 4 1 2 2 1 1 2 2 1 5 1 2 2 1 2 1 1 2 k1

k21

4

4

在Ln(m1×m2×…×mk)中,若m1,m2,…,mk不完全相等,则称为混合水平正交表。其中最常用的是Ln(m1m2)型混合水平正交表。其中m1表示,水平数为m1的有k1列;m2表示,水平数为m2的有k2列。用这类正交表安排试验时,水平数为m1的因素最多可安排k1个,水平数为m2的因素最多可安排k2个。

科学实践中,由于实验条件所限,某因素不能多取水平;有时需要重点考察的因素可多取水平,而其他因素水平数可适当减少。混合正交表正是用来设计该类试验的,即各因素的水平数不完全相同的正交表。表3-2是一张混合水平正交表,此表最多可安排4水平因素1个和2水平因素4个。常用的混合水平正交表有:L8(4×2),L16(4×2),L16(4×2),L16(4×2)。 2、正交表的基本性质

由正交表的定义可以得出,它具有下列性质: (1) 正交性

正交表的正交性主要表现在:① 任一列中各元素(即水平)出现次数相等;② 任何两列的同行元素构成的元素对为一个“完全对”,且每种元素对出现次数相同。

由正交表的正交性可以看出:① 正交表各列的地位平等,表中各列之间可以相互置换,称为列置换;② 正交表的各行之间也可相互置换,称为行置换;③ 正交表的同一列的水平间也可以相互置换,称为水平置换。上述三种置换称为正交表的三种初等变换。经过初等变换得到的正交表称为原正交表的等价表。实际应用时,可根据不同试验的要求,把一个正交表变换成与之等价的其他变换形式。 (2) 代表性

① 由于正交表的任一列的不同水平都会出现,试验中包含了所有因素的所有水平;同时,由于正交表的任何两列的所有水平都出现,且相互配合,使得对任意两个因素的所有水平信息及任2个因素间的组合信息

1

4

12

9

4

3

k1k2无一遗漏。因此,尽管用正交表安排的是部分试验方案,但却能了解到全面试验的情况,在这个意义上说,正交试验可以代表全面试验。

② 由于正交表的正交性,正交试验的试验点(处理组合)必然均衡地分布在全面试验之中,因而具有很强的代表性。所以,由部分试验寻找的最优条件与全面试验所寻找的最优条件,应该有一致的趋势。 (3) 综合可比性

由于正交表的正交性,使得任意因素的不同水平具有相同的试验条件,这就保证了在每列因素的各个水平的效应中,最大限度地排除了其他因素的干扰,从而可以综合比较该因素不同水平对试验指标值的影响,把这种特性称为综合可比性。

不可否认正交试验作为部分实施试验,相对于全面实施试验来说,具有减少处理组合数,缩小试验规模,提高试验效率的优点。但是,正交设计也有其不足的一面,如果设计不当,会出现某些因素效应与其他因素的交互效应相混杂的问题。解决该问题的办法是在正交设计中通过巧妙的表头设计,可以达到避免重要因素的效应与重要的交互效应相互混杂的目的。 3. 正交试验设计的基本步骤

正交试验设计总的来说包括两部分:一是实验设计,二是数据处理。基本步骤可简单归纳如下。 (1) 明确实验目的,确定评价指标

任何一个试验都是为了解决某一个问题,或是为了得到某些结论而进行的,所以任何一个正交试验都应该有一个明确的目的,这是正交试验设计的基础。如产品的产量、纯度等试验指标是通常用来表示实验结果特性的值,常常用它来衡量或考核试验效果。 (2) 确定因素和水平

影响试验指标的因素很多,试验因素的选择首先要根据专业知识与以往的研究经验,尽可能全面考虑到影响试验指标的诸因素。然后根据试验要求和尽量少选因素的原则,选出主要因素,略去次要因素,以减少要考察的因素。如果对问题了解不够,可以适当多取一些因素。确定因素的水平时,尽可能使因素的水平数相等,以方便试验数据处理。最后列出因素水平表。

在实际工作中,应根据专业知识和有关资料,尽可能把水平设置在最佳区域或接近最佳区域。如果经验或资料不足,不能保证把因素水平定在最佳区域附近,就需要把水平尽量拉开,尽可能使最佳区域包含在拉开的区间内。然后通过1~2套试验,逐步缩小水平范围,以便寻找出最佳区域。 (3) 选择适当的正交表

根据因素数和水平数来选择合适的正交表。一般要求,因素数≤正交表列数,因素水平数与正交表对应的水平数一致,在满足上述条件的前提下,选择较小的表。例如,对于4因素3水平的试验,满足要求的表有L9(3),L27(3)等,一般可选择L9(3),但是如果要求精度高,并且试验条件允许,可以选择较大的表。表头设计就是将试验因素安排到所选正交表相应的列中。 (4) 明确试验方案进行试验,对试验结果进行统计分析

根据正交表和表头设计确定每套试验的方案,然后进行试验,得到以试验指标形式表示的试验结果。对正交试验结果的分析,通常采用两种方法:一种是极差分析法(或称直观分析法);另一种是方差分析法。通过试验结果分析可以得到因素主次顺序、优方案等有用信息。 (5) 进行验证试验,作进一步分析

优方案是通过统计分析得出的,还需要进行试验验证,以保证优方案与实际一致,否则还需要进行新的正交试验。

二、正交实验数据分析方法 1. 正交实验设计结果的极差分析法 (1) 单指标正交实验设计结果的极差分析法

极差分析法又称直观分析法,它具有计算简便、直观形象、简单易懂等优点,是正交试验结果常用的分析方法,极差分析法简称R法。根据实验指标的个数,可把正交试验设计分为单指标试验设计与多指标试验设计,下面通过例子说明如何用正交表进行单指标正交设计,以及如何对试验结果进行极差(直观)

4

13

4

分析。

例3.1 以合成某有机化合物的产率为试验指标。该有机化合物的合成主要影响因素为反应温度、时间及催化剂,现对其合成工艺进行优化,以提高产率。根据前期条件试验,确定的因素与水平如表3-3所示,假定因素间无交互作用。

表3-3 例3.1的因素水平表

水平 1 2 3 (A)温度/℃ 100 80 60 (B)反应时间/h 3 1 5 (C)催化剂种类 甲 乙 丙 注意:为了避免人为因素导致的系统误差,因素的各水平哪一个定为1水平、2水平、3水平,最好不要简单地完全按因素水平数值由小到大或由大到小的顺序排列,应按“随机化”的方法处理,例如用抽签的方法,将3 h定为B1,1 h定为B2,5 h定为B3。

解:本题中试验的目的是提高产品的产率,试验的指标为单指标产率,因素和水平 是已知的,所以可以从正交表的选取开始进行试验设计和极差分析。

① 选正交表。本例是一个3水平的试验,因此要选用Ln(3)型正交表,本例共有3个因素,且不考虑因素间的交互作用,所以要选一张m≥3的表,而L9(3)是满足条件m≥3最小的Ln(3)型正交表,故选用正交表L9(3)来安排试验。

② 表头设计。本例不考虑因素间的交互作用,只需将各因素分别安排在正交表L9(3)上方与列号对应的位置上,一般1个因素占有一列,不同因素占有不同的列(可以随机排列),就得到所谓的表头设计(见表3-4)。

表3-4 例3.1的表头设计

因素 列号 A 1 空列 2 B 3 C 4 4

4

4

m

m不放置因素或交互作用的列称为空白列(简称空列),空白列在正交设计的方差分析 中也称为误差列,一般最好留至少一个空白列。

表3.5 例3.1的试验方案

试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 空列 1 2 3 1 2 3 1 2 3 B 1 2 3 2 3 1 3 1 2 C 1 2 3 3 1 2 2 3 1 试验方案 A1B1C1 A1B2C2 A1B3C3 A2B2C3 A2B3C1 A2B1C2 A3B3C2 A3B1C3 A3B2C1 ③ 明确试验方案。完成了表头设计之后,只要把正交表中各列上的数字1,2,3分别看成是该列所填因素在各个试验中的水平数,这样正交表的每一行就对应着一个试验方案,即各因素的水平组合,如表3-5所示。注意,空白列对试验方案没有影响。

例如,对于5号试验,试验方案为A2B3C1,它表示反应条件为:温度80℃、时间5 h、催化剂甲。 ④ 按规定的方案做试验,得出试验结果。按正交表的各试验号中规定的水平组合进行试验,本例总共要做

9个试验,将试验结果(指标)填写在表的最后一列中,如表3.6。

在实施实验中注意以下事项:第一,严格按照规定的方案完成每一号试验,即使其中有某号试验事先根据专业知识可以肯定其试验结果不理想,但仍然需要认真完成该号试验;第二,试验进行的次序没有必要完全按照正交表上试验号码的顺序,可按抽签方法随机决定试验进行的顺序,事实上,把试验顺序打“乱”,有利于消除实验误差干扰,以及外界条件所引起的系统误差等不利影响;第三,试验条件的控制力求做到十分严格,尤其是在水平的数值差别不大时。例如在本例中,因素A的A1=100℃,A2=80℃,B3=60℃,温度差别不大,如果控制不好就将使这个试验失去正交试验设计的特点,使后续的结果分析丧失了必要的前提条件,而得不到正确的结论。

表3.6 例3.1试验方案及实验结果分析

试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 1.79 2.64 1.92 0.597 0.880 0.640 0.85 空列 1 2 3 1 2 3 1 2 3 2.09 2.23 2.03 0.697 0.743 0.677 0.20 B 1 2 3 2 3 1 3 1 2 1.95 2.30 2.10 0.650 0.767 0.700 0.35 ABC A2B2C2 C 1 2 3 3 1 2 2 3 1 2.02 2.28 2.05 0.673 0.760 0.683 0.26 产率 0.50 0.75 0.54 0.91 0.88 0.85 0.68 0.60 0.64 K1 K2 K3 k1 k2 k3 极差R 因素主次 优方案 ⑤ 计算级差,确定因素的主次顺序。首先解释表3-6中引入的三个符号。

Ki:表示任一列上水平号为i(本例中i=1,2或3)时所对应的试验结果之和。例如,在表3-6中,在C

因素所在的第4列上,第1,5,9号试验中C取C1水平,所以K1为第1,5,9号试验结果之和,即K1=0.50+0.88+0.64=2.02;第3,5,7号试验中B取B3水平,所以K3为第3,5,7号试验之和,即K3=0.54+0.88+0.68=2.10;同理可以计算出其他列中的Ki,结果如表3-6所示。

ki = Ki/s,其中s为任一列上各水平出现的次数,所以ki表示任一列上因素取水平i时所得试验结果的算

术平均值。例如,在本例中s=3,在B因素所在的第3列中,k1=1.95/3=0.650,k2=2.30/3=0.767,

k3=2.10/3=0.700。同理可以计算出其他列中的ki,结果如表3-6所示。

R:称为极差,在任一列上R={K1,K2,K3}max-{K1,K2,K3}min,或R={k1,k2,k3}max-{k1,k2,k3}min。例如,在第3

列上,最大的Ki为K2(=2.30),最小的Ki为K1(=1.95),所以R=2.30-1.95=0.35,或R=0.767-0.650=0.117。

通常各列的极差是不相等的,这说明各因素的水平改变对试验结果的影响是不相同的,极差越大,表示该列因素的数值在试验范围内的变化,会导致试验指标在数值上有更大的变化,所以极差最大的那一列,就是因素的水平对试验结果影响最大的因素,即最主要的因素。在本例中,由于RA>RB>RC,所以各因素从主到次的顺序为:A(温度),B(反应时间),C(催化剂种类)。

当极差计算显示空白列的极差比其他所有因素的极差还要大,说明因素之间可能存在不可忽略的交互作用,

或者漏掉了对试验结果有重要影响的其他因素。所以,在进行结果分析时,尤其是对所做的试验没有足够的认知时,最好将空白列的极差一并计算出来,从中也可以得到一些有用信息。

⑥ 通过极差确定优方案。优方案是指在所做的试验范围内,各因素较优的水平组合。在选择确定时,各因素优水平的确定与试验指标有关,若指标越大越好,则应选取使指标大的水平,即各列Ki(或ki)中最大的那个值对应的水平;反之,若指标越小越好,则应选取使指标小的那个水平。

在本例中,试验指标是产率,指标越大越好,所以应挑选每个因素的K1,K2,K3(或k1,k2,k3)中最大的值对应的那个水平,由于:

A因素列:K2>K3>K1 B因素列:K2>K3>K1 C因素列:K2>K3>K1

所以优方案为A2B2C2,即反应温度80℃,反应时间1 h,催化剂为乙。

在实际确定优方案时,还应区分因素的主次,对于主要因素,一定要按有利于指标的要求选取最好的水平,而对于不重要的因素,由于其水平改变对试验结果的影响较小,则可以根据有利于降低消耗、提高效率等目的来考虑别的水平。例如,本例的C因素的重要性排在末尾,因此,假设丙种催化剂比乙种催化剂更廉价、易得,则可以将优方案中得C2换为C3,于是优方案就变为A2B2C3,这正好是正交表中的第4号试验,它是已做过的9个试验中产率最高的试验方案,也是比较好的方案。

本例中,通过极差分析得到的优方案A2B2C2,并不包含在正交表中已做过的9个试验方案中,这正体现了正交试验设计的优越性。

⑦ 进行验证试验,作进一步的分析。上述优方案是通过理论分析得到,但它实际上是不是真正的优方案还需要作进一步的验证。首先,将优方案A2B2C2与正交表中最好的第4号试验A2B2C3作对比试验,若方案A2B2C2比第4号试验结果更好,通常就可以认为A2B2C2是真正的优方案,否则第4号试验A2B2C3就是所需的优方案。若出现后一种情况,一般来说可能是没有考虑交互作用或者试验误差较大所引起的,需要作进一步的研究,可能还有提高试验指标的潜力。

上述优方案是在给定的因素和水平的条件下得到的,若不限定给定水平,有可能得到更好的试验方案,所以当所选的因素和水平不恰当时,该优方案也有可能达不到试验的目的,不是真正意义上的优方案,这时就应该对所选的因素和水平进行适当的调整,以找到新的更优方案。我们可以将因素水平作为横坐标,以它的实验指标的平均值ki为纵坐标,画出因素与指标的关系图—趋势图。

在画趋势图时要注意,对于数量因素(如本例中的温度和时间),横坐标上的点不能按水平号顺序排列,而应按水平的实际大小顺序排列,并将各坐标点连成折线图,这样就能从图中很容易地看出指标随因素数值增大时的变化趋势;如果是属性因素(如本例中的催化剂种类),由于不是连续变化的数值,则可不考虑横坐标顺序,也不用将坐标点连成折线。

图3-1 例3.1的趋势图

从图3-1也可以看出,反应温度A2=80℃,时间B2=2 h,选用乙种催化剂(C2)时产率最高,即优方案为A2B2C2。从趋势图还可以看出:酯化时间并不是越长越好,当酯化时间少于3 h时,产品的乳化能力有随反应时间减少而提高的趋势,所以适当的减少时间也许会找到更优的方案。因此根据趋势图可以对一些重要因素的水平作适当调整,选取更优的水平,再安排一批新的试验。新的正交试验可以只考虑一些主要因素,次要因素则可固定在某个较好的水平上,另外还应考虑漏掉的交互作用或重要因素,所以新一轮正交试验的因素数和水平将会更合理,也会得到更优的试验方案。 极差分析属于直观分析,其缺点是无法对因素效应作显著性检验。 (2)多指标正交试验设计及其结果的极差分析

在实际生产和科学试验中,多指标的试验设计及结果分析是很常见的方法,因为整个试验结果的评判往往多于一个指标,并且不同指标的重要程度常常是不一致的,各因素对不同指标的影响程度也不完全相同,所以多指标试验的结果分析相对复杂一些。下面介绍两种解决多指标正交试验的分析方法:综合平衡法和综合评分法。

① 综合平衡法(指标单个分析综合处理法)

多指标试验结果直观分析时,对每一个试验结果单个进行直观分析,得到每个指标的影响因素的主次顺序

和最佳水平组合,然后根据相关的专业知识、试验的目的和试图解决的实际问题综合分析,得出较优方案,这种方法称为综合平衡法(也称为指标单个分析综合处理法)。

例3.2 现代药理学研究表明,红景天具有抗心律失常、调节免疫功能、镇静、抗疲劳、抗缺氧、抗衰老、抗癌等作用。其化学成分中,红景天苷及其苷元酪醇是红景天主要有效成份,也是评价红景天及其提取物的最重要指标。红景天有效成分的提取主要以醇提法和水提法为主,而以醇提法尤佳。分别考察浸膏得率、红景天苷和酪醇含量, 三个指标都是越大越好,根据前期预研试验,决定选取3个相对重要的因素:乙醇浓度、加醇量(倍数)和提取时间进行正交试验,它们各有3个水平,具体如下表3-7,不考虑因素间相互作用,试分析找出较好的提取工艺。

表3-7 例3.2因素水平表

水 平 1 2 3 因 素 (A)乙醇浓度% 90 70 80 (B)加醇量(倍) 7 6 8 4

(C)提取时间(h) 1 2 3 解:这是一个3因素3水平的试验,由于不考虑交互作用,所以可利用L9(3)正交试验筛选醇提取红景天最佳工艺条件,较全面的优选红景天醇提工艺条件,为新药研究和充分利用红景天药材资源提供参考依据。 表头设计、试验方案及试验结果如表3-8所示。

表3-8 例3.2试验方案及试验结果

试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 B 1 2 3 1 2 3 1 2 3 空列 1 2 3 2 3 1 3 1 2 C 1 2 3 3 1 2 2 3 1 浸膏得率/% 6.2 7.4 7.8 8.0 7.0 8.2 7.4 8.2 6.6 红景天苷含量/% 5.1 6.3 7.2 6.9 6.4 6.9 7.3 8.0 7.0 苷元酪醇含量/% 2.1 2.5 2.6 2.4 2.5 2.5 2.8 3.1 2.2 与单指标试验的分析方法相同,先对各指标分别进行直观分析,得出因素的主次和优方案(结果如表3-9所示)。由表3-9可以看出,对于不同的指标而言,不同因素的影响程度是不一样的,所以将3个因素对3个指标影响的重要性的主次顺序统一起来是行不通的。

不同指标所对应的优方案也是不同的,但是通过综合平衡法可以得到综合的优方案。具体平衡过程如下: 因素A:对于后两个指标都是取A3好,而且对于红景天苷含量,A因素是最主要的因素,在确定优水平是应重点考虑;对于浸膏得率则是取A2好,而且从极差可以看出,A为较次要的因素。所以根据多数倾向和A因素对不同指标的重要程度,先取A3。

因素B:对于浸膏得率,取B2或B3基本相同,对于红景天苷含量取B3好,对于苷元酪醇含量则是取B2;另外,对于这三个指标而言,B因素都是处于末位的次要因素,所以B取哪一个水平对3个指标的影响都比较小,这时可以本着降低消耗的原则,选取B2,以减少溶剂耗量。 因素C:对3个指标来说,都是以C3为最佳水平,所以取C3。

表3-9 例3.2试验结果分析

指标 浸膏得率/% A B 21.6 22.6 空列 22.6 22.0 C 19.8 23.0 K1 K2 21.4 23.2 K3 k1 k2 k3 极差R 因素主次 优方案 22.2 7.13 7.73 7.40 1.8 22.6 7.20 7.53 7.53 1.0 CAB 22.2 7.53 7.33 7.40 0.6 24.0 6.60 7.67 8.00 4.2 C3A2B3或C3A2B3 18.6 20.2 22.3 6.20 6.73 7.43 3.7 19.3 20.7 21.1 6.43 6.90 7.03 1.8 CAB A3C3B3 7.2 7.4 8.1 2.40 2.47 2.70 0.9 7.3 8.1 7.3 2.43 2.70 2.43 0.8 CAB C3A3B3 7.7 7.1 7.9 2.57 2.37 2.63 0.8 6.8 7.8 8.1 2.27 2.60 2.70 1.3 20.0 20.2 20.9 6.67 6.73 6.97 0.7 18.5 20.5 22.1 6.17 6.83 7.37 3.6 K1 K2 K3 k1 红景天苷 含量/% k2 k3 极差R 因素主次 优方案 K1 K2 K3 k1 苷元酪醇 含量/% k2 k3 极差R 因素主次 优方案 综合上述的分析,优方案为A3B2C3,即乙醇浓度80%、加醇量6(倍数)和提取时间3 h。

在使用综合平衡数据分析是依据以下四条原则:第一,当某个因素对某个指标是主要因素,但对另外的指标则可能是次要因素,在确定该因素的优水平时,就应选取作为主要因素时的优水平;第二,若某因素对各指标的影响程度相差不大,可按“少数服从多数”的原则,选取出现次数较多的优水平;第三,当因素各水平相差不大时,依据降低消耗,提高效率原则选取合适水平;第四,若各试验指标的重要程度不同,则在确定因素优水平时应首先满足相对重要的指标。在具体运用这几条原则时,将以上几条原则要综合分析考虑才可得出结论。

可见,综合平衡法要对每一个指标单独进行分析,分析工作量较大。实际工作中,多指标的综合平衡有时是比较困难的,仅仅依据数学的分析往往得不到正确的结果,还必须结合专业知识和经验才能得出符合实际的优方案。 ② 综合评分法

所谓综合评分,就是对多指标一一进行测试后,按照具体情况根据各个指标的重要程度确定评分标准,对这些指标进行综合评分,将多指标综合转化为单指标,从而得到多指标试验的结论。利用单指标试验结果的直观分析法作进一步的分析,确定较好的试验方案,下面介绍几种评分方法。

排队综合评分法:先对每号试验的每个指标按一定的评分标准评出分数,若各指标的重要性是一样的,可以将同一号试验中各指标的分数的总和作为该号试验的总分数。排队综合评分法是应用比较广的一种方法,它不仅用于多指标试验,也可用于某些定性的单指标试验。如机器产品的外观、颜色,轻工产品的色、香、味等特性,只能通过手摸、眼看、鼻嗅、耳听、口尝来评定等。这些定性指标的定量化,往往也可利用该

法处理。

公式综合评分法:对每号试验结果的各个指标统一权衡,综合评价,直接给出每一号试验结果的综合分数。 加权综合评分法:先对每号试验的每个指标按一定的评分标准评出分数,若各指标的重要性不相同,此时要先确定各指标相对重要性的权数,然后求加权和作为该号试验总分数。

对于另外两种评分方法,最关键的是如何对每个指标评出合理的分数。如果指标是定性的,则可以依靠经验和专业知识直接给出一个分数,这样非数量化的指标就转换为数量化指标,使结果分析变得更容易;对于定指标,有时指标本身就可以作为分数,如回收率、纯度等;但不是所有的指标值本身都能作为分数,这时就可以使用“隶属度”来表示分数,隶属度的计算方法见例3.3。

例3.3 玉米淀粉改性制备高取代度的三乙酸淀粉酯的试验中,需要考察两个指示,即取代度和酯化率,这两个指标都是越大越好,试验的因素和水平如表3-10所示,不考虑因素之间的交互作用,试验目的是为了找到使取代度和酯化率都高的试验方案。

表3-10 例3.3因素水平表

水平 1 2 3 (A)反应时间/h 3 4 5 (B)吡啶用量/g 150 90 120 4(C)乙酸酐用量/g 100 70 130 解:这是一个3因素3水平的试验,由于不考虑交互作用,所以可选用正交表L9(3)来安排实验。表头设计、试验方案及试验结果如表3-11所示。

本例中有两个指标:取代度和酯化率,这里将两个指标都转换成它们的隶属度,用隶属度来表示分数。隶属度的计算方法如下:

(3-1)

表3-11 例3.3试验方案及试验结果

试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 1.47 1.01 1.60 B 1 2 3 2 3 1 3 1 2 1.59 1.04 1.45 0.55 空列 1 2 3 3 1 2 2 3 1 1.68 1.09 1.31 0.59 C 1 2 3 3 1 2 2 3 1 2.34 0.48 1.26 1.86 CAB C1A3B1 取代数 2.96 2.18 2.45 2.70 2.49 2.41 2.71 2.42 2.83 酯化率 /% 65.70 40.36 54.31 41.09 56.29 43.23 41.43 56.29 60.14 取代度 隶属度 1.00 0 0.35 0.67 0.40 0.29 0.68 0.31 0.83 酯化率 隶属度 1 0 0.55 0.03 0.63 0.11 0.04 0.63 0.78 综合分 1.00 0 0.47 0.29 0.54 0.18 0.30 0.50 0.80 k1 k2 k3 极差R 0.59 因素主次 优方案 可见,指标最大值的隶属度为1,而指标最小值的隶属度为0,所以0≤指标隶属度≤1。如果各指标的重要性一样,就可以直接将各指标的隶属度相加作为综合分数,否则求出加权和作为综合分数。

本例中的两个指标的重要性不一样,根据实际要求,取代度和酯化率的权重分别取0.4和0.6,于是每号试验的综合分数=取代度隶属×0.4 + 酯化率隶属度×0.6,满分为1.00。评分结果和以综合分数作为总

指标进行的直观分析如表3-11所示。可以看出,这里分析出来的优方案C1A3B1,不包括在已经做过的9个试验中,所以应该按照这个方案做一次验证试验,看是否比正交表中1号试验的结果更好,从而确定真正最好的试验方案。

可见,综合评分法是将多指标的问题,通过适当的评分方法,转换成了单指标的问题,使结果的分析计算变得简单方便。但是,结果分析的可靠性,主要取决于评分的合理性,如果评分标准、评分方法不适合,指标的权数不恰当,所得到的结论就不能反映全面情况,所以如何确定合理的评分标准和各指标的权数,是综合评分的关键,它的解决有赖于研究者的专业知识、经验和实际试验本身的要求,单纯从数学上是无法解决的。

在实际应用中,如果遇到多指标的问题,究竟是采用综合平衡法,还是综合评分法,要视具体情况而定,有时可以将两者结合起来,以便比较和参考。 (3)有交互作用的正交试验设计及其结果的直观分析

在许多试验中不仅要考虑各个因素对试验指标起作用,还要考虑因素间的交互作用对试验结果的影响。 ① 交互作用的判别

下面说明如何判别因素间的交互作用。

表3-12 判别交互作用试验数据表(1) 因 素 B1 B2 A1 10 30 A2 20 15 表3-13 判别交互作用试验数据表(2) 因 素 B1 B2

图3-2 有交互作用 图3-3 无交互作用

设有两个因素A和B,它们各取两个水平A1,A2和B1,B2,这们A,B共有4种水平组合,在每种组合下各做一次试验,试验结果如表3-12。

当B=B1时,A由A1变到A2使试验指标增加10,当B=B2时,A由A1变到A2使试验指标减少15,可见因素A由A1变到A2时,试验指标变化趋相反,与B取哪一个水平有关;类似地,当因素B与B1变到B2时,试验指标变化趋也相反,与A取哪一个水平有关,这时,可以认为A与B之间有交互作用。如果将表3-12中的数据描述在图3-2中,可以看到两条直线是明显相交的,这是交互作用很强的一种表现。

表3-13和图3-3给出了一个无交互作用的例子,由表中可以看出,A或B对试验指标的影响与另一个因素取哪一个水平无关;在图3-3中两直线是互相平行的,但是由于试验误差的存在,如果两直线近似相互平行,也可以认为两因素间无交互作用,或交互作用可以忽略。 ② 有交互作用的正交试验设计及其结果的直观分析

例3.4 用石墨炉原子吸收分光光度法测定食品中的铅,为提高测定灵敏度,希望吸光度大。为提高吸光度,对A(灰化温度/℃)、B(原子化温度/℃)和C(灯电流/mA)3个因素进行了考察,并考虑交互作用A×B、A×C,各因素及水平见表3-14。试进行正交试验,找出最优水平组合。

表3-14 例3.4因素水平表

A1 10 20 A2 20 30

水 平 1 2 解:ⅰ.选表

A 300 700 B 1800 2400 C 8 10 这是一个3因素2水平的试验,但还有两个交互作用,在选正交表时应将交互作用看成因素,所以本例应按照5因素2水平的情况来选正交表,于是可以选择满足这一条件的最小正交表L8(2)来安排正交试验。 ⅱ.表头设计

由于交互作用被看作是影响因素,所以在正交表中应该占有相应的列,称为交互作用列。但是交互作用列是不能随意安排的,一般可以通过两种方法来安排。

第一种方法是查所选正交表对应的交互作用表(见本部分附表),表3-15就是正交表L8(2)对应的交互作用表。表3-15中写了两种列号,一种列号是带括号的,它们表示因素所在的列号;另一种列号是不带括号的,它们表示交互作用的列号。根据表3-15就可以查出正交表L8(2)中任何两列的交互作用列。例如,要查第2列和第4列的交互作用列,先在表对角线上找到列号(2)和(4),然后从(2)向右横看,从(4)向上竖看,交叉的数字为6,即为它们的交互作用列,所以如果将A,B分别放在正交表L8(2)的第2列和第4列,则A×B应该放在第6列。类似地,从该表中还可查同其他两列间的交互作用列。

表3-15 L8(2)二列间的交互作用

列号 ( ) (1) (2) (3) (4) (5) (6) (7) 7

7

7

7

7

7

列 号 1 (1) 2 3 (2) 3 2 1 (3) 4 5 6 7 (4) 5 4 7 6 1 (5) 6 7 4 5 2 3 (6) 7 6 5 4 3 2 1 (7) 第二种方法是直接查对应正交表的表头设计表,表3-16就是正交表L8(2)的表头设计表,它实质上是根据交互作用表整理出来的,使用起来更方便,一些常用交互表及正交表见本部分附表。在本例中,总共有3个因素,根据表3-16可知,可以将A,B,C依次安排在1,2,4列,而交互作用A×B,A×C分别安排在第3列和第5列上。

表3-16 L8(2)表头设计

因素数 3 4 列 号 1 A A 2 B B 3 A×B A×B C×D A B C×D A 5 D×E B C×D A×B A×B C×E ⅲ.明确试验方案、进行试验、得到试验结果

表头设计完之后,根据A,B,C三个因素所在的列,就可以确定本例中的8个试验方案。注意,交互作用虽也中有相应的列,但它们与空白列一样,对确定试验方案不起任何作用。

C B×D C B×D A×C B×E 4 C C 5 A×C A×C B×D A×C 6 B×C B×C A×D D B×C D A×E B×C E A×D A×D 7 D 7

4 按正交表规定的试验方案进行试验,测定试验结果,试验方案与试验结果yi(i = 1,2…,8)见表3-17。

表3-17 例3.4试验方案与试验结果分析

试验号 1 2 3 4 5 6 7 8 A 1 1 1 1 1 2 2 2 2 1.980 2.058 0.078 B 2 1 1 2 2 1 1 2 2 1.884 2.154 0.270 A×B 3 1 1 2 2 2 2 1 1 2.038 2.000 0.038 C 4 1 2 1 2 1 2 1 2 2.042 1.996 0.046 A×C 5 1 2 1 2 2 1 2 1 2.048 1.990 0.058 空列 6 1 2 2 1 1 2 2 1 2.024 2.014 0.010 空列 7 1 2 2 1 2 1 1 2 2.034 2.004 0.030 吸光度 yi 0.484 0.448 0.532 0.516 0.472 0.480 0.554 0.552 K1 K2 极差R 因素主次 B A A×C C A×B ⅳ.计算极差、确定因素主次

极差计算结果和因素主次见表3-17。注意,虽然交互作用对试验方案没有影响,但应将它们看作因素,所以在排因素主次顺序时,应该包括交互作用。 ⅴ.优方案的确定

如果不考虑因素间的交互作用,根据指标越大越好,可以得到优方案为A2B2C1。但是根据上一步排出的因素主次,可知交互作用A×C比因素C对试验指标的影响更大,所以要确定C的水平,应该按因素A、C各水平搭配好坏确定。两因素的搭配表见表3-18。

表3-18 例3.4因素A、C水平搭配表

因素 C1 C2 A1 (y1+y3)/2 = (0.484 + 0.532)/2 = 0.508 (y2+y4)/2 = (0.448 + 0.516)/2 = 0.482 A2 (y5+y7)/2 = (0.472 + 0.554)/2 = 0.513 (y6+y8)/2 = (0.480 + 0.552)/2 = 0.516 比较表3-18中的四个值,0.516最大,所以取A2C2好,从而优方案为A2B2C2,即灰化温度700℃、原子化温度2400℃、灯电流10 mA。显然,不考虑交互作用和考虑交互作用时的优方案不完全一致,这正反映了因互间交互作用对试验结果的影响。

最后就有交互作用的正交试验设计补充说明如下。

① 在进行表头设计时,一般来说,表头上第一列最多只能安排一个因素或一个交互作用,不允许出现混杂(一列安排多个因素或交互作用);对于重点要考虑的因素和交互作用,不能与任何交互作用混杂,而让次要的因素或交互作用混杂。所以,当考察的因素和交互作用比较多时,表头设计比较麻烦,为避免混杂可以选择较大的正交表,如果选择上表,则不可避免会出现混杂。

② 两个因素间的交互作用称为一级交互作用(正交表中只占一列);3个或3个以上因素的交互作用,称为高级交互作用(三水平因素之间的交互作用则占两列,r水平两因素间的交互作用只占r-1列)。例如,三个因素A,B,C的高级交互作用可记作A×B×C。在绝大多数的实际问题中,高级交互作用都可以忽略,一般只需考察少数几个一级交互作用,其余大部分一级交互作用也是可以忽略的,至于哪些交互作用应该忽略,则要依据专业知识和实践经验来判断。所以当因素的水平数≥3时,交互作用的分析比较复杂,不便用直观分析法,通常都用方差分析法。 (4) 混合水平的正交试验设计及其结果的直观分析

在实际问题中,由于具体情况不同,有时各因素的水平数是不相同的,这就是混合水平的多因素试验问题。

混合水平的正交试验设计方法主要有两种:一是直接利用混合水平的正交表;二是采用拟水平法,即将混合水平问题转换为等水平的问题。 ① 直接利用混合水平的正交表

例3.5 某造板厂进行胶压制造工艺的实验,以提高胶压的性能,因素及水平如表3-19,胶压板的性能指标采用综合评分的方法,分数越高越好,忽略因素间的交互作用。

表3-19 例3.5因素水平表

水平 1 2 3 4 (A)压力/kPa 810.60 1013.25 1114.58 1215.90 (B)温度/℃ 95 90 (C)时间/min 9 12 解:本问题中有3个因素,一个因素有4个水平,另外两个因素都为2个水平,可以选用混合水平正交表L8(4×4)。因素A有4个水平,应安排在第1列,B和C都为2个水平,可以放在后4列中的任何两列上,本例将B,C依次放在第2,3列上,第4,5列为空列。本例的试验方案、试验结果如表3-20所示。 由于C因素是对试验结果影响较小的次要因素,它取不同的水平对试验结果的影响很小,如果从经济的角度考虑,可取9 min,所以优方案也可以为A4B2C1,即压力1215.90 kPa、温度90℃、时间9 min。 上述的分析计算与前述方法基本相同,但是由于各因素的水平数不完全相同,所以在计算k1,k2,k3,k4时与等水平的正交设计不完全相同。例如,A因素有4个水平,每个水平出现两次,所以在计算k1,k2,k3,

1

2

k4时,应当是相应的K1,K2,K3,K4分别除以2得到的;而对于因素B,C,它们都只有2个水平,每个水平

出现4次,所以k1,k2应当是相应的K1,K2分别除以4得到。

还应注意,在计算极差时,应该根据ki(i表示水平号)来计算,即R = {ki}max-{ki}min,不能根据Ki计算极差。这是因为,对于A因素,K1,K2,K3,K4分别是2个指标值之和,而对于B,C两因素,K1,K2分别是4个指标值之和,所以只有根据平均值ki求出的极差才有可比性。

本例中没有考虑因素间的交互作用,但混合水平正交表也是可以安排交互作用的,只不过表头设计比较麻烦,一般可以直接参考对应的表头设计表。

表3-20 例3.5试验结果及其直观分析

试验号 1 2 3 4 5 6 7 8 A 1 1 2 2 3 3 4 4 8 9 14 19 B 1 2 1 2 1 2 1 2 21 29 C 1 2 1 2 2 1 2 1 24 26 空列 1 2 2 1 1 2 2 1 23 27 空列 1 2 2 1 2 1 1 2 24 26 得分 2 6 4 5 6 8 9 10 K1 K2 K3 K4 k1 k2 k3 k4 极差R 因素主次 优方案 ② 拟水平法

4.0 4.5 7.0 9.5 5.5 5.2 7.2 6.0 6.5 5.8 6.8 6.0 6.5 2.0 0.5 ABC 1 0.5 A4B3C2或A4B2C1 拟水平法是将混合水平的问题转化成等水平问题来处理的一种方法,下面举例说明。

例3.6 某制药厂为提高某种药品的合成率,决定对缩合工序进行优化,因素水平表如表3-21所示,忽略因素间的交互作用。

表3-21 例3.6因素水平表

水平 1 2 3 (A)温度/℃ 35 25 45 (B)甲醇钠量/mL 3 5 4 (C)醛状态 固 液 液 (D)缩合剂量/mL 0.9 1.2 1.5 1

分析:这是一个4因素的试验,其中3个因素是3水平,1个因素是2水平,可以套用混合水平正交表L18(2

7

×3),需要做18次试验。假如C因素也有31个水平,则本例就变成了4因素3水平的问题,如果忽略因素间的交互作用,就可以选用等水平正交表L9(2),只需要做9次试验。但是实际上因素C只能取2个水平,不能够不切实际地安排出第3个水平。这时可以根据实际,将C因素较好的一个水平重复一次,使C因素变成3水平的因素。在本例中,如果C因素的第2个水平比第1水平好,就可将第2水平重复次作为第3水平(如表3-21),由于第3水平是虚拟的,故称为拟水平。

解:C因素虚拟出一个水平之后,就可以选用正交表L9(3)来安排试验,试验结果及分析见表3-22。(在本例中,为了简化计算,将试验结果都减去了70%,这种简化不会影响到因素主次顺序和优方案的确定)。 在试验结果的分析计算中应注意,因素C的第3水平实际上与第2水平是相等的,应重新安排第3列中C因素的水平,将3水平改成2(结果如表3-22所示),于是C因素所在的第3列只有1,2两个水平,其中2水平出现6次。所以求和时只有K1,K2,求平均值时k1 = K1/3,k2 = K2/6。其他列的K1,K2与k1,k2的计算方法如例3.1。

在计算极差时,应该根据ki(i表示水平号)来计算,即R = {ki}max-{ki}min,不能根据Ki计算极差,这是因为,对于C因素,K1是2个指标值之和,K2是6个指标值之和,而对于A,B,D三因素,K1,K2,K3分别是3个指标值之和,所以只有根据平均值求出的ki极差才有可比性。

表3-22 例3.6试验结果及其直观分析

试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 9.0 B 1 2 3 1 2 3 1 2 3 2.5 C 1(1) 2(2) 3(2) 2(2) 3(2) 1(1) 3(2) 1(1) 2(2) -4.6 D 1 2 3 3 1 2 2 3 1 15.6 合成率/% 69.2 71.8 78.0 74.1 77.6 66.5 69.2 69.7 78.8 (合成率-70)/% -0.8 1.8 8.0 4.1 7.6 -3.5 -0.8 -0.3 8.8 4

4

K1 K2 K3 k1 k2 k3 极差R 因素主次 优方案 8.2 7.7 3.0 2.7 2.6 0.4 9.1 13.3 0.8 3.0 4.4 3.6 29.5 -2.5 11.8 -1.5 4.9 15.6 -2.5 11.8 6.4 6 CDBA C2D1B3A1 在确定优方案时,由于合成率是越高越好,因素A,B,D的优水平可以根据K1,K2,K3的大小顺序取较大的

Ki或ki所对应的水平,但是对于因素C,就不能根据K1,K2的大小来选择优水平,而是应根据k1,k2的大小

来选择优水平。所以本例的优方案为C2D1B3A1,即醛为液态、缩合剂量0.9 mL、甲醇钠量4 mL、温度35℃。 由上面的讨论可知,拟水平法不能保证整个正交表均衡搭配,只具有部分均衡搭配的性质。这种方法不仅可以对一个因素虚拟水平,也可以对多个因素虚拟水平,使正交表的选择更方便、灵活。 2. 正交试验设计结果的方差分析法

前面介绍了正交试验设计结果的直观分析法,直观分析法具有简单直观、计算量小等优点,但直观分析不能估计误差的大小,不能精确地估计各因素的试验结果影响的重要程度,特别是对于水平数≥3且要考虑交互作用的试验,直观分析法不便使用,如果对试验结果进行方差分析,就能弥补直观分析法的这些不足。 (1) 方差分析的基本步骤与格式

对于正交试验多因素的方差分析,其基本思想和方法与前面介绍的单因素和双因素的方差分析是一致,也是先计算出各因素和误差的离差平方和,然后求出自由度、均方、F值,最后进行F检验。

如果用正交表Ln(r)来安排试验,则因素的水平数为r,正交表的列数为m,总试验次数为n,设试验结果为yi(i = 1,2,…,n)。方差分析的基本步骤如下。 ① 计算离差平方和 ⅰ. 总离差平方和

设 (3-2)

(3-3) (3-4)

(3-5) 则 (3-6)

mSST即为总离差平方和,它反映了试验结果的总差异,总离差平方和越大,则说明各试验结果之间的差异越

大。因素水平的变化和试验误差是引起试验结果之间的差异的原因。

ⅱ.各因素引起的离差平方和:设因素A安排在正交表中的某一列上,则因素A引起的离差平方和为:

(3-7)

若将因素A安排在正交表的第j(j = 1,2,…,m)列上,则有SSA = SSj,且称SSj为第j列所引起的离差平方和,于是有:

(3-8)

(3-9)

也就是说,总离差平方和可以分解成各列离差平方和之和。

ⅲ.试验误差的离差平方和:为了方差分析的方便,在进行表头设计时一般要求留有空列,即误差列。所以误差的离差平方和为所有空列所对应离差平方和之和,即

(3-10)

ⅳ.交互作用的离差平和:由于交互作用在正交试验设计时作为因素看待,所以在正交表中占有相应的列,也会引起离差平方和。如果交互作用中占有一列,则其离差平方和就等于所在列的离差平方和SSj;如果交

本文来源:https://www.bwwdw.com/article/sadt.html

Top