课件1:质量分析中的常用统计技术 - 图文

更新时间:2024-05-06 12:29:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

计件值数据:对产品按件检查时得到的数据。如:批产品中的不合格品数、事故件数等。三、其它分类顺序数据按某种标准将产品进行优劣排序,所得到的排位值如:按感官质量好坏对10个卷烟样品进行排序,得到的一组排序值,即序号数。点数数据如:100分标度制评分,9分标度制评分,5分标度制评分等。优劣数据如:0-1强制打分法中数据,1表示好,0表示差。计点值数据:检查单件产品上质量缺陷时得到的数据。如:烟支表面油渍、黄斑、污点数等。1.4 抽样方法质量检验通常可采用两种方式,即全数检验和抽样检验。在产品制造过程中,为了保证产品符合质量标准,防止不合格品出厂或流入下道工序,通常不可能对产品进行全数检验,只能采取抽样检验。随机抽样:所谓随机抽样,即保证抽样的随机性。总体中由N个个体(单位产品)构成,若抽样时保证每一个个体被抽到的概率都是完全相同,则称为具有抽样的随机性。常用的随机抽样方法有简单随机抽样法、系统抽样法、分层抽样法、分段随机抽样法等。一、简单随机抽样指总体中每一个个体都有同等可能的机会被抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。二、分层抽样先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。也称为类型抽样。三、系统抽样从总体中每隔K个个体抽取一个个体的抽样方法,比值K是总体容量N与样本容量n之比。又称等距抽样或机械抽样。四、分段抽样分层抽样法虽然具有代表性强的优点,但在实施上往往比较困难。如在产品质量审核中,各个包装箱在抽样时必须全部打开,这对高档产品包装的破坏损失很大。又称分阶段抽样。为弥补这一不足可改用分阶段抽样法。第一次抽样也称第一段抽样或第一阶抽样,先从若干子总体中(包装箱)中,抽取一部分子总体(包装箱)。第二次抽样也称为第二段抽样或第二阶抽样,是从所抽取的子总体中再抽取个体组成样本。1.5 抽样检验注意事项1.明确抽样检验目的与方法;质量检验按检验效果可分为判定性检验(质量把关)、信息性检验(将质量检验与过程控制相结合)和寻因性检验(寻找产生不合格的原因)。2.注意检验数据的修正,剔除异常数据;3.检验数据记录要真实、可靠、准确;4.测定和记录工作应标准规范;5.注意记录与检验有关的数据背景。满足质量管理和质量研究的需要。保持指标序列的可比性。有利于分析问题,避免不同条件的数据混淆。问题讨论:针对判定性检验、信息性检验和寻因性检验分别分析其检验数据的背景应包括哪些? 2 数值修约规则总体、样本、数据间的关系:在卷烟检验过程中经常需要对测量结果进行计算、并按标准规定的位数对结果进行修约,为保证测试结果的可比性,GB/T 8170规定了各种数值的修约规则。必须注意有效数字构成的测量值与通常数学上的概念是不同的。比如:24.5、24.50、24.500这三个数在数学上是同一数值,若用于表示卷烟圆周的测量值时,三个值所反映的测量结果的准确程度是不同的。在对卷烟质量进行检验时,应将检验结果按GB/T 8170《数值修约规则》进行修约,保留位数与《卷烟》产品标准各项质量指标相一致。一、进舍规则四要舍,六要入;五后非零进一位,五后皆零看奇偶;五前为奇进一位,五前为偶全舍光;数值修约有规定,连续修约不应当。三、应用实例2卷烟国标要求卷烟硬度测量值保留一位小数。修约前修约后修约前修约后76.4修约前12.0511.3812.3511.84修约后0.92912.20注:0视为偶数。76.5 76.4修约后修约前76.5 修约后12.0611.3812.3611.8412.20卷烟国标要求卷烟水份测量值保留二位小数。12.06 12.0511.38 11.3812.36 12.3511.84 11.8412.20 12.20二、应用实例1卷烟国标要求卷烟圆周测量值保留两位小数。修约前24.52修约前0.928修约后修约前修约后24.54 24.52 24.54修约后修约前卷烟国标要求重量测量值保留三位小数。0.929 0.928四、应用实例3在对卷烟含水率的测试结果12.58正确的修约方法为:12.59%。不正确的修约方法为:12.58545%→12.5854%→12.585%→12.58%→12.58%%进行修约时:六、应用实例5将下列数字修约到―百‖位数的0.2单位(修约间隔为20):拟修约数值乘5 5A修约值A修约值(A) (5A) (修约间隔为100) (修约间隔为20)830 4150 4200 840842 4210 4200 -930 -4650 -4600 A修约值840-920五、应用实例4将下列数字修约到个数位的0.5单位(修约间隔为0.5):拟修约数值乘2 2A修约值(A) (2A) (修约间隔为1) (修约间隔为0.5)60.25 120.50 120 60.060.38 120.76 121 60.5-60.75 -121.50 -122 -61.03 EXCEL在质量分析中的应用单击菜单栏中的【工具命令】,可检查展开的下拉菜单中是否有【数据分析】命令。加载分析工具:单击【工具】菜单中的【加载宏】命令,在【加载宏】对话框的【当前加载宏】列表中,选中【分析工具库】复选框,按【确定】。如果安装Excel时运行的是典型安装,则【分析工具库】很可能没有被加载。如果【加载宏】对话框中没有【分析工具库】,请单击【浏览】按钮,定位到分析工具库加载宏文件―Analys321xll‖所在的驱动器和文件夹(通常应在Microsoft Office/ Library/ Analysis 文件夹中)。如果没有找到该文件,应运行―安装‖程序。3.1 分析测试数据的信息特征一、表征数据集中趋势的统计特征数1.简单算术平均数2. 加权算术平均数x?1nm?inxi加权平均数是不同权重数据的平均数。i?1?(wx)iw?i?1?wi?1mi3. 中位数Me?xn?1(n为奇数)2Me?12(xn?xn22?1)(n为偶数)4. 众数一组数据中出现次数最多的那个数据。中位数与平均数是唯一存在的,而众数是不唯一的。 二、表征数据离散趋势的统计特征数1.极差三、测量精度的表示方法反映测量结果与真值接近程度的量,称为精度。它与误差的大小相对应,因此可用误差的大小来表示精度的高低,误差小则精度高,误差大则精度低。精度又分为精密度、准确度和精确度。测量的精密度高,是指偶然误差较小,这时测量数据比较集中,但系统误差的大小并不明确。测量的准确度高,是指系统误差较小,这时测量数据的平均值偏离真值较少,但数据分散的情况,即偶然误差的大小不明确。测量精确度(也常简称精度)高,是指偶然误差与系统误差都比较小,这时测量数据比较集中在真值附近。对于具体的测量,精密度高的而准确度不一定高,准确度高而精密度也不一定高,但精确度高,则精密度和准确度都高。R?xmax?xmin2.方差s2?3.标准偏差?nn(xi?x)n?12i?1?2??nn(xi?x)n2i?1s??(xi?x)2n?1i?1???(xi?x)2ni?14.变异系数CV(%)?s?100x用打靶时弹着点为例,说明上述三个词的意义。用靶心表示其值位置,黑点为每次测得值的位置。甲图表示射击的精密度高但准确度较差,即系统误差较大。乙图表示射击的准确度高,但精密度较差,即偶然误差较大。丙图表示精密度和准确度都比较好,称为精确度高,这时偶然误差和系统误差都比较小。精密度是表示多次重复测定某一量时,所得测量值的离散程度,它反映测量中随机误差的影响程度,可用偏差、平均偏差、标准偏差、变异系数(相对标准偏差,RSD)和极差来度量。n偏差di?xi?x平均偏差相对平均偏差标准偏差变异系数极差d?RAD??xi?1i?xnd?100%xs?CV?sx?100%?(x?x)ii?1n2n?1R?xmax?xmin准确度是指测量值与真值的相符程度,它表示测量值的可靠性,反映测量中系统误差的影响程度,可用误差和相对误差表示。误差(绝对误差)相对误差RE?四、Excel在提取数据信息特征中的应用数据信息特征的提取,实际上就是数据的描述性或探索性统计分析。在Excel 中,可以用―描述统计‖工具来完成这项工作。―描述统计‖工具能自动给出绝大多数表征数据信息特征的统计量。在此基础上,进行适当的计算,则可以得到几乎全部表征数据信息特征的统计量。应用实例?i?xi???i?精确度它反映测量结果中系统误差和随机误差综合的影响程度,其定量特征可用测量的不确定度来表示。X平标中众标方峰偏区最最求观最最置均准位数准差度度域小大和测大小信1.158136360.030747631.1465#N/A0.144219180.020799174.180325950.095385960.7970.7611.55825.479221.5580.7610.0639432平标中众标方峰偏区最最求观最最置均准位数准差度度域小大和测大小信Y0.0829230.0017250.082950.08380.0080936.55E-050.6736770.2379050.03610.06570.10181.8243220.10180.06570.003588误差数差误差数差值值数(1)(1)度(95.0%)值值数(1)(1)度(95.0%) 3.2 正态分布在质量分析中的应用高斯(Gauss)分布,连续性变数(连续型变量)的理论分布,统计学理论和应用中最重要的分布。许多现象的数据服从正态分布。试验误差的分布:一般服从;许多生物现象的计量资料:近似服从。在一定条件下,作为二项分布、其它间断性或连续性变数分布的近似分布,代替其它分布进行概率计算和统计推断。作为统计数的抽样分布。总体非正态分布,但总体中抽出的样本平均数、其它统计数,在样本容量大时趋近正态分布。3.2.1 正态分布的性质正态分布的概率密度函数f(x)?1?2?e1x??2?()2?正态分布的特征1)当x=μ时,f(x)最大,故正态分布曲线是以平均数μ为中心的分布。2)当x-μ的绝对值相等时,f(x)值也相等,故正态分布是以μ为中心向左右两侧对称的分布。3)由于正态分布曲线是对称曲线,故其算术平均数、中数、众数均相等,三者合一,位于μ点上。4)由μ和σ共同决定的一系列曲线(曲线簇) μ确定它在横轴上的位置,σ确定它的变异度。5)(x-μ)/σ的绝对值越大,f(x)越小,但f(x)永远≠0,x∈(-∞,+∞)。曲线左右伸展,永不接触横轴,当x→±∞,正态分布以x轴为渐近线,曲线全距从-∞到+∞。6)正态分布曲线在Ix-μI=1σ处有拐点,即在x=μ±σ处各有一个拐点,曲线通过拐点时改变弯曲度。7)正态曲线与横轴之间的总面积=1。给定值x1和x2,从x=x1到x=x2之间的面积,等于介于这两个定值间面积占总面积的成数,或等于x落在该区间内的概率。8)多数次数集中于μ附近,离μ越远,次数越少;在μ左右相等Ix-μI范围内具有相等次数;在Ix-μI≥3σ以上其次数极少。FN(x)P(x?a)?FN(a)P(a?x?b)?FN(b)?FN(a)NORMDIST用途:返回给定平均值和标准偏差的正态分布的累积函数。语法:NORMDIST(x,mean,standard_dev,cumulative)参数:X为用于计算正态分布函数的区间点,Mean是分布的算术平均值,Standard_dev是分布的标准方差;Cumulative为一逻辑值,指明函数的形式。如果cumulative为TRUE,则NORMDIST函数返回累积分布函数;如果为FALSE,则返回概率密度函数。实例:=NORMDIST(46,35,2.5,TRUE) 返回0.999994587= NORMDIST(46,35,2.5, FALSE) 返回9.98E-06NORMSDIST用途:返回标准正态分布的累积函数,该分布的平均值为0,标准偏差为1。语法:NORMSDIST(z)参数:Z为需要计算其分布的数值。实例: =NORMSDIST(1.5) 返为0.933192798731142NORMSINV用途:返回标准正态分布累积函数的逆函数。该分布的平均值为0,标准偏差为1。语法:NORMSINV(probability)参数:Probability是正态分布的概率值。实例:=NORMSINV(0.933192771) 返回1.53.2.2 标准正态分布N(?,?2)3.2.3 正态分布的应用例:假定x是一烟叶样本的随机变量,μ=30,σ=5,具正态分布。求x≤26,≤40,26~40,>40的概率。方法1:直接运用一般正态分布的概率密度函数计算。f(x)?1e1x??2?()2?=NORMDIST(26,30,5,TRUE)FN(26)=0.211855398583397u?x???2??12?12?ue2方法2:直接运用标准正态分布的概率密度函数计算。12?12?ue2u?x??f(u)?f(u)???26?30??0.85=NORMSDIST(-0.8)FN(26)=0.211855398583397

已知:均数3250,标准差360,求变量介于2800 ~ 3500的比例(概率、合格率)?已知平均值为8.23,标准差为1.7502, 求置信度为95%的正常值范围?3.2.4 正态性检验正态分布检验包括三类:JB检验、KS检验、Lilliefors检验,用于检验样本是否来自于一个正态分布总体。Jarque-Bera检验。正态分布的偏度(三阶矩)S=0,峰度(四阶矩)K=3,若样本来自正态总体,则他们分别在0,3附近。基于此构造一个包含x2(卡方)统计量:NORMINV返回指定平均值和标准偏差的正态累积分布函数的反函数。语法NORMINV(probability,mean,standard_dev)Probability 正态分布的概率值。Mean 分布的算术平均值。Standard_dev分布的标准偏差。?S2(K?3)2?JB?n???624??其中:n为样本容量,S为样本概率分布的偏度,K为样本概率分布的峰度。若总体服从正态分布,则J-B统计量值与0无显著差异,即其P值大于0.05。1. 计算偏度:SKEW(number1,number2,...)2. 计算峰度:KURT(number1,number2,...) 3. 计算J-B统计量值4. 计算P值:CHIDIST(x, degrees_freedom),其中X为J-B统计量计算值,degrees_freedom为2。例:X平均标准误差中位数众数标准差方差峰度偏度区域最小值最大值求和观测数最大(1)最小(1)置信度(95.0%)1.158136360.030747631.1465#N/A0.144219180.020799174.180325950.095385960.7970.7611.55825.479221.5580.7610.0639432Y平均标准误差中位数众数标准差方差峰度偏度区域最小值最大值求和观测数最大(1)最小(1)置信度(95.0%)0.0829230.0017250.082950.08380.0080936.55E-050.6736770.2379050.03610.06570.10181.8243220.10180.06570.0035885.1683250.0754593.3 统计检验在质量分析中的应用在大多数情况下,分析测试都是采取抽样检验,通过样本测试对总体的某个或某些特征进行估计与作出推断。在分析测试中,统计检验的任务大致上可分为两类,一类是检验统计假设是否正确,另一类是由样本值来估计总体的置信区间。分析测试是一个复杂的过程,存在着多种因素的影响以及因素之间的交互影响,使得一组测定值内各测定值之间或一组测定值同另一组测定值之间存在着差异。统计检验就是正确区分这种差异究竟是由于分析测试过程受到不可避免的偶然因素的影响而造成的,还是由于测试条件的改变而引起的。J-B=1.310433P=0.51932962统计检验是由样本的测定值来推断总体的特性。既然是推测,当然不可能有100%的把握,因此,在作统计推断时,应该而且必须指明统计推断的可靠程度。可靠程度用显著性水平(a)或置信度(1-a)来表示,在统计上,显著性水平通常取10%、5%、1%,置信度取90%、95%、99%。在分析测试中通常选取5%的显著性水平和95%的置信度作为统计推断的标准,但这不是一成不变的,而要根据具体情况灵活地掌握。作为一般的原则是,当试验条件改变容易实现,花费较小时,可以选取较大的显著性水平值,较小的置信度,因为显著性水平取得较大,出现认为有显著性差异的概率也就较大,统计上允许的合理置信区间较窄,这时只要测定值有较小的变化,在统计上则已认为有显著性差异了。从实际工作考虑,试验条件的改变,工艺的变革,虽然效果不是很大,但因耗费小,总的看来仍是合算的。反之,如果试验条件的改变耗费很大,或者在事关重大的检验中,应取较小的显著性水平,较大的置信度。3.3.1 离群值的检验在实验中,得到一组数据之后,往往有个别数据与其他数据相差较远,这一数据称为离群值,又称异常值或可疑值或极端值。如果在重复测定中发现某次测定有失常情况,如在溶解样品时有溶液溅出,滴定时不慎加入过量滴定剂等,这次测定值必须剔除。若是某次测定并无失误而结果又与其他值差异较大,则对于该异常值是保留还是剔除,应按一定的统计学方法进行处理。检验离群值的方法是假定被检验的一组测量值是来自同一正态总体,给定一个合理的显著性水平a。根据a和样本容量n确定一个误差限度,即相应的统计检验的临界值。因此,凡是检验离群值的实验统计量超过临界值,就有(1-a)的置信度认为它不属于随机误差的范围,此数据应予舍去。其方法有多种,这里只介绍3倍标准偏差准则。3倍标准偏差准则(拉依达准则)是最常用也是最简单的离群值检验准则,它是以测量次数充分大为前提,但通常测量次数皆较少,因此3倍标准偏差准则只是一个近似的准则(适用于测量次数大于10次时)。对于某一测量列,若各测量值只含有随机误差,则根据随机误差的正态分布规律,其残余误差(又称残差)落在±3标准偏差以外的概率约为0.3%,即在370次测量中只有一次其残余误差│vi│>3s。如果在测量列中,发现有大于3标准偏差的残余误差的测量值,即残差vi?xi?x(i=1,2,…,n)s?例对某量进行15次等精度测量,测得值为:28.39,28.39,28.40,28.41,28.42,28.43,28.40,28.30,28.39,28.42,28.43,28.40,28.43,28.42,28.43。试判别该组数据中是否含有异常值。解:根据这组数据可以计算得:15x?115?xi?1ni?28.4042i?(x?x)i2n?1??v2i3s?3?vi?1n?1?3?0.033?0.099n?1这组数据中:最大值的列差为│v6│=│28.43-28.404│=0.026最小值的列差为│v8│=│28.30-28.404│=0.104显然│v8│>3s 由拉依达准则可知x8=28.30为异常值,应予剔除。│vi│>3s 则可以认为它含有粗大误差,应予剔除。习惯上我们把含有粗大误差测量值称为异常值或离群值。 3.3.2 平均值的检验在质量分析和试验研究中,经常对未知总体(分析或研究对象)提出一些假设问题。如对工艺参数经过优化后,想知道参数优化后,加工质量是否得到改进等。这时,我们对总体的情况往往已有一种“看法”,如“质量是否得到改进”、“优化前后加工质量是否不同”、“有害成分是否降低”等,希望通过样本来验证这种“看法”是否正确,这就是所谓的统计假设检验(统计检验)。在分析测试中,也常遇到两个平均值的比较问题,如测定平均值和标样名义值的比较,不同分析人员或用不同分析方法测定的平均值的比较,对比性试验研究等均属于此类问题。上述问题可用t检验或u检验来解决。从统计的观点来看,如果样本都是由同一总体中抽出的,由有限次测定得到的各平均值,尽管在数值上并不一定相等,但彼此之间的差异在约定的显著性水平下应该是不显著的。反之,如果t或u检验证明,计算的统计量t或u大于相应自由度和显著性水平下的临界值,这表明两个平均值不属于同一总体,引起平均值之间的差异不能仅仅归因于偶然误差,除偶然误差之外,还必有某个固定因素在起作用,这个固定因素正是区分不同总体的因素。3.3.2.1 假设检验的理论依据实际生活经验:将硬币抛N次,观察其出现正面和反面的次数。如果硬币均匀,那么出现正反面的次数应该相差不大;如果不均匀,那么出现正反面次数应该相差较大。我们的推断:如果出现正反面次数相差不大,那么硬币均匀;反之,则不均匀。推断中隐藏的概率思想(依据):正常情况下,硬币是均匀的()。如果硬币均匀,则出现正反面次数相差较大的可能性就很小,而概率很小的事件在一次试验中几乎不会发生;如果小概率事件发生了(即出现了正反面次数相差较大的情况),则拒绝原假设,判断硬币不均匀()。3.3.2.2 假设检验的方法和步骤假设检验的步骤步骤1 设立两个假设(原假设和备择假设)步骤2 选择检验统计量步骤3 决定拒绝域及接受域(决策法则)步骤4 计算检验统计量(或将检验统计量与临界值比较)步骤5 下结论应用实例1根据历年资料,已知某卷烟牌号烟支单重量为0.88g,标准偏差为0.025g,现某班加工过程中抽检20支样品的平均重量为0.91g 。小概率原理:如果事件发生的概率很小,则它在一次试验中出现的可能性就很小,当概率小于一个规定的界限时,就认为该事件不可能发生。问题:1)烟支重量是否发生变化?2)烟支重量是否增重?3)烟支重量是否减轻?步骤1:设立两个假设1)H0:μ=μ0(=0.88);H1:μ≠μ2)H0:μ≤μ3)H0:μ≥μ 原假设H0的符号 备择假设H1的符号 拒绝域 00双尾检验f(x)000(=0.88) (>0.88)(<0.88) xL*1-?/2(≤0.88);H1:μ>μ(≥0.88);H1:μ<μ双尾检验 = ? 在左右两尾 假设检验的符号左尾检验 右尾检验 ? ? 在左尾 ? ? 在右尾 ???0xU*?值 ?/2 ? ? 单尾检验f(x)设立假设的原则以反面主张做为原假设。把需要等待验证的结论设为备择假。需要等待验证的结论是指那些猜测的、可能的、预期的结论或新的状况。原假设对应于大概率,备择假设对应于小概率。假设检验是期望用小概率的事实去推翻原假设所代表的结论。把不能轻易否定的结论设为原假设,这些结论一般指原有的理论、原有的看法(声明) 、原有的状况,或者是说那些保守的、历史的、经验的、广为公认的结论。错误地拒绝某一假设的后果较错误地接受或不拒绝该某一假设的后果为严重者,将该假设设为原假设。将他人的主张做为原假设,亦即假定他人的主张是真实的。x ?f(x)x*??3x1-????0x* 两类错误?类错误当H0为真,而拒绝H0所发生的错误,称为?类错误(type ?error)。型?错误的概率为α,表示为两个错误如何选择一般认为型?错误的后果会比较严重,因此希望?较小;换言之,希望在证据相当足够充分下才可推翻H0。在假设检定中,发生型?错误、型??错误均可能发生损失,但损失的大小通常未知,就像法官判案一样,型?错误(嫌疑犯无罪而被误判有罪)的损失较为严重,因此一般均将?设得较小,?通常值为0.01、0.05及0.10。 真实情况 H0为真 H1为真 ??p(拒绝H0H0为真)α又称为为显著水平(significance level)。??类错误当H0为假(或H1为真),而不拒绝H0所发生的错误,称为??类错误(type???error)。型??错误的概率以β表示:??p(不拒绝H0H0为假) 决策 不拒绝H0 1??(正确机率) ?(错误机率) 拒绝H0 1??称为检出力,表示H0为假,不拒绝H0的概率。?(错误机率) 1??(正确机率) 3.3.2.3单个总体平均值的检验设立假设单个总体平均数的假设检验(运用Excel中的函数也可一步完成)选择检验的样本统计量决定决策法则Yes抽样并进行检验一、Z(u)检验1)总体方差已知时统计差异是否显著No接受该假设Z?x??0?xx??0sx?x??nsn2)总体方差未知,但n>30时拒绝该假设Z?sx?3)应用实例1根据历年资料,已知某卷烟牌号烟支单重量为0.88g,标准偏差为0.025g,现某班加工过程中抽检20支样品的平均重量为0.91g .试判定烟支重量是否发生变化?(1)建立假设.H0:μ= 0.88g, H1:μ≠0.88g;确定显著性水平,双尾α=0.05.()0.91?0.88(2)计算统计量.Z??5.3665633)应用实例1 续根据历年资料,已知某卷烟牌号烟支单重量为0.88g,标准偏差为0.025g,现某班加工过程中抽检20支样品的平均重量为0.91g .试判定烟支重量是否增重?(1)建立假设.H0:μ≤0.88g, H1:μ>0.88g;确定显著性水平,单尾α=0.05.()(2)计算统计量.0.02520Z?0.91?0.880.02520?5.366563(3)确定H0成立的概率,作出推断结论.双尾:??????=NORMSINV(0.975) = 1.95996????=NORMSINV(0.025) = -1.95996双尾:P值=2*(1-NORMSDIST(5.366563))=8.03E-08(3)确定H0成立的概率,作出推断结论.右尾:????=NORMSINV(0.95) = 1.64485右尾:P值=1-NORMSDIST(5.366563)=4.013E-08因为z?z0.975,说明H0成立的概率小于0.05,所以拒绝H0,接受H1。推论:该班加工的烟支重量发生了显著变化.因为z?z0.95接受H1。,说明H0成立的概率小于0.05,所以否定H0,推论:该班加工的烟支重量显著增重.4)应用实例1 再续()根据历年资料,已知某卷烟牌号烟支单重量为0.88g,标准偏差为0.025g,现某班加工过程中抽检20支样品的平均重量为0.91g .试判定烟支重量是否增重?ZTEST(array,u0,sigma)返回Z检验的单尾概率值。对于给定的假设总体平均值u0,ZTEST返回样本平均值大于数据集(数组)中观察平均值的概率,即观察样本平均值。Array ——为用来检验u0的数组或数据区域。U0——为被检验的值。Sigma——为样本总体(已知)的标准偏差,如果省略,则使用样本标准偏差。说明:双尾概率的计算P值=2*MIN(ZTEST(array,u0,sigma), 1 -ZTEST(array,u0,sigma))。推论:该班加工的烟支重量显著增重. 二、t 检验当样本取自正态总体,但方差未知,且n<30时应采用t检验.t?x??0sxsx?sn说明:查临界值:TINV(probability,degrees_freedom)Probability——为对应于双尾t 分布的概率。Degrees_freedom——为分布的自由度。单尾t 值可通过用两倍概率替换概率而求得。如果显著水平为0.05 而自由度为10 ,则双尾值由TINV(0.05,10) 计算得到,它返回2.28139。而同样显著水平和自由度的单尾值可由TINV(2*0.05,10) 计算得到,它返回1.812462。查P值:TDIST(x, degrees_freedom, tails)X——为需要计算分布的数值,即t 统计量计算值。Degrees_freedom——为表示自由度的整数。如果tails = 1,单尾。如果tails = 2,双尾。因为不允许x < 0,当x < 0 时要使用TDIST,应该注意TDIST(-x,df,1) = 1 –TDIST(x,df,1) = P(X > -x) 和TDIST(-x,df,2) = TDIST(xdf,2) = P(|X| > x)。应用实例2已知某标准烟叶样品中糖含量为20.70mg/L,现用某方法测定样品11次,测定结果的平均值为21.037mg/L,标准偏差为1.05 mg/L,问该方法的测定结果是否有显著差异。(1)建立假设.H0:μ= 20.70, H1:μ≠20.70;确定显著性水平,双尾α=0.05.(2)计算统计量.应用实例3已知某地烟叶样品36个,测得六六六平均含量为0.325 mg/kg,标准偏差为0.068 mg/kg,若标准规定六六六≤0.3 mg/kg,问该地烟叶六六六含量是否超标。(1)建立假设.H0:μ≤0.3 , H1:μ>0.3;确定显著性水平,单尾α=0.05,则双尾α=0.1(2)计算统计量.21.037?20.70t??1.0641.0511t?t0.05t?0.325?0.30.06836?2.206=TINV(2*0.05,35)=TINV(0.05,10)(3)确定H0成立的概率,作出推断结论.按df=11-1=10,查t 临界值表,得t0.05(10)=2.228因为否定H1.,说明H0成立的概率大于0.05,所以接受H0,=TDIST(1.064,10,2)=0.3123(3)确定H0成立的概率,作出推断结论.按df=36-1=35,查t 临界值表,得t0.1(35)=1.69因为t?t0.05接受H1.,说明H0成立的概率小于0.05,所以否定H0,推论:该地烟叶六六六含量已超标。=TDIST(2.206,35,1)=0.0170推论:该方法的测定结果是没有显著差异。应用实例4已知卷烟纸生产厂家提供定量的检测值为26.5g/m2,现对一批卷烟纸进行抽样检验,按标准检测20个样,得平均值为27.3g/m2,标准偏差为0.169g/m2,问生产厂家检测结果是否可信?(1)建立假设.H0:μ=26.5 , H1:μ≠26.5;确定显著性水平,双尾α=0.05(2)计算统计量.27.3?26.5t??21.170.16920TINV(0.05,19)(3)确定H0成立的概率,作出推断结论.按df=20-1=19,查t 临界值表,得t0.05(19)=2.09因为t?t0.05接受H1.,说明H0成立的概率小于0.05,所以否定H0,3.3.2.4 两个总体平均值的检验一、成组资料特点:两个样本的观测值是从各自总体中随机抽取的,两个样本之间的观测值没有任何关联性,即两个样本彼此独立.两组数据以进行相互比较,来检验其差异显著性.1)u检验(z-检验: 双样本均值分析)已知两个正态总体方差, H0:μ1= μ2,则有(x?x2)?(?1??2)x1?x2u?1??x?x?1?212以H0:?1??2为前提n1?n2推论:生产厂家检测结果不可信。=TDIST(21.17,19,2)=1.13E-14当两个正态总体方差未知,但样本容量大于30时,可用两个样本方差代替两个总体方差.应用实例5 为研究某新型香料对卷烟质量的影响,设喷施该香料与喷清水对照处理,各处理制作样品32个,共64个样品.评价各样本某感官质量的结果如下:对照42.541.343.741.041.844.042.541.343.741.041.844.042.541.343.741.0处理47.648.246.347.946.049.047.648.246.347.946.049.047.648.246.347.9对照41.844.042.541.343.741.041.844.042.541.343.741.041.844.042.541.3处理46.049.047.648.246.347.946.049.047.648.246.347.946.049.047.648.2应用实例6设两台卷烟机卷制卷烟的单支重量的总体标准偏差分别为0.025g,0.023g,分别抽检16支烟的单支重量。问两2卷烟机的单支重量有无显著差异.分析结果如下(结论:无显著差异)。1 号机0.890.900.900.900.900.890.890.900.910.910.890.920.932 号机0.900.910.900.910.900.900.900.890.890.910.870.880.91z-检验: 双样本均值分析对照42.353131.293538320-18.9901.64485401.959964处理47.5251.0832z-检验: 双样本均值分析平均已知协方差观测值假设平均差zP(Z<=z) 单尾z 单尾临界P(Z<=z) 双尾z 双尾临界平均已知协方差观测值假设平均差zP(Z<=z) 单尾z 单尾临界P(Z<=z) 双尾z 双尾临界1 号机2 号机0.9023080.8976920.0006250.000529131300.4898650.3121151.6448540.6242291.959964 2)t检验相当于EXCEL中的t-检验:双样本异方差假设和双样本等方差假设.当两个正态总体方差未知,但样本容量小于30时,用两个样本方差代替两个总体方差.双样本t检验,严格地说,在检验前要先进行方差检验,根据方差检验结果确定是等方差还是异方差。等方差时的统计量t?(x1?x2)?(?1??2)sx1?x2sx1应用实例7 为研究某卷烟品牌在两个生产点加工质量是否存在差异,分别从各加工点随机取6个样,共12个样,某质量指标评价结果如下:(1)假设两样本方差双样本等方差假设”,检验两样本均值有无显著化,用“t-检验: (2)假设两样本方差,检验两样本均值有无显著变化,用“t-检验: 双样本异方差假设”t-检验: 双样本等方差假设t-检验: 双样本异方差假设?x2?s12df1?s22df2df1?df2(1n1?1n2)df?n1?n2?2s1s2?n1n222t?异方差时的统计量(x1?x2)?(?1??2)sx?x1sx1?x2?df?(s12n1?s22n2)2(s12n1)22n1?1?(s22n2)2?2n2?1对照42.5041.3043.7041.0041.8044.00处理47.6048.2046.3047.9046.0049.00平均方差观测值合并方差假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界对照处理42.3833347.51.5576671.32661.438833010-7.388271.17E-051.8124612.35E-052.228139平均方差观测值假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界对照42.383331.5576676010-7.388271.17E-051.8124612.35E-052.228139处理47.51.326应用实例8设对总糖测定方法进行调整,调整前后分别对某样品连续检测10次,问检测方法调整前后检测数据的平均值有无显著变化? (1)假设两样本方差,检验两样本均值有无显著变化,用―t-检验: 双样本等方差假设‖(2)假设两样本方差,检验两样本均值有无显著变化,用―t-检验: 双样本异方差假设‖t-检验: 双样本等方差假设调整前调整后16.0116.010.1210.08988910100.1054440182.45E-140.51.73406312.100924t-检验: 双样本异方差假设调整前平均方差观测值假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界调整后―等方差与异方差‖问题对于不平衡试验用―等方差与异方差‖计算出的t值和自由度是不同的,相应的P值也有差异。对于平衡试验用―等方差与异方差‖计算出的t 值是相同的,相应的自由度和P值一般也是相同的。因此,试验应尽可能是平衡试验,即两个处理的样本量应相等。两个或多个处理下方差相等的情况称为方差齐性,从严格意义上说,任何两个处理的方差都不会完全相同,我们说方差齐性也只是认为两个处理的方差相差不大,其方差的差异不足以影响统计分析结果的正确性,同时采用平衡试验还可降低方差的差异的影响。若试验前能知道方差是非齐性的,则应增大方差大的样本量。实际应用中多数情况下方差是齐性的,而方差分析的前提是方差齐性,所以等方差的假设是普遍的。平均方差观测值合并方差假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界16.0116.010.1210.089889100182.45E-140.51.73406312.10092410z检验与t 检验的区别与联系Z检验主要适用于方差已知的试验数据,或方差未知但样本数量大于30个以上的试验数据;t检验主要适用于方差未知且样本数量小于30的试验数据;对于方差未知且样本数量大于30个以上的试验数据, Z检验与t检验的结果较为接近的.应用实例9 二、成对资料特点:(1)将受试对象按要求配成对子,对同一配对分别进行两种处理,经推断两种处理有无差别;(2)对同一受试对象处理前后的某指标进行比较,以推断该处理效果有无差别.统计量1ndidn?i?1t???ssdndf?n?11n?dini?1?(d?d)ii?1nn?1n应用实例10选生长期、发育进度、植株大小和其他方面皆比较一致的两株烟草构成, 共得七组,每组中一株接种A处理病毒, 另一株接种B处理病毒, 以研究不同的处理方法对病毒钝化的效果,得结果为病毒在烟株上产生的病痕数目.t-检验: 成对双样本均值分析应用实例11两分析人员测定10个样品中某成分的含量,问两分析人员的测定结果是否有系统误差?应用―t-检验: 成对双样本均值分析‖.认为两分析人员的测定结果无系统误差. 样品12345678910A人员798108119898B人员11710109101091111t-检验: 成对双样本均值分析A人员B人员8.79.81.3444441.5111111010-0.1247309-1.941180.0420751.8331140.084152.262159组别1234567处理A1013835206处理B25121415122718平均方差观测值泊松相关系数假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界处理A处理B9.28571417.5714333.238137.61905770.60734506-4.149920.0030061.943180.0060122.446912平均方差观测值泊松相关系数假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界

应用实例12进行某工艺试验,测得参数改进前后某有害化学指标的降低情况,问该工艺改进有无效果? 应用―t-检验: 成对双样本均值分析‖.认为该工艺改进对降低该有害化学指标的效果达5%的显著水平.试验样品改进前11.521.431.541.4551.3561.471.481.591.4101.35改进后1.451.351.451.51.41.41.351.41.351.3t-检验: 成对双样本均值分析改进前改进后1.4251.3950.0034720.00358310100.669374091.9639610.0405631.8331140.0811262.262159思考题1 为研究某烟草新品种是否比原有品种增加产量150kg/hm2以上, 选择土壤肥力和其他条件相对较为一致的相邻小区10对, 每对中随机确定1区种植新品种, 另1区种植老品种, 得烟叶产量下。小区新品种老品种1236975747073056900711069604568107335658572006774857065735068708967956915631568251071556870平均方差观测值泊松相关系数假设平均差dft StatP(T<=t) 单尾t 单尾临界P(T<=t) 双尾t 双尾临界3.3.3 方差的检验方差(或标准差)是衡量分析操作条件是否稳定的一个重要标志,反映了测定结果的精密度和测试条件的稳定性。方差的检验,对指导生产与科学实践是很有意义的。例如在工厂,在生产正常的情况下,方差有着一个相对稳定的数值,如果某个工作日发现方差有了较大的变化,超过了所允许的范围,这说明生产中出现了异常情况,提醒人们加以注意,迅速查明原因。又比如几个分析人员用同一种分析方法,测定同一试样,得到的标准偏差不同,这时就有必要研究产生这种差异的原因,是偶然因素引起的,还是得到较大标准偏差的那位分析人员在工作中出现了什么异常现象呢?诸如此类的问题,通过方差的检验,可以获得满意的解决。3.3.3.1 单个总体方差的检验一个总体方差的检验采用统计量n?2??(x?x)ii?12?2?1?2(n?1)s2式中s2是样本方差,?2是总体方差,统计量?的大小反映样本方差与总体方差的差异程度,在约定的显著性水平和自由度2222下,???(1?a/2,f)或???(a/2,f),则说明样本方差与总体方差有显著性差异,反之,样本方差和总体方差是一致的。临界值可2从?分布表中查得,或利用EXCEL电子表格中的函数CHIDIST( ? ,df)直接计算P值(单尾概率)。22应用实例13某卷烟企业在正常生产的情况下,生产的某卷烟产品烟气焦油量的方差为0.25,经工艺改进后,随机抽取35个样品,测得的方差为0.15,试问工艺改进对降低焦油的波动是否有效?依题意,本问题为单侧检验。依据样本计算统计量:应用实例14某质检站在正常生产的情况下,用分光光度法测定某烟叶原料某重金属含量,测定方差为0.182,分光光度计经检修后,用它测定同样烟叶原料该重金属含量,重复测定6次,方差为0.041,试问仪器经检修后稳定性是否有了显著变化?依题意,本问题为双侧检验。依据样本计算统计量:??2(n?1)s2?2?(35?1)0.150.25?20.4??2(n?1)s2计算P值:P值=MIN((1-CHIDIST(20.4,34)), CHIDIST(20.4,34))=0.0316推断:因为原假设成立的概率为0.0316,小于0.05,应接受备择假设,说明工艺对降低焦油的波动是有效的。?2?(6?1)0.041?6.3270.182计算P值:P值=2*MIN((1-CHIDIST(6.327,5)), CHIDIST(6.327,5))=0.5514推断:因为原假设成立的概率为0.5514,大于0.05,应接受原假设,说明仪器经检修后稳定性没有变化。3.3.3.2 两个总体方差的检验两个总体方差的检验即F检验,它的统计量是2s1F(f1,f2)?2s2式中s1和s2分别是样本1和样本2的方差,通常把数值大的作为分子,数值小的作为分母。f1和f2分别为相应的自由度。2应用实例15A与B两人用同一分析方法测定烟叶中某重金属。测得的该重金属含量如下,试问A与B两人测定该重金属的精密度是否存在显著性差异?分析人员A8.08.010.010.06.06.04.06.06.08.0分析人员B7.57.54.54.05.58.07.57.55.58.0这一个双侧检验问题。F-检验 双样本方差分析平均方差观测值dfFP(F<=f) 单尾F 单尾临界分析人员A7.203.731091.620.24143.18分析人员B6.552.301092两个总体方差的检验即F检验,可以通过EXCEL中的数据分析工具直接完成。 应用实例16用新旧两种工艺生产某卷烟产品,分别从用两种工艺生产的产品中抽取样品,测定某化学成分的含量,结果如下,试问新工艺是否比旧工艺生产更稳定?旧工艺2.692.282.572.32.232.422.612.642.723.022.452.952.51新工艺2.262.252.062.352.432.192.062.322.343.4 区间估计在质量分析中的应用在分析和解决实际质量问题时,要取得分析对象的全部数据是困难的,也是不现实的。比较可行的方法是从总体中抽取一定数量的样本,取得样本的测量数据,再通过样本数据对总体数据进行估计。区间估计就在已知样本状况时,估计总体值的可能区间的方法。这一个单侧检验问题。F-检验 双样本方差分析旧工艺新工艺2.56852.2511平均0.05860.0164方差139观测值df128FP(F<=f) 单尾F 单尾临界3.57160.03973.28393.4.1 单样本正态总体均值的区间估计例:某产品质量指标的目标值为10.88mm,现随机抽样一批产品中的10个样本进行检测,以判断该质量指标的平均值与目标值是否相同。10.8810.8910.8710.8810.8710.8910.8910.8610.8810.86计算样本均值和标准差样本量=10 均值=10.877 标准差=0.0116从计算的样本均值可发现均值与目标值存在差异,那么这种差异是偶然因素还是特殊因素造成的?计算总体均值的置信区间(95%的置信度)总体标准差未知时,置信区间计算公式Snta(n?1)?0.0116/10^0.5*2.262?0.0082式中,2.262为查临界值ta/2(n-1),df=10-1对应的t分布表所得。通过EXCEL函数:TINV(probability,degrees_freedom)计算。Probability为双尾t分布的概率,Degrees_freedom为自由度。还可通过EXCEL描述统计分析得到置信区间的置信限。由此可得,总体均值95%的置信区间为10.877±0.008,即(10.869,10.885)。分析:由计算可知,目标值包含在置信区间内。即有95%的把握总体均值在(10.869,10.885)之间。结论:没有证据表明该质量指标不在目标值范围内,即样本均值与目标值存在差异,这种差异是偶然因素造成的。?SS?,x?t?(n?1)?x?t?(n?1)?nn??22样本大小对置信区间的影响对于上例,假定样本均值和标准差不变,而样本量为100。此时,总体均值95%的置信区间为(10.874,10.879)。总体标准差已知时,置信区间计算公式??,?x?u?n?2x?u?2???n?此时,可通过EXCEL函数直接计算置信区间:CONFIDENCE(alpha,standard_dev,size)从上表可以发现,随着样本量增加,置信区间变小。即样本量越大,样本越能反映总体的实际情况。a值对置信区间的影响对于上例只改变a值,则置信区间为:其中,Alpha是用于计算置信度的显著水平。置信度等于100*(1-alpha)%,即若alpha为0.05,则置信度为95%。Standard_dev是数据区域的总体标准偏差,假设为已知。Size为样本容量。从上表可以发现,随a值的减小,置信区间变大。例随机从一批产品中抽取16个样本,测得某质量指标为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设服从正态分布,求总体均值μ的0.95的置信区间.已知σ=0.01.在EXCEL中可以求得95%的置信区间为:(1.148225,1.158025)3.4.2 单样本正态总体方差的区间估计在实际应用中,有时需要估计总体的分布状况,即根据样本方差来估计总体方差的置信区间,仍以前述实例中的数据来估计95%置信度下总体方差的置信区间。纵高χ2分布(chi-square distribution)图0.50.40.3自由度=110.8810.8910.8710.8810.8710.8910.8910.8610.8810.86计算样本标准差和方差样本量=10 标准差=0.0116 方差=0.0001344方差置信区间计算公式0.20.1自由度=2自由度=3由度=6?2?(n?1)s,?2??(n?1)?2??(n?1)s???2?(n?1)?1?2?2方差的置信区间是不对称的.0036912卡方值1518 EXCEL函数:CHIINV(probability,degrees_freedom) Probability 为χ2分布的单尾概率。Degrees_freedom为自由度。χ2分布下限临界值:=CHIINV(0.025,9)=19.02277χ2分布上限临界值:=CHIINV(0.975,9)= 3.4.3 双样本正态总体均值差的区间估计在解决实际问题时,常会遇到对多个样本进行比较的情况,如比较同一品牌不同加工点的产品质量、不同供应商同一种来料的品质等,这时可用双样本区间估计进行分析比较。若双样本正态总体均值差的置信区间包括0,则表明两者间差异不显著(可以推论二总体均值等),否则差异显著(可以推论二总体均值不等)。若双样本正态总体或方差比的置信区间包括1,则表明两者间差异不显著(可以推论二总体方差相等),否则差异显著(可以推论二总体方差不等)。 2.70039置信区间下限:=9*0.000134444/CHIINV(0.025,9)=0.000064置信区间上限:=9*0.000134444/CHIINV(0.975,9)=0.000448结论:95%置信度下总体方差的置信区间为(0.000064,0.000448)。若知道以前生产时的总体方差,则可判断产品质量是否发生显著波动。例在甲、乙两个加工地随机抽取同一卷烟品牌的样本,其容量分别为5和7,分析其烟气总粒相物含量为甲:12.6 13.4 11.9 12.8 13.0乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4烟气总粒相物含量符合正态等方差条件,试估计甲、乙两地产烟气总粒相物含量差μ1–μ2所在的范围。(取α=0.05)计算两个样本的均值和标准差样本量: n1=5 n2=7 均值:x1?12.74x2?13.02857标准差:s1=0.55497 s2=0.407080等方时的合并标准差:22计算两个总体均值差的置信区间222μ-μ2的置信区间计算公式σ1=σ2=σ但未知时,1样本均值差:=-0.288571置信区间下限:=-0.288571-TINV(0.025,10)*0.471835*SQRT(1/ 5+1/7)=-1.01622置信区间上限:=-0.288571+TINV(0.025,10)*0.471835*SQRT(1/ 5+1/7)=0.439082结论甲、乙两地产烟气总粒相物含量均值差,95%置信度下的置信区间为(-1.01622,0.439082),因为置信区间包括0,所以有95%的把握认为两地间的烟气总粒相物含量无显著差异。???(x1?x2)?t(n1?n2?2)sw1?1??n1n2????2sw?n1s1?n2s2?0.471835n1?n2?23.4.4 双样本正态总体方差比的区间估计在实际应用中,有时需要比较两个样本的分布状况,这时可通过计算两样本正态总体方差比的置信区间来进行比较。仍以上例数据为例,计算两产地95%置信度下的方差比置信区间。计算两个样本标准差样本量: n1=5 n2=7标准差:s1=0.55497 s2=0.407080方差:s12=0.308000 s22=0.165714计算两总体方差比的置信区间?2?2?s11s11??s2F(n?1,n?1),2s2F?(n1?1,n2?1)?12?2??1??22?置信区间下限:=0.308000/(0.165714*FINV(0.05/2,5-1,7-1))=0.29847置信区间上限:=0.308000/(0.165714*FINV(1-0.05/2,5-1,7-1))=17.09434结论两产地95%置信度下的方差比置信区间为(0.29847,17.09434),因为置信区间包括1,所以有95%的把握认为两地间的烟气总粒相物含量的方差(即波动)无显著差异。3.5 方差分析在质量分析中的应用根据偏差平方和的加和性,总偏差平方和可以分解成为组间偏差平方和与组内偏差平方和,前者反映了因素对试验结果的影响,后者反映了误差对试验结果的影响.根据组间偏差平方和与组内偏差平方和的比值即F的大小,来确定试验处理的显著性.说明:在方差分析中,总是每个处理下的试验指标服从正态分布,并且方差相等,同时还要求试验数据独立性,即符合随机化试验的原则.方差来源组间组内总和偏差平方和自由度方差估计值F值F0.01F0.05显著性 分差分析是将总变异分解为各个因素的相应变异,从而推断各个因素在变异中所占的重要程度。Excel 提供了3 个方差分析工具,即―单因素方差分析‖、―可重复双因素方差分析‖、―无重复双因素方差分析‖。其中―单因素方差分析‖适用于单向分组资料,如单因素完全随机试验。―可重复双因素方差分析‖适用于两因素完全随机试验。―无重复双因素方差分析‖适用于两向分组资料,如单因素随机区组试验。一、单因素方差分析应用实例17 研究6 种氮肥施肥法对烟叶含氮量的影响,每种施肥法重复5 次,完全随机设计,结果如下表,试进行方差分析。这是一个单因素完全随机设计试验的单向分组资料,所以用―方差分析:单因素方差分析‖工具。氮肥ABCDEF重复 Ⅰ 12.91412.610.514.614 Ⅱ 12.313.813.210.814.613.3 Ⅲ 12.213.813.410.714.413.7 Ⅳ 12.513.613.410.814.413.5 Ⅴ 12.713.61310.514.413.7方差分析差异源SS组间44.463组内1.3总计45.763df52429MSFP-valueF crit8.8926164.17119.62E-182.6206540.054167思考题对某年采购5个地区的烟叶进行等级合格率检验,每地区分别抽取5组C1F样品,测得合格率如下,试比较5个地区C1F等级合格率是否有差异?地区ABCDE样品1(%)样品2(%)样品3(%)样品4(%)样品5(%)71.570.269.573.57572.374.27672.870.669.569.873.174.576.472.173.474.168.867.978.175.677.173.474.5二、无重复双因素方差分析应用实例18 研究6 种氮肥施肥法对烟叶含氮量的影响,每种施肥法设置5 个小区,随机区组设计,结果如下表,试进行方差分析。这是一个单因素随机区组设计试验的两向分组资料,所以用―方差分析:无重复双因素方差分析‖工具。氮肥ABCDEF Ⅰ 12.91412.610.514.614 Ⅱ 12.31111133043.....82863区组 Ⅲ 12.21111133043.....84747 Ⅳ 12.51111133043.....64845 Ⅴ 12.713.61310.514.413.7方差分析差异源行列误差总计SS44.4630.0481.25245.763df542029MSFP-valueF crit8.8926142.05436.48E-152.710890.0120.1916930.939912.8660810.0626应用实例19考察热风温度和热风风速对烘后烟丝填充值的影响,热风温度和热风风速都设2个水平(80-120℃,0.5-1.0 m/s) 9个组合,每组合不设重复试验. 思考题对某年采购5个地区的烟叶进行等级合格率检验,每地区分别抽取5个烤烟品种C1F样品,测得合格率如下,试比较不同地区、不同品种C1F等级合格率是否有差异?地区ABCDE品种1(%)品种2(%)品种3(%)品种4(%)品种5(%)71.570.269.573.57572.374.27672.870.669.569.873.174.576.472.173.474.168.867.978.175.677.173.474.5热风风速0.501.00方差分析差异源SS行0.0049列0.0169误差0.0004总计0.0222df热风温度801204.945.094.895.00MS0.00490.01690.0004FP-valueF crit12.250.17717161.44642.250.09718161.4461113三、可重复双因素方差分析应用实例20 某地进行烟草氮肥用量(因素B) 及施用时期(因素A) 试验,其中氮肥用量取3 个水平,施用时期取2个水平。各处理组合重复5 次,完全随机排列。小区产量结果如下表,试作方差分析。这是一个完全随机设计的两因素试验,采用〔方差分析:可重复双因素方差分析〕工具进行方差分析。因素B1 5059A1 4552585560A2 566245B2 60535862557165757880B3 64666771635559586360方差分析差异源SS样本116.0333列708.0667交互689.2667内部576.8总计2090.167dfMSFP-valueF crit1116.03334.8280170.0378944.2596772354.033314.730936.7E-053.4028262344.633314.339818E-053.4028262424.0333329 应用实例21考察烘焙温度和时间对白肋烟处理感官质量的影响,烘焙温度和时间都设3个水平(7-9-11分钟,110-120-130℃)9个组合,每组合重复3次. 烘焙温度120889786455烘焙时间7911烘焙时间7911110565898566130676655445110565898566烘焙温度120889786455130676655445方差分析差异源样本列交互内部总计SS21.62969.1851921.25937.3333359.4074df2241826MSFP-valueF crit10.814826.54554.3E-063.554564.5925911.27270.000673.554565.3148113.04553.7E-052.927750.407413.6 相关分析在质量分析中的应用应用实例22 测得22 个土样的全氮量(y) 与有机质含量(x) 列于表7 ,分析全氮量(y) 与有机质含量(x) 的相关性。EXXEL中只能计算相关系数的大小,而不能进行显著性判断,为此可以运用下式计算临界值:=SQRT((TINV(0.05,20))^2/((TINV(0.05,20))^2+20))显著水平自由度=n-2XXY10.913893Y10.05水平0.4227140.01水平0.5368简单相关分析应注意的问题相关系数的大小和正负只能反映变量间的线性关系,而不能反映变量间是否存在较强的非线性关系。

本文来源:https://www.bwwdw.com/article/x9tg.html

Top