第二章 - 误差和分析数据的处理

更新时间:2024-01-23 12:50:02 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章 误差和分析数据的处理

Error and Statistical Treatment of Analytical Data

本章学习要求:

1.掌握误差产生的原因和减免方法;准确度和精密度的衡量方式及两者之间的关系。 2.掌握随机误差的正态分布。 3.掌握有限测定数据的统计处理。 4.理解有效数字的意义并掌握其用算规则。

【背景问题】

1. 如果我非常认真地做实验,我的实验结果是不是就是真值?哪些因素会影响我的实验结

果?针对这些影响因素,我该怎么办?

2. 如果我重复做了多次实验,是不是每次的实验结果都是一样的?

3. 如何正确地记录数据?如何计算实验数据才是正确的?计算结果应该保留几位? 4. 如何撰写一篇好的学生实验报告?

定量分析的目的是通过一系列的分析步骤,来获得被测组分的准确含量。但是,在实际测量过程中,即使采用最可靠的分析方法,使用最精密的仪器,由技术最熟练的分析人员测定也不可能得到绝对准确的结果。由同一个人,在同样条件下对同一个试样进行多次测定,所得结果也不尽相同。这说明,在分析测定过程中误差是客观存在的。因此,我们不仅要得到被测组分的含量,而且必须了解分析过程中误差产生的原因及出现的规律,以便采取相应措施减小误差,并进行科学的归纳、取舍、处理,使测定结果尽量接近客观真实值。

2.1 定量分析的误差(error,E)

2.1.1 精密度、准确度和精确度

反映测量结果与真实值接近程度的量,称为精度(亦称精确度)。它与误差大小相对应,测量的精度越高,其测量误差就越小。“精度”应包括精密度和准确度两层含义。 (1)精密度(precision):测量中所测得数值重现性的程度,称为精密度。它反映偶然误差的影响程度,精密度高就表示偶然误差小。

(2)准确度(Accuracy): 测量值与真值的偏移程度,称为准确度。它反映系统误差的影响精度,准确度高就表示系统误差小。

(3)精确度*(精度): 它反映测量中所有系统误差和偶然误差综合的影响程度。 在一组测量中,精密度高的准确度不一定高,准确度高的精密度也不一定高,但精确度

1

高,则精密度和准确度都高。

为了说明精密度与准确度的区别,可用下述打靶子例子来说明。如图2-1所示。 图2-1(a)中表示精密度和准确度都很好,则精确度高;图2-1(b)表示精密度很好,但准确度却不高;图2-1(c)表示精密度与准确度都不好。在实际测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值。

(a) (b) (c)

图 2-1 精密度和准确度的关系

综上所述:精密度高,不一定准确度高;准确度高,一定要精密度好。精密度是保证准确度的先决条件,精密度高的分析结果才有可能获得高准确度;准确度是反映系统误差和随机误差两者的综合指标。

【思考题】

2-1什么是真值T (True value)?有哪几类? 2-2 准确度和精密度有何区别和联系?

2.1.2 误差与偏差

分析结果与真实值之间的差值称为误差。准确度的高低用误差来衡量。差值越小,误差就越小,即准确度高。误差一般用绝对误差和相对误差来表示。

绝对误差(E):表示测量值与真实值之差,简称误差。

E=x-μ

相对误差(RE):表示绝对误差与真实值之比,常用百分率表示。

RE=

E?x100%

【例题2-1】实验测得过氧化氢溶液的含量w(H2O2)为0.2898,若试样中过氧化氢的实值w(H2O2)为0.2902,求其绝对误差和相对误差。 【解】 E?0.2898?0.2902??0.0004RE??

0.0004?100%??0.14%0.29022

E和RE都有正负之分。正值表示分析结果偏高,负值表示分析结果偏低。其中RE能反映误差在真实结果中所占的比例,这对于比较在各种情况下测定结果的准确度更为方便,所以分析结果的准确度用RE表示更具实际意义。

在实际分析工作中,真实值并不知道,一般是取多次平行测定值的算术平均值(Average)来表示分析结果:

x1?x2??xn1nX???xi

nni?1各次测定值与平均值之差称为偏差(deviation)。偏差的大小可表示分析结果的精密度,偏差越小说明测定值的精密度越高。偏差也分为绝对偏差和相对偏差。

绝对偏差(Deviation):是某一测定值与平均值之差。

d?Xi?X相对偏差(Relative Deviation):是绝对偏差与平均值之比,常用百分率表示。

Rd?d?100%Xn平均偏差(Mean deviation):为各次测定值的偏差的绝对值的平均值。

d??Xi?1i?X式中n为测量次数。由于各测定值的绝对偏差有正有负,取平均值时会相互抵消。只有取偏差的绝对值的平均值才能正确反映一组重复测定值间的符合程度。

相对平均偏差(Relative mean deviation ):为平均偏差与平均值之比,常用百分率表示。 【例题2-2】一组重复测定值为15.67,15.69,16.03,15.89。求平均偏差和相对平均偏差。

【解】:

n15.67?15.69?16.03?15.89?15.8240.15?0.13?0.21?0.07d??0.1440.14Rd??100%?0.89.82X?在一组重复测定值中, 小偏差出现机会多,大偏差出现机会少,用平均偏差表示精密度时,对大偏差反映不够充分。例如,下面两组数据为各次测定的偏差。

3

甲组: 乙组:

?0.4, ?0.2,?0.1,0.0,?0.2,?0.2,?0.3,?0.3,?0.3,?0.4d甲?0.24,n?10?0.9,?0.1,?0.1,?0.1,0.0,0.0,?0.1,?0.2,?0.2,?0.7,d乙?0.24,n?10但是,如果用标准偏差来表示时,乙组数据的标准偏差明显偏大,因而精度度低。 标准偏差(Standard Deviation):为各测定值绝对偏差平方的平均值的平方根

n????Xi?1i???2n式中μ为总体平均值,σ为总体标准偏差。

由于实际工作中只作有限次测量,测定值的分散程度要用样本标准偏差S表示。样本为从总体中随机抽取的一部分。

S?

??Xi?1ni?X?2n?1?n?2??X?X/n????i?i?1??i?1n?12inX 代替总体平均值μ,(n-1)称为自由度,常用f 表示,表示独立偏差的式中用样本平均值

个数。

前述两组数据的标准偏差分别是 甲组 乙组

0.42?0.22??????0.4?S甲??0.2810?120.92?0.12??????0.7?S乙??0.4010?12由此可见,甲组测定值精密度较好。

相对标准偏差(Relative standard deviation):为偏差与平均值之比,用百分率表示。

RSD?S?100%X2.1.3 误差的分类与减免

根据误差产生的原因和性质分为系统误差和随机误差。

4

1.系统误差(Systematic error)

这类误差是由某种固定的原因造成的,它具有单向性,即正负、大小都有一定的规律性。当重复进行测定时系统误差会重复出现。若能找出原因,并设法加以校正,系统误差就可以消除,因此也称为可测误差。系统误差产生的主要原因是:

(1) 方法误差(Method error)指分析方法本身所造成的误差。例如滴定分析中,由指示剂确定的滴定终点与化学计量点不完全符合以及副反应的发生等,都将系统地使测定结果偏高或偏低。

(2) 仪器误差(Instrument error)主要是仪器本身不够准确或未经校准所引起的。如天平、砝码和容量器皿刻度不准等,在使用过程中就会使测定结果产生误差。

(3) 试剂误差(reagent error)是由于试剂不纯或蒸馏水中含有微量杂质所引起的。 (4) 操作误差(operational error)是由于操作人员的主观原因造成。例如,对终点颜色变化的判断,有人敏锐,有人迟钝;滴定管读数偏高或偏低等。

(5)主观误差(Personal error)分析人员本身主观因素引起的。对指示剂颜色辨别偏深或偏浅;滴定管读数习惯性偏高或偏低。

2.随机误差(Random error)

随机误差也称偶然误差。这类误差是由一些偶然和意外的原因产生的,如温度、压力等外界条件的突然变化,仪器性能的微小变化,操作稍有出入等原因所引起的。在同一条件下多次测定所出现的随机误差,其大小、正负不定,是非单向性的,因此不能用校正的方法来减少或避免此项误差。

3.过失误差(Gross error, mistake)

除了系统误差和随机误差外,还有一种由工作人员粗心大意,违反操作规程造成的错误,称 “过失”,如读错数据、透滤等。 这类误差是可以避免的。处理所得数据时,对已发现因过失而产生的结果应舍弃。

从误差的分类和各种误差产生的原因来看,只有熟练操作并尽可能地减少系统误差和随机误差,才能提高分析结果的准确度。减免误差的主要方法分述如下。

1.对照试验

5

这是用来检验系统误差的有效方法。进行对照试验时,常用已知准确含量的标准试样(或标准溶液),按同样方法进行分析测定以资对照,也可以用不同的分析方法,或者由不同单位的化验人员分析同一试样来互相对照。

在生产中,常常在分析试样的同时,用同样的方法做标样分析,以检查操作是否正确和仪器是否正常,若分析标样的结果符合“公差”规定,说明操作与仪器均符合要求,试样的分析结果是可靠的。

2.空白试验

在不加试样的情况下,按照试样的分析步骤和条件而进行的测定叫做空白试验。得到的结果称为“空白值”。从试样的分析结果中扣除空白值,就可以得到更接近于真实含量的分析结果。由试剂、蒸馏水、实验器皿和环境带入的杂质所引起的系统误差,可以通过空白试验来校正。空白值过大时,必须采取提纯试剂或改用适当器皿等措施来降低。

3.校准仪器

在日常分析工作中,因仪器出厂时已进行过校正,只要仪器保管妥善,一般可不必进行校准。在准确度要求较高的分析中,对所用的仪器如滴定管、移液管、容量瓶、天平砝码等,必须进行校准,求出校正值,并在计算结果时采用,以消除由仪器带来的误差。 4.方法校正

某些分析方法的系统误差可用其它方法直接校正。例如,在重量分析中,使被测组分沉淀绝对完全是不可能的,如有必要,须采用其它方法对溶解损失进行校正。如在沉淀硅酸后,可再用比色法测定残留在滤液中的少量硅,在准确度要求高时,应将滤液中该组分的比色测定结果加到重 量分析结果中去。

5.进行多次平行测定

这是减小随机误差的有效方法,随机误差初看起来似乎没有规律性,但事实上偶然中包含有必然性,经过人们大量的实践发现,当测量次数很多时,随机误差的分布服从一般的统计规律:

(1) 大小相近的正误差和负误差出现的机会相等,即绝对值相近而符号相反的误差是以同等的机会出现的;

(2) 小误差出现的频率较高,而大误差出现的频率较低。

6

在消除系统误差的情况下,平行测定的次数越多,则测得值的算术平均值越接近真值。显然,无限多次测定的平均值μ,在校正了系统误差的情况下,即为真值。

2.2 随机误差的正态分布

2.2.1正态分布

随机误差产生是由一些不确定的偶然因素所引起。特征是不恒定,可大可小,时正时负,难以预料和控制。似乎没有什么规律,但在同一条件下进行多次测定,则随机误差的分布符合统计规律。即按“正态分布”规律分布。

正态分布即所谓的高斯分布,它的曲线呈对称钟形,两头小,中间大,分布曲线有最高点。正态分布的数学表达式:y?f(x)?221e?(x??)/2??2?y 1 ?2> ? 1 2 ?

x

式中:y-概率密度,x-测量值,?-总体平均值,?-标准偏差,(x-?)-随机误差。

按高斯方程,曲线的具体形状和位置由μ、σ二参数决定。故不同的正态分布曲线可用函数 N(μ,σ2)表示。见图2-2.。

由此可知随机误差具有三个重要特性: 图2-2 不同σ参数的正态分布图 对称性——正、负误差出现的概率相同; 单峰性——误差小的测量占多数;

有界性——最大随机误差的绝对值不超过3σ。 2.2.2. 标准正态分布 在高斯方程中,若令 u?x???,可将正态分布

曲线中的二变量合并为一个变量u(标准正态变量),相应的高斯方程经微分转化后为:

y?f(x)?21e?u/2

?2?图3-3 标准正态分布图

7

在曲线对应的关系式中,只有一个自变量 u—故不管原始正态分布曲线形状如何,转化后的标准正态分布曲线是一样的 (峰值位置由μ变为0,拐点横坐标至μ的距离由σ变为1),即标准正态分布曲线可用函数 N(0,1) 表示,从而使问题的处理更简化。 见图3-3。

2.2.2. 随机误差的区间概率

正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。即概率为:P???????(u)?du??????1?u2/2e?du 2?随机误差在某一区间出现概率(即:测量值在某一区间内出现概率),可以取不同u值进行积分,P??u0?(u)?du??u01?u2/2e?du。见图2-4。 2?欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对式(3-16)积分求面积而得到。例如随机误差在±σ区间(u=±1),即测定值在μ±σ区间出现的概率是:

1P(?1?u?1)?2???1??1eu22du?0.683

按此法求出不同u值时的积分面积,制成相应的概率积分表可供直接查用。

表2-1中列出的面积对应于图中的阴影部分。若区间为±|u|值,则应将所查得的值乘以2。例如:

图2-4 不同u值的概率P

随机误差出现的区间 测定值出现的区间 概率 u=±1 x=μ±σ 0.3413×2=0.6826 u=±2 x=μ±2σ 0.4773×2=0.9546 u=±3 x=μ±3σ 0.4987×2=0.9974

表2-1 正态分布概率积分表

|u| 面积 |u| 面积 |u| 面积

8

0.0 0.0000 1.1 0.3643 2.2 0.4821

0.1 0.0398 1.2 0.3849 2.2 0.4861

0.2 0.0793 1.3 0.4032 2.3 0.4893

0.3 0.1179 1.4 0.4192 2.4 0.4918

0.4 0.1554 1.5 0.4332 2.5 0.4938

0.5 0.1915 1.6 0.4452 2.58 0.4951

0.6 0.2258 1.7 0.4554 2.6 0.4953

0.7 0.2580 1.8 0.4641 2.7 0.4965

0.8 0.2881 1.9 0.4713 2.8 0.4974

0.9 0.3159 1.96 0.4950 3.0 0.4987

1.0 0.3413 2.0 0.4773 ∞ 0.5000

概率积分面积表的另一用途是由概率确定误差界限。例如要保证测定值出现的概率为0.95,那么随机误差界限应为±1.96σ。

【例题2-3】 经过无数次测定并在消除了系统误差的情况下,测得某钢样中磷的质量分数为0.099%。已知σ=0.002%,问测定值落在区间0.095%-0.103%的概率是多少?

【解】:根据得u?x???

u1?0.103?0.0990.095?0.099?2 u2???2

0.0020.002|u|=2,由表3-1查得相应的概率为0.4773,则P(0.095%≤x≤0.103%)=0.4773×2=0.955。

9

【例题2-4】 对烧结矿样进行150次全铁含量分析,已知结果符合正态分布(0.4695,0.00202)。求大于0.4735的测定值可能出现的次数。 【解】:u?x????0.4735?0.4695?2 0.0020 查表,P=0.4773,故在150次测定中大于0.4773的测定值出现的概率为: 0.5000-0.4773=0.0227 150×0.0227≈3 2.3 有限测定数据的统计处理

2.3.1 t分布曲线

正态分布是无限次测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限次的测量。由于测量次数有限,σ和μ无从知道。英国统计学与化学家Gosset提出用t分布解决了这一问题。使不致因为用s代替σ而引起对正态分布的偏离。

t分布和t分布曲线,统计量t,定义为 :t?x?? sx与正态分布曲线形状相似,但t分布随自由度f而改变,当f>20时, t值与u值已非常接近了。f趋于∞时,t分布趋于正态分布。见图2-5。

图2-5 t分布曲线

t分布曲线与横坐标 t 某区间所夹面积,与正态分布曲线一样,表示测量值落在该区间的概率。显然,若选定某一概率和一定的自由度f,则 t 值也就一定。

由于t 值与置信度及自由度有关,故其表示为:tα,f 。不同f值及概率所对应的t值已计算出,可查ta,f表获得。见表2-2。

表2-2 不同测定次数和置信度下的t 值

10

测定次数 2 3 4 5 6 7 8 9 10 11 21 ∞

90% 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.725 1.645

置 信 度 95% 12.706 4.303 3,182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.086 1.960

99% 63.657 9.925 5.841 4.604 4.032 3.707 3,500 3.355 3.250 3.169 2.846 2.576

前表为最常用的 t 值表。表中的P称为置信度,表示随机测定值落在(μ±ts)区间内的概率,称为显著性水准,用α表示,即α=1-P。应用表时须加脚注,注明显著性水准和自由度,例如:t0.05, 9是指:置信度为95%(显著性水准为0.05),自由度为9时的t值。

统计量 t的表达式t?x??s中:

sx称为平均值的标准偏差(平均值x与总体平均值μ

x相符的程度),与样本容量n有关,即:

sx?s n从图2-6中可见,当测定次数n>10时,

sx的值降低

己不明显。所以,一般的测定平行做3~4次,要求较高的5~6次,要求更高的测定做10~12次也足够了。

2.3.2 平均值与真值的关系—平均值的置信区间

图2-6 平均次数的关系值的

标准偏差与

用样本研究总体时,样本均值x并不等于总体均值μ,但可以肯定,只要消除了系统误差,在某一置信度下,一定存在着一个以样本均值x为中心,包括总体均值μ在内的某一范围,称为平均值的置信区间。

由t的定义式得:??X?tsn

式中X?ts称为置信区间,其大小取决于测定的标准偏差、测定次数和置信度的选择,n置信区间愈小平均值x愈接近总体平均值μ。

11

【例题2-5】:测定 SiO2 的质量分数,得到下列数据,28.62, 28.59, 28.51, 28.48, 28.52, 28.63。求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。

【解】:x?28.62?28.59?28..51?28.48?28.52?28.63?28.56

6(0.06)2?(0.03)2?(0.05)2?(0.08)2?(0.04)2?(0.07)2s??0.06

6?1查表 2-2 置信度为 90%,n = 6 时,t = 2.015。

??28.56?2.571?0.06?28.56?0.05

6置信度为 95% 时:

??28.56?2.571?0.06?28.56?0.07

6由计算知,置信度增大,置信区间也变大。一般将置信度定为95%或90%。

【例题2-6】:测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次, 测得的数据为1.11%, 1.16%和1.12%。计算两次测定和五次测定平均值的置信区间(95%置信度)。 【解】:n = 2 时,x?1.12%?1.15%?1.14%

2(0.015)2?(0.015)2s??0.021

2?1查表 2-2,得 t95% = 12.7。

WCr?1.14%?12.7?0.021?1.14%?0.19%

2n = 5 时:x?1.12%?1.15%?1.11%?1.16%?1.12%?1.13%

5 12

?(x?x)2s??0.022

n?1查表 2-2,得 t95% = 2.78。

WCr?1.13%?2.78?0.022?1.13%?0.03%

5在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,即可使测定的平均值与总体平均值μ接近。 【思考题】

2-3 u分布和t分布曲线有何不同?

2.4 分析结果的数据处理

2.4.1 可疑数据的取舍(Outlier rejection)

在实验中得到一组数据,往往发现个别数据离群较远,这一数据称为异常值又称可疑值,如果这是由于过失造成的,必须舍去。若不是这种情况,不应随意取舍。应按一定的统计方法处理。下面我们介绍几种简单的方法。

判断离群值是否仍在偶然误差范围内,常用的统计检测方法有格鲁布斯检验法、Q检验法和4d检验法。

2.4.1.1 格鲁布斯检验法(Grubbs)

步骤:(1)将测量值从小到大排列,

x1?x2???xn,其中x1或xn为可疑值;

(2)算出平均值x及标准偏差s;

(3)若G>G表 时,可疑值舍去;若G

表2-3 GP,n值表

13

测定次数

n 3 4 5 6 7 8 9 10 11

置信度(P) 95% 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23

99% 1.15 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48

测定次数

n 12 13 14 15 16 17 18 19 20

置信度(P) 95% 2.29 2.33 2.37 2.41 2.44 2.47 2.50 2.53 2.56

99% 2.55 2.61 2.66 2.71 2.75 2.79 2.82 2.85 2.88

2. 4.1.2 Q检验法(测定次数在10次以内)

步骤:(1)将测量值从小到大排列,

(2)算出Q值,

x1?x2???xn,其中x1或xn为可疑值;

x2?x1x?x1 (2.10)

当x1可疑时,Q = nxn?xn?1xxn?x1 (2.11) 当n可疑时,Q =

(3)若Q>Q表 时,可疑值舍去;若Q

表2-4 QP,n值表

测量次数n

Q0.90

3 0.9

4 0.7

5 0.6

6 0.5

7 0.5

8 0.4

9 0.4

10 0.4

14

Q0.95 0.90.80.70.60.50.50.50.4

【例题2-7】 测定某药物中Co的质量分数(×10-6)得到结果如下:1.25,1.27,1.31,1.40。用格鲁布斯检验法和Q检验法判断1.40×10-6这个数据是否保留。 【解】:(1)格鲁布斯检验法

x=1.3110-6,s = 0.06610-6

1.40?1.310.066 = 1.36 G =

置信度选95%,n=4,查表得G表 = 1.46,G

xn?xn?11.40?1.31xn?x1 = 1.40?1.25 = 0.60 Q =

n=4,查表得Q0.90 = 0.76,Q

统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差?有下列关系? = 0.7979 ? ? 0.80 ? 。4? ? 3?,偏差超过4? 的测量值可以舍弃。

步骤:(1)将可疑值除外,求其余数据的平均值 x n ? 1和平均偏差 d n ? 1;

n? (2)求可疑值x与平均值 1之间的差的绝对值x?xn?1;

x (3)判断 x?xn?1?4dn?1,舍弃。

【例题2-8】:测量得结果:1.25、1.27、1.31、1.40,试问1.40这个数据是否应保留? 【解】:不计异常值1.40,得:x?1.28,d?0.023,4d?0.092。 异常值与平均值的绝对值差:

1.40?1.28?0.12?4d,1.40这个数据应舍去。

15

4d法在数理统计上是不够严格的,这种方法把可疑值首先排除在外,然后进行检验,容易把原来属于有效的数据也舍弃掉,所以此法有一定局限性。

Q检验法符合数理统计原理,但只适合用于一组数据中有一个可疑值的判断。 Grubbs法将正态分布中两个重要参数x及S引进,方法准确度较好。 三种方法以Grubbs法最合理而普遍适用。 2.4.2样本平均值与标准值的比较(t检验法)

为了检验一个分析方法是否可靠,是否有足够的准确度,常用已知含量的标准试样进行检验,即对照试验,用t检验法将测定的平均值与标准值比较,按t?x??s n计算t值。

若t?t表,则x与标样值有显著差异,表明被检测的方法存在系统误差;若t?t表,则

x与标样值之间的差异可认为是偶然误差引起的正常差异。

【例题2-9】 一种新方法用来测定试样含铜量,用含量为11.7mg/kg的标准试样,进行五次测定,所得数据为10.9,11.8,10.9,10.3,10.0。判断该方法是否可行?(是否存在系统误差)。

【解】:x=10.8,s=0.7

t?查表得t(0.95,5)=2.78,因此

x??sn=

10.8?11.70.75=2.87

t?t表

说明该方法存在系统误差,结果偏低。

2.4.3两组数据平均值的比较(F检验和t检验法)

当需要对两个分析人员测定相同试样所得结果进行评价,或对两种方法进行比较,检查两种方法是否存在显著性差异,即是否存在系统误差时,先用F检验检测两种数据的精密度是否存在显著性差异,若两种数据的精密度不存在显著性差异,则必须再进行t检验,已确定两种数据或两种方法是否存在显著性差异,即是否存在系统误差;若先用F检验检测两种数据的精密度存在显著性差异时,则不必再进行t检验就可确定两种数据或两种方法之间存在显著性差异。

F检验:

F?2s大s2小 (2.12)

若F?F表,不需进行t检验;若F?F表,合并标准偏差,再进行t检验。

16

公式如下: s合2(n1?1)s12?(n2?1)s2? (2.14)

n1?n2?2t?x1?x2s合n1n2 (2.13)

n1?n2

【例题2-10】 甲、乙两人对同一试样用不同方法进行测定,得两种测定值如下:

甲:1.26,1.25,1.22

乙:1.35,1.31,1.33,1.34

问两种方法间有无显著差异?

【解】: n甲?3 x甲?1.24 s甲?0.021

n乙?4 x乙?1.33 s乙?0.017

F?2s大s2小=1.53

查表得F表=9.55,F?F表,说明两组数据的精密度无显著差异。进一步进行t检

验。

s合2(n1?1)s12?(n2?1)s2(3?1)(0.021)2?(4?1)(0.017)2?==0.020

n1?n2?23?4?2t?x1?x2s合n1n2=5.90

n1?n2查表f=3+4-2=5,t表=2.57,t?t表,表明甲乙二人采用的不同方法间存在显著差异。

2.5 有效数字及其运算法则

在科学实验中,为了得到准确的测量结果,不仅要准确地测定各种数据,而是还要正确地记录和计算。分析结果的数值不仅表示试样中被测成分含量的多少,而且还反映了测定的准确程度。所以,记录实验数据和计算结果应保留几位数字是一件很重要的事,不能随便增加或减少位数。例如用重量法测定硅酸盐中的SiO2时,若称取试样重为0.4538克,经过一系列处理后,灼烧得到SiO2沉淀重0.1374克,则其百分含量为:

SiO2 % =(0.1374/0.4538)×100%=30.277655354%

上述分析结果共有11位数字,从运算来讲,并无错误,但实际上用这样多位数的数字

17

来表示上述分析结果是错误的,它没有反映客观事实,因为所用的分析方法和测量仪器不可能准确到这种程度。那么在分析实验中记录和计算时,究竟要准确到什么程度,才符合客观事实呢?这就必须了解“有效数字”的意义。

2.5.1有效数字的意义及位数

有效数字(significant figures)是指在分析工作中实际上能测量到的数字。记录数据和计算结果时究竟应该保留几位数字,须根据测定方法和使用仪器的准确程度来决定。在记录数据和计算结果时,所保留的有效数字中,只有最后一位是可疑的数字。

例如: 坩埚重18.5734克 六位有效数字 标准溶液体积24.41毫升 四位有效数字

由于万分之一的分析天平能称准至±0.0001克,滴定管的读数能读准至±0.01毫升,故上述坩埚重应是18.5734±0.0001克,标准溶液的体积应是24.41±0.01毫升,因此这些数值的最后一位都是可疑的,这一位数字称为“不定数字”。在分析工作中应当使测定的数值,只有最后一位是可疑的。

有效数字的位数,直接与测定的相对误差有关。例如称得某物重为0.5180克,它表示该物实际重量是0.5180±0.0001克,其相对误差为:

(±0.0001/0.5180)×100%=±0.02%

如果少取一位有效数字,则表示该物实际重量是0.518±0.001克,其相对误差为: (±0.001/0.518)×100%=±0.2%

表明测量的准确度后者比前者低10倍。所以在测量准确度的范围内,有效数字位数越多,测量也越准确。但超过测量准确度的范围,过多的位数是毫无意义的。

必须指出,如果数据中有“0”时,应分析具体情况,然后才能肯定哪些数据中的“0”是有效数字,哪些数据中的“0”不是有效数字。

例如:

1.0005 五位有效数字 0.5000;31.05% ;6.023×102 四位有效数字

18

0.0540;1.86×10-5 三位有效数字 0.0054;0.40% 两位有效数字 0.5 ; 0.002% 一位有效数字

在1.0005克中的三个“0”,0.5000克中的后三个“0”,都是有效数字;在0.0054克中的“0”只起定位作用,不是有效数;在0.0540克中,前面的“0”起定位作用,最后一位“0”是有效数字。同样,这些数值的最后一位数字,都是不定数字

因此,在记录测量数据和计算结果时,应根据所使用的仪器的准确度,必须使所保留的有效数字中,只有最后一位数是“不定数字”。例如,用感量为百分之一克的台秤称物体的重量,由于仪器本身能准确称到±0.0l克,所以物体的重量如果是10.4克,就应写成10.40克,不能写成10.4克。

分析化学中还经常遇到pH、pC、lgK等对数值,其有效数字的位数仅取决于小数部分数字的位数,因整数部分只说明该数的方次。例如,pH=12.68,即[H+]=2.1×l0-13mol/L,其有效数字为两位,而不是四位。

对于非测量所得的数字,如倍数、分数、π、e等等,它们没有不确定性,其有效数字可视为无限多位,根据具体情况来确定。

另外,在乘除法中,如果有效数字位数最少的因数的首位数是“8”或“9”,则有效数字可认为比这个因数多取一位。 2.5.2数字修约规则 “四舍六入五留双”。

具体的做法是,当尾数≤4时将其舍去;尾数≥6时就进一位;如果尾数为5而后面的数为0时则看前方:前方为奇数就进位,前方为偶数则舍去;当“5”后面还有不是0的任何数时,都须向前进一位,无论前方是奇还是偶数,“0”则以偶数论。

0.53664→0.5366 0.58346→0.5835 10.2750→10.28 16.4050→16.40 27.1850→27.18 18.06501→18.07

必须注意:进行数字修约时只能一次修约到指定的位数,不能数次修约,否则会得出错误的结果。

19

2.5.3有效数字的运算规则 1.加减法

当几个数据相加或相减时、它们的和或差的有效数字的保留,应以小数点后位效最少,即绝对误差最大的的数据为依据。例如0.0121、25.64及1.05782三数相加,若各数最后一位为可疑数字,则25.64中的4已是可疑数字。因此,三数相加后,第二位小数已属可疑,其余两个数据可按规则进行修约、整理到只保留两位小数。

因此,0.0121应写成0.01;1.05782应写成1.06;三者之和为: 0.01+25.64+1.06=26.71

在大量数据的运算中。为使误差不迅速积累,对参加运算的所有数据,可以多保留一位可疑数字(多保留的这一位数字叫“安全数字”)。如计算5.2727、0.075、3.7及2.12的总和时,根据上述规则,只应保留一位小数。但在运算中可以多保留一位,故5.2727应写成5.27;0.075应写成0.08;2.12应写成2.12。因此其和为:

5.27+0.08+3.7+2.12=11.17 然后、再根据修约规则把11.17整化成11.2。 2.乘除法

几个数据相乘除时,积或商的有效数字的保留,应以其中相对误差最大的那个数,即有效数字位数最少的那个数为依据。

例如求0.0121、25.64和1.05782三数相乘之积。设此三数的最后一位数字为可疑数字,且最后一位数字都有±1的绝对误差,则它们的相对误差分别为:

0.0121:±1/121×1000‰=±8‰

25.64: ±1/2564×1000‰=±0.4‰ 1.05782:±1/105782×1000‰=±0.009‰

第一个数是三位有效数字,其相对误差最大,以此数据为依据,确定其他数据的位数,即按规则将各数都保留三位有效数字然后相乘:0.0121×25.6×1.06 = 0.328

若是多保留一位可疑数字时,则0.0121×25.64×1.058 = 0.3282

20

然后再按“四舍六入五留双”规则,将0.3282,改写成0.328。 2.5.4.有效数字的运算规则在分析化学实验中的应用

1.根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位可疑数字。 2.在计算结果之前,先根据运算方法确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。

3.分析化学中的计算主要有两大类。一类是各种化学平衡中有关浓度的计算。 另一类是计算测定结果,确定其有效数字位数与待测组分在试样中的相对含量有关,一般具体要求如下:对于高含量组分(10%)的测定,四位有效数字;对中含量组分(1%-10%),三位有效数字;微量组分(<1%),两位有效数字。

2.6 一元线性回归分析法

使用标准曲线来获得试样某组分的浓度。如:光度分析中的浓度-吸光度曲线;电位法中的浓度-电位值曲线;色谱法中的浓度-峰面积(或峰高)曲线。

基本原理:线性方程的最小二乘法拟合。 一元线性方程: y = a + bx。

使各实验点到直线的距离最短(误差最小)。

利用最小二乘法计算系数a和b,得 y对 x 的回归方程,相应的直线称为回归直线。 2.6.1 一元线性回归方程 (linear regression) 设对y 作n 次独立的观测,得到一系列观测值。

yyi(xi,yi),i?1,2,3......n

假设求得一元线性回归方程表示为y?a?bx。

图2-7 回归曲线

怎样才能得出各数据点误差最小的直线呢?较好的办法是对数据进行回归分析。

x根据最小二乘法的原理,最佳的回归线应是各观测值yi 与相对应的落在回归线上的值之差的平方和(Q)为最小。见图2-7。

21

yi?a?bxi?ei

式中ei为残差,通过最小二乘法可解出线性回归系数a与b,使残差平方和达到最小。

nn2n?i???[yi?(a?bxi)]2 Q??e???yi?y2ii?1i?1i?1nn?Q?Q令:??2?xi(yi?a?bxi)?0 ??2?(yi?a?bxi)?0

?b?ai?1i?1解得:a??yi?1ni?b?xii?1nn?y?bx b??(x?x)(yii?1nii?1ni?y)

2?(x?x)1nx??xi

ni?11n其中y??yi,ni?1式中x,y分别为x和y的平均值,a为直线的截矩,b为直线的斜率,它们的值确定之后,一元线性回归方程及回归直线 y?a?bx 就定了。

2.6.2 相关系数(correlation coefficient)

用相关系数表示多点组成的回归方程的线性关系:

r??(xi?1nni?x)?(yi?y)i?1n?(xi?1i?x)2?(yi?y)2i?1n或r??xy?nxyiii?1n

n??????xi2?nx2???yi2?ny2??i?1??i?1?n a.当所有的认值(点)都在回归线上时,r= 1。 b.当y与x之间完全不存在线性关系时,r=0。

c.当 R 的绝对值在 0 与 1 之间时,可根据测量的次数及置信水平与相应的相关系数临界值比较,绝对值大于临界值时,则可认为这种线性关系是有意义的。

表5 相关系数的临界值表

22

f=n-2 r 置信度 置90% 信95% 度99%

0.988 0.997 0.999

0.900 0.950 0.990

0.805 0.878 0.959

0.729 0.811 0.917

0.669 0.755 0.875

0.622 0.707 0.834

0.582 0.666 0.798

0.549 0.632 0.765

0.521 0.602 0.735

0.497 0.576 0.708

1 2 3 4 5 6 7 8 9 10

【例题2-11】:光度法测定Fe3+时, 得到下列数据:

Fe3+(mg)

0.20 0.40 0.60 0.80 1.0

吸光度A 0.077 0.126 0.176 0.230 0.280

求①一元线性回归方程。 ②相关系数。 【解】:n?5, x?0.60, y?0.1778

?xi?152i?2.2 ?y?0.184 ?xiyi?0.6345

2ii?1i?155b??(x?x)(yii?15ii?15i?y)?2?(x?x)?xy?nxy?x?nxii2i20.6354?5?0.60?0.1778 ? ?0.2552.20?5?0.360a?y?bx?0.1778?0.025?0.60?0.025y?0.025?0.255x

r??(xi?1nni?x)?(yi?y)i?1n?(xi?1i?x)2?(yi?y)2i?1n?0.9998

f = 5 – 2 = 3, ? = 0.05, 查表 R0 = 0.878, R > R0, 有相关性(置信度95%)。

2.7 提高分析结果准确度的方法

23

1. 选择合适的分析方法

(1) 根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或重量分析法;低含量用仪器分析法。

(2) 充分考虑试样中共存组分对测定的干扰, 采用适当的掩蔽或分离方法。

(3) 对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定。

2. 减小测量的相对误差

称量:分析天平的称量误差为±0.0002g,为了使测量时的相对误差在0.1%以下,试样质量必须在0.2 g以上。

滴定管读数常有±0.0l mL的误差,在一次滴定中,读数两次,可能造成±0.02 mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20 mL以上,最好使体积在25 mL左右,一般在20至30mL之间。

微量组分的光度测定中,可将称量的准确度提高约一个数量级。 3. 减小随机误差

在消除系统误差的前提下,平行测定次数愈多,平均值愈接近真实值。因此,增加测定次数,可以提高平均值精密度。在化学分析中,对于同一试样,通常要求平行测定(parallel determination)2~4次。

4. 消除系统误差

由于系统误差是由某种固定的原因造成的,因而找出这一原因,就可以消除系统误差的来源。有下列几种方法。

(1) 对照试验-contrast test

与标准试样的标准结果进行对照;标准试样、管理样、合成样、加入回收法。 与其它成熟的分析方法进行对照;国家标准分析方法或公认的经典分析方法。 由不同分析人员,不同实验室来进行对照试验。

24

内检、外检。

(2) 空白试验- blank test

在不加待测组分的情况下,按照试样分析同样的操作手续和条件进行实验,所测定的结果为空白值,从试样测定结果中扣除空白值,来校正分析结果。

消除由试剂、蒸馏水、实验器皿和环境带入的杂质引起的系统误差,但空白值不可太大。 (3) 校准仪器 -calibration instrument

仪器不准确引起的系统误差,通过校准仪器来减小其影响。例如砝码、移液管和滴定管等,在精确的分析中,必须进行校准,并在计算结果时采用校正值。

(4) 分析结果的校正-correction result

校正分析过程的方法误差,例用重量法测定试样中高含量的SiO2,因硅酸盐沉淀不完全而使测定结果偏低,可用光度法测定滤液中少量的硅,而后将分析结果相加。

5. 正确表示分析结果

为了正确的表示分析结果,不仅要表明其数值的大小,还应该反映出测定的准确度、精密度以及为此进行的测定次数。因此最基本的参数为样本的平均值、样本的标准偏差和测定次数。也可以采用置信区间表示分析结果。

习题 一、选择题

1、下列论述中正确的是( ) A 总体平均值通常用σ表示

B 正态分布中正误差和负误差出现的概率相等 C 标准偏差通常用μ表示

D 分析结果落在μ±σ范围内的概率为68.3%

25

答案:B

2、下列论述中错误的是( ) A 平均值的置信区间是μ=x±

B 少量实验数据的平均值的置信区间是μ= x±S C 平均值与标准值的比较要用F检验 D t实验法是比较两组数据的方差S2 答案:D

3、下述情况,使分析结果产生负误差的是( ) A 用HCl标准溶液滴定碱时,测定管内壁挂水珠 B 用于标定溶液的基准物质吸湿

C 测定H2C2O4·H2O摩尔质量时,H2C2O4·2H2O失水 D 滴定前用标准溶液荡洗了锥形瓶 答案:C

4、对SiO2标样(SiO2%=37.45)测定5次,结果如下:37.40(x1)%,37.20(x2)%,37.30(x3)%,37.50(x4)%,37.30(x5)%。其相对误差(%)是( )

A 0.29 B —0.29 C 0.58 D -0.58 答案:B

5、对4题,其相对平均值的标准偏差(相对平均值的精密度)是( ) A 0.31 B 0.051

26

C -0.14 D 0.14 答案:D

6、用NaOH滴定HAc,以酚酞为指示剂滴到pH=9,会引起( ) A 正误差 B 负误差 C 操作误差 D 过失误差 答案:A

7、碱式滴定管气泡未赶出,滴定过程中气泡消失,会导致( ) A 滴定体积减小 B 滴定体积增大 C 对测定无影响

D 若为标定NaOH浓度,会使标定的浓度减小 答案:D

8、某人对试样测定5次,求得各次测定值xi与平均值x的偏差d分别:+0.04,-0.02,+0.01,-0.01,+0.06。此计算结果是( )

A 正确的 B 不正确的 C 全部结果正值 D 全部结果负值 答案:B 二、问答题

27

1、已知金矿中Au%标准值为12.2g/t,=0.2g/t。求分析结果小于11.6g/t的概率。 答:概率为99.74%。

2、测得W的百分含量为20.39、20.41、20.43,计算平均值的标准偏差和置信度为95%的置信区间

答:t0.05,2=4.30。

=0.0115%, =(20.410.049)%

3、已知铁矿石样的Fe%=54.46%,某人测4次得平均值为54.26%,标准偏差s=0.05%,问置信度95%时,分析结果是否存在系统误差。

答:存在系统误差。

4、用两种基准物质标定HCl溶液,得到下面两组结果: A.0.09896,0.09891,0.09901,0.09896

B.0.09911,0.09896,0.09886,0.09901,0.09906 问置信度为90%时,两组结果是否存在显著性差异。 答:两组结果无显著性差异

5、测定矿石中Cu%得到:2.50,2.53,2.55。问再一次所得分析结果不应舍去的界限是多少?用4d法估计。

答:不应舍去的界限是2.46~2.60。 三、计算题

1.指出下列各种误差是系统误差还是偶然误差?如果是系统误差,请区别方法误差、仪器和试剂误差或操作误差,并给出它们的减免办法。

(1)砝码受腐蚀;(2)天平的两臂不等长;(3)容量瓶与移液管未经校准;(4)在重量分析中,试样的非被测组分被共沉淀;(5)试剂含被测组分;(6)试样在称量过程中吸湿;(7)化学计量点不在指示剂的变色范围内;(8)读取滴定管读数时,最后一位数字估计不准;(9)在分光光度法测定中,波长指示器所示波长与实际波长不符。(10)在HPLC测定中,待测组分峰与相邻杂质峰部分重叠。

答:(1)系统误差;校准砝码。

(2)系统误差;校准仪器。

28

(3)系统误差;校准仪器。

(4)系统误差;控制条件扣除共沉淀。

(5)系统误差;扣除试剂空白或将试剂进一步提纯。 (6)系统误差;在110℃左右干燥后称重。 (7)系统误差;重新选择指示剂。

(8)偶然误差;最后一位是估计值,因而估计不准产生偶然误差。 (9)系统误差;校准仪器。

(10)系统误差;重新选择分析条件。 2. 说明误差与偏差、准确度与精密度的区别

答:误差是准确度的表示,是实测值与真实值偏离程度,而偏差是精密度的表示,是平行测量间的相异程度;

准确度表示测量结果的正确性,精密度表示测量结果的重复性和重现性,精密度是准确度的前提条件。

3. 为什么统计检测的正确顺序是:先进行可疑数据的取舍,再进行F检验,在F检验通过后,才能进行t检验

答:精确度为准确度的前提,只有精确度接近,准确度检验才有意义。

4.如果分析天平的称量误差为±0.2mg,拟分别称取试样0.1g和1g左右,称量的相对误差各为多少?这些结果说明了什么问题?

解:因分析天平的称量误差为?0.2mg。故读数的绝对误差?a??0.0002g

根据?r??a?100%可得 ??r0.1g??0.0002g?100%??0.2%

0.1000g?0.0002g?100%??0.02%

1.0000g ?r1g? 这说明,两物体称量的绝对误差相等,但他们的相对误差并不相同。也就是说,当被测定的量较大时,相对误差就比较小,测定的准确程度也就比较高。 5.滴定管的读数误差为±0.02mL。如果滴定中用去标准溶液的体积分别为2mL和20mL左右,读数的相对误差各是多少?从相对误差的大小说明了什么问题?

解:因滴定管的读数误差为?0.02mL,故读数的绝对误差?a??0.02mL 根据?r??a?100%可得 ??r2mL? ?r20mL?0.02mL?100%??1%

2mL?0.02mL??100%??0.1%

20mL 这说明,量取两溶液的绝对误差相等,但他们的相对误差并不相同。也就是说,当

29

被测定的量较大时,测量的相对误差较小,测定的准确程度也就较高。 6.下列数据各包括了几位有效数字?

(1)0.0330 (2) 10.030 (3) 0.01020 (4) 8.7×10-5 (5) pKa=4.74 (6) pH=10.00 答:(1)三位有效数字 (2)五位有效数字 (3)四位有效数字

(4) 两位有效数字 (5) 两位有效数字 (6)两位有效数字 7.用返滴定法测定软锰矿中MnO2的质量分数,其结果按下式进行计算:

?MnO20.80005?8.00?0.1000?10?3?)?86.942?126.07?100%

0.5000(问测定结果应以几位有效数字报出?

答::应以四位有效数字报出。

8.进行下述运算,并给出适当位数的有效数字。 (1)

2.52?4.10?15.146.16?104 (2)

3.01?21.14?5.100.0001120 (3)

?351.0?4.03?10?42.512?0.002034

(4)

+

0.0324?8.1?2.12?101.0502 (5)

2.2856?2.51?5.42?1.8940?7.50?103.5462(6) pH = 2.10 , 求

[H] = ?

(2.54×10?;2.98×10;4.02;53.0;3.144;7.9×10?mol/L)

3

6

3

9.测定碳的相对原子质量所得数据:12.0080、12.0095、12.0099、12.0101、12.0102、12.0106、12.0111、12.0113、12.0118及12.0120。求算:①平均值;②标准偏差;③平均值的标准偏差;④平均值在99%置信水平的置信限。 解x?:

12.0080?12.0095?12.0099?12.0101?12.0102?12.0106?12.0111?12.0113?12.0118?12.012010?12.01

S??(xi?1ni?x)2?0.0012

n?1Sx?0.001210?0.00038

x?t0.01,9?0.00038?12.0104?0.0012

10. 现有一组平行测定值,符合正态分布(μ=20.40,σ=0.042)。计算:(1)x=20.30和x=20.46

时的u值;(2)测定值在20.30 -20.46区间出现的概率。

2

解:(1)根据u?x???得

30

本文来源:https://www.bwwdw.com/article/mi6o.html

Top