定量分析的误差及数据处理.docx
- 文档编号:15741518
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:26
- 大小:194.21KB
定量分析的误差及数据处理.docx
《定量分析的误差及数据处理.docx》由会员分享,可在线阅读,更多相关《定量分析的误差及数据处理.docx(26页珍藏版)》请在冰点文库上搜索。
定量分析的误差及数据处理
第2章定量分析的误差及数据处理
要点与难点
1.准确度与精密度
2.误差与偏差的运算
3.系统误差与随机误差
4.检验并消除系统误差
5.可疑值的取舍
6.有效数字及运算规则
2.1误差的种类和来源
定量分析的任务是准确测定试样中有关组分的含量,但在分析过程中误差是客观存在的,因此应该了解分析过程中误差产生的原因及其出现的规律,以便采取相应措施减少误差。
另一方面必须对分析结果进行评价,判断其准确性。
一、系统误差(systematicerror)
系统误差又称可测误差,是由某种固定原因按确定方向起作用而造成的。
具有重复性、单向性和可测性。
即在一定条件下重复测定时会重复出现;使测定结果系统地偏高或偏低,其正负和大小也有一定规律;因产生原因固定,所以可设法测出其数值大小,并通过校正的方法予以减小或消除。
系统误差存在与否决定分析结果的准确度。
产生系统误差的原因主要有以下几种。
1.方法误差
由分析方法自身不足所造成的误差。
如,重量分析法中,沉淀的溶解度大,沉淀不完全引起的分析结果偏低;滴定分析中,指示剂选择不适合,滴定终点与化学计量点不符合引起的误差;光度分析法中偏离定律,副反应发生等都能导致分析结果系统地偏高或偏低。
2.仪器误差
由测量仪器自身的不足所造成的误差。
如天平两臂不等长,砝码锈蚀磨损质量改变;量器(容量瓶、滴定管等)和仪表刻度不准确等,在使用过程中都会引起仪器误差。
3.试剂误差
由于所用试剂不纯或蒸馏水中含有微量杂质所引起的。
对痕量分析造成的影响尤为严重。
4.操作误差
是因在正常操作情况下,由于分析人员的某些主观原因或操作条件过程控制不当造成的误差。
如分析人员掌握的分析操作与正确的分析操作有差别;对颜色敏感度的不同;称量时忽视了试样的吸湿性;沉淀洗涤不充分或过分等均会引入操作误差。
二、随机误差(randomerror)
随机误差又称偶然误差:
是由某些不确定的偶然的因素引起的误差,使测定结果在一定范围内波动,大小、正负不定,难以找到原因,无法测量。
例如,测量时环境温度、湿度和气压的微小波动;仪器电源的微小波动;分析人员对各份试样处理的微小差别等。
随机误差的大小决定分析结果的精密度。
随机误差的正负、大小都不可预见,无法控制,属不可测误差。
从单次测量结果来看没有任何规律性,但是在消除系统误差后,对同一试样进行多次平行测定时,各次结果的随机误差分布呈现一定的规律,利用统计学方法处理发现随机误差遵从高斯正态分布规律。
如图2-1所示,当测量值个数n趋近于无穷大,组距△S趋近于无穷小,频率分布曲线趋近于一条正态分布的平滑曲线,称为概率密度曲线。
正态分布的概率密度函数式是:
,这样的正态分布记作N(μ,σ2),其中,y表示概率分布;x表示测量值;μ表示总体平均值,即无限次测定所得数据的平均值,表示无限个数据的集中趋势。
没有系统误差时,μ=T。
σ表示总体标准偏差,表征无限次测定数据的分散程度。
(x-μ)表示随机误差,若以(x-μ)为横坐标,则曲线最高点横坐标为0。
这时表示的是随机误差的正态分布。
图2-1随机误差的正态分布曲线(μ同,σ不同,σB>σA)
测量值和随机误差的正态分布体现了随机误差的概率统计规律:
单峰性:
x=μ时,y值最大,表明测量值向μ集中的趋势;大多数测量值集中在总体平均值附近,μ很好地反映了测量值的集中趋势。
对称性:
正误差出现的概率与负误差出现的概率相等;
有限性:
小误差出现的概率大,大误差出现的概率小,特别大的误差出现的概率极小;
相消性:
无限多次测定的结果,其误差的算术平均值趋于零,即误差的平均值的极限为零。
此外,当x=μ时,
,表明数据的分散程度与σ有关,σ越大,测量值的分散程度越大,正态分布曲线也就越平坦。
三、过失
过失是由于工作人员的粗心大意或违背操作规程所产生的错误(也叫过失误差),如溶液溅失、沉淀穿滤、加错试剂、记错读数等,都会对结果带来较大影响。
在数据处理过程中,如发现过失造成的测定结果,应弃之不用。
2.2准确度和精密度
一、准确度与误差(accuracyanderror)
准确度表征测定值(x)与真实值(T)的符合程度。
测量值与真实值之间差别越小,则分析结果的准确度越高。
它说明测定结果的可靠性。
准确度的高低用误差来衡量,误差越小,表示结果的准确度越高,反之,误差越大,准确度越低。
对真值为T的分析对象总体随机抽取一个样本进行n次测量。
得到n个个别测定值x1、x2、x3、•••xn,对n个测定值进行平均,得到测定结果的平均值,那么:
(1)个别测量值的误差为:
Ei=xi-T;(2-1)
(2)实际上,通常用各次测量结果的平均值
表示测定结果,测定结果的绝对误差为:
Ea=
-T;(2-2)
(3)测量结果的相对误差为:
。
(2-3)
Er反映了误差在真实值中所占的比例,可以较合理的比较在各种情况下测定结果的准确度。
真值T(Truevalue):
某一物理量本身具有的客观存在的真实值。
真值是未知的、客观存在的量。
在特定情况下认为是已知的:
(1)理论真值(如化合物的理论组成)(如,NaCl中Cl的含量)
(2)计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等)
(3)相对真值(如高一级精度的测量值相对于低一级精度的测量值)(例如,标准样品的标准值)
二、精密度与偏差(precisionanddeviation)
精密度表征同一样品在相同条件下几次平行测量值相互符合程度。
平行测定所得数据间差别越小,则分析结果的精密度越高。
其表达了测定结果的重复性和再现性。
精密度的高低用偏差来衡量,偏差越小,精密度越高。
1.平均值(
)
n次测量值的算术平均值不是真值,但比单次策略结果更接近真值,是对真值的最佳估计。
(2-4)
2.中位数(xM)
把一组测量数据按从小到大顺序排列,中间一个数据即为中位数。
当测量数据个数为偶数时,中位数为中间相邻两个测量值的平均值。
3.绝对偏差(di)和相对偏差(dr)
绝对偏差为某单次测量值与平均值之差;相对偏差为绝对偏差与平均值之比,常用百分数形式表示。
绝对偏差:
di=xi-
(2-5)
相对偏差:
(2-6)
一组平行测定结果中的偏差有正有负或者为零,各单次测定结果偏差的代数和为零。
di和dr只能反映单次测定结果偏离平均值的程度,不能反映一组结果的精密度。
4.平均偏差(
)和相对平均偏差(
)
在实际测定中往往要比较一组平行测定结果间接近程度或离散程度,这时要用平均偏差和相对平均偏差来衡量。
平均偏差指各单次测定结果偏差绝对值的平均值:
(2-7)
相对平均偏差是平均偏差与平均值之比,常以百分数形式表示:
(2-8)
一般分析工作中,精密度常用相对平均偏差表示。
5.标准偏差
又称均方根偏差,当平行测定次数n趋于无穷大时,测定的平均值接近真值,此时标准偏差用总体标准偏差表示:
(2-9)
式中,μ为无限多次平行测定结果的平均值,称为总体平均值。
在实际测定中,测定次数有限,此时,标准偏差用样本标准偏差S来表示,定义为:
(2-10)
式中,(n-1)为自由度,指独立偏差的个数,用f表示。
相对标准偏差又称变异系数(CV),常用百分数形式表示:
(2-11)
S是表示偏差的最好方法,数学严格性高,可靠性大,能显示出较大的偏差。
6.相差(D)和相对相差(Dr)
若对样品只做两次平行测定,精密度常用相差表示:
相差D=∣x1-x2∣(2-12)
相对相差Dr=
(2-13)
7.极差(R)和相对极差(Rr)
又称全距或范围误差
极差R=xmax-xmin(2-14)
相对极差
(2-15)
此法适于说明少数几次测定结果的离散程度。
例2.1测定某样品中的含氮量,六次平行测定的结果是20.48%,20.55%,20.58%,20.60%,20.53%,20.50%。
(1)计算这组数据的平均值、中位数、极差、平均偏差、标准偏差、变异系数。
(2)若此样品是标准样品,含氮量为20.45%,计算以上测定的绝对误差和相对误差。
解:
(1)
,
,
(2)
,
三、准确度与精密度的关系
从上述讨论可知,精密度只能检验平行测定值之间相符合程度,与真值无关。
也就是说获得了良好的精密度不一定准确度就高。
这是因为精密度只反映随机误差的大小,而准确度既反映随机误差又反映系统误差。
只有在消除了系统误差的前提下,精密度好才能确定准确度好。
例如:
A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。
图2-2不同分析人员对同一样品分析结果
由图可知A的精密度低,准确度也低,测定结果较差;B的精密度虽然较高,但准确度低,测定结果也差;C的精密度高和准确度均高,故测定结果好;D的准确度虽然高但几个数据分散,靠取平均值时抵消了正负误差,这是一种巧合,是不可靠的。
从上例分析可知,好的测定结果,精密度和准确度必然都高;精密度不好,衡量准确度无意义,精密度低的测定结果绝对不可信,即精密度是保证准确度的先决条件。
但精密度高,准确度不一定好,可能有系统误差存在。
2.3提高分析结果准确度的方法
分析过程的每一步骤都可能引入误差,要使最终分析结果误差小于所允许的不确定性,必须将每一步的误差控制在允许的误差范围内。
一、选择合适的分析方法
要提高测定的准确度,首先要选择适宜的分析方法。
不同的分析方法对准确度和灵敏度各有侧重,如化学分析法准确度高,适宜常量分析中的常量组分分析;仪器分析法灵敏度高,适宜微量组分的测定。
二、减小测量误差
使用仪器进行测量时造成的绝对误差大小,由测量仪器本身的精度决定,减小测量误差的方法是适当增大被测量。
如一般分析天平一次读数的绝对误差Ei=±0.0001g,一次称量读两次Ea=2Ei =±0.0002g,一般常量分析要求测量误差Er不超过±0.1%。
故
即试样的称量质量必须在0.2g以上。
又如在滴定分析中,一般滴定管读数常有±0.01ml的误差,一次滴定中,读数两次Ea=±0.02ml,常量分析要求测量误差Er不超过±0.1%。
故
即要求每次滴定体积不少于20mL。
三、减小随机误差
减小随机误差的有效方法是增加平行测定的次数,在保证精密度符合要求的前提下,以平均值作为测定结果。
在一般的分析化学中,对于同一试样,通常要求平行测定2~4次。
四、检验并消除系统误差
(1)对照试验这是检验和消除系统误差最有效的方法,可分为以下几类:
①与标准试样进行对照可以用一组成和含量与待测试样相近的标准样,用同一方法在相同条件下对标样进行测定,如果测定结果符合要求,则说明方法可靠。
②与标准方法进行对照选择标准方法在相同条件下对待测试样进行测定,用其结果与被检验方法结果比较,判断是否存在系统误差并进行校正。
③回收试验如果待测试样组成不清楚的,可以在其中加入已知量被测组分,然后测定,看对加入已知量待测组分的回收率,由此也可以发现系统误差并加以校正。
(2)空白试验由试剂、蒸馏水、器皿带入杂质造成的误差,可以用此法扣除。
空白试验是指在不加待测试样的情况下,按照分析试样的同样操作条件进行测定,其结果为空白值,再从测定试样的结果中扣除空白值,就可得到较可靠的结果,消除系统误差。
(3)校准仪器此法可消除仪器不准引入的误差。
如砝码、移液管、滴定管等在精确分析中,都应该进行校准,并在计算结果中采用校准值。
2.4分析数据的统计处理
实际测量工作中,不可能做无限次平行测定。
对于有限次平行测定,随机误差不遵从正态分布,各次测定结果的平均值也就无法替代真实值。
人们只能估计平均值与真实值的接近程度,即真实值会在平均值周围多大的范围内出现,及出现概率有多高。
一、有限数据的分布及置信区间
1.t分布与区间概率
正态分布是无限次测量数据的分布规律。
当测量数据不多时,其分布服从t分布规律。
定义:
(2-16)
t分布曲线随自由度f而改变。
当f趋近于无穷大时,t分布趋近于正态分布。
图2-3t分布曲线(f=1,5,∞)
t分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。
不同f值及概率所相应的t值已由下表可查。
表2-1t分布值表
自由度
f=(n-1)
置信度P或(1-α)
0.50
0.90
0.95
0.99
1
1.00
6.31
12.71
63.66
2
0.82
2.92
4.30
9.93
3
0.76
2.35
3.18
5.84
4
0.74
2.13
2.78
4.60
5
0.73
2.02
2.57
4.03
6
0.72
1.94
2.45
3.71
7
0.71
1.90
2.37
3.50
8
0.71
1.86
2.31
3.36
9
0.70
1.83
2.26
3.25
10
0.70
1.81
2.23
3.17
20
0.69
1.73
2.09
2.85
0.67
1.65
1.96
2.58
表中置信度用P表示,它表示在±t区间内出现的概率;α称为显著性水准,表示在±t区间以外所出现的概率。
由于t值与置信度及自由度有关,一般表示为tα,f,例如:
t0.05,10表示置信度为95%,自由度为10时的t值。
2.置信区间
对少量测量数据,以样品平均值估计总体平均值可能存在的区间为:
(2-17)
此式表示在一定置信度下,以平均值
为中心,包含总体平均值μ的范围,称为总体平均值的置信区间。
其中,s为标准偏差,n为测量次数。
例如,μ=36.86%±0.10%(置信度为95%),可理解为有95%的把握说以平均值36.86%为中心,包含了总体平均值的区间为36.86%±0.10%。
在测量次数增多(n>30时),总体标准偏差已知的情况下,总体平均值在一定置信度下的置信区间为:
(2-18)
例2.2分析铁矿中的铁的质量分数,得到如下数据:
37.45,37.20,37.50,37.30,37.25(%)。
求置信度分别为95%和99%的置信区间。
解:
查表2-1,当P=0.95,f=n-1=4时,t=2.78
的95%置信区间为:
当P=0.99,f=n-1=4时,t=4.60
的99%置信区间为:
。
从此例结果可知,置信度越高,置信区间越大,在此区间内包括总体平均值的可能性就越大。
置信度的高低说明估计的把握程度,置信区间的大小反映了估计的精度。
置信度并非越高越好,过高的置信度导致极宽的置信区间,精度很差,没有任何意义。
二、显著性检验
显著性检验是指对存在着差异的两个样本平均值之间、或样本平均值与总体真值之间是否存在“显著性差异”的检验。
在实际工作中,往往会遇到对标准样品进行测定时,所得到的平均值与标准值(相对真值)不完全一致;或者采用两种不同的分析法或不同的分析仪器或不同的分析人员对同一试剂进行分析时,所得的样本平均值有一定的差异。
显著性检验就是检验这种差异是由随机误差引起或是由系统误差引起。
如果存在“显著性差异”,就认为这种差异是由系统误差引起;否则这种误差就是由随机误差引起,认为是正常的。
1.平均值与标准值的比较
在检验试样的平均值与标准值之间是否存在显著差异,可以使用t检验法,方法如下:
首先根据下式计算出
值:
(2-19)
再根据置信度P和自由度f,从表2-1中查出
值,并进行比较。
如果
则认为存在着显著性差异,否则不存在显著性差异。
在分析化学中,通常以95%的置信度为检验标准,即显著性水准为5%。
例2.3某化验室测定某样品中CaO的含量,得如下结果:
,该样品中CaO的质量分数标准值为30.43%,问此测定有无系统误差?
(置信度95%)
解:
查表得:
n=6,P=95%时,
。
,说明平均值和标准值间有显著差异,此测定存在系统误差。
2.两组数据平均值的比较
比较两组数据
和
之间是否存在显著性差异,必须首先用F检验法检验两者精密度之间是否差异显著,若两者差异不明显,再用t检验法检验两者平均值有无明显差异。
(1)F检验F检验是通过比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。
按下式计算F值:
(2-20)
式中,
和
分别代表两组数据中大的方差和小的方差。
查表2-2得
的值,并比较,如果
,则认为两组数据的精密度之间存在显著性差异(置信度为95%),否则不存在显著性差异。
表2-2置信度为95%的F值
f小
f大
2345678910∞
2
3
4
5
6
7
8
9
10
∞
19.00
19.16
19.25
19.30
19.33
19.36
19.37
19.38
19.39
19.50
9.55
9.28
9.12
9.01
8.94
8.88
8.84
8.81
8.78
8.53
6.54
6.59
6.39
6.26
6.16
6.09
6.04
6.00
5.96
5.63
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.78
4.71
4.36
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
4.06
4.67
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
3.63
3.23
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
3.34
2.93
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
3.13
2.71
4.10
3.71
3.48
3.33
3.22
3.14
3.07
3.02
2.97
2.54
3.00
2.60
2.37
2.21
2.10
2.01
1.94
1.88
1.83
1.00
(2)t检验确定两组平均值间有无显著差异若s1和s2之间无显著差异,则用下式求得合并标准偏差s:
(2-21)
接着计算t值:
(2-22)
再从t值表中查出
值,此时总自由度f=n1+n2-2。
如果
,则两组平均值存在显著性差异。
例2.4在不同温度下对某试样纯度作分析,所得结果(%)如下:
10℃:
96.5,95.8,97.1,96.0
37℃:
94.2,93.0,95.0,93.0,94.5
试比较两组结果是否有显著差异。
(置信度为95%)
解:
(1)F检验
,
;
,
;
,查表2-2得:
;
,表明两组数据的精密度s1和s2之间没有显著差异。
(2)t检验
;
;
查表2-1得:
;
,所以两组数据间存在着显著性差异。
三、可疑值的取舍
在一组测量数据中,有时会发现某一测量值偏离其它测量值过远。
这种测量值称为离群值或可疑值。
可疑值的取舍会影响结果的平均值,尤其是当数据较少时影响更大。
因此在计算前应对可疑值进行合理的取舍。
若可疑值是由于过失引起的,因立即舍弃,若非过失引起,则可按下列方法决定其取舍。
1.
法步骤如下:
(1)将可疑值除外,求其余数据的平均值
和平均偏差
;
(2)求可疑值x与平均值
之间的差的绝对值
;
(3)判断:
若
,则舍弃可疑值,反之保留。
2.Q检验法步骤如下:
(1)将一组测量数据按从小到大依次排列:
x1,x2,…xn-1,xn;
(2)计算舍弃商Q,统计量Q定义为:
(xn为可疑值)(2-23)
(x1为可疑值)(2-24)
(3)根据测定次数和置信度,从表2-3中查出Q表;
(4)比较Q表与Q计,若
,可疑值应舍去,反之应保留。
表2-3Q值表
测定次数,n
3
4
5
6
7
8
9
10
置
信
度
90%(Q0.90)
0.94
0.76
0.64
0.56
0.51
0.47
0.44
0.41
95%(Q0.95)
0.97
0.84
0.73
0.64
0.59
0.54
0.51
0.49
99%(Q0.99)
0.99
0.93
0.82
0.74
0.68
0.63
0.60
0.57
例2.5测定碱灰总碱量(%Na2O)得到6个数据,按其从小到大顺序排列为40.02,40.12,40.16,40.18,40.18,40.20。
第一个数据可疑,用Q检验法判断是否应舍弃?
(置性度为90%)。
解:
查表:
n=6,Q表=0.56,
,所以应舍弃可疑值。
3.格鲁布斯(Grubbs)法步骤如下:
(1)把一组数据,按从小到大排列为:
x1,x2,…xn-1,xn;
(2)统计量G定义为:
(x1为可疑值)(2-25)
(xn为可疑值)
(2-26)
(3)根据测定次数和置信度,从表2-4中查出G表;
(4)比较G表与G计,若
,可疑值应舍去,反之应保留。
表2-4G值表
n
置信度P
95%97.5%99%
3
1.15
1.15
1.15
4
1.46
1.48
1.49
5
1.67
1.71
1.75
6
1.82
1.89
1.94
7
1.94
2.02
2.10
8
2.03
2.13
2.22
9
2.11
2.21
2.32
10
2.18
2.29
2.41
11
2.23
2.36
2.48
12
2.29
2.41
2.55
13
2.33
2.46
2.61
14
2.37
2.51
2.63
15
2.41
2.55
2.71
20
2.56
2.71
2.88
2.5有效数字的运算规则
一、有效数字
在实践中对任何一种物理量的测定,其准确度都是有限的,即相对的。
比如对一个物体的质量,用分析天平称量,甲的结果是2.1543g,乙的结果是2.1542g,丙的结果是2.1541g。
这三个结果中除最后一位数字不同外,其它数字一样,这说明分析天平测出的数据除最后一位是估值外,其余数字都是准确可靠的。
这种在分析工作中能实际测量到
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定量分析 误差 数据处理