实验设计与数据处理.ppt
- 文档编号:434260
- 上传时间:2023-04-29
- 格式:PPT
- 页数:109
- 大小:2.46MB
实验设计与数据处理.ppt
《实验设计与数据处理.ppt》由会员分享,可在线阅读,更多相关《实验设计与数据处理.ppt(109页珍藏版)》请在冰点文库上搜索。
实验设计与数据处理,引言,新产品、新工艺、新材料、新品种及其他科研成果产生流程,多次反复试验,试验数据分析,规律研究,提高产量,提高产品性能,降低成本能耗,实验已知某个结论去验证已知方法的操作验证性,实验和试验,试验未知某个结论去探索未知方法的探索探索性,科研工作的必要手段试验,1980s美国引进田口方法,1920s,1935,1949,1980s,试验设计方法起源,1935“DesignofExperiments”试验设计成为应用技术科学193040s英、美、苏用于工业,1940s末美国Deming传播SED至日本1949日本GenichiTaguechi(田口玄一)以SED为基础建立“正交试验设计”法1952应用L27(313)于日本东海电报公司19521962应用100万项,1/3成效明显19551970日本借此推行全面质量管理,1920sFisher用于田间试验StatisticalExperimentDesign1920sTippett将SED用于棉纺,1924,我国试验设计方法发展,1978,1948,范福仁田间试验之统计与分析,1970.4华罗庚推广优选法、统筹法1978优选法用于五粮液获成功,方开泰、王元创建均匀设计法,课程性质与任务,试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。
试验设计方法是自然科学研究方法论领域中的一个成熟分支学科。
让学生熟悉并掌握近代最常用、最有效的几种优化试验设计方法的基本原理及其应用。
什么叫做(优化)试验设计方法?
把数学上优化理论、技术应用于试验设计中,科学的安排试验、处理试验结果的方法。
采用科学的方法去安排试验,处理试验结果,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果的最有效的技术方法。
数理统计现有数据的分析,优化试验设计在科学研究中的地位与意义:
1.试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。
2.科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果。
简称为:
多、快、好、省。
试验设计,试验实施,数据整理,数据分析,试验研究,如何进行科学合理的试验设计优良的试验方案遵循试验设计基本原则,控制试验误差简单计算获取有价值试验规律试验研究结果可推广和重复,试验设计效果,因素对指标影响规律,因素对指标影响大小,因素间是否相互影响,优选最佳条件,估计指标值,估计和控制试验误差,本课程试验设计方法可以解决以上5个问题,实验设计基本要素,1.指标:
用来衡量实验效果好坏的特征值。
(1)指标的分类:
A.定量指标,数量指标,如重量、转化率、收率、成活率、合格率等。
B.定性指标,非数量指标,如颜色、味道、光泽等。
(2)指标的选择原则:
A.客观性强B.易于量化C.灵敏度高D.精确性强,2.因素:
对试验指标有影响的原因或要素,又称因子,在试验时重点考察的内容,一般用大写字母A、B、C标记。
(1)分类:
A.可控因素:
温度、时间、浓度等B.不可控因素:
风速、气压、气温等
(2)选择原则:
A.抓住主要因素,并且考虑各因素之间的交互作用。
B.找出非主要因素,使其在试验中保持不变,以消除其干扰作用。
3.水平:
因素在试验中所处的不同状态,可能引起指标的变化。
选择原则:
宜选择三水平;水平是等间隔的;水平是具体的;在技术上现实可行。
试验设计的方法,针对不同的具体情况,有不同的试验设计方法。
单因素试验设计多因素试验设计正交试验设计各种试验方法的目的、出发点各不相同。
试验设计方案的步骤,1.明确试验目的,确定试验指标。
2.挑选因素,选取水平。
3.确定试验设计方法。
4.安排试验点。
数据处理的目的,通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。
参考文献,水处理实验技术.李燕城.中国建筑工业出版社.试验设计与数据处理.李云雁等.化学工业出版社:
2005.2O212.6-43/2实验设计与数据处理.刘振学等.化学工业出版社:
2005.3O212.6-43/1实验设计与数据处理.田胜元.中国建筑工业出版社.TU83-43,第一章实验数据的误差分析,误差分析(erroranalysis):
对原始数据的可靠性进行客观的评定误差(error):
试验中获得的试验值与它的客观真实值在数值上的不一致试验结果都具有误差,误差自始至终存在于一切科学实验过程中客观真实值真值,1.1真值与平均值,1.1.1真值(truevalue)真值:
在某一时刻和某一状态下,某量的客观值或实际值真值一般是未知的相对的意义上来说,真值又是已知的平面三角形三内角之和恒为180国家标准样品的标称值国际上公认的计量值高精度仪器所测之值多次试验值的平均值,1.1.2平均值(mean),
(1)算术平均值(arithmeticmean),等精度试验值,适合:
试验值服从正态分布,
(2)加权平均值(weightedmean),适合不同试验值的精度或可靠性不一致时,wi权重,加权和,确定权重的方法,试验值xi在测量次数中出现的频率ni/n;当xi是各组的平均值时,wi代表各组内的试验次数(数据个数);根据权与绝对误差的平方成反比来确定权数。
例1-1在实验室称量某样品时,不同的人得4组称量结果如表1-1所示,如果认为各测量结果的可靠程度仅与测量次数成正比,试求其加权平均值。
表1-1例1-1数据表,解:
由于各测量结果的可靠程度仅与测量次数成正比,所以每组试验平均值的权值即为对应的试验次数,即,,所以加权平均值为:
例1-2在测定溶液pH值时,得到两组试验数据,其平均值为:
,试求它们的平均值。
解:
根据两组数据的绝对误差计算权重:
因为,所以,(3)对数平均值(logarithmicmean),说明:
若数据的分布具有对数特性,则宜使用对数平均值对数平均值算术平均值如果1/2x1/x22时,可用算术平均值代替,设两个数:
x10,x20,则,(4)几何平均值(geometricmean),当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。
几何平均值算术平均值,设有n个正试验值:
x1,x2,xn,则,(5)调和平均值(harmonicmean),常用在涉及到与一些量的倒数有关的场合调和平均值几何平均值算术平均值,设有n个正试验值:
x1,x2,xn,则:
1.2误差的基本概念,1.2.1绝对误差(absoluteerror)
(1)定义绝对误差试验值真值或,
(2)说明,真值未知,绝对误差也未知,可以估计出绝对误差的范围:
绝对误差限或绝对误差上界,或,绝对误差估算方法:
最小刻度的一半为绝对误差;最小刻度为最大绝对误差;根据仪表精度等级计算:
绝对误差=量程精度等级%例如,某压强表注明的精度为1.5级,则表明该表绝对误差为最大量程的1.5%,若最大量程为0.4MPa,该压强表绝对误差为:
又如某天平的最小刻度为0.lmg,则表明该天平有把握的最小称量质量是0.lmg,所以它的最大绝对误差为0.lmg。
1.2.2相对误差(relativeerror),
(1)定义:
或,或,
(2)说明:
真值未知,常将x与试验值或平均值之比作为相对误差:
或,可以估计出相对误差的大小范围:
相对误差限或相对误差上界,相对误差常常表示为百分数(%)或千分数(),例1-3已知某样品质量的称量结果为:
58.79士0.2g,试求其相对误差解:
依题意,称量的绝对误差为0.2g,所以相对误差为,1.2.3算术平均误差(averagediscrepancy),定义式:
可以反映一组试验数据的误差大小,1.2.4标准误差(standarderror),当试验次数n无穷大时,总体标准差:
试验次数为有限次时,样本标准差:
表示试验值的精密度,标准差,试验数据精密度,
(1)定义:
以不可预知的规律变化着的误差,绝对误差时正时负,时大时小
(2)产生的原因:
偶然因素(3)特点:
具有统计规律小误差比大误差出现机会多正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零可以通过增加试验次数减小随机误差随机误差不可完全避免的,1.3.1随机误差(randomerror),1.3试验数据误差的来源及分类,1.3.2系统误差(systematicerror),
(1)定义:
一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差
(2)产生的原因:
多方面(3)特点:
系统误差大小及其符号在同一试验中是恒定的它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。
1.3.3过失误差(mistake),
(1)定义:
一种显然与事实不符的误差
(2)产生的原因:
实验人员粗心大意造成(3)特点:
可以完全避免没有一定的规律,1.4.1精密度(precision),
(1)含义:
反映了随机误差大小的程度在一定的试验条件下,多次试验值的彼此符合程度例:
甲:
11.45,11.46,11.45,11.44乙:
11.39,11.45,11.48,11.50
(2)说明:
可以通过增加试验次数而达到提高数据精密度的目的试验数据的精密度是建立在数据用途基础之上的试验过程足够精密,则只需少量几次试验就能满足要求,1.4试验数据的精准度,(3)精密度判断,极差(range),标准差(standarderror),R,精密度,标准差,精密度,方差(variance),标准差的平方:
样本方差(s2)总体方差
(2)方差,精密度,1.4.2正确度(correctness),
(1)含义:
反映系统误差的大小
(2)正确度与精密度的关系:
精密度不好,但当试验次数相当多时,有时也会得到好的正确度,精密度高并不意味着正确度也高,(a),(b),(c),1.4.3准确度(accuracy),
(1)含义:
反映了系统误差和随机误差的综合表示了试验结果与真值的一致程度
(2)三者关系无系统误差的试验,精密度:
ABC正确度:
ABC准确度:
ABC,有系统误差的试验,精密度:
ABC准确度:
ABC,AB,C,1.5.1随机误差的检验,1.5试验数据误差的统计假设检验,
(1)目的:
对试验数据的随机误差或精密度进行检验。
(2)检验步骤:
计算统计量,查临界值,一般取0.01或0.05,表示有显著差异的概率,双侧(尾)检验(two-sided/tailedtest):
检验,若,则判断两方差无显著差异,否则有显著差异,单侧(尾)检验(one-sided/tailedtest):
左侧(尾)检验:
则判断该方差与原总体方差无显著减小,否则有显著减小,右侧(尾)检验,则判断该方差与原总体方差无显著增大,否则有显著增大,若,若,1.5.1.2F检验(F-test),
(1)目的:
对两组具有正态分布的试验数据之间的精密度进行比较
(2)检验步骤计算统计量,设有两组试验数据:
都服从正态分布,样本方差分别为,和,和,,则,第一自由度为,第二自由度为,服从F分布,,查临界值给定的显著水平,查F分布表,临界值,双侧(尾)检验(two-sided/tailedtest):
检验,若,则判断两方差无显著差异,否则有显著差异,单侧(尾)检验(one-sided/tailedtest):
左侧(尾)检验:
则判断该判断方差1比方差2无显著减小,否则有显著减小,右侧(尾)检验,则判断该方差1比方差2无显著增大,否则有显著增大,若,若,(3)Excel在,F检验中的应用,1.5.2系统误差的检验,1.5.2.1t检验法
(1)平均值与给定值比较目的:
检验服从正态分布数据的算术平均值是否与给定值有显著差异检验步骤:
计算统计量:
给定值(可以是真值、期望值或标准值),双侧检验:
若,则可判断该平均值与给定值无显著差异,否则就有显著差异,单侧检验,左侧检验,若,且,则判断该平均值与给定值无显著减小,否则有显著减小,右侧检验,若,且,则判断该平均值与给定值无显著增大,否则有显著增大,
(2)两个平均值的比较目的:
判断两组服从正态分布数据的算术平均值有无显著差异计算统计量:
两组数据的方差无显著差异时,s合并标准差:
两组数据的精密度或方差有显著差异时,服从t分布,其自由度为:
t检验,双侧检验:
若,则可判断两平均值无显著差异,否则就有显著差异,单侧检验,左侧检验,若,且,则判断该平均值1较平均值2无显著减小,否则有显著减小,右侧检验,若,且,则判断该平均值1较平均值2无显著增大,否则有显著增大,(3)成对数据的比较目的:
试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差计算统计量:
成对测定值之差的算术平均值:
零或其他指定值,n对试验值之差值的样本标准差:
t检验若,否则两组数据之间存在显著的系统误差,,则成对数据之间不存在显著的系统误差,,(4)Excel在,t检验中的应用,1.5.2.2秩和检验法(ranksumtest),
(1)目的:
两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等,不要求数据具有正态分布
(2)内容:
设有两组试验数据,相互独立,n1,n2分别是两组数据的个数,总假定n1n2;将这个试验数据混在一起,按从小到大的次序排列每个试验值在序列中的次序叫作该值的秩(rank)将属于第1组数据的秩相加,其和记为R1R1第1组数据的秩和(ranksum)如果两组数据之间无显著差异,则R1就不应该太大或太小,查秩和临界值表:
根据显著性水平和n1,n2,可查得R1的上下限T2和T1检验:
如果R1T2或R1T1,则认为两组数据有显著差异,另一组数据有系统误差如果T1R1T2,则两组数据无显著差异,另一组数据也无系统误差,(3)例:
设甲、乙两组测定值为:
甲:
8.6,10.0,9.9,8.8,9.1,9.1乙:
8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。
(0.05),解:
(1)排序:
(2)求秩和R1R1=7911.511.5141568(3)查秩和临界值表对于0.05,n1=6,n2=9得T1=33,T263,R1T2故:
两组数据有显著差异,乙组测定值有系统误差,1.5.3异常值的检验,可疑数据、离群值、异常值一般处理原则为:
在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理;若数据较少,则可重做一组数据对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法,1.5.3.1拉依达()检验法,内容:
可疑数据xp,若,则应将该试验值剔除。
说明:
计算平均值及标准偏差s时,应包括可疑值在内,3s相当于显著水平0.01,2s相当于显著水平0.05,可疑数据应逐一检验,不能同时检验多个数据首先检验偏差最大的数剔除一个数后,如果还要检验下一个数,应重新计算平均值及标准偏差方法简单,无须查表该检验法适用于试验次数较多或要求不高时3s为界时,要求n102s为界时,要求n5,有一组分析测试数据:
0.128,0.129,0.131,0.133,0.135,0.138,0.141,0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是否应被舍去?
(0.01),解:
(1)计算,例:
(2)计算偏差,(3)比较,3s30.011160.03350.027,故按拉依达准则,当0.01时,0.167这一可疑值不应舍去,
(2)格拉布斯(Grubbs)检验法,内容:
可疑数据xp,若,则应将该值剔除。
Grubbs检验临界值,格拉布斯(Grubbs)检验临界值G(,n)表,说明:
计算平均值及标准偏差s时,应包括可疑值在内可疑数据应逐一检验,不能同时检验多个数据首先检验偏差最大的数剔除一个数后,如果还要检验下一个数,应重新计算平均值及标准偏差能适用于试验数据较少时格拉布斯准则也可以用于检验两个数据偏小,或两个数据偏大的情况例:
例1-13,(3)狄克逊(Dixon)检验法,单侧情形将n个试验数据按从小到大的顺序排列:
x1x2xn-1xn如果有异常值存在,必然出现在两端,即x1或xn计算出统计量D或D查单侧临界值,检验,双侧情形计算D和D查双侧临界值,检验,说明,适用于试验数据较少时的检验,计算量较小单侧检验时,可疑数据应逐一检验,不能同时检验多个数据剔除一个数后,如果还要检验下一个数,应重新排序例:
例1-14,使用三种检验法时应注意的问题:
单侧检验时,可疑数据应逐一检验,不能同时检验多个数据,应按照与偏差的大小顺序来检验;单侧检验时,剔除一个数后,如果还要检验下一个数,应注意试验数据的总数发生了变化;用不同的方法检验同一组试验数据,在相同的显著性水平上,可能会有不同的结论。
三种检验法的应用范围:
当试验数据较多时,使用拉依达检验法最简单,但当试验数据较少时,不能应用;格拉布斯检验法和狄克逊检验法都能适用于试验数据较少时的检验,但是总的来说,还是试验数据越多,可疑数据被错误剔除的可能性越小,准确性越高。
1.6.1有效数字(significancefigure),能够代表一定物理量的数字有效数字的位数可反映试验或试验仪表的精度数据中小数点的位置不影响有效数字的位数例如:
50,0.050m,5.0104m第一个非0数前的数字都不是有效数字,而第一个非0数后的数字都是有效数字例如:
29和29.00第一位数字等于或大于8,则可以多计一位例如:
9.99,1.6有效数字和试验结果的表示,1.6.2有效数字的运算,
(1)加、减运算:
与其中小数点后位数最少的相同
(2)乘、除运算以各乘、除数中有效数字位数最少的为准(3)乘方、开方运算:
与其底数的相同:
例如:
2.42=5.8(4)对数运算:
与其真数的相同例如ln6.841.92;lg0.000044,(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位(6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。
(7)一些常数的有效数字的位数可以认为是无限制的例如,圆周率、重力加速度g、1/3等(8)一般在工程计算中,取23位有效数字,1.6.3有效数字的修约规则,4:
舍去5,且其后跟有非零数字,进1位例如:
3.141593.1425,其右无数字或皆为0时,“尾留双”:
若所保留的末位数字为奇数则进1若所保留的末位数字为偶数则舍弃例如:
3.14153.1421.36651.366,1.7误差的传递,误差的传递:
根据直接测量值的误差来计算间接测量值的误差1.7.1误差传递基本公式间接测量值y与直接测量值xi之间函数关系:
全微分,1.6.2有效数字的运算,
(1)加、减运算:
与其中小数点后位数最少的相同
(2)乘、除运算以各乘、除数中有效数字位数最少的为准(3)乘方、开方运算:
与其底数的相同:
例如:
2.42=5.8(4)对数运算:
与其真数的相同例如ln6.841.92;lg0.000044,(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位(6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。
(7)一些常数的有效数字的位数可以认为是无限制的例如,圆周率、重力加速度g、1/3等(8)一般在工程计算中,取23位有效数字,1.6.3有效数字的修约规则,4:
舍去5,且其后跟有非零数字,进1位例如:
3.141593.1425,其右无数字或皆为0时,“尾留双”:
若所保留的末位数字为奇数则进1若所保留的末位数字为偶数则舍弃例如:
3.14153.1421.36651.366,1.7误差的传递,误差的传递:
根据直接测量值的误差来计算间接测量值的误差1.7.1误差传递基本公式间接测量值y与直接测量值xi之间函数关系:
全微分,函数或间接测量值的绝对误差为:
相对误差为:
误差传递系数,直接测量值的绝对误差;,间接测量值的绝对误差或称函数的绝对误差。
函数标准误差传递公式:
1.7.2常用函数的误差传递公式,表1-4,1.7.3误差传递公式的应用,
(1)根据各分误差的大小,来判断间接测量或函数误差的主要来源:
例1-16
(2)选择合适的测量仪器或方法:
例1-17,例1-17测量静止流体内部某处的静压强p(Pa),计算公式为,式中pa-液面上方的大气压,Pa;-液体的密度,kg/m3;g-重力加速度,取9.81m/s2;h-测压点距液面的距离,m。
试求p的最大绝对误差、最大相对误差。
已知某次测量中,,习题,1.将下列数据保留4位有效数字:
3.1459,136653,2.33050,2.7500,2.774472.在容量分析中,计算组分含量的公式为W=Vc,其中V是滴定液的体积,c是滴定液浓度。
用浓度为(1.0000.001)mg/mL的标准液滴定某试液,消耗的体积为(20.000.02)mL,计算滴定结果的绝对误差和相对误差。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验设计 数据处理