随机误差.pptx
- 文档编号:14933854
- 上传时间:2023-06-28
- 格式:PPTX
- 页数:92
- 大小:1.23MB
随机误差.pptx
《随机误差.pptx》由会员分享,可在线阅读,更多相关《随机误差.pptx(92页珍藏版)》请在冰点文库上搜索。
第2章随机误差,第二节常见测量误差分布,本节介绍几种常见的误差分布,包括正态分布、均匀分布、三角分布、瑞利分布、反正弦分布、分布。
一、正态分布,服从正态分布的条件,误差因素多而小,无一个占优,彼此相互独立(中心极限定理)。
一般认为,当影响测量的因素在15个以上,且相互独立,其影响程度相当,可以认为测量值服从正态分布;若要求不高,影响因素则应在5个(至少3个)以上,也可视为正态分布。
概率密度函数,正态分布的密度函数,为测量总体的数学期望,如不计系统误差,则即为随机误差,为测量总体的标准差,也是随机误差的标准差,正态分布的这三个特点与误差大样本下的统计特性相符。
但在理论上,正态分布无界,这也是正态分布与实际误差有界性不相符之处。
分布的误差特性,单峰性:
小误差出现的概率比大误差出现的概率大。
对称性:
正误差出现的概率与负误差出现的概率相等。
抵偿性:
随测量次数增加,算术平均值趋于零。
概率计算,测得值x落在区间的置信概率,置信概率,k置信因子,正态分布的概率计算,已知随机误差服从正态分布,求误差落在区间内的概率,随机误差服从正态分布,且标准偏差为,则在该条件下,进行100次测量,可能有99次的随机误差落在区间内,正态分布的概率计算,已知随机误差服从正态分布,设概率,求与之对应的误差区间,插值计算,经典误差理论都是建立在正态分布的基础上。
凡是有3、5个以上的、差不多微小的、独立影响的合成分布都趋近正态分布。
这是被前人早已证明了的中心极限定理告诉我们的一个事实。
许多非正态分布可以用正态分布来表示。
正态分布的概率密度函数具有简单的数学形式和优良的性质。
也有不少的误差分布并不能简单地用正态分布来描述。
因而,现代误差理论及其实践需要进一步研究非正态分布的问题。
正态分布在误差理论和实践中的地位,均匀分布,若随机变量在某一范围中出现的概率相等,称其服从均匀分布,也称为等概率分布。
概率密度函数,期望,o,均匀分布,概率密度函数,标准偏差,置信因子,o,用a表示区间半宽度,即,方差,服从均匀分布的可能情形,数据切尾引起的舍入误差;数字显示末位的截断误差瞄准误差;数字仪器的量化误差;齿轮回程所产生的误差以及基线尺滑轮摩擦引起的误差;多中心值不同的正态误差总和服从均匀分布。
三角分布,概率密度函数,数学期望,标准方差,当两个分布范围相等的均匀分布,其合成误差就是三角分布。
置信因子,梯形分布,设梯形的上底半宽度为a,下底半宽度为a,01,概率密度函数,标准偏差,当=0时,梯形分布变成三角形分布,当=1时,梯形分布变成矩形分布,反正弦分布,度盘偏心引起的测角误差;正弦(或余弦)振动引起的位移误差;无线电中失配引起的误差。
概率密度函数,数学期望,标准方差,a,-a,o,服从反正弦分布的可能情形,置信因子,瑞利分布,偏心值在非负值的单向误差中,由于偏心因素所引起的轴的径向跳动齿轮和分度盘的最大齿距累积误差刻度盘、圆光栅盘的最大分度误差,概率密度函数,数学期望,标准方差,服从瑞利分布的可能情形,贝塔分布,概率密度函数,数学期望,标准方差,在给定分布界限下通过参数取不同值,贝塔分布可呈对称分布、非对称分布、单峰分布、递增或递减分布等,可逼近常见的正态、三角、均匀、反正弦、瑞利等各种典型分布。
贝塔分布具有可逼近各种实际误差分布的多态性。
贝塔分布在理论上就是有界的。
不像正态、瑞利等呈拖尾型分布,完全符合误差的基本特性即有界性。
贝塔分布的性质与密度函数图,常见分布的数字特征量,名称,正态分布,区间半宽度,标准差,期望,等价,均匀分布,三角分布,反正弦分布,瑞利分布,第三节常见的统计量分布,本节介绍常用的统计量分布,包括t分布F分布,分布。
一、分布,定义,若为独立服从同分布的随机误差,则,称服从为自由度为的分布。
概率密度函数,数学期望,标准方差,二、t分布,定义,若随机误差,随机误差,且和相互独立,则,服从的分布称为自由度为的t分布。
概率密度函数,数学期望,标准方差,o,当自由度足够大时,t分布趋近于正态分布。
t分布在误差理论和实践中的应用,t分布在研究正态小子样(测量次数较少时),是一个严密而有效的理论分布。
正态样本的算术平均值构成的如下统计量,服从自由度为的t分布。
其测量算术平均值满足,t分布的临界值,满足,三、F分布,定义,若,则,称服从为自由度为的F分布。
概率密度函数,数学期望,标准方差,第四节误差分布的分析与检验,本节介绍确定误差分布规律的几种方法,包括物理来源法,函数关系法以及图形判断法。
最后介绍有关分布检验的知识,包括正态分布统计检验(夏皮罗-威尔克检验、偏态系数和峰态系数检验)和一般分布检验(皮尔逊检验)。
一、误差分布的分析与判断,物理来源判断法,根据测量误差产生的来源,可以判断其属于何种类型如其测量受到至少有三个以上独立的、微小而大小相近的因素的影响,则可认为它服从或接近正态分布。
测量值在某范围内各处出现的机会相等,则可认为它服从均匀分布。
若与都服从正态分布,则服从偏心分布(瑞利分布),若与都在-a,a内服从均匀分布,则服从三角分布,若服从均匀分布,则服从反正弦分布,函数关系法,图形判断法,对重复测量获得的样本数据绘出频率密度直方图,并与各种常见的概率密度分布曲线相比较,判断它与何种分布相接近。
二、误差分布的统计检验,什么是统计检验?
1、概念,事先对分布形式作出某种假设,然后利用样本信息来判断原假设是否成立,2、类型,正态分布统计检验,一般分布检验,夏皮罗-威尔克检验,偏态系数检验,峰态系数检验,皮尔逊检验,皮尔逊检验(),1、提出原假设,总体的分布函数未知,某个已知的分布函数,2、计算统计量,总体中抽取出一个容量为的样本,把整个数轴分成个区间,频数,样本的观察值落在第个区间的个数,由计算出总体在各区间内取值的概率,检验(续),3、在给定显著性水平下,由分布表查得临界值。
4、作出决策。
若,拒绝,则认为。
反之,,皮尔逊检验(分布中含有参数),1、提出原假设,总体的分布函数未知,某个已知形式的分布函数,未知参数,2、计算统计量,总体中抽取出一个容量为的样本,在下利用样本给出的极大似然估计,把整个数轴分成个区间,频数,样本的观察值落在第个区间的个数,由计算出总体在各区间内取值的概率,3、在给定显著性水平下,由分布表查得临界值。
4、作出决策。
若,拒绝,皮尔逊检验(续),偏态系数检验,
(1)给出备择假设(正偏)或(负偏),
(2)计算检验统计量,(3)查表。
根据显著性水平和样本容量,由偏态统计量的分位数表查出,(4)判断。
当备择假设为时,若,则拒绝正态性假设;当备择假设为时,若,则拒绝正态性假设,【例2-3】,有下列一组测量数据,确定这批数据是否来自正态分布,-0.40-1.80-2.140.40-1.400.67-1.40-1.511.40-1.40-1.38-1.401.20-2.14-0.60-2.331.24-0.40-0.32-0.22-1.60-1.40-0.51-0.20-1.40-1.72-1.60-1.20-1.801.20-1.40-0.80-1.72-0.71-1.40-1.20-1.91-0.69-1.60-1.39-2.20-1.40-0.400.40-1.80-1.80-1.600-1.951.20,计算结果,计算统计量,由,得,因此,选择备择假设,给定显著性水平,当n=50时,查表得,因为,故拒绝正态性假设,峰态系数检验,
(1)给出备择假设(正偏)或(负偏),
(2)计算检验统计量,(3)查表。
根据显著性水平和样本容量,由峰态统计量的分位数表查出或,(4)判断。
当备择假设为时,若,则拒绝正态性假设;当备择假设为时,若,则拒绝正态性假设,【例2-4】,利用某测量仪器进行40次测量,测得与理论值的如下一系列偏差数据,确定这批数据是否来自正态分布,0.0380.2400.1240.054-0.061-0.004-0.004-0.0060.0070.0010.0610.0430.0350.163-0.008-0.0100.006-0.008-0.0240.0070.0280.1080.155-0.159-0.0320.003-0.007-0.018-0.008-0.0110.0600.067-0.025-0.096-0.2230.004-0.007-0.007-0.0100.014,计算结果,计算统计量,由,得,因此,选择备择假设,给定显著性水平,当n=40时,查表得,因为,故拒绝正态性假设,随机误差概述,一、随机误差产生的原因,举例:
某台激光数字波面干涉仪,对其进行准确度考核,在相同测量条件下对某标准平晶的表面面形进行150次重复测量获得面形峰谷值数据。
通过实验分析,查询有关的技术资料和其他信息,可知随机误差来源,150次的面形峰谷值数据,数据特点,数据列表明,各次测值不尽相同,这说明各次测量中含有随机误差,这些误差的出现没有确定的规律,即前一个数据出现后,不能预测下一个数据的大小。
但就数据整体而言,却明显具有某种统计规律,这个规律可以用统计直方图来表示。
0.13,统计直方图,统计直方图在对称性方面有一些偏离理想正态分布的情形对于测量状态比较完好的光电类测量仪器,其随机误差的分布往往较好的呈现正态分布的特征对于测量状态不完好的光电类测量仪器,特别是对传动机械部件磨损较严重而规律尚未掌握的仪器,其测量随机误差可能就呈现其他分布的特征。
激光数字波面干涉仪的随机误差主要来源,测量装置方面的因素氦氖激光源辐射激光束的频率不够稳定造成激光波长的漂移CCD光电探测器采集信号及其电信号处理电路造成干涉图像信号的随机噪声离散化采样误差、各次装夹定位不一致测量环境方面的因素放置测量主机和被测试样的隔震台不能很好消除外界的低频震动仪器所在实验室气流和温度的波动空气尘埃的漂浮、稳压电源供电电压的微小波动,激光数字波面干涉仪的随机误差主要来源,操作人员方面的因素操作人员的装夹调整不当引起被采集的测量干涉图像质量低、条纹疏密不当采集干涉图像的摄像头变焦倍数过小造成较大的离散化采样误差操作人员作为热源引起测量光路中气流和温度的扰动等,减小随机误差的技术途径,
(1)测量前,找出并消除或减小其随机误差的物理源;,
(2)测量中,采用适当的技术措施,抑制和减小随机误差;,(3)测量后,对采集的测量数据进行适当处理,抑制和减小随机误差。
对防震台充气减震、关空调减少气流、开机对激光器预热等。
戴工作手套装夹工件,调整光路要尽量减少离焦、倾斜,并使干涉条纹疏密适当,人员尽量远离测量光路;必要的话,适当增加重复测量次数取算术平均值等,视需要,有针对性地对采集的测量干涉图进行预处理,如用低通滤波、平滑滤波等方法来消除中高频随机噪声,用高通滤波法则可以有效消除低频随机噪声。
实验数据处理的统计方法,点估计的评价标准,对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题,
(1)无偏性,(3)一致性,
(2)有效性,若,则称,是的无偏估计量.,定义,我们不可能要求每一次由样本得到的,估计值与真值都相等,但可以要求这些估,计值的期望与真值相等.,都是总体参数的无偏估计量,且,则称比更有效.,当时,称为达到方差下界的无偏估计量,此时称为最有效的估计量,简称有效估计量.,罗克拉美(RaoCramer)不等式,若,是参数的无偏估计量,则,其中f(x,)是总体X的概率分布或密度函数,称为方差的下界.,定义设是总体参数,则称,是总体参数的一致(或相合)估计量.,的估计量.若对于任意的,当n时,依概率收敛于,即,一致性估计量仅在样本容量n足够大时,才显示其优越性.,正态分布的参数的估计,在等权测量条件下,对某被测量进行多次重复测量,得到一系列测量值,假设这些测量值服从正态分布。
问题的描述,为了完整描述该正态分布,必须估计其期望和方差,采用的方法:
最大似然原理,似然函数,最大似然函数,算术平均值,无偏性,是总体X的样本,证明:
不论X服从什么分布(但期望存在),是,的无偏估计量.,设总体X的k阶矩,存在,则,一致性,切比晓夫大数定理,若测量次数无限增多,且无系统误差下,由大数定理知,算术平均值以概率为1趋近于真值A,有效性,若,是参数A的无偏估计量,则,有限次测量时的估计值,算术平均值(arithmeticmean)-期望的最佳估计值,在相同测量条件下,对某被测量X进行有限次独立重复测量,得到一系列测量值,算术平均值为,最佳估计的意义,若测量次数有限,由参数估计知,算术平均值是该测量总体期望的一个最佳的估计量,即满足,满足最小二乘原理所有测量值对其算术平均值之差的平方和达到最小,在正态分布条件下,满足最大似然原理该测量事件发生的概率最大,无偏性,有效性,一致性,算术平均值,若干个独立同分布的随机变量的平均值以无限接近于1的概率接近于其期望。
所以是期望的最佳估计值。
即使在同一条件下对同一量进行多组测量,每组的平均值都不相同,说明算术平均值本身也是随机变量。
由于有限次测量时的算术平均值是其期望的最佳估计值,因此,通常用算术平均值作为测量结果的值。
方差,单次测量的方差,在等权的测量列中,即同一条件下所得一系列测值中,各随机误差平方和平均值,即,存在问题:
因其中的表示“真差”(即实际测得值与真值A之差),而因为在一般情况下真值未知,所以不能直接按定义求出值。
上述定义只是数学理论意义上的定义,无法利用上式来计算单次测量的方差。
方差,无偏性,实验标准偏差(experimentalstandarddeviation)-有限次测量时标准偏差的估计值实际工作中不可能测量无穷多次,因此无法得到总体标准偏差。
用有限次测量的数据得到标准偏差的估计值称为实验标准偏差,用符号s表示。
现介绍几种常用的实验标准偏差的估计方法。
在相同测量条件下,对某被测量X进行有限次独立重复测量,得到一系列测量值,则实验标准偏差可按以下几种方法估计,
(1)贝塞尔公式式中n次测量的算术平均值残差自由度(测量值xk的)实验标准偏差,残余误差,各个测得值与算术平均值之差,叫作残余误差(也称残差),残余误差性质:
残余误差的代数和等于零。
即,这是因为,例:
用游标卡尺测某一尺寸10次,数据见表(设无系统和粗大误差),求算术平均值及单次测值的实验标准差。
可得,利用贝塞尔公式求出的实验标准差是上述10个测值的测量组中单次测量的实验标准差。
如何理解?
例:
测量列为75.01,75.04,75.07,75.00,75.03,75.09,75.06,75.02,75.05,75.08;这10个测值是等权测量,每一个测值的实验标准差都是0.0303mm。
单次测值的实验标准差在数据处理中的意义:
1)可比较不同测量组的测量可靠性:
例:
对同一被测量进行了两组测量(如由两人),其数据是:
测量结果一样,哪个测量者的测量水平高、测值更可靠?
何时会用单次测量值作为测量结果?
2)当用单次测量值作为测量结果时,可反映单次测量测量结果的可靠性。
说明:
(1)单次测量的实验标准偏差s并非只测量一次就能得到的。
对于一定的测量方法或量仪,必须通过多次测试才能获得。
(即所谓“用统计方法得出”)
(2)一旦得出了s值,在今后使用该量仪或测量方法时,s便为已知值,便能对单次测量给出测量不确定度。
(3)在有的仪器说明书里或手册表格中往往也给出了s值。
此时,在测量过程中便可直接引用,而不必自己去求出。
需进一步研究的问题:
我们已可求出单次测量的实验标准偏差s,那么,多个测值的算术平均值的实验标准差又怎样计算?
算术平均值的实验标准差,多次测量中我们以算术平均值作为最终测量结果的值,但算术平均值并不等于真值,算术平均值仍然具有误差,在多次、等精度测量时:
算术平均值的标准差与单次测量的标准差的关系,适当增加测量次数取其算术平均值表示测量结果,是减小测量随机误差的一种常用方法。
单次测量标准差,测量总体标准差,两者的分布类型和峰值位置未发生变化,只是分散性不同。
单次,多次,10次算术平均值与单次测量的分布关系,测量次数愈大时,也愈难保证测量条件的不变,从而带来新的误差。
另外,增加测量次数,必,与测量次数的关系,当一定时,以后,已减小得较缓慢。
然会增加测量的工作量及其成本。
因此一般情况下,取以内较为适宜。
总之,要提高测量准确度,应选用适当准确度的测量仪器,选取适当的测量次数。
极差法,对多次独立测得的数据,最大值,最小值,当测量误差服从正态分布时,标准差的计算公式,估算时的相对误差,极差,是测量总体标准差的无偏估计,最大误差法,测量误差服从正态分布时,估计标准差的计算公式,估算时的相对误差,在已知被测量的真值的情形,多次独立测得的数据的真误差,其中的绝对值最大,在只进行一次性实验中,是唯一可用的方法,最大残差法,在一般情况下,被测量的真值难以知道,无法应用最大误差法估计标准差,最大残余误差估计标准差,最大残差法不适用于n=1的情形,【例】,某激光管发出的激光波长经检定为,由于某些原因,未对此检定波长作误差分析,但后来又用更精确的方法测得激光波长,试求原检定波长的标准差,概率统计术语,等权测量数据的处理的初步步骤,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机误差