六西格玛分析之置信区间.pptx
- 文档编号:18683995
- 上传时间:2023-09-08
- 格式:PPTX
- 页数:29
- 大小:874.14KB
六西格玛分析之置信区间.pptx
《六西格玛分析之置信区间.pptx》由会员分享,可在线阅读,更多相关《六西格玛分析之置信区间.pptx(29页珍藏版)》请在冰点文库上搜索。
置信区间置信区间-1-本资料来源置信区间置信区间-2-置信区间置信区间(ConfidenceIntervals)置信区间置信区间-3-DefineMeasureAnalyzeImproveControlStep8-Data分析分析Step9-VitalFewX的选定的选定q多量究变研多量究变研q中心限定理极中心限定理极q假设检验假设检验q置信区间置信区间q方差分析,均值检验方差分析,均值检验q卡方检验卡方检验q相关相关/回分析归回分析归Step7-Data收集收集路径位置路径位置理论课理论课置信区间置信区间-4-目录目录q置信区间介绍置信区间介绍q总体均值的置信区间总体均值的置信区间q总体标准差的置信区间总体标准差的置信区间qCpCp的置信区间的置信区间q置信区间例题置信区间例题置信区间置信区间-5-u抽样估计:
抽样估计:
根据样本提供的信息对总体的某些特征进行估计或推断。
估计量或统计量:
用来估计总体特征的的样本指标;总体参数:
待估计的总体指标。
所以对总体数字特征的抽样估计也叫参数估计。
所以对总体数字特征的抽样估计也叫参数估计。
可分为:
点估计和区间估计。
可分为:
点估计和区间估计。
总体总体样本样本抽取样本抽取样本零假设零假设备择假设备择假设P-valueP-value预测总体特征预测总体特征统计性推断统计性推断总体参数总体参数统计量统计量参数估计参数估计置信区间置信区间-6-l区间估计:
区间估计:
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
根据样本估计量以一定可靠程度推断总体参数所在的区间范围。
这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。
利用基于统计学的置信区间来量化样本的不确定性利用基于统计学的置信区间来量化样本的不确定性置信区间置信区间-7-设总体参数为设总体参数为,L、U为样本确定的两个样本量,为样本确定的两个样本量,对于给定的对于给定的(01),有),有P(LU)=1-则称(则称(L,U)为参数)为参数的置信度为的置信度为1-的置信区间。
的置信区间。
该区间的两个端点该区间的两个端点L、U分别称为置信下限和置信上限,分别称为置信下限和置信上限,通称为置信限。
通称为置信限。
为显著性水平;为显著性水平;1-则称为置信度,则称为置信度,l置信区间的定义置信区间的定义置信区间置信区间-8-它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。
真实的可能性。
置信度为置信度为1-1-的置信区间也就表示以的置信区间也就表示以1-1-的可能性(概率)包含了的可能性(概率)包含了未知总体参数的区间。
未知总体参数的区间。
置信区间的直观意义为:
置信区间的直观意义为:
若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。
平均说来,包含了总体参数的真值,有点区间却未包含总体参数的真值。
平均说来,包含总体参数真值的区间有(含总体参数真值的区间有(1-1-)*100%*100%,反之有,反之有*100%*100%的区间未包的区间未包含总体参数真值。
含总体参数真值。
l置信区间的意义置信区间的意义置信区间置信区间-9-u绝大多数情况下,我们计算95%的置信区间(CI)u这可解释为-100中大约95的CI将包含总体参数,或者-我们95%确信总体参数在此区间内u反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内(正态分布时Z=2s内的概率约为95%.)u如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%.l95%的置信区间的置信区间置信区间置信区间-10-求参数置信区间时可参考下面的通用格式:
求参数置信区间时可参考下面的通用格式:
置信区间置信区间=统计量统计量K*(标准误差)(标准误差)这里,统计量这里,统计量=均值、方差、均值、方差、Cp等等K=基于某统计分布的常数基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布置信区间反映我们的点估计的样本与样本间的散布我们将考虑如下的置信区间:
我们将考虑如下的置信区间:
11)总体均值)总体均值uu的置信区间;的置信区间;22)总体方差)总体方差的置信区间;的置信区间;33)工程能力)工程能力CpCp的置信区间;的置信区间;44)总体比例)总体比例PP的置信区间;的置信区间;置信区间介绍置信区间介绍置信区间置信区间-11-1-11-1)总体方差已知时,正态总体均值的区间估计)总体方差已知时,正态总体均值的区间估计1)总体均值的置信区间)总体均值的置信区间xZxZ-+aas()m/22xs()x一般公式一般公式其中其中x称为样本均值称为样本均值;称为对应于称为对应于a/2的的ZZ值值;称为抽样平均误称为抽样平均误差差;称为抽样极称为抽样极限误差限误差(x)Za/2s(x)Za/2s(x)置信区间置信区间-12-例题例题1某企业从长期实践得知,其产品直径某企业从长期实践得知,其产品直径XX是一个随机变量,服是一个随机变量,服从标准差为从标准差为0.050.05的正态分布。
从某日产品中随机抽取的正态分布。
从某日产品中随机抽取66个,测得个,测得其直径分别为其直径分别为14.814.8,15.315.3,15.115.1,1515,14.714.7,15.115.1(单(单位:
厘米)。
在位:
厘米)。
在0.950.95的置信度下,试求该产品直径的均值的置信的置信度下,试求该产品直径的均值的置信区间。
区间。
Minitab解法解法将题中的将题中的66个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:
统计基本统计单样本路径:
统计基本统计单样本ZZ输入相关参数(参考右图)输入相关参数(参考右图)置信区间置信区间-13-输出结果:
输出结果:
结论:
该产品直径的均值置信区间为(结论:
该产品直径的均值置信区间为(14.96,15.04)cm平均值平均值量变量变N平均准差准值标标误平均准差准值标标误95%置信区间置信区间C1615.00000.21910.0204(14.9600,15.0400)当样本容量相当大时,即使总体分布形式未知或总体为非正当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的方法与上述方法相同;值的方法与上述方法相同;大样本情况下,当总体方差未知而用样本方差代替时,由于大样本情况下,当总体方差未知而用样本方差代替时,由于t分布可用正态分布近似,所以对总体均值的估计也采用上述方法。
分布可用正态分布近似,所以对总体均值的估计也采用上述方法。
注意注意置信区间置信区间-14-例题例题2某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不重复抽样人,某日采用不重复抽样从中随机抽取从中随机抽取100100人调查他们的当日产量,样本人均产量为人调查他们的当日产量,样本人均产量为3535件,产量的样本标准差为件,产量的样本标准差为4.54.5件,试以件,试以95.5%95.5%的置信度估计平均的置信度估计平均产量的置信区间。
产量的置信区间。
Minitab解法解法打开打开MinitabMinitab路径:
统计基本统计量单样本路径:
统计基本统计量单样本ZZ置信区间置信区间-15-输出结果:
输出结果:
结论:
平均产量的均值置信区间为(结论:
平均产量的均值置信区间为(34.0979,35.9021)件)件平均值平均值N平均准值标误平均准值标误95.5%置信区间置信区间10035.0000.450(34.098,35.902)输入相关参数(参考下图)输入相关参数(参考下图)置信区间置信区间-16-1-21-2)总体方差未知时,正态总体均值的区间估计(小样本)总体方差未知时,正态总体均值的区间估计(小样本)一般公式一般公式其中其中x称为样本均值称为样本均值;称为对应于称为对应于a/2,自由度为自由度为n-1n-1的的的的t值值;称为抽样极限误差称为抽样极限误差(x)ta/2,n-1SSta/2,n-1snxtnxtnnn/,/,2121置信区间置信区间-17-例题例题3某食品厂从一批袋装食品中随机抽取某食品厂从一批袋装食品中随机抽取1010袋,测得每袋重量袋,测得每袋重量(单位:
克)分别为(单位:
克)分别为789789、780780、794794、762762、802802、813813、770770、785785、810810、806806,要求以,要求以95%95%的把握程度,估计这批食品的平均每袋重量的区间范的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。
围及其允许误差。
Minitab解法解法将题中的将题中的1010个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:
统计基本统计量单样本路径:
统计基本统计量单样本tt置信区间置信区间-18-输入相关参数(参考右图)输入相关参数(参考右图)输出结果:
输出结果:
结论:
该产品每袋重量的均值置信区间为(结论:
该产品每袋重量的均值置信区间为(778.841,803.359)克;)克;允许误差:
允许误差:
2.262*2.262*5.419=12.26(克)(克)平均值平均值量变量变N平均准差准值标标误平均准差准值标标误95%置信区间置信区间C110791.1017.145.42(778.84,803.36)置信区间置信区间-19-2)总体标准差的置信区间)总体标准差的置信区间一般公式一般公式(小样(小样本)本)其中其中s称为样本标准差称为样本标准差;称为对应于称为对应于a/2的的Chi-Square值值;称为自由度称为自由度;2a/2n-1/scsscaann-1122122SS置信区间置信区间-20-假设我们获得一个假设我们获得一个16个数据点的样本,得到的标准偏差为个数据点的样本,得到的标准偏差为1.66。
自由度。
自由度(为为16-1或或15。
Sigma的的95%(=.05)置信区置信区间是:
间是:
123257.166161166161166161166161166161274916616162605221052202529752././.置信区间置信区间-21-例题例题4用用例题例题33的的1010个数据求标准差的置信区间个数据求标准差的置信区间Minitab解法解法将题中的将题中的1010个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:
统计基本统计量路径:
统计基本统计量形化图汇总形化图汇总置信区间置信区间-22-结论:
样本的标准差是结论:
样本的标准差是17.14,17.14,总体标准差的总体标准差的95%95%的置信区间在的置信区间在11.7911.79和和31.7831.78之间。
之间。
输出结果输出结果810800790780770760中位数平均值805800795790785780775第一四分位数777.50中位数791.50第三四分位数807.00最大值813.00778.84803.36776.58807.3711.7931.28A平方0.19P值0.869平均值791.10标准差17.14方差293.66偏度-0.379718峰度-0.914935N10最小值762.00Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间9955%置置信信区区间间CC11摘摘要要置信区间置信区间-23-Cpn-1CpCpn-11-/2,n-12/2,n-12ccaaCpn-1CpCpn-11-/2,n-12/2,n-12ccaa这就是说,我们有这就是说,我们有95%把握说真实的把握说真实的Cp值在值在1.57和和3.01之间之间Cp=2.29(n=20)的的95%置信区间计算如置信区间计算如右:
右:
3)工程能力)工程能力Cp的置信区间的置信区间一般公式一般公式229191922989119328519157975192025192.,.,CP2.29CP2.29Cp3.01/2-1-n21,21,1的百分数上限和下限平方分布的的是自由度为和其中nn置信区间置信区间-24-v我们将定义一个过程,其目标值为我们将定义一个过程,其目标值为7070,USL=100USL=100,LSL=40.LSL=40.v班上的每个人都从一个平均值班上的每个人都从一个平均值=70=70,标准差,标准差=10=10的分布中产生的分布中产生2020个随机正态数字个随机正态数字v假设我们的“真实的”假设我们的“真实的”Cp=1.00.Cp=1.00.v产生数据后,先用产生数据后,先用MinitabMinitab计算出计算出CpCp;v再用前面的公式计算再用前面的公式计算CpCp的的95%95%置信区间;置信区间;v假设班里的人数为假设班里的人数为5050,我们期待至少一个,我们期待至少一个CICI不不包含包含1.001.00v准备发表你的结果准备发表你的结果Cp的置信区间的置信区间Minitab模模拟拟置信区间置信区间-25-1.1.产生产生2020个随机数据,并保存在个随机数据,并保存在C1C12.2.求其工程能力求其工程能力100908070605040LSLUSLLSL40目标*USL100样本均值68.7953样本N20标准差(组内)14.7561标准差(整体)11.4249过程数据Cp0.68CPL0.65CPU0.70Cpk0.65Pp0.88PPL0.84PPU0.91Ppk0.84Cpm*整体能力潜在(组内)能力PPMUSL0.00PPM合计0.00实测性能PPMUSL17227.49PPM合计42730.98预期组内性能PPMUSL3154.32PPM合计9015.42预期整体性能组内整体CC11的的过过程程能能力力置信区间置信区间-26-3.基本量形化统计统计图汇总基本量形化统计统计图汇总4.4.求总体标准差的置信区间的上限和下限求总体标准差的置信区间的上限和下限.80706050中位数平均值75.072.570.067.565.062.560.0第一四分位数60.558中位数68.902第三四分位数79.653最大值87.14563.44874.14260.98972.8228.68916.687A平方0.39P值0.346平均值68.795标准差11.425方差130.528偏度0.123551峰度-0.887528N20最小值49.512Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间9955%置置信信区区间间CC11摘摘要要置信区间置信区间-27-总体标准差的置信区间总体标准差的置信区间下限下限Sigma上限样本大小上限样本大小8.68911.42516.68720CCpBestCase)(WorstCase)p(=-=-=100406*8.6891.15100400.599现在我们可以使用这些估计的上下限来计算现在我们可以使用这些估计的上下限来计算Cp的置信区间了的置信区间了我们看到这是一个包含我们看到这是一个包含1.00的实际的实际Cp95%的置信区间的置信区间5.5.求求CpCp的置信区间的置信区间6*16.687置信区间置信区间-28-4)总体比率(或比例)总体比率(或比例)P的置信区间的置信区间pZpZ-+aas()P/22ps()p一般公式一般公式其中其中p称为样本比例称为样本比例;称为抽样极称为抽样极限误差限误差(p)Za/2s(p)置信区间置信区间-29-例题例题5某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品品200200只,样本良品率为只,样本良品率为85%85%,试计算当把握程度为,试计算当把握程度为90%90%时良品时良品率的区间范围。
率的区间范围。
公式求法公式求法已知:
已知:
n=200,p=0.85,1-a=0.90,Za/2=1.645则将上面的数字代入公式中,得则将上面的数字代入公式中,得总体良品率总体良品率PP的置信度为的置信度为90%90%的置信区间为:
的置信区间为:
85%-4.15%P85%+4.15%85%-4.15%P85%+4.15%;即为(即为(80.85%80.85%,89.15%89.15%)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛 分析 置信区间