六西格玛之分析阶段 S8 43 中心极限定理 p27.pptx
- 文档编号:18684330
- 上传时间:2023-09-08
- 格式:PPTX
- 页数:28
- 大小:1.45MB
六西格玛之分析阶段 S8 43 中心极限定理 p27.pptx
《六西格玛之分析阶段 S8 43 中心极限定理 p27.pptx》由会员分享,可在线阅读,更多相关《六西格玛之分析阶段 S8 43 中心极限定理 p27.pptx(28页珍藏版)》请在冰点文库上搜索。
中心极限定理中心极限定理-1-中心极限定理中心极限定理(CentralLimitTheorem)中心极限定理中心极限定理-2-DefineMeasureAnalyzeImproveControlStep8-Data分析分析Step9-VitalFewX的选定的选定q多量究变研多量究变研q中心限定理极中心限定理极q假设检验假设检验q置信区间置信区间q方差分析,均值检验方差分析,均值检验q卡方检验卡方检验q相关相关/回分析归回分析归Step7-Data收集收集路径位置路径位置理论课理论课中心极限定理中心极限定理-3-q定义定义q中心极限定理的应用中心极限定理的应用1.正态分布的例子2.Chi-Square分布的例子q标准误差与样本大小的关系标准误差与样本大小的关系目录目录中心极限定理中心极限定理-4-定义定义q中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。
最常用的有:
列定理的总称。
最常用的有:
q独立同分布中心极限定理:
独立同分布中心极限定理:
“随机变量随机变量x1,x2,独立,且服从同一分布,独立,且服从同一分布,若存在有限的数学期望若存在有限的数学期望E(xi)=u和方差和方差D(xi)=2,当当n时,随机变量的总和时,随机变量的总和xi趋于均值为趋于均值为nu,方差为,方差为n2的正态分的正态分布。
布。
(即算术平均数(即算术平均数1/nxi=xbar趋于均值为趋于均值为u,方差为,方差为2/n的正态分布)”的正态分布)”不论总体服从何种分布,只要它的数学期望和方差存在,不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为从中抽取容量为n的样本,则这个样本的总和或平均数是随机变量,的样本,则这个样本的总和或平均数是随机变量,当当n充分大时,充分大时,xi或或xbar趋于正态分布。
趋于正态分布。
中心极限定理中心极限定理-5-定义定义q德莫佛德莫佛-拉普拉斯中心极限定理:
拉普拉斯中心极限定理:
“如果用如果用X表示表示n次独立试验中事件次独立试验中事件A发生发生(“成功”成功”)的次数,的次数,P是事件是事件A在每次试验中发生的概率在每次试验中发生的概率,则则X服从二项分布服从二项分布,B(n,p),当当n时,时,X趋于均值为趋于均值为np,方差为,方差为npq的正态分布。
”的正态分布。
”正态分布和泊松分布都是二项分布的极限分布正态分布和泊松分布都是二项分布的极限分布当n足够大时,可用正态分布近似计算;当n足够大且p小时,可用泊松分布近似计算。
q中心极限定理是一种十分重要的现象中心极限定理是一种十分重要的现象,它是统计学中应用的许多方法它是统计学中应用的许多方法的理论基础的组成部分的理论基础的组成部分(如如:
计算样本均值的置信区间计算样本均值的置信区间)中心极限定理中心极限定理-6-利用同样的数据画出两种不同的控制图利用同样的数据画出两种不同的控制图,并仔细比较它们的差并仔细比较它们的差异异:
打开文件CENLIMIT.MTW.分别用下面的两个路径画出个体图和子群大小为5的均值图个体图路径均值图路径应用应用中心极限定理中心极限定理-7-图形输出图形输出个体数据个体数据样本平均样本平均仔细比较两个图上的控制上下线仔细比较两个图上的控制上下线(UCL(UCL和和LCL),LCL),有什么不有什么不同同?
应用应用1361211069176614631161100908070605040观观测测值值单单独独值值_X=68.28UCL=96.59LCL=39.97OOuuttppuutt的的单单值值控控制制图图28252219161310741807570656055样样本本样样本本均均值值_X=68.28UCL=80.70LCL=55.861OOuuttppuutt的的XXbbaarr控控制制图图中心极限定理中心极限定理-8-个体控制图和个体控制图和XbarXbar控制图的差异控制图的差异15100102030405060应用应用UCLX3LCLX3UCLnX3LCLnX3中心极限定理中心极限定理-9-平均值分布的标准偏差叫做平均值分布的标准偏差叫做均值标准误差,因而其定义为均值标准误差,因而其定义为:
这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平方根。
方根。
ssx=均值标准误差均值标准误差个体值的标准差个体值的标准差n=平均值的样本数平均值的样本数x均值的标准误差(均值的标准误差(StandardErroroftheMeanStandardErroroftheMean)其中其中xxn中心极限定理中心极限定理-10-我们经常依靠从测量系统中得到的一个数值来估计输入我们经常依靠从测量系统中得到的一个数值来估计输入或输出变量的值。
减小测量系统误差的简易方法就是把两个或更或输出变量的值。
减小测量系统误差的简易方法就是把两个或更多的读数平均。
多的读数平均。
我们的测量系统的精密度自动增加,增加因子是平均值样本我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根数的平方根,如果我们要想使测量系统的误差减小一半,我们就如果我们要想使测量系统的误差减小一半,我们就需要把需要把44次的测量值平均才可以。
次的测量值平均才可以。
实际应用实际应用测量系统的改善测量系统的改善MSmeanMSn()中心极限定理中心极限定理-11-l当总体数据具备正态分布时当总体数据具备正态分布时中心极限定理理解例题模拟中心极限定理理解例题模拟-1-1G假设你面前有一个大桶假设你面前有一个大桶,桶里面装有相当多数量的白色纸条桶里面装有相当多数量的白色纸条,每张纸条上都写每张纸条上都写有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布.1)1)从中随机抽出从中随机抽出99张白色纸条张白色纸条,并把其上面的并把其上面的99个数字求平均个数字求平均,2)2)然后把这个平均值写在一张绿色纸条上然后把这个平均值写在一张绿色纸条上,3)3)把这把这99张白色纸条放回原来的桶里张白色纸条放回原来的桶里,4)4)把这张绿色纸条放入另外一个桶里把这张绿色纸条放入另外一个桶里,如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。
如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。
G白色纸条代表总体的数据;白色纸条代表总体的数据;G绿色纸条代表平均值的样本;绿色纸条代表平均值的样本;G我们用我们用MINITABMINITAB来模拟做这个练习。
来模拟做这个练习。
中心极限定理中心极限定理-12-:
让我们用让我们用MINITABMINITAB产生一些模拟的数据来验证我们的理论。
产生一些模拟的数据来验证我们的理论。
:
首先用首先用MINITABMINITAB产生产生99列各列各250250个数据,假设这些数据来自一个个数据,假设这些数据来自一个平均值平均值=70=70、标准偏差、标准偏差=9=9的正态分布的正态分布:
则列则列C1-C9C1-C9代表白色纸条代表白色纸条:
然后求出各行然后求出各行99个数据的平均值,其结果放在列个数据的平均值,其结果放在列C10C10,则,则:
C10C10代表绿色纸条。
代表绿色纸条。
:
我们用描述统计的方法求出各列数据的平均和标准偏差。
我们用描述统计的方法求出各列数据的平均和标准偏差。
:
仔细比较仔细比较C1-C9C1-C9列与列与C10C10列有什么差别?
列有什么差别?
例题例题11中心极限定理应用模拟中心极限定理应用模拟中心极限定理中心极限定理-13-11、用、用MINITABMINITAB随机产生样本数据随机产生样本数据分别输入下列信息分别输入下列信息中心极限定理中心极限定理-14-22、样本平均数计、样本平均数计算算中心极限定理中心极限定理-15-33、输出:
产生、输出:
产生1010列数列数据据注意:
每次每个人操作产生的数据都不一样中心极限定理中心极限定理-16-44、描述统计路径、描述统计路径中心极限定理中心极限定理-17-55、描述统计结果比较、描述统计结果比较描述性统计描述性统计:
C1,C2,C3,C4,C5,C6,C7,C8,C9,C10平均值平均值量变量变NN*平均准准差最小下四分位中位上四分位值标误标值数数数平均准准差最小下四分位中位上四分位值标误标值数数数C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.180xxxn99933中心极限定理中心极限定理-18-55、描述统计结果比较(续)、描述统计结果比较(续)描述性统计描述性统计:
C1,C2,C3,C4,C5,C6,C7,C8,C9,C10平均值平均值量变量变NN*平均准准差最小下四分位中位上四分位值标误标值数数数平均准准差最小下四分位中位上四分位值标误标值数数数C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.180现在开始比较。
现在开始比较。
中心极限定理中心极限定理-19-G样本的散布样本的散布(C9)(C9)和样本平均的散布和样本平均的散布(C10)(C10)进行比较。
进行比较。
散布散布减少了很多减少了很多.=8.988=2.93066、直方图结果比较、直方图结果比较7674727068666462403020100CC1100频频率率均值70.05标准差2.930N250CC1100的的直直方方图图正态90.082.575.067.560.052.5403020100CC99频频率率均值70.13标准差8.988N250CC99的的直直方方图图正态中心极限定理中心极限定理-20-G用点图比较频度数则能够更明确的了解散布。
用点图比较频度数则能够更明确的了解散布。
77、点图结果比较、点图结果比较91847770635649C9C10数数据据CC99,CC1100的的点点图图每个符号最多表示2个观测值。
中心极限定理中心极限定理-21-!
样本平均值分布的样本平均值分布的平均值平均值和总体的平均值十分接近和总体的平均值十分接近;!
样本平均值分布的样本平均值分布的标准偏差标准偏差等于总体的标准偏差除以等于总体的标准偏差除以样本数的平方根样本数的平方根;!
样本平均值的分布十分接近正态分布。
样本平均值的分布十分接近正态分布。
88、结论、结论中心极限定理中心极限定理-22-q当总体数据是非正态分布时,若从中随机抽样当总体数据是非正态分布时,若从中随机抽样nn个并计算其平均,个并计算其平均,同样如此反复若干次,然后比较这些平均的散布与这些个体值的同样如此反复若干次,然后比较这些平均的散布与这些个体值的散布,你会发现,当散布,你会发现,当nn时,时,x-barx-bar的散布也具有正态分布。
的散布也具有正态分布。
q为了验证为了验证,我们在非正态分布中随机选择一个偏移较大的分布我们在非正态分布中随机选择一个偏移较大的分布-“Chi-SquareChi-Square分布”,求其分布”,求其x-barx-bar来体会一下中心极限定理。
来体会一下中心极限定理。
l当总体数据不具备正态分布时当总体数据不具备正态分布时中心极限定理理解例题模拟中心极限定理理解例题模拟-2-2中心极限定理中心极限定理-23-11、用卡方分布随机产生、用卡方分布随机产生99列,每列各有列,每列各有250250个数据个数据中心极限定理中心极限定理-24-22、用产生的数据进行点图描绘和正态检验、用产生的数据进行点图描绘和正态检验在这里看到,这是一个很偏移的分布,在这里看到,这是一个很偏移的分布,我们用它来验证中心极限定理我们用它来验证中心极限定理15.012.510.07.55.02.50.0CC99CC99的的点点图图每个符号最多表示2个观测值。
151050-599.99995908070605040302010510.1CC99百百分分比比均值2.008标准差2.149N250AD15.427P值0.005CC99的的概概率率图图正态-95%置信区间中心极限定理中心极限定理-25-C10C10项是对项是对C1C9C1C9的平均值的数据统计,的平均值的数据统计,同样样本大小为同样样本大小为99,其散布明显变得小多了。
,其散布明显变得小多了。
描述性统计描述性统计:
C1,C2,C3,C4,C5,C6,C7,C8,C9,C10平均值平均值量变量变NN*平均准准差最小下四分位中位上四分位值标误标值数数数平均准准差最小下四分位中位上四分位值标误标值数数数C125001.9170.1221.9320.0020.5431.2522.602C225002.0380.1121.7680.0030.6021.4533.068C325002.0720.1302.0500.0090.5581.4022.853C425002.0050.1392.2040.0020.5511.3272.875C525001.8540.1091.7260.0090.5341.2832.595C625001.9540.1292.0390.0030.4771.3472.743C725001.9650.1221.9350.0110.5161.4122.759C825002.0740.1382.1780.0110.5971.3792.755C925002.0080.1362.1490.0220.5991.2832.680C1025001.98750.04360.68940.47331.52531.92902.421433、用产生的数据进行描述统计比较、用产生的数据进行描述统计比较sssxxxn=2092030.67.中心极限定理中心极限定理-26-个体值的分布个体值的分布样本平均的分布样本平均的分布44、点图描绘比较,验证中心极限定理、点图描绘比较,验证中心极限定理15.012.510.07.55.02.50.0C9C10数数据据CC99,CC1100的的点点图图每个符号最多表示3个观测值。
中心极限定理中心极限定理-27-个体值的概率图个体值的概率图样本平均的分布样本平均的分布55、正态概率图描绘比较,验证中心极限定、正态概率图描绘比较,验证中心极限定理理54321099.99995908070605040302010510.1CC1100百百分分比比均值1.987标准差0.6894N250AD1.162P值0.005CC1100的的概概率率图图正态-95%置信区间151050-599.99995908070605040302010510.1CC99百百分分比比均值2.008标准差2.149N250AD15.427P值0.005CC99的的概概率率图图正态-95%置信区间中心极限定理中心极限定理-28-30201001098765432SamplenStanErr标准误差和样本大小关系标准误差与样本大小的关系标准误差与样本大小的关系Letx1010xn
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛之分析阶段 S8 43 中心极限定理 p27 六西格玛 分析 阶段 中心 极限 定理