方差分析.ppt
- 文档编号:18891684
- 上传时间:2024-02-09
- 格式:PPT
- 页数:42
- 大小:4.05MB
方差分析.ppt
《方差分析.ppt》由会员分享,可在线阅读,更多相关《方差分析.ppt(42页珍藏版)》请在冰点文库上搜索。
1方方差差分分析析(ANOVA)MeasureAnalyzeImproveControl2学学习习目目标标l从双样本从双样本t检验过渡到更一般的情况检验过渡到更一般的情况,即比较即比较22组以上数据组以上数据的均值的均值(单因素方差单因素方差分析分析-one-wayANOVA)l如果各组均值存在显著差异如果各组均值存在显著差异,能指出是哪些组的均值与能指出是哪些组的均值与众不同众不同(多重多重比较比较-multiplecomparisonsmultiplecomparisons)l检检验验22个或个或22个以上因素在不同水平时的效应个以上因素在不同水平时的效应(双因素或双因素或多因素方差分析多因素方差分析-two-wayorhigherANOVAtwo-wayorhigherANOVA)l用方差分析法来分析总波动中各个因素的波动组成用方差分析法来分析总波动中各个因素的波动组成,从而从而得出得出方差分量方差分量(variancecomponents)的估计值的估计值.3单因素方差分析与双样本单因素方差分析与双样本tt检验检验双双样样本本TT检检验验如如何何比比较较更更多多的的方方法法?
问问:
两两种种方方法法的的均均值值是是否否有有差差异异?
问问:
各各种种方方法法的的均均值值是是否否有有差差异异?
如如存存在在差差异异,究究竟竟是是哪哪些些方方法法与与众众不不同同?
4是否存在差异是否存在差异?
输输出出1020304050123xAxx因素因素AA是指线路板焊接过程中的预热温度是指线路板焊接过程中的预热温度.图中横坐标表示预热温度的三个水平设置图中横坐标表示预热温度的三个水平设置.纵坐标输出表示每块线路板上的平均焊接缺陷数纵坐标输出表示每块线路板上的平均焊接缺陷数.问问:
因素因素AA的不同水平是否对输出有影响的不同水平是否对输出有影响,为什么为什么?
要做出正确判断还需什么信息要做出正确判断还需什么信息?
5方差分析方差分析l现在你的结论如何现在你的结论如何?
因素因素AA是否会产生输出差异是否会产生输出差异?
为什么为什么?
1020304050123xxx输输出出A6单因素方差分析单因素方差分析l单因素方差分析是一种比较单因素方差分析是一种比较22组以上数据均值的统计方法组以上数据均值的统计方法l检验假设检验假设:
l简而言之简而言之,ANOVA只检验均值是否存在差异只检验均值是否存在差异,但并不能但并不能指出哪些均值与众不同指出哪些均值与众不同,要回答这一问题要回答这一问题,需用多重比较需用多重比较法法.l为什么不用为什么不用tt检验两两比较检验两两比较?
7举举例例l一高尔夫设计人员需从四种凹陷形式中选取一种一高尔夫设计人员需从四种凹陷形式中选取一种,他想了解不同的他想了解不同的凹陷形式是否对球的射程有影响凹陷形式是否对球的射程有影响.l现有现有44种凹陷形式的高尔夫球共种凹陷形式的高尔夫球共2424个个.l输入变量是凹陷形式输入变量是凹陷形式,输出变量是射程输出变量是射程.l实验采用美国高尔夫协会采用的标准测试器实验采用美国高尔夫协会采用的标准测试器,实验用球随机抽取实验用球随机抽取,为什么为什么?
Dimple1Dimple2Dimple3Dimple4277281304250268299295277281317317268263286299272290304281295304286281263golf.mtw8ANOVA涉及的问题涉及的问题各种凹陷形式的平均射程是否相同各种凹陷形式的平均射程是否相同?
即即44组样本是否来自同一总体组样本是否来自同一总体?
44组均值是否确实有差异组均值是否确实有差异?
9方差分析方差分析lANOVA考察三种波动来源考察三种波动来源:
总总体体=所有观察值的总体波动所有观察值的总体波动组组间间=各组均值之间的波动各组均值之间的波动(因素因素)组组内内=各组内部的随机波动各组内部的随机波动(噪声噪声,统计误差统计误差)Total=between+within子子组组之之间间波波动动子子组组内内部部波波动动与与控控制制图图比比较较10ANOVAANOVA基础基础-平方和平方和432170656055FactorResponseyij-单单值值y-总总均均值值yj-组组均均值值i=第第jj组的第组的第ii个观察值个观察值j=第第jj组组g=总组总组数数SS(Tot)=总平方和总平方和(单值单值-总均值总均值)SS(Factor)=组间平方和组间平方和(因素平方和因素平方和)(组均值组均值-总均值总均值)SS(Error)=组内平方和组内平方和(误差平方和误差平方和)(单值单值-组均值组均值)11方差分析表方差分析表HypothesisTest为决定是否接受零假设为决定是否接受零假设,我们将利用方差分析表计算检验统计量我们将利用方差分析表计算检验统计量F为何称组内波动为误差或噪声为何称组内波动为误差或噪声.FF值有何意义值有何意义?
FF值大意味什么值大意味什么?
方差分析表方差分析表标标准准形形式式误差的共同方差误差的共同方差SOURCESSdfMS(=SS/df)F=MS(Factor)/MS(Error)BETWEENSS(Factor)g-1SS(Factor)/(g-1)MS(Factor)/MS(Error)WITHINSS(Error)SS(Error)/TOTALSS(Total)njjg=()-11gnjj-=11()gnjj-=11()12用用MinitabMinitab进行方差分析进行方差分析l打开文件打开文件golf.golf.mtwmtwlMinitabMinitab通过统计法和图表法进行方差分析通过统计法和图表法进行方差分析.图表法图表法主效应图主效应图区间图区间图统计法统计法方差分析表方差分析表l稍后我们会学习如何确定哪些组对之间存在差异稍后我们会学习如何确定哪些组对之间存在差异?
多重比较多重比较13图表法图表法-主效应图主效应图要产生主效应图要产生主效应图,首先需将各组数据堆栈首先需将各组数据堆栈,命令如下命令如下:
ManipManipStack/Stack/UnstackUnstackStackStack数据堆栈后数据堆栈后,用下列命令产生主效应图用下列命令产生主效应图:
StatANOVAMainEffectsPlotsStatANOVAMainEffectsPlots说明主效应图的意义说明主效应图的意义ChooseGraphBoxplot14图表法图表法-区间图区间图产生区间图命令如下产生区间图命令如下:
StatANOVAIntervalPlotStatANOVAIntervalPlot选取选取StandardErrorStandardError选取选取ConfidenceIntervalConfidenceInterval区间图有何意义区间图有何意义,你能否判断不同的凹陷形式是否有差异你能否判断不同的凹陷形式是否有差异,为什么为什么?
15方差分析表方差分析表用如下命令产生方差分析表用如下命令产生方差分析表:
StatANOVAOne-Way(StatANOVAOne-Way(UnstackedUnstacked)OK)OKOne-WayAnalysisofVarianceAnalysisofVarianceonDistanceTraveled16方差分析表说明方差分析表说明One-WayAnalysisofVarianceAnalysisofVarianceonResponseSourceDFSSMSFpPattern34,6261542.013.760.000Error202,242112.1Total236,8684242322212sssss+=PooledF值接近1时,说明各组均值很相近,本例中F值很大如P值小于5%,说明至少有一组均值与众不同,本例中,我们拒绝各组均值相同的原假设,即至少有一种凹陷形式的组均值与其它组不同.本例中F值对应的发生概率小于万分之一.当各组样本数相同时当各组样本数相同时.(本例样本数不同本例样本数不同,所以是加权平均值所以是加权平均值)17FF分布说明分布说明141210864200.70.60.50.40.30.20.10.0F-ValueProbF-Distributionfor3and20degreesofFreedom10%Point5%Point1%PointObservedPoint下面我们来解释下面我们来解释FF分布及分布及FF检验量检验量,下图显示的是如果所有方法产生的均值下图显示的是如果所有方法产生的均值相同时相同时FF值的分布值的分布.注意本例中计算出的注意本例中计算出的FF值在分布图形的尾部值在分布图形的尾部.10%10%点表示如果不同凹陷形式的均值相同点表示如果不同凹陷形式的均值相同,FF值大于值大于22的概率是的概率是10%.10%.18多重比较多重比较l我们已经找出凹陷形式之间存在着显著的差异我们已经找出凹陷形式之间存在着显著的差异.下一步是什么下一步是什么?
哪种哪种形式是最佳的形式是最佳的?
哪组均值显著不同哪组均值显著不同?
l我们采用多重比较来解决上述问题我们采用多重比较来解决上述问题.19多重比较多重比较l按命令按命令StatANOVAStatANOVAOnewayOneway,选择选择ComparisonsComparisons项项,屏幕显示如下选择屏幕显示如下选择项项:
lTukeysTukeyslFishersFisherslDunnettsDunnettslHsusMCBHsusMCB究竟采用哪一种多重比较方法究竟采用哪一种多重比较方法?
通常我们推荐使用通常我们推荐使用FisherFisher多重比较法多重比较法.FisherFisher多重比较法将控制各比较检验的显著性水平多重比较法将控制各比较检验的显著性水平(通常通常p=.05)p=.05)然后得然后得出总体误差率出总体误差率.TukeyTukey多重比较法提高各个比较检验的显著性水平多重比较法提高各个比较检验的显著性水平(p.05),pANOVABalancedANOVASurvivalPoisonTreatmentPoison*TreatmentOK因素效应显著因素效应显著,而互而互作用则不显著作用则不显著.28结结论论l基于前述分析基于前述分析,我们得出如下结论我们得出如下结论:
毒药和医序处理是重要因素毒药和医序处理是重要因素,而而互交作用不是互交作用不是(p=0.11).l如何检查模型的完备性如何检查模型的完备性?
模型假设成立的前提模型假设成立的前提?
方差齐次性方差齐次性残差相互独立残差相互独立残差呈正态分布残差呈正态分布均值为零均值为零标准差由组内波动估计标准差由组内波动估计模型是可被加的模型是可被加的.29检查模型符合性检查模型符合性残差看上去不呈正态分布残差看上去不呈正态分布.喇喇叭叭口口30方差稳定化方差稳定化l用用Box-CoxBox-Cox变化可以确定正确的变化参数从而保证残差正态性与变化可以确定正确的变化参数从而保证残差正态性与方差齐次性方差齐次性.l子组数为子组数为44.StatControlChartsBox-CoxTransformationSurvival4OK看来应取倒数看来应取倒数.生存时间的倒数生存时间的倒数是何意义是何意义?
31对死亡率进行方差分析对死亡率进行方差分析AnalysisofVariance(BalancedDesigns)FactorTypeLevelsValuesPoisonfixed3123Treatmenfixed41234AnalysisofVarianceforDyingSourceDFSSMSFPPoison234.877117.438672.630.000Treatmen320.41436.804828.340.000Poison*Treatmen61.57080.26181.090.387Error368.64310.2401Total4765.5053互作用波动与组互作用波动与组内波动一致内波动一致.32对死亡率再进行残差分析对死亡率再进行残差分析变化后数据表明残差方差变化后数据表明残差方差稳定稳定,残差正态性良好残差正态性良好结论结论:
(1)死亡率死亡率(Survival)Survival)-1-1作作为输出响应应更合适为输出响应应更合适;
(2)
(2)毒药和医序处理都是重毒药和医序处理都是重要的显著因素要的显著因素.注注意意:
我们的记录指标对实验分析来说我们的记录指标对实验分析来说不不一定是最佳的一定是最佳的.33ANOVAANOVA与方差分量与方差分量(COV)COV)l前述例子是前述例子是:
双双因素方差分析因素方差分析“毒药毒药”和和“医序处理医序处理”两个因素两个因素固定效应固定效应我们选择的两个因素的水平是我们选择的两个因素的水平是固定固定的的,而而不能从不能从“毒药毒药”总体或总体或“医序处理医序处理”总体中随机选取总体中随机选取.“毒药毒药”和和“处理处理”这两个因素是这两个因素是交叉交叉的的.实验单元是实验单元是“动物动物”,”,这是这是随机随机变量变量,套套在在PoisonPoison和和TreatmentTreatment组合中组合中,动物变量波动动物变量波动组合成实验误差或噪声组合成实验误差或噪声误差误差.3422因素套设计方差分析因素套设计方差分析l数据见右图数据见右图:
双因素双因素“小时小时”和和“零件零件”“小时小时”和和“零件零件”是是随机因素随机因素这里这里“小时小时”代表从大量的代表从大量的小时集合中的随机样本小时集合中的随机样本,“,“零件零件”代表一小时内生产的零件中随代表一小时内生产的零件中随机选择的样本机选择的样本.“零件零件”套套在在“小时小时”内内因第一小时内选取的因第一小时内选取的22个零件并个零件并不是第二小时内选取的不是第二小时内选取的22个零件个零件.实验单元是测量值实验单元是测量值,这是一这是一随机随机变量变量,套在套在“零件零件”内内,而而“零件零件”又又套套在在“小时小时”内内.Nested-Parts.mtw35图表分析图表分析:
零件测量值均值零件测量值均值StatControlChartsXbar-RSubgroupsize:
Part(3measurements)代代表表什什么么?
答答案案:
36图表分析图表分析:
每小时均值每小时均值极差图反映每小时内零件测量值均值的变化极差图反映每小时内零件测量值均值的变化代表代表什什么么?
回回答答:
37图表分析图表分析:
每小时均值的波动每小时均值的波动移动极差图是根据相邻每小时均值的变化量绘制的移动极差图是根据相邻每小时均值的变化量绘制的代表什么代表什么?
答案答案:
38控制图计算总结控制图计算总结现在我们用现在我们用MinitabMinitab进行分析进行分析:
StatANOVAFullyNestedANOVAStatANOVAFullyNestedANOVA注意注意:
方差分量估计时方差分量估计时,需减去一部分对应的下级分量方差需减去一部分对应的下级分量方差.有时当某一方差分量很小时有时当某一方差分量很小时,计算结果会出现负数计算结果会出现负数.由于方差不可能为负由于方差不可能为负,我们就将其设为我们就将其设为0.0.39Minitab:
Minitab:
套设计方差分析套设计方差分析40MinitabMinitab结果结果FullyNestedAnalysisofVarianceAnalysisofVarianceforYSourceDFSSMSFPHour42.26840.56710.1720.944不显著不显著Part516.49673.299364.2770.000非常显著非常显著Measurem201.02660.0513Total2919.7917VarianceComponentsSourceVarComp.%ofTotalStDev控制图法结果控制图法结果Hour-0.455*0.000.0000Part1.08395.471.0411.25Measurem0.0514.530.2270.21Total1.1341.065*Valueisnegative,andisestimatedbyzero.ExpectedMeanSquares1Hour1.00(3)+3.00
(2)+6.00
(1)2Part1.00(3)+3.00
(2)3Measurem1.00(3)41使用控制图使用控制图还是方差分析还是方差分析?
l控制图优点控制图优点直观显示各个级别的方差分量直观显示各个级别的方差分量检测出异常值检测出异常值计算简便计算简便,甚至可笔算甚至可笔算l方差分析优点方差分析优点理论上比控制图更具功效理论上比控制图更具功效,只要各级变差或波动彼此独立且呈正态分布只要各级变差或波动彼此独立且呈正态分布许多软件包能提供计算程序且计算方法已标准化许多软件包能提供计算程序且计算方法已标准化,如如MinitabMinitab方差分析可扩展至更一般的场合方差分析可扩展至更一般的场合能应付同时具有交叉因素和嵌套因素的实验能应付同时具有交叉因素和嵌套因素的实验,如如GageR&RGageR&R能应付同时具有固定因素和随机因素的实验能应付同时具有固定因素和随机因素的实验(混合混合模型模型)上述实验的设计和分析很复杂上述实验的设计和分析很复杂,可由专业人员指导可由专业人员指导42总结总结l单因素方差分析单因素方差分析每组均值之间是否存在显著差异每组均值之间是否存在显著差异?
总平方和总平方和=组间平方和组间平方和+组内平方和组内平方和(TotalSS)=TotalSS)=(BetweenSS)+BetweenSS)+(WithinSS)WithinSS)方差分析表方差分析表,F-F-检验检验,自由度自由度.哪组均值与众不同哪组均值与众不同?
(?
(多重比较多重比较)l将上述概念扩展至将上述概念扩展至双因素交叉设计的方差分析双因素交叉设计的方差分析(固定效应固定效应)两个因素两个因素,每个因素有多个水平每个因素有多个水平l举例说明了举例说明了残差分析残差分析方差稳定性变化方差稳定性变化(Box-CoxBox-Cox分析分析)l通过通过双因素套设计的方差分析双因素套设计的方差分析(随机效应随机效应)来估计方差分量来估计方差分量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析