方差分析举例.docx
- 文档编号:697195
- 上传时间:2023-04-29
- 格式:DOCX
- 页数:15
- 大小:75.25KB
方差分析举例.docx
《方差分析举例.docx》由会员分享,可在线阅读,更多相关《方差分析举例.docx(15页珍藏版)》请在冰点文库上搜索。
方差分析举例
方差分析举例
一、什么是方差分析
例1:
某饮料生产企业研制出一种新型饮料。
饮料的颜色共有四种,别离为橘黄色、粉色、绿色和无色透明。
这四种饮料的营养含量、味道、价钱、包装等可能阻碍销售量的因素全数相同,先从地理位置相似、经营规模相仿的五家超级市场上搜集了前一期该种饮料的销售量情形,见表10-1。
表10-1该饮料在五家超市的销售情形单位:
箱
超市
无色
粉色
橘黄色
绿色
1
2
3
4
5
合计
问饮料的颜色是不是对销售量产生阻碍。
解:
从表10-1中看到,20个数据各不相同,其缘故可能有两个方面:
一是销售地址不同的阻碍。
即便是相同颜色的饮料,在不同超市的销售量也是不同的。
可是,由于这五个超市地理位置相似、经营规模相仿,因此,能够把不同地址产品销售量的不同看成是随机因素的阻碍。
二是饮料颜色不同的阻碍。
即便在同一个超市里,不同颜色的饮料的销售量也是不同的。
哪怕它们的营养成份、味道、价钱、包装等方面的因素都相同,但销售量也不相同。
这种不同,有可能是由于抽样的随机性造成的,也有可能是由于人们对不同颜色的偏爱造成的。
于是,上述问题就归结为查验饮料颜色对销售量是不是有阻碍的问题。
咱们能够令μ1、μ2、μ3、μ4别离为四种颜色饮料的平均销售量,查验它们是不是相等。
若是查验结果显示μ1、μ2、μ3、μ4不相等,那么意味着不同颜色的饮料来自于不同的整体,说明饮料颜色对销售量有阻碍;反之,若是查验结果显示μ1、μ2、μ3、μ4之间不存在显著性不同,那么意味着不同颜色的饮料来自于相同的整体,能够为饮料颜色对销售量没有阻碍。
这确实是一个方差分析问题。
在方差分析中经常使用到一些术语。
1.因素
因素是一个独立的变量,也确实是方差分析研究的对象,也称为因子。
如:
例1中,咱们要分析饮料的颜色对饮料的销售量是不是有阻碍,在那个地址,“饮料的颜色”是所要查验的对象,它确实是一个因素。
在有的书中把因素称为“因子”。
2.水平
因素中的内容称为水平,它是因素的具体表现。
如:
例1中“饮料的颜色”这一因素中的水平有四个,即饮料的四种不同颜色:
无色、粉色、桔黄色、绿色;它们是“饮料的颜色”这一因素的四种具体表现。
因素的每一个水平能够看做是一个整体,比如:
无色、粉色、桔黄色、绿色饮料能够看做是四个整体。
3.操纵变量
在方差分析中,能够人为操纵的阻碍因素称为操纵因素,或操纵变量;如:
例1中,“饮料的颜色”关于饮料的销售量而言,是能够人为操纵的阻碍因素,称为操纵变量。
4.随机变量
在方差分析中,人为很难操纵的阻碍因素称为随机因素,或随机变量;如:
例1中,“人们对不同颜色的偏爱”关于饮料的销售量而言,是人为很难操纵的阻碍因素,称为随机变量。
5.观看变量与观看值
在方差分析中,受操纵因素和随机因素阻碍的事物,称为观看变量。
在每一个水平下取得的样本数据称为观看值。
如:
例1中,销售量是观看变量,在每一个饮料颜色下取得的样本数据(即表10-1中的数据)确实是观看值。
二.方差分析的原理
从方差分析的目的来看,是要查验各个水平的均值μ1、μ2、…、μm是不是相等(m为水平个数),而实现那个目的的手腕是通过方差的比较(即考察各观看数据的不同)。
在变量的观看值之间存在着不同。
不同的产生来自于两个方面。
一个方面是由因素中的不同水平造成的,称之为系统性不同(或系统性误差)。
如:
饮料的不同颜色带来不同的销售量。
另一个方面是由于抽选样本的随机性而产生的不同,称之为随机性不同(或随机性误差)。
如:
相同颜色的饮料在不同的商场销售量也不同。
两个方面产生的不同能够用两个方差来计量。
一个叫组间方差,即水平之间的方差,是衡量不同整体下各样本之间不同的方差。
在组间方差里,既包括系统性误差,也包括随机性误差。
如:
在例1中,不同颜色的饮料在不同地址(超市)产品销售量之间的不同既有系统性误差(即由于人们对不同颜色的偏爱造成的不同),也有随机性误差(即由于抽样的随机性造成的不同)。
不同颜色的饮料在不同地址(超市)产品销售量之间的方差即为组间方差。
另一个叫组内方差,即水平内部的方差,是衡量同一个整体下样本数据的方差。
在组内方差里仅包括随机性不同。
如:
在例1中,能够把同一个颜色的饮料在不同地址(超市)产品销售量之间的不同看成是随机因素的阻碍,同一个颜色的饮料在不同地址(超市)产品销售量之间的方差即为组内方差。
若是不同的水平对结果没有阻碍,如:
饮料的不同颜色对销售量无阻碍,那么在水平之间的方差中,就仅仅有随机因素阻碍的不同,而没有系统性因素阻碍的不同。
如此一来,组间方差与组内方差就应该超级接近,两个方差的比值就会接近于1;反之,若是饮料的不同颜色对销售量有阻碍,在组间方差中就不仅包括了随机性误差,也包括了系统性误差,这时,组间方差就会大于组内方差,两个方差的比值就会大于1。
当那个比值大到某种程度时,咱们就能够够作出判定,说不同水平之间存在着显著性不同。
一次,方差分析确实是通过不同方差的比较,作出同意原假设或拒绝原假设的判定。
如:
例1中,判定饮料的不同颜色对销售量是不是有显著性阻碍的问题,事实上也确实是查验销售量的不同主若是由于什么缘故所引发的。
若是这种不同主若是系统性误差,咱们就说饮料的不同颜色对销售量有显著性阻碍。
三、单因素方差分析
为说明问题方便,咱们以例2为例,论述单因素方差分析的大体步骤如下:
例2:
已知在一组给定的条件下饲养小鸡所增加的体重服从正态散布。
某养鸡场欲查验四种饲料配方对小鸡增重的阻碍是不是不相同(假定已经通过查验说明不同饲料配方下的小鸡增重方差相等)。
为此,他们对四组初始条件完全相同的小鸡,在完全相同的其他饲养条件下,别离利用四种不同的饲料配方进行喂养。
所取得的增重数据如表10-2。
表10-2四种不同饲料配方下小鸡的增重情形
饲料配方i
小鸡序列j
38周后小鸡个体增重(克)
123456
行合计
配方1
配方2
配方3
配方4
370420450490
490380400390500410
330340400380470
410480400420380410
1730
2570
1920
2500
列合计
16001620165016801350820
8720
试分析四种饲料配方对小鸡增重的阻碍是不是不相同。
解:
在那个地址,“饲料”是一个因素,因素中的水平有四个,即小鸡增重的四种饲料配方。
不同的饲料是小鸡饲养随机实验的不同条件,因此,四组不同的数据应别离看做四个不同整体即四个随机变量y1、y2、y3、y4各自的样本。
在水平(配方)1下有4个样本水平值,n1=4;在水平(配方)2下有6个样本水平值,n2=6;在水平(配方)3下有5个样本水平值,n3=5;在水平(配方)4下有6个样本水平值,n4=6;因此,咱们此刻的问题是要查验方差相等的四个正态随机变量y1、y2、y3、y4的均值(期望值)μ1、μ2、μ3、μ4是不是相等。
有时,人们还会利用另外的提法:
增重与饲料配方是不是有关。
其实,回答了均值是不是相等的问题,自然也就回答了增重与饲料配方是不是有关的问题。
因为若是实验条件的不同没有使均值产生不同,自然说明该实验条件不是变量的阻碍因素,即说明实验条件与变量彼此独立。
关于类似本例的问题,一样地,把随机变量分组的数量记作m,本例m=4。
(一)成立假设
咱们可成立以下假设。
原假设H0:
μ1=μ2=…=μm;备择假设H1:
μ1、μ2、…、μm不全相等。
式中,μi为第i个整体(水平)的均值。
可见,单因素方差分析的原假设
是假设在操纵变量的不同水平下,各整体均值无显著不同。
即操纵变量的不同水平对观看变量没有产生显著的阻碍。
而备择假设
是假设在操纵变量的不同水平下,各整体均值有显著不同。
就例2来讲,提出的假设是:
原假设H0:
μ1=μ2=μ3=μ4;即假设四个配方的小鸡增重均值是相等的。
备择假设H1:
μ1、μ2、μ3、μ4不全相等;即假设四个配方对小鸡增重有显著阻碍。
如何判定配方对小鸡增重是不是有显著阻碍呢?
这就需要通过对数据误差来源的分析,判定各整体均值是不是相等。
第一需要考察各观看数据的误差。
在同一种配方(同一个整体)下,小鸡增重是不同的。
因此,能够把不同小鸡增重的不同看出是随机因素的阻碍,即这种不同是由于抽样的随机性所造成的,称为随机误差。
在不同配方下(不同整体)下,小鸡增重也是不同的。
这种不同可能是由于抽样的随机性造成的,也可能是由于配方本身造成的。
由于配方本身所形成的误差是由系统性因素造成的,称为系统性误差。
衡量同一种配方下样本数据的方差,叫组内方差,显然组内方差只包括随机误差。
衡量不同种配方下各样本之间的方差,叫组间方差。
而组间方差既包括随机性误差,也包括系统性误差。
若是不同配方对小鸡增重没有阻碍,那么组间方差中只包括随机性误差。
这时组间方差与组内方差的比值就会接近于1。
反之,若是不同配方对小鸡增重有阻碍,那么组间方差中既有随机性误差,也有系统性误差,这时组间方差与组内方差的比值就会大于1。
当那个比值大到某个程度时,咱们就能够够说不同配方之间存在显著性不同,从而说明配方对小鸡增重有显著阻碍
(二)计算水平均值
假定从第i个整体中抽取一个容量为ni的简单随机样本,那么有:
第i组样本平均数
=
(i=1、2、…、m)
式中,ni为第i个整体的样本观看值个数,
为第i个整体的第j个观看值。
就例2来讲,
配方1的小鸡增重均值
=(370+420+450+490)÷4=
配方2的小鸡增重均值
=(490+380+400+390+500+410)÷6=
配方3的小鸡增重均值
=(330+340+400+380+470)÷5=384克
配方4的小鸡增重均值
=(410+480+400+420+380+410)÷6=
(三)计算全数观看值的总均值
总的样本平均数
=
=
;
式中,ni为第i组的数据个数,n1+n2+…+nm=n。
就例2来讲,
全数小鸡平均增重
=8720÷21=克
n=n1+n2+n3+n4=4+6+5+6=21
(四)计算离差平方和
方差分析采纳的统计推断方式是计算F统计量,进行F查验。
因此,为了构造查验的统计量,需要计算三个离差平方和。
方差分析将观看变量总的离差平方和,记为SST,并将它分解成两个部份:
一部份是由操纵变量引发的离差,记为SSR,即水平项离差平方和(也称为组间离差平方和BetweenGroups),;另一部份是由随机变量引发的离差,记为SSE,即误差项离差平方和(也称为组内离差平方和WithinGroups)。
于是有:
SST=SSR+SSE
式中:
总离差平方和
组间离差平方和
组内离差平方和
以上三式中的总样本平均数概念为:
各组样本平均数概念为:
ni是各组样本观测值的个数,n为所有样本观测值的个数,m是分组数量。
就例2来讲,(参见表10-2中数据)
总离差平方和SST=
=()2+()2+…+()2+()2=
组间离差平方和SSR=
=
=4×(-)2+6×(-)2
+5×(384-)2+6×(-)2
=
{或采纳SSR=
=[4×()2+6×()2+5×(384)2+6×()2]-[21×()2]
=}
组内离差平方和SSE=
=[()2+()2+()2+()2]
+[()2+()2+()2+()2
+()2+()2]
+[(330-384)2+(340-384)2+(400-384)2+(380-384)2+(470-384)2]
+[()2+()2+()2+()2
+()2+()2]
=
(或采纳SSE=
==)
(五)构造统计量并计算查验统计量的样本值
F=
=
=
=
=
=
(六)确信查验规那么、列出方差分析表、做出统计决策
P-值规那么:
依照算得的查验统计量的样本值(F值)算出P-值=(见表10-3)。
由于P-值=>显著水平标准
=,因此不能拒绝H0,即没有取得足以说明四种配方的饲料下小鸡增重水平有不同的显著证据。
临界值规那么:
依照给定的显著水平
=,查表得临界值为
(3,17)=。
因为F=<,查验统计量的样本值落入同意域,因此不能拒绝
即没有取得足以说明四种配方的饲料下小鸡增重水平有不同的显著证据。
表10-3方差分析表
变异来源
离差平方和
自由度
均方差
F值
P-值
临界值
组间
组内
3
17
总计
20
例3:
由前例1表10-1的“四种颜色饮料销售量在五家超市的销售情形”数据,对饮料的颜色是不是对销售量产生阻碍做方差分析。
解:
第一步、成立假设
原假设H0:
μ1=μ2=μ3=μ4;即假设颜色对销售量没有阻碍。
备择假设H1:
μ1、μ2、μ3、μ4不全相等;即假设四个配方颜色对销售量有阻碍。
第二步、计算水平均值
无色饮料销售量均值
=÷5=箱
粉色饮料销售量均值
=÷5=箱
桔黄色饮料销售量均值
=÷5=箱
绿色饮料销售量均值
=÷5=箱
第三步、计算全数观看值的总均值
各类颜色饮料销售量总的样本平均数
=+++÷20=箱
第四步、计算离差平方和
总离差平方和SST=
=(-)2+(-)2+…+(-)2=
组间离差平方和SSR=
=
=5×(-)2+5×(-)2
+5×(-)2+5×(-)2
=
组内离差平方和SSE=
=+++=
其中:
=(-)2+…+(-)2=
=(-)2+…+(-)2=
=(-)2+…+(-)2=
=(-)2+…+(-)2=
第五步、构造统计量并计算查验统计量的样本值
F=
=
=
=
=
=
第六步、确信查验规那么、列出方差分析表、做出统计决策
P-值规那么:
依照算得的查验统计量的样本值(F值)算出P-值=(见表10-4)。
由于P-值=<显著水平标准
=,因此拒绝H0,同意备择假设H1,即通过查验知,μj不全相等,说明饮料的颜色对销售量有显著阻碍。
临界值规那么:
依照给定的显著水平
=,查表得临界值为
(3,16)=。
因为F=>,查验统计量的样本值落入拒绝域,因此拒绝
同意备择假设H1,即通过查验知,μj不全相等,说明饮料的颜色对销售量有显著阻碍。
表10-4方差分析表
变异来源
离差平方和
自由度
均方差
F值
P-值
临界值
组间
组内
3
16
总计
19
—
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 举例