spss方差分析.docx
- 文档编号:11528636
- 上传时间:2023-06-01
- 格式:DOCX
- 页数:30
- 大小:343.61KB
spss方差分析.docx
《spss方差分析.docx》由会员分享,可在线阅读,更多相关《spss方差分析.docx(30页珍藏版)》请在冰点文库上搜索。
spss方差分析
方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:
通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:
①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。
(2)实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。
总偏差平方和SSt=SSb+SSw。
组内SSt、组间SSw除以各自的自由度(组内dfw=n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。
另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,MSb>>MSw(远远大于)。
MSb/MSw比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体。
方差分析的假设检验
假设有m个样本,如果原假设H0:
样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差
。
则m个样本来自具有共同的方差
和相同的均数u的总体。
零假设H0:
m组样本均值都相同,即μ1=μ2=....=μm
如果,计算结果的组间均方远远大于组内均方(MSb>>MSw),F>F0.05(dfb,dfw),p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则,F
SPSS中方差分析过程
1)One-WayANOVA过程
One-Way过程是单因素简单方差分析过程。
它在Analyze菜单中的CompareMeans过程组中。
用0ne-WayANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。
2)GeneralLinearModel过程组
在SPSS主菜单“Analyze”项调用。
这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。
该过程允许指定最高阶次的交互效应,建立包括所有效应的模型。
如果想建立包括某些特定的交互效应的模型也可以通过过程中的“Method”对话框中的选择项实现。
在GeneralLinearModel菜单项的下一级菜单中有四项过程,每个菜单项分别完成不同类型的方差分析任务。
这些过程的主要功能分别是:
①Univariate过程
Univariate过程完成一般的单因变量、多因素方差分析。
可以指定协变量,即进行协方差分析。
在指定模型方面有较大的灵活性并可以提供大量的统计输出。
②Multivariate过程
Multivariate过程进行多因变量的多因素分析。
当研究的问题具有两个或两个以上相关的因变量时,要研究一个或几个因素变量与因变量集之间的关系时,才可以选用Multivariate过程。
例如,当你研究数学、物理的考试成绩是否与教学方法、学生性别、以及方法与性别的交互作用有关时,使用此菜单项。
如果只有几个不相关的因变量或只有一个因变量,应该使用Univariate过程。
③RepeatedMeasure过程
RepeatedMeasure过程进行重复测量方差分析。
当一个因变量在不只一种条件下进行测度,要检验有关因变量均值的假设应该使用该过程。
④VarianceComponent过程
VarianceComponent过程进行方差估计分析。
通过计算方差估计值,可以帮助我们分析如何减小方差。
单因素方差分析
单因素方差分析也称作一维方差分析。
它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。
还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。
One-WayANOVA过程要求因变量属于正态分布总体。
如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。
如果几个因变量之间彼此不独立,应该用RepeatedMeasure过程。
[例子]
调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。
表5-1不同水稻品种百丛中稻纵卷叶螟幼虫数
从复
水稻品种
1
2
3
4
5
1
41
33
38
37
31
2
39
37
35
39
34
3
40
35
35
38
34
数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。
图5-1
分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。
1)准备分析数据
在数据编辑窗口中输入数据。
建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。
或者打开已存在的数据文件“DATA5-1.SAV”。
2)启动分析过程
点击主菜单“Analyze”项,在下拉菜单中点击“CompareMeans”项,在右拉式菜单中点击“0ne-WayANOVA”项,系统
打开单因素方差分析设置窗口如图5-2。
图5-2单因素方差分析窗口
3)设置分析变量
因变量:
选择一个或多个因子变量进入“DependentList”框中。
本例选择“幼虫”。
因素变量:
选择一个因素变量进入“Factor”框中。
本例选择“品种”。
4)设置多项式比较
单击“Contrasts”按钮,将打开如图5-3所示的对话框。
该对话框用于设置均值的多项式比较。
图5-3“Contrasts”对话框
定义多项式的步骤为:
均值的多项式比较是包括两个或更多个均值的比较。
例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:
第一组均值的1.1倍与第二组的均值相等。
单因素方差分析的“0ne-WayANOVA”过程允许进行高达5次的均值多项式比较。
多项式的系数需要由读者自己根据研究的需要输入。
具体的操作步骤如下:
①选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。
②单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。
③为多项式指定各组均值的系数。
方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。
依次输入各组均值的系数,在方形显示框中形成—列数值。
因素变量分为几组,输入几个系数,多出的无意义。
如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。
如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。
可以同时建立多个多项式。
一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。
如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。
单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。
当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。
④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。
要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。
本例子不做多项式比较的选择,选择缺省值。
5)设置多重比较
在主对话框里单击“PostHoc”按钮,将打开如图5-4所示的多重比较对话框。
该对话框用于设置多重比较和配对比较。
方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。
图5-4“PostHocMultipleComparisons”对话框
(1)多重比较的选择项:
①方差具有齐次性时(EqualVariancesAssumed),该矩形框中有如下方法供选择:
LSD(Least-significantdifference)最小显著差数法,用t检验完成各组均值间的配对比较。
对多重比较误差率不进行调整。
Bonferroni(LSDMOD)用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。
Sidak计算t统计量进行多重配对比较。
可以调整显著性水平,比Bofferroni方法的界限要小。
Scheffe对所有可能的组合进行同步进入的配对比较。
这些选择项可以同时选择若干个。
以便比较各种均值比较方法的结果。
R-E-G-WF(Ryan-Einot-Gabriel-WelschF)用F检验进行多重比较检验。
R-E-G-WQ(Ryan-Einot-Gabriel-Welschrangetest)正态分布范围进行多重配对比较。
S-N-K(Student-Newmnan-Keuls)用StudentRange分布进行所有各组均值间的配对比较。
如果各组样本含量相等或者选择了
“Harmonicaverageofallgroups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较
小的子集)的均值配对比较。
在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey(Tukey's,honestlysignicantdifference)用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误
差率作为实验误差率。
Tukey's-b用“stndentRange”分布进行组间均值的配对比较。
其精确值为前两种检验相应值的平均值。
Duncan(Duncan'smultiplerangetest)新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg'sGT2用正态最大系数进行多重比较。
Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。
Dunnett指定此选择项,进行各组与对照组的均值比较。
默认的对照组是最后一组。
选择了该项就激活下面的“Control
Category”参数框。
展开下拉列表,可以重新选择对照组。
“Test”框中列出了三种区间分别为:
∙“2-sides”双边检验;
∙“ ∙“>Conbo1”“右边检验。 ②方差不具有齐次性时(EqualVarancenotassumed),检验各均数间是否有差异的方祛有四种可供选择: Tamhane'sT2,t检验进行配对比较。 Dunnett'sT3,采用基于学生氏最大模的成对比较法。 Games-Howell,Games-Howell比较,该方法较灵活。 Dunnett'sC,采用基于学生氏极值的成对比较法。 ③Significance选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。 本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。 6)设置输出统计量 单击“Options”按钮,打开“Options”对话框,如图5-5所示。 选择要求输出的统计量。 并按要求的方式显示这些统计量。 在该对话框中还可以选择对缺失值的处理要求。 各组选择项的含义如下: 图5-5输出统计量的设置 “Statistics”栏中选择输出统计量: Descriptive,要求输出描述统计量。 选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量 的95%置信区间。 Fixedandrandomeffects,固定和随机描述统计量 Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。 用“Levenelest”检验,即计算每个观测量与其组均 值之差,然后对这些差值进行一维方差分析。 Brown-Forsythe布朗检验 Welch,韦尔奇检验 Meansplot,即均数分布图,根据各组均数描绘出因变量的分布情况。 “MissingValues”栏中,选择缺失值处理方法。 Excludecasesanalysisbyanalysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。 Excludecaseslistwise选项,对含有缺失值的观测量,从所有分析中剔除。 以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。 本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。 6)提交执行 设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。 7)结果与分析 输出结果: 表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。 表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。 这个结论在选择多重比较方法时作为一个条件。 表5-4方差分析表: 第1栏是方差来源,包括组间变差“BetweenGroups”;组内变差“WithinGroups”和总变差“Total”。 第2栏是离差平方和“SumofSquares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之和。 第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。 第4栏是均方“MeanSquare”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。 第5栏是F值9.125(组间均方与组内均方之比)。 第6栏: F值对应的概率值,针对假设H0: 组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。 计算的F值9.125,对应的概率值为0.002。 表5-5LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD方法适用。 第1栏的第1列“[i]品种”为比较基准品种,第2列“[j]品种”是比较品种。 第2栏是比较基准品种平均数减去比较品种平均数的差值(MeanDifference),均值之间具有0.05水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。 第3栏是差值的标准误。 第4栏是差值检验的显著性水平。 第5栏是差值的95%置信范围的下限和上限。 表5-6是多重比较的Duncan法进行比较的结果。 第1栏为品种,按均数由小到大排列。 第2栏列出计算均数用的样本数。 第3栏列出了在显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。 多重比较比较表显著性差异差异的判读: 在同一列的平均数表示没有显著性差异,反之则具有显著性的差异。 例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明与品种2差异不显著(0.05水平),再往右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水平)。 则品种3与品种5和品种1具有显著性的差异(0.05水平)。 品种3和品种4都显示有平均数值。 结果分析: 根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p值均小于临界值。 因此否定Ho假设,水稻品种对稻纵卷叶螟幼虫抗虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。 根据该结论选择抗稻纵卷叶螟幼虫水稻品种,犯错误的概率几乎为0.008。 只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。 LSD法多重比较表明: 品种1与品种2、品种3和品种5之间存在显著性差异; 品种2与品种1和品种4之间存在显著性差异; 品种3与品种1和品种5之间存在显著性差异; 品种4与品种2和品种5之间存在显著性差异; 品种5与品种1、品种3和品种4之间存在显著性差异。 Duncan法多重比较表明: 品种5与品种3、品种4和品种1之间存在显著性差异。 品种2与品种4和品种1之间存在显著性差异; 品种3与品种5和品种1之间存在显著性差异; 品种4与品种5和品种2之间存在显著性差异; 品种1与品种5、品种2和品种3之间存在显著性差异; 两种方法比较结果一致。 多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。 SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。 在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。 该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。 但也可以通过方差齐次性检验选择均值比较结果。 因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。 因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。 固定因素变量(FixedFactor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。 分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7不同温度与不同湿度粘虫发育历期表 相对湿度(%) 温度℃ 重复 1 2 3 4 100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 29 79.2 67.0 75.7 70.6 31 65.2 63.3 63.6 63.3 80 25 93.2 89.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9 40 25 100.2 103.3 98.3 103.8 27 90.6 91.7 94.5 92.2 29 77.2 85.8 81.7 79.7 31 73.6 73.2 76.4 72.5 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。 1)准备分析数据 在数据编辑窗口中输入数据。 建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。 然后输入对应的数值,如图5-6所示。 或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“GeneralLinearModel”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7多因素方差分析窗口 3)设置分析变量 设置因变量: 在左边变量列表中选“历期”,用 向右拉按钮选入到“DependentVariable: ”框中。 设置因素变量: 在左边变量列表中选“a”和“b”变量,用 向右拉按钮移到“FixedFactor(s): ”框中。 可以选择多个因素变量。 由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量: 在左边变量列表中选“重复”变量,用向右拉按钮移到“到RandomFactor(s)”框中。 可以选择多个随机变量。 设置协变量: 如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量: 如果需要分析权重变量的影响,将权重变量移到“WLSWeight”框中。 4)选择分析模型 在主对话框中单击“Model”按钮,打开“UnivariateModel”对话框。 见图5-8。 图5-8“UnivariateModel”定义分析模型对话框 在SpecifyModel栏中,指定分析模型类型。 ①FullFactorial选项 此项为系统默认的模型类型。 该项选择建立全模型。 全模型包括所有因素变量的主效应和所有的交互效应。 例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。 选择该项后无需进行进一步的操作,即可单击“Continue”按钮返回主对话框。 此项是系统缺省项。 ②Custom选项 建立自定义的分析模型。 选择了“Custom”后,原被屏蔽的“Factors&Covariates”、“Model”和“BuildTerm(s)”栏被激活。 在“Factors&Covariates”框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字母“C”。 这些变量都是由用户在主对话框中定义过的。 根据表中列出的变量名建立模型,其方法如下: 在“BuildTerm(s)”栏右面的有一向下箭头按钮(下拉按钮),单击该按钮可以展开一小菜单,在下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 方差分析