第08课方差分析.docx
- 文档编号:16501686
- 上传时间:2023-07-14
- 格式:DOCX
- 页数:23
- 大小:173.53KB
第08课方差分析.docx
《第08课方差分析.docx》由会员分享,可在线阅读,更多相关《第08课方差分析.docx(23页珍藏版)》请在冰点文库上搜索。
第08课方差分析
第八课方差分析
一般线性模型(GeneralLinearModel菜单)
8.1 两因素方差分析
8.1.1 对话框说明
8.1.2 实例分析
8.1.3 结果分析
8.2 协方差分析
8.2.1 分析步骤
8.2.2 结果解释
8.3 其他较简单的方差分析问题
8.4 多元方差分析
8.4.1 分析步骤
8.4.2 结果解释
8.5 重复测量的方差分析
8.5.1 Repeatedmeasures对话框界面说明
8.5.2 结果解释
多因素方差分析主要是分析统计几个因素同时影响一个或几个因变量的统计分析方法。
比如成组设计的方差分析(即单因素方差分析)、配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的方差分析、重复测量的方差分析、协方差分析等等。
因此,能真正掌握GLM菜单的用法,会使大家的统计分析能力有极大地提高。
多因素方差是由一般线性模型(GeneralLinearModel)菜单完成。
一般线性模型四个子菜单各自的功能是:
∙Univariate子菜单(其含义是指仅有一个因变量,自变量可有一个或多个。
∙Multivariate子菜单(多个因变量的多因素方差分析)
∙RepetedMeasures子菜单(重复测量的方差分析,即对同一因变量进行重复测量)
∙VarianceComponents子菜单(方差的成分分析)
§8.1 两因素方差分析
8.1.1 univarate对话框界面说明
Analyze==>GeneralLinearModel==>Univariate,弹出univarate对话框如下所示:
【DependentVariable框】
选入需要分析的变量(因变量),只能选入一个。
这里我们的因变量为Score,将它选入即可。
【FixedFactors框】
即固定因素,固定因素指的是在样本中它所有可能的取值都出现了,比如例中的method,只可能有1、2、3这三个值,并且都出现了,就被称作固定效应。
必须是分类变量。
可多选。
【RandomFactors框】
用于选入随机因素,随机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,如本例中的group,实际上总体中当然不可能只有这8成绩组,因此要用样本中group的情况来推论总体中group未出现的那些取值的情况时就会存在误差,因此被称为随机因素。
必须是分类变量。
可多选。
注意:
把随机因素当作固定因素选入,其结果是一样的。
【Covariate框】
用于选入协方差分析时的协变量,必须是连续型数值变量。
可多选。
【WLSWeight框】
即用于选入最小二乘法权重系数,加权变量。
【Model钮】
单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Fullfactorial,即分析所有的主效应和交互作用。
将按钮切换到右侧的custum,这时中部的BuildTerm下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应(maineffects)、两阶交互(all2-way)、三阶交互(all3-way)等。
这里我们只能分析主效应:
选择main,再用黑色箭头将group和methodfood选入右侧的model框中,如下图。
该对话框中还有两个元素:
左下方的Sumofsquares框用于选择方差分析模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3型即可;中下部有个Includeinterceptinmodel复选框,用于选择是否在模型中包括截距,不用改动,默认即可。
【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义。
【Plots钮】
用于指定用模型的某些参数作图,比如用method和group来作图,用的也比较少。
【PostHoc钮】
该按钮弹出的两两比较对话框和第7章单因素方差分析中的一模一样,不再重复。
本题对method作两两比较,方法为LSD法。
【Save钮】
将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保存的有预测值、残差、诊断用指标等。
【Options钮】
可以定义输出哪些指标的估计均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。
8.1.2 实例分析
例8.1教学方法的改革实验。
采用随机区组设计方法,以成绩作为划分区组的特征,消除成绩对教学方法的不良影响。
现将成绩相等的24个学生分为8个区组,每个区组3个学生。
三周后学习测验的结果如下表,问学生经三种不同教学方法的教学后的成绩有无差别?
区组号
教法A
教法B
教法C
1
50.10
58.20
64.50
2
47.80
48.50
62.40
3
53.10
53.80
58.60
4
63.50
64.20
72.50
5
71.20
68.40
79.30
6
41.40
45.70
38.40
7
61.90
53.00
51.20
8
42.20
39.80
46.20
根据统计分析的要求,我们建立了三个变量来包括上述信息,即group表示区组,method代表三种不同的教学方法,Score表示测验成绩,即:
group
method
score
1
1
50.01
1
2
58.20
具体的操作步骤为:
1.Analyze==>GeneralLinealmodel==>Univariate
2.DependentVariable框:
选入Score
3.FixedFactors框:
选入group和method
4.Model钮:
单击
5.Custom单选钮:
选中,从factors框选因素入model框,选入group和method,
6.“buildterms”选择“maineffect"Model框:
选入group和method,
7.单击continue
8.PostHoc钮:
单击
9.PostHoctestfor框:
选入method
∙LSD复选框:
选中
∙单击OK
∙单击OK
8.1.3 结果分析
按照上题的操作,结果输出如下:
UnivariateAnalysisofVariance
这是一个所分析因素的取值情况列表。
现在大家看到的是一个典型的方差分析表,首先是所用方差分析模型的检验,F值为11.517,P=0.000,小于0.01,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量GROUP,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的method,非常遗憾,它的P值为0.084,还没有统计学意义。
尽管不太愿意,我们的结论也只能是:
尚不能认为三种教学方法的教学有差别。
上表的标题内容翻译如下:
变异来源
III型方差SS
自由度
均方MS
统计量F
P值
校正的模型
2521.294
9
280.144
11.517
.000
截距
74359.534
1
74359.534
3056.985
.000
GROUP
2376.376
7
339.482
13.956
.000
FOOD
144.917
2
72.459
2.979
.084
误差
340.543
14
24.324
合计
77221.370
24
校正的合计
2861.836
23
PostHocTests
Method
现在是两两比较的结果,方法为LSD法,两两之间均无显著性差异。
与上表统计意义相同。
好了,上面是正确的结果,如果model选择是采用Fullfactor又如何呢?
会得出方差分析表如下:
看到了吗?
由于所谓的交互作用将自由度给全部“吃”掉了,没有误差可用于统计分析,什么结果也做不出来。
注意:
检查因素变量的交互作用
univariate==>plots==>Factors,“group”选入“horizontalaxis”,“method”选入“separatelines”==>add==>continue==>ok
§8.2 协方差分析(不好理解)
例8.2 某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。
而胆固醇含量与年龄有关,资料见下表。
正常组
超重组
年龄(X1)
胆固醇(Y1)
年龄(X2)
胆固醇(Y2)
48
3.5
58
7.3
33
4.6
41
4.7
51
5.8
71
8.4
43
5.8
76
8.8
44
4.9
49
5.1
63
8.7
33
4.9
49
3.6
54
6.7
42
5.5
65
6.4
40
4.9
39
6.0
47
5.1
52
7.5
41
4.1
45
6.4
41
4.6
58
6.8
56
5.1
67
9.2
考虑到统计分析对数据格式的要求,我们这里建立三个变量:
GROUP表示组别,AGE代表年龄,CHOL则表示胆固醇。
8.2.1 分析步骤
首先应进行预分析,了解资料是否符合协方差分析的要求,最重要的一点就是看age的影响在两组中是否相同,这可以用age与group是否存在交互作用来表示。
看交互作用有无统计学意义,无统计意义,则不存在交互作用,这样就不符合协方差分析的要求,反之。
预分析步骤:
1.Analyze==>GeneralLinealmodel==>Univariate
2.DependentVariable框:
选入chol
3.FixedFactors框:
选入group
4.Covariate框:
选入age
5.Model钮:
单击
6.Custom单选钮:
选中
7.
8. Model框:
选入group、age和group*age(同时选中group,age,用interaction方法就可选入)
1. Sumofsquares列表框:
改为ModelI
1. 单击OK
1.单击OK
该步骤用于判断group和age间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续。
注意这里选择了ModelI,从而拟合结果和模型中变量的引入顺序有关,即侧重点在group对chol的影响大小和交互作用上。
8.2.2 结果解释
预分析步骤的结果如下:
UnivariateAnalysisofVariance
上表显示交互作用无统计学意义,而且P值非常大,因此交换group和age多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。
正式分析步骤:
Analyze==>GeneralLinealmodel==>Univariate
DependentVariable框:
选入chol
FixedFactors框:
选入group,age
Model钮:
单击
Custom单选钮:
选中
1. Model框:
选入group、age
Sumofsquares列表框:
改为ModelIII
1. 单击OK
2.Options钮:
单击
3. Displsymeansfor框:
选入group
4. Comparemeaneffects复选框:
选中(下面的区间调整方法就用LSD(none)即可)
5. 单击OK
6.单击OK
UnivariateAnalysisofVariance
这是正式的统计分析结果,显示group和age都对胆固醇含量有影响,P值分别为0.038和小于0.001。
EstimatedMarginalMeans
这是两组的修正均数及相应的可信区间,显然超重组的胆固醇均值较高。
下方的提示表明该修正均数是按年龄为50.2308岁的情形计算的。
§8.3 其他较简单的方差分析问题
其他各种不太复杂的方差分析,如交叉设计的方差分析、析因设计的方差分析等的菜单选择和统计结果的解释我就不一一详细讲解了,大家举一反三,类似上面的方法就可以作出来。
这里只是列举对于初学者来说可能有用的几个问题:
∙需要分析的影响因素可以都选入fixedfactor框,如果不是复杂的模型,一般分析结果不会有误。
∙方差分析模型多数情况下要选modelIII,但这在数据存在缺失值、设计不平衡等情况下要慎重考虑,因为此时往往会要求模型进行详细的设置。
∙model的设置对分析是非常重要的,如果设置不正确,可能什么都做不出来,比如无重复数据的方差分析纳入了交互作用、析因设计的方差分析纳入了设计中不存在的因素,就会做不出结果。
∙一般线性模型的复杂性是超出大家想象的,实际上这几个敲门就有误人子弟之嫌。
千万不要以为读懂了以上内容就可以打遍天下了,一但有存在疑问的内容,一定要查阅有关统计书籍,并在必要时请教专业统计分析人员。
SPSS第八课:
征服一般线性模型
――GeneralLinearModel菜单详解(下)
8.1 两因素方差分析
8.1.1 univarate对话框界面说明
8.1.2 结果解释
8.2 协方差分析
8.2.1 分析步骤
8.2.2 结果解释
8.3 其他较简单的方差分析问题
8.4 多元方差分析
8.4.1 分析步骤
8.4.2 结果解释
8.5 重复测量的方差分析
8.5.1 Repeatedmeasures对话框界面说明
8.5.2 结果解释
§8.4 多元方差分析
所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应变量共同反映了自变量的影响程度。
比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。
8.4.1 分析步骤
为了方便起见,我们这里直接利用SPSS自带的数据集plastic.sav,假设tear_res、gloss和opacity都使反应橡胶质量的指标(不要笑,是假设),现在要研究extrusn和additive对橡胶的质量影响如何,则应采用多元方差分析。
选择Analyze==>GeneralLinearModel==>Multivariate,则弹出Multivariate对话框,请注意,除了没有randomeffect外,它的所有元素都是和univariate对话框相同的,里面的内容也相同,因此我们这里就不再重复了。
按照我们的分析要求,对话框操作步骤如下:
1.Analyze==>GeneralLinealmodel==>Multivariate
2.DependentVariable框:
选入tear_res、gloss和opacity
3.FixedFactors框:
选入extrusn和additive
4.单击OK
此处两个自变量均是二分类变量,故无需选择两两比较方法。
8.4.2 结果解释
按上面的选择,分析结果如下:
GeneralLinearModel
这是引入模型的自变量的取值情况列表。
上表是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多元检验方法。
一般他们的结果都是相同的,如果不同,一般以Hotelling'sTrace方法的结果为准。
可见在所用的模型中,extrusn和additive对结果变量是有统计学意义的,但交互作用无统计学意义。
上表实际上是四个一元方差分析表的合并,即分别考虑四个应变量时的方差分析结果。
上面的多元方差分析已经得知两自变量对应变量有影响,从现在的分析表就可以更清楚的知道是对那些自变量影响较大。
对照可知,extrusn和additive对tearresistance和gloss都有较大影响,而他们的交互作用对gloss有影响,他们(及交互作用)对Opacity都没有影响。
§8.5 重复测量的方差分析
重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
8.5.1 Repeatedmeasures对话框界面说明
实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?
我们通过下面的例子来看看:
例8.3 在数据集anxity2.sav中判断:
anxiety和tension对实验结果(即trial1~trial4)有无影响;四次试验间有无差异;试验次数和两个变量有无交互作用。
anxity2.sav和anxity.sav实际上是同一个数据,但根据不同的分析目的采用了不同的数据排列方式。
如果采用anxity.sav进行分析,我们可以分析四次试验间有无差异的问题,但对另两个问题就无能为力了,因为用普通的方差分析模型,anxity和tension的影响被合并到了subject中,根本就无法分解出来进行分析,这时,我们就只能求助于重复测量的方差分析模型。
在菜单中选择Analyze==>GeneralLinealmodel==>Repeatedmeasures,系统首先会弹出一个重复测量因子定义对话框如下:
因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量中,所以我们这里要自行定义应变量。
默认的名称为factor1,我们将其改为trail,下面的因素等级数填入4(因一共测量了四次)。
单击Add钮,则该变量被加入,我们就完成了模型设置的第一步:
应变量名称和测量次数定义。
单击define,我们开始进行下一个步骤:
具体重复测量变量定义及模型设置,对话框如下:
这个对话框和我们以前看到的方差分析对话框不太一样:
它没有应变量框,而是改为了组内效应框,实际上是一回事,上面我们定义了trial有四次测量,此处就给出了四个空让你填入相应代表四次测量的变量,选中trial1~trial4,将其选入;然后要选择自变量了(这里又将其称为了betweensubjectsfactor),将剩下的三个都选入即可。
最后,根据题意,不需要检验anxity与tension的交互作用对试验次数有无交互作用,所以要在model中作相应设置,把那个东东拉出来。
详细的操作步骤如下:
1.Analyze==>GeneralLinealmodel==>Repeatedmeasures
2.Within-subjectfactorname框:
键选入trial
3.numberoflevels框:
键入4
4.单击ADD钮
5.单击DEFINE钮
6.Within-subjectvariables(trial)框:
选入trial1~trial4
7.betweensubjectsfactor框:
选入subject、anxity和tension
8.单击MODEL钮
9. Custom单选钮:
选中
10. Within-subjectModel框:
选入trial
11. betweensubjectsModel框:
选入anxity和tension
12. 单击CONTINUE
13.单击OK
请注意,这里没有选入变量subject,因为它实际上在这里成为了一个记录ID,要是将它选入,则什么都检验不了了。
8.5.2 结果解释
本题的分析结果如下:
GeneralLinearModel
上表给出了所定义的4次测量的变量名,在模型中它们都代表一个应变量trial,只是测量的次数不同而已。
这是引入模型的其它自变量的情况列表。
上表是针对所检验的结果变量trial,以及他和另两个引入模型的自变量间的交互作用是否存在统计学意义,采用的是四种多元检验方法。
一般他们的结果都是相同的,如果不同,我一般以Hotelling'sTrace方法的结果为准。
可见在所用的模型中,trial的四次测量间的确是存在着统计学差异的,但它和另两个变量间的交互作用无统计学意义。
上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从一种叫做球形分布的东东。
上面可能有些内容不好懂,不过没关系,只要看到近似卡方为9.383,自由度为5,P值为0.097就可以了。
因此trial是勉强服从球形分布的,可以进行重复测量的方差分析。
上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布假设成立时的结果,就是我们所要看的。
如果该假设不成立,则根据不同的情况可能看下面三种检验结果之一,或放弃该检验方法。
上表是非常重要的一部分:
各次重复测量间变化趋势的模型分析,这里要求检验没有统计学意义,否则说明变化趋势不服从该曲线。
以trial为例,对Linear的检验P值小于千分之一,Quadratic的P值略大于0.05。
只有Cubic的P值在0.5附近,因此最佳的拟合曲线应为Cubic(三次方曲线);但由于一共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上的知识,最终的拟和曲线应为Quadratic(二次方曲线)。
上表为最后一张,为组间效应的方差分析结果,可见anxiety和tension均无统计学意义。
最后,为了再确认一下几次测量间的变化趋势,我们另外用plots子菜单作出模型估计的四次测量均数值如下图:
可见四次测量均数实际上还是近似于直线趋势的,因此前面的模型应为线性最佳。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第08课 方差分析 08