spss学习系列22方差分析.docx
- 文档编号:14305310
- 上传时间:2023-06-22
- 格式:DOCX
- 页数:47
- 大小:420.54KB
spss学习系列22方差分析.docx
《spss学习系列22方差分析.docx》由会员分享,可在线阅读,更多相关《spss学习系列22方差分析.docx(47页珍藏版)》请在冰点文库上搜索。
spss学习系列22方差分析
22.方差剖析
一、方差剖析原理
1.方差剖析概括
方差剖析可用来研究多个分组的均值有无差异,此中分组是按影
响要素的不一样水平值组合进行区分的。
方差剖析是对总变异进行剖析。
看总变异是由哪些部分构成的,这些部分间的关系怎样。
方差剖析,是用来查验两个或两个以上均值间差异明显性(影响察看结果的要素:
原由变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。
一元经常用F查验(也称一元方差剖析),多
元时用多元方差剖析(最常用Wilks’∧查验)。
方差剖析可用于:
(1)完整随机设计(单要素)、随机区组设计(双要素)、析因设计、拉丁方设计和正交设计等资料;
(2)可对两要素间交互作用差异进行明显性查验;
(3)进行方差齐性查验。
要比较几组均值时,理论上抽得的几个样本,都假定来自正态整体,且有一个同样的方差,只是均值能够不同样。
还需假定每一个察看值都由若干部分累加而成,也即总的成效可分红若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。
所谓的方差是离均差平方和除以自由度,在方差剖析中常简称为均方(MeanSquare)。
2.基本思想
基本思想是,将所有丈量值上的总变异依据其变异的根源分解为
多个部份,而后进行比较,评论由某种要素所惹起的变异能否拥有统计学意义。
依据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分红相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,而后列出方差剖析表算出F查验值,作出统计推测。
方差剖析的重点是总离均差平方和的分解,分解越仔细,各部分的含义就越明确,对各样效应的作用就越认识,统计推测就越正确。
效应项与试验设计或统计剖析的目的有关,一般有:
主效应(包含各样要素),交互影响项(要素间的多级交互影响),协变量(来自回归的变异项),等等。
当剖析和确立了各个效应项S后,依据原始察看资料可计算出各
个离均差平方和SS,再依据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值其实是两个均方之比值,往常状况下,分母的均方是偏差项的均方。
依据F值的分子、分母均方的自由度f1和f2,在确立明显性水平
为α状况下,由F(f
f
2
)临界值表查得单侧
F界线值。
当
F 1 α α 则P值>α,不拒绝原假定H0,说明不拒绝这个效应项的效应为 0的原 假定,也即这个效应项是可能对总变异没有本质影响的;若 F>Fα则P 值≤α,拒绝原假定H0,也即这个效应项是很可能对总变异有本质影 响的。 3.方差剖析的实验设计 为了确立方差剖析表中各个有关效应项,需要在试验设计阶段就 作出安排,再依据设计要求进行试验,得出原始察看值,按本来设计方案算出方差剖析表中的各项。 在试验设计阶段往常需要考虑以下4个方面: (1)研究的主要变量(因变量) 即试验所要察看的主要指标,一次试验时能够有多个察看指标, 方差剖析时也能够同时对多个因变量进行剖析; (2)要素和水平 试验的要素(factor)能够是品种、人员、方法、时间、地域等等,要素所处的状态叫水平(level)。 在每一个要素下边能够分红若干水平。 比如,某工厂的原料来自4个不一样地域,那么用不一样地域的原料生产的产质量量能否一致呢所要比较的地域就是要素,4个地域即是地域这一要素的4个水平。 当某个主要要素的各个水平间的主要因变 量的均值体现统计明显性时,必需时可作两两水平间的比较,称为均 值间的两两比较。 (3)要素间的交互影响 多要素的试验设计,有时需要剖析要素间的交互影响 (interaction),2个要素间的交互影响称为一级交互影响(A×B); 3个要素间的交互影响称为二级交互影响(A×B×C)。 当交互影响项体现统计不明显时,表示各个要素独立,当体现统计明显时,就需要列出这个交互影响项的效应,以助于作出正确的统计推测。 二、单要素方差剖析 1个因变量,1个影响要素: 总差异 Yij = 均匀差异 μ + 要素差异 αi + 随机差异 εij 例 1 比较 4种品牌的胶合板的耐磨性,各抽取 5个样品,同样 转速磨损同样时间测得磨损深度( mm),以下: 比较4个品牌胶合板的耐磨性有无差异 总差异Yij=均匀磨损μ+品牌差异αi+随机差异εij 1.【剖析】——【一般线性模型】——【单变量】,翻开“单变量”窗口,将变量“wear磨损深度”选入【因变量】框,“brand品牌”选入【固定因子】框; 2.点【两两比较】,翻开“观察均值的两两比较”子窗口,勾选【假定方差齐性】下的“LSD”、“S-N-K”,点【持续】; 3.点【选项】,翻开“选项”子窗口,勾选“描绘统计”、“方差齐性查验”,点【持续】; 点【确立】,获得 给出每个品牌的均值、标准差、样本数。 方差齐性查验结果,P值=>,故接受原假定H0: 方差齐。 方差剖析结果,“校订模型”是整个方差剖析模型的查验,原假 设H0: 所有系数(μ,αi,εij)都=0;P值<<,故拒绝原假定。 “截距”查验均值μ,原假定H0: μ=0(即不考虑品牌时,均匀 磨损为0);P值<<,故拒绝原假定。 “brand”对要素品牌的查验,原假定H0: 按要素水平值的各分组的因变量无差异,即品牌要素对磨损深度无影响;P值<<,故拒绝原假定,即不一样品牌的耐磨性有差异。 B列为各品牌均值与均值μ(截距)的差。 预计常数项时使用的L矩阵,均为即总样本的均值是按四种品牌 等量混淆的状况计算的。 对照系数矩阵,默认将最后一组“品牌D”作为比较组,故上上 表的截距(均值μ)的预计值=品牌D的均值= T α α α]×L2=0, L2=[0100-1],关于L2列,令[μα 2 1 3 4 化简得α1=α4即前表对α1作的假定查验。 LSD法给出的两两比较,将各组均和一个参照水平做比较,未指定默认,则每一个水平都作为参照比较一次。 每两个之间的差异有无统计学意义,看对应的P值判断(原假定H0: 无差异)。 LSD法给出的两两比较结果,将各组的值从小到大排序,注意4个品牌共被分红了3个亚组(无差异的作为一组),品牌B和A放在一个亚组,两者的P值=(无差异)。 三、两要素方差剖析 1个因变量,2个影响要素: 总差异Yijk=均匀差异μ+要素1差异αi+要素2差异βi +要素1,2交互作用差异γij+随机差异εijk 例2剖析商场某商品的销售量在不一样的商场规模(小型、中型、大型)、货架地点(A、B、C、D)能否有差异部分数据文件以下: 变量size商场规模: 1=小型,2=中型,3=大型。 总差异Yijk=均匀差异μ+商场规模差异αi+货架地点差异βi +商场规模货架地点交互作用差异γij+随机差异εijk 1.【剖析】——【一般线性模型】——【单变量】,翻开“单变量”窗口,将变量“sale销售量”选入【因变量】框,将变量“size 商场规模”、“position货架地点”选入【固定因子】框; 2.点【选项】,翻开“选项”子窗口,勾选【输出】下的“描绘统计”、“方差齐性查验”,点【持续】; 点【确立】,获得 商场规模3个水平,货架地点4个水平,共将样安分红3×4=12组,因为有单组样本数<3个,故没法做方差齐性查验(值缺失)。 整个方差剖析模型的查验结果,交互作用项size*position的P 值=>,故接受原假定H0: 该交互作用无差异。 下边去掉交互因子持续做两要素方差剖析。 3.在第1步的窗口点【模型】,翻开“模型”子窗口,选择【指 定模型】下的“设定”,将【建立项】下的【种类】设为“主效应”,将变量“size”、“position”选入【模型】框,点【持续】; 4.原窗口点【两两比较】,翻开“观察均值的两两比较”子窗口,将因子“size”、“position”选入【两两比较查验】框,勾选【假定方差齐性】下的“S-N-K”,点【持续】; 注: 若已明确比较组,观察其余组与它的比较,宜采纳LSD法; 若要进行多个均值间的两两比较,且各组人数相等,宜采纳Tukey法 或S-N-K法(若比较的组数特别多,不宜用S-N-K法,宜用Scheffe法);关于不均衡设计或含有协变量的模型,应采纳LSD法、Bonferroni法、 Sidak法。 点【确立】获得: 方差齐性查验,P值=>,故接受原假定H0,即方差齐。 整个方差模型的查验结果(解说参照例1)。 用S-N-K法进行两两比较,可见商场规模越大,销售量越大;货 架地点对销售量也有影响,地点AD在同一亚组,销售量最小,地点B 销售量居中,地点C销售量最大,三个亚组之间有统计学差异;此外,因为交互作用被合理地剔除,故上述差异不受另一要素(商场规模)取值的影响。 5.若要绘制轮廓图。 原窗口点【绘制】,翻开“轮廓图”子窗口,将因子“size”、“position”分别选入【水平轴】点【增添】,点【持续】; 注: 若要获得两变量的结合轮廓图,将另一变量选入【单图】框 即可。 点【确立】,获得单变量的轮廓图: 边沿均值,是鉴于现有模型,控制了其余要素作用后,依据样本状况计算某要素各水平的均值预计值(若模型中有协变量,会按协变量均值加以修正)。 轮廓图,即以边沿均值为纵轴,以观察要素为横轴的折线图。 用以比较该要素取不一样水平值时,样本均值的变化状况。 此外,轮廓图也可用来查验两要素能否存在交互作用: 关于单要素模型或包含所有交互项的全模型,边沿均值就是各分组的样本均 值,其轮廓图就体现一组平行线;若剔除某交互作用后各曲线显然不平行,则说明两要素存在交互作用。 此外,【选项】子窗口也供给了“缺少拟合优度查验”,勾选它,运转获得 用来查验目前模型(剔除交互项)与全模型(包含所有交互项)的比较,原假定H0: 两模型无差异;本例的P值=>,接受原假定,即两要素商场规模、货架地点的交互作用能够忽视。 6.若要绘制残差图。 原窗口点【选项】,勾选【输出】下的“残差图”,运转获得 残差图给出了因变量的实测值、展望值、标准化残差的散点图,若展望值与实测值有显然的有关性(靠近直线趋向),标准化残差在 1邻近随机散布,则表示拟合结果较好。 7.除两两比较外,也能够自定义比较。 下边只说明原理,详细操作需要借助代码实现。 比如,前文比较货架地点A与D时,L矩阵=[100-1]T,有 [ABCD]×[100-1]T=0等价于A=D 前方剖析发现地点A与D的销售量基本无差异,此刻想将A与D归并 再与B比较有无差异,则能够指定L矩阵=[1-201]T,则 [ABCD]×[1-201]T=0等价于(A+D)/2=B 注意: 是从(A+D)/2=B倒推L矩阵,该式即A-2B+0C+D=0. 四、含随机要素的方差剖析 随机要素设为固定要素作为剖析,可能获得错误的结果。 例3研究4种广告方式(店内展现、发放传单、销售员展现、广播广告)有无差异。 该地域有几百个销售网点,经费有限只随机选用了18个网点,记录了固准时间段内使用某种广告方式的销售额(为减小偏差,各网点重复丈量两次): 变量area表示网点;adstype表示广告种类: 1=店内展现,2=发放传单,3=销售员展现,4=广播广告;sales表示销售额。 因为网点是随机选用的,若重复研究从头抽取的网点可能完整不一样,故变量area属于随机要素。 注: 若对地区进行细分归类,每类地区选代表网点,则不是随机要素。 【剖析】——【一般线性模型】——【单变量】,翻开“单变量”窗口,将变量“sales销售额”选入【因变量】框,将“adstype广告种类”选入【固定因子】框,将“area网点”选入【随机因子】框; 点【确立】获得 整个方差剖析模型的查验结果,注意当模型含有随机要素时,不再进行总模型的查验,而是分别对每个要素做独自查验,并给出独自的偏差项。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 学习 系列 22 方差分析