1、方差分析方差分析一、单因素方差分析1.1 完全随机设计1.1.1 试验设计 随机化(randomization)是将实验对象的实验顺序及分组进行随机分配。这是保证非处理因素均衡的一个重要手段。 常用的随机化分组方法有抽签法和随机数字表法。 1. SAS的PLAN过程 SAS软件中用于试验设计的SAS过程称为试验设计(PLAN)。SAS的PLAN过程基本语法格式如下: Proc Plan ; Factors 要求/options; Treatments 要求; Output Out=Sas-datasetDATA=Sas-dataset试验因子值设定; PROC PLAN语句有2个选项,SEED
2、=n,用于设定种子数,n为一个5、6或7位的奇数,缺省时利用系统时钟时间作种子数。ORDERED,与Factors联用。 FACTORS语句指明试验处理因子的抽样方式,格式是:因子=m OF n抽样方式。m和n为数字,且mn。例如:unit=6,表示对试验因子unit产生1,2,3,4,5,6的一个排列。unit=6 OF 8,表示从8个中选出6个。 抽样方法包括RANDOM、ORDERED和CYCLIC,缺省为RANDOM。RANDOM为随机排列,从1,2,m中随机选出;ORDERED为顺序排列,顺序产生1,2,m序列;CYCLIC为循环排列,格式:CYCLIC(初始排列)增量,因子水平依1
3、,2,m或原始区组循环排列。如GROUP=5 CYCLIC,产生排列1,2,3,4,5。GROUP=5 CYCLIC 2,产生排列1,2,3,4,5,以后每次增量为2。 TREATMENT语句与FACTOR语句类似。 OUTPUT语句将结果存储至SAS数据集中,供其它过程调用。括号“”内为可选项。 2. 设计实例 单因素完全随机设计,分2组,每组6个样本。方法一:data crd; do unit=1 to 12; if unit Chi-Square0.0073 P=0.00732)数据的分析,而Wilcoxon秩和检验则只用于对两组数据的比较。2.1 完全随机非均衡资料差别比较的非参数检验
4、 张荣基. 异方差性的方差分析及其应用. 数理统计与管理. 1999,18(4):1-4 广西农星畜牧研究所在家猪育种中,就本地的陆川母猪为母本,选择了四种不同的公猪交配。试比较这四种杂交组合产的仔猪至28日龄断奶时的平均头重有无差别。家猪不同杂交组合的仔猪断奶时的头数与窝重(kg)重复A1A2A3A4长白公猪陆川母猪约克公猪陆川母猪英白公猪陆川母猪广西白公猪陆川母猪窝重头数窝重头数窝重头数窝重头数134.5443.5446.554452585485566446360662.5661766.57464.5764.5762.58668574865.5876966.59670.5976977.51
5、077.5107791076.51083.5117211880.51184.51183.51282.5129791282.51210851392.513Data Zhangrj; input group weight n; av=weight/n;cards;1 34.5 4 2 43.5 4 3 46.5 5 4 44.0 51 58.0 5 2 48.0 5 3 56.0 6 4 44.0 61 60.0 6 2 62.5 6 3 61.0 7 4 66.5 71 64.5 7 2 64.5 7 3 62.5 8 4 66.0 81 74.0 8 2 65.5 8 3 76.0 9 4 6
6、6.5 91 70.5 9 2 76.0 9 3 77.5 10 4 77.5 101 79.0 10 2 76.5 10 3 83.5 11 4 72.0 111 80.5 11 2 84.5 11 3 83.5 12 4 82.5 121 79.0 12 2 82.5 121 85.0 13 2 92.5 13;proc npar1way wilcoxon; class group; var av;run;Kruskal-Wallis TestChi-Square1.5796DF3Pr Chi-Square0.6640 P=0.66400.05,因此,接受,即认为陆川母猪产的产仔断奶时的体
7、重与选配的公猪没有多大关系。三、双因素方差分析3.1 22析因设计3.1.1 试验设计 析因试验设计(Factorial Experiment Design)是一种多因素的交叉分组试验,它不仅可以检验每个因素各水平的差异,而且可以检验各因素间的交互作用。两个或多个因素如存在交互作用,表示各因素不独立,而是一个因素有改变时,另一个或几个因素的效应也相应有所改变。反之,如不存在交互作用,表示各因素具有独立性,即一个因素的水平有所改变时不影响其他因素的效应。 22析因设计表示有2上因素,每个因素有2个水平,共有4种组合。3.2 拉丁方设计3.2.1 拉丁方试验设计 试验处理数k=4,分别为0, 10
8、0, 200, 300,在4个实验室(Lab),4天(Day)完成,试做拉丁方设计。 proc plan seed=33373; factors rows=4 ordered cols=4 ordered/noprint; treatments tmts=4 cyclic; output out=g rows cvals=(Day1 Day2 Day3 Day4) random cols cvals=(Lab1 Lab2 Lab3 Lab4) random tmts nvals(0 100 200 300) random;run;PROC TABULATE; CLASS ROWS COLS; VAR TMT