方差分析.docx
- 文档编号:13875698
- 上传时间:2023-06-18
- 格式:DOCX
- 页数:22
- 大小:31.95KB
方差分析.docx
《方差分析.docx》由会员分享,可在线阅读,更多相关《方差分析.docx(22页珍藏版)》请在冰点文库上搜索。
方差分析
方差分析
一、单因素方差分析
1.1完全随机设计
1.1.1试验设计
随机化(randomization)是将实验对象的实验顺序及分组进行随机分配。
这是保证非处理因素均衡的一个重要手段。
常用的随机化分组方法有抽签法和随机数字表法。
1.SAS的PLAN过程
SAS软件中用于试验设计的SAS过程称为试验设计(PLAN)。
SAS的PLAN过程基本语法格式如下:
ProcPlan
Factors要求/options;
Treatments要求;
OutputOut=Sas-dataset[DATA=Sas-dataset][试验因子值设定];
PROCPLAN语句有2个选项,SEED=n,用于设定种子数,n为一个5、6或7位的奇数,缺省时利用系统时钟时间作种子数。
ORDERED,与Factors联用。
FACTORS语句指明试验处理因子的抽样方式,格式是:
因子=m[OFn][抽样方式]。
m和n为数字,且m≤n。
例如:
unit=6,表示对试验因子unit产生1,2,3,4,5,6的一个排列。
unit=6OF8,表示从8个中选出6个。
抽样方法包括RANDOM、ORDERED和CYCLIC,缺省为RANDOM。
RANDOM为随机排列,从1,2,…,m中随机选出;ORDERED为顺序排列,顺序产生1,2,…,m序列;CYCLIC为循环排列,格式:
CYCLIC[(初始排列)][增量],因子水平依1,2,…,m或原始区组循环排列。
如GROUP=5CYCLIC,产生排列1,2,3,4,5。
GROUP=5CYCLIC2,产生排列1,2,3,4,5,以后每次增量为2。
TREATMENT语句与FACTOR语句类似。
OUTPUT语句将结果存储至SAS数据集中,供其它过程调用。
括号“[]”内为可选项。
2.设计实例
单因素完全随机设计,分2组,每组6个样本。
方法一:
datacrd;
dounit=1to12;
ifunit<=6thengroup=1;
elsegroup=2;
output;
end;
procplanseed=27371;
factorsunit=12;
outputout=crddatdata=crd;
procprint;
run;
建立一个数据集crd,建立12个观测,先指定前6个数字为第一组,后6个数字为第二组。
接下来PLAN程序启动随机乱数表(用SEED=27371),将数据集crd的12个整数随机排列,然后将结果储存在文件crddat内,最后经PRINT过程输出。
方法二:
procplanseed=27371;
factorsunit=12;
treatmentsgroup=12cyclic(111111222222);
outputout=outdata;
procprint;
run;
1.1.2红三叶草接种不同的根瘤菌后植株体中的氮含量试验
乔有明.利用SAS软件对方差不同质试验数据的分析.青海大学学报(自然科学版).2004,22(4):
73-75,78
本文所采用的数据(见表1)引自Steel和Torrie1980年的著作。
试验测定了红三叶草接种6种不同的根瘤菌后植株体中的氮含量,以比较不同根瘤菌的接种效果。
这是一个单项分组资料,每个处理含氮量重复测定5次。
每个处理代表一个总体,分别有其平均数μi和方差σi2。
对这样一个资料作方差分析,至少认为在理论上它满足两个基本假定:
①试验误差是独立的,并作正态分布。
即可以假设研究者在进行此试验时是将6个处理随机地分配给30株,且各株之间互不影响;②试验误差方差是同质的,因为测试的30株最初来自同一个总体,所以处理之间的误差方差理论上没有差异。
但实际存在的一种可能情况是,由于处理的作用,各个处理的平均数和方差都受到影响而产生差异。
表1 不同根瘤菌接种红三叶草后植株体中的氮含量
菌种
含氮量测定值(mg)
1
19.4
32.6
27.0
32.1
33.0
2
17.7
24.8
27.9
25.2
24.3
3
17.0
19.4
9.1
15.8
20.7
4
20.7
21.0
20.5
18.8
18.6
5
14.3
14.4
11.8
11.6
14.2
6
17.3
19.4
19.1
16.9
20.8
/*SasProg09a03.Sas*/
Dataclover;
Dotrtmt=1to6;
doq=1to5;
Inputx@@;
output;
end;
End;
Cards;
19.432.627.032.133.0
17.724.827.925.224.3
17.019.49.115.820.7
20.721.020.518.818.6
14.314.411.811.614.2
17.319.419.116.920.8
;
Procanova;
Classtrtmt;
Modelx=trtmt;
Meanstrtmt/duncanalpha=0.05;
procunivariatenormal;/*正态性检验*/
bytrtmt;
varx;
run;
/*SasProg09a04.Sas*/
Dataclover;
Dotrtmt=1to6;
doq=1to5;
Inputx@@;
output;
end;
End;
Cards;
19.432.627.032.133.0
17.724.827.925.224.3
17.019.49.115.820.7
20.721.020.518.818.6
14.314.411.811.614.2
17.319.419.116.920.8
;
Procmixed;
Classtrtmt;
Modelx=trtmt/ddfm=satterth;
repeated/group=trtmt;
lsmeanstrtmt/diff;
run;
1.2随机区组设计
1.2.1试验设计
随机区组设计(Therandomizedcomplete-blockdesign),处理组8个,13个区组,请给出试验方案。
/*SasProg09c00.Sas*/
procplanseed=33373;
treatmentsplots=8of52cyclic(123432434649)4;
factorsblock=13treats=8;
outputout=d09c001;
run;
排列方式:
循环排列。
依据原始排列,增量为4,从52个排列值中选择8个。
如果需要完全随机,可改为treatmentsplots=8;
1.2.2玉米品种比较试验
李玉华,郑如明,冯革章等.51个玉米杂交种比较试验.甘肃农业大学学报.2002,37(3):
323-328
为加快甘肃省杂交玉米新品种的试验、示范、审定和更新换代步伐,对省内外51个育成玉米新品种进行品种比较试验。
主对照品种CK1为中单2号,副对照品种CK2为凉单2号。
试验采用随机区组排列,三次重复,5行区,小区面积21m2,行距50cm,株距28cm。
保苗7200株/hm2,四周设保护行,实收中间3行测产。
小区产量统计
品种
重复I
重复II
重复III
甘玉2750
24.18
21.78
23.31
DH6238
30.08
20.97
23.67
98-1
27.18
23.62
21.43
屯玉1号
27.08
27.69
27.69
农大85
28.71
25.81
26.67
秦单2号
29.19
25.14
17.10
屯试26
23.06
23.92
29.93
DH3670
32.53
28.10
24.43
中种玉3号
27.74
20.36
23.16
屯试16
32.52
20.46
26.47
DH3708
30.29
27.08
22.29
DH3333
26.16
25.45
29.73
秦单1号
22.70
21.53
29.62
脑奥1号
23.67
23.62
31.66
368
25.96
22.14
25.25
凉单4号
23.82
29.62
21.43
屯试52
24.94
25.55
26.21
屯试19
25.45
31.97
25.65
凉单3号
23.41
20.36
27.94
承6-3
26.37
21.58
22.09
农大84
21.38
26.47
26.16
徽试201
24.43
26.88
26.88
武禾2号
25.57
24.33
24.28
奥17
28.20
25.09
24.48
中单2号
20.16
19.85
25.81
R104
21.38
21.33
22.85
DH3619
30.03
31.76
24.53
QFM-1
19.90
25.25
23.36
CT881
25.45
23.82
23.62
凉单1号
24.43
30.29
25.14
奥试302
19.80
22.40
26.42
金穗2001
23.41
28.71
24.53
承6-2
21.84
14.91
16.80
屯102
30.74
21.28
26.42
长城9904
29.93
25.57
23.67
武禾4号
25.86
19.34
22.40
中种玉8号
21.73
15.42
15.83
奥试402
19.95
18.02
19.75
高油115
24.43
19.55
15.27
CT99A12
27.23
25.75
28.25
C19
28.81
35.17
31.51
甘玉2840
20.61
22.19
22.96
承3359
24.94
25.96
26.06
DH6242
25.45
25.20
24.99
承6-4
27.94
22.85
22.65
980III
22.40
28.55
18.68
农大91
30.34
28.18
20.82
北玉1号
27.69
30.44
27.03
D2000
23.83
26.42
21.38
屯试21
26.98
26.21
26.47
中种玉6号
16.64
15.63
12.22
dataliyuhua;
dovariety=1to51;
doblock=1to3;
inputyield@@;
output;
end;
end;
cards;
24.1821.7823.3130.0820.9723.6727.1823.6221.43
27.0827.6927.6928.7125.8126.6729.1925.1417.10
23.0623.9229.9332.5328.1024.4327.7420.3623.16
32.5220.4626.4730.2927.0822.2926.1625.4529.73
22.7021.5329.6223.6723.6231.6625.9622.1425.25
23.8229.6221.4324.9425.5526.2125.4531.9725.65
23.4120.3627.9426.3721.5822.0921.3826.4726.16
24.4326.8826.8825.5724.3324.2828.2025.0924.48
20.1619.8525.8121.3821.3322.8530.0331.7624.53
19.9025.2523.3625.4523.8223.6224.4330.2925.14
19.8022.4026.4223.4128.7124.5321.8414.9116.80
30.7421.2826.4229.9325.5723.6725.8619.3422.40
21.7315.4215.8319.9518.0219.7524.4319.5515.27
27.2325.7528.2528.8135.1731.5120.6122.1922.96
24.9425.9626.0625.4525.2024.9927.9422.8522.65
22.4028.5518.6830.3428.1820.8227.6930.4427.03
23.8326.4221.3826.9826.2126.4716.6415.6312.22
;
procanova;
classblockvariety;
modelyield=blockvariety;
meansvariety/duncan;
meansvariety/t;
run;
1.2.3紫花苜蓿品种比较试验
刘明启,孙建义,王成章.不同紫花苜蓿品种生产性能比较试验.中国饲料.2004,(13):
18-20
10个紫花苜蓿品种,随机分组法设计田间试验,3次重复。
第二年第一茬苜蓿鲜草(kg/hm2)数据见表,试进行方差分析。
不同苜蓿品种鲜草产量(kg/hm2)
品种
重复I
重复II
重复III
78
34736.84
35754.39
33964.91
中苜1号
30456.14
36842.11
28649.12
内蒙古
29473.68
35087.72
30877.19
奥汉
27684.61
29438.60
32421.05
无棣
29122.81
30526.32
28421.11
佛纳尔
29824.56
30526.32
26315.79
4978-1
28859.65
32982.46
24561.40
A多
27719.30
29473.68
27368.42
赛特
30175.44
25263.16
28421.05
意大利
30175.44
24912.28
20701.75
dataalfalfa;
dovariety=1to10;
inputalfalfa$@;
doblock=1to3;
inputx@@;
output;
end;
end;
cards;
7834736.8435754.3933964.91
中苜1号30456.1436842.1128649.12
内蒙古29473.6835087.7230877.19
奥汉27684.6129438.6032421.05
无棣29122.8130526.3228421.11
佛纳尔29824.5630526.3226315.79
4978-128859.6532982.4624561.40
A多27719.3029473.6827368.42
赛特30175.4425263.1628421.05
意大利30175.4424912.2820701.75
;
procanova;
classvarietyblock;
modelx=varietyblock;
meansvariety/duncanalpha=0.05;
run;
1.3二级系统分组设计
1.3.1试验设计
组数为3,组内亚组数4,亚组内个体为3,试作试验设计。
/*SasProg09d00.Sas*/
procplanseed=17431;
factorsgroup=3subgroup=4n=3;
run;
二、非参数统计
1.1完全随机均衡资料差别比较
薛富波,张文彤.田晓燕编.SAS8.2统计应用教程.北京:
兵器工业出版社、希望电子出版社.2004,8.第1版:
172
为研究精氨酸对小鼠截肢后淋巴细胞转化功能的影响,将21只小鼠分等分成3组:
A组为对照,B组为截肢组,C组为截肢加精氨酸治疗组。
观测脾淋巴细胞对HPA刺激的增值反应,测量指标是3H吸收量(cpm),数据如表所示,试分析各组测量值是否不同。
脾淋巴细胞对HPA刺激的增值反应(测量指标3H吸收量,cpm)
A组
B组
C组
3012
2532
8138
9458
4682
2073
8419
2025
1867
9580
2268
885
13590
2775
6490
12787
2884
9003
6600
1717
0
dataXuefb;
don=1to7;
dogroup=1to3;
inputx@@;
output;
end;
end;
cards;
301225328138
945846822073
841920251867
95802268885
1359027756490
1278728849003
660017170
;
procnpar1waywilcoxon;
classgroup;
varx;
run;
Kruskal-WallisTest
Chi-Square
9.8479
DF
2
Pr>Chi-Square
0.0073
P=0.0073<0.05,因此,拒绝
,即各组测量值之间有显著性差异。
这一部分的内容相当于参数检验中的方差分析,依据的方法是Kruskal-Wallis秩和检验,此方法的基本思想与Wilcoxon秩和检验基本相同,都是基于各组混合编秩后,各组秩和应相等的假设。
两者的不同点就在于Kruskal-Wallis秩和检验是针对多组(>2)数据的分析,而Wilcoxon秩和检验则只用于对两组数据的比较。
2.1完全随机非均衡资料差别比较的非参数检验
张荣基.异方差性的方差分析及其应用.数理统计与管理.1999,18(4):
1-4
广西农星畜牧研究所在家猪育种中,就本地的陆川母猪为母本,选择了四种不同的公猪交配。
试比较这四种杂交组合产的仔猪至28日龄断奶时的平均头重有无差别。
家猪不同杂交组合的仔猪断奶时的头数与窝重(kg)
重复
A1
A2
A3
A4
长白公猪×陆川母猪
约克公猪×陆川母猪
英白公猪×陆川母猪
广西白公猪×陆川母猪
窝重
头数
窝重
头数
窝重
头数
窝重
头数
1
34.5
4
43.5
4
46.5
5
44
5
2
58
5
48
5
56
6
44
6
3
60
6
62.5
6
61
7
66.5
7
4
64.5
7
64.5
7
62.5
8
66
8
5
74
8
65.5
8
76
9
66.5
9
6
70.5
9
76
9
77.5
10
77.5
10
7
79
10
76.5
10
83.5
11
72
11
8
80.5
11
84.5
11
83.5
12
82.5
12
9
79
12
82.5
12
10
85
13
92.5
13
DataZhangrj;
inputgroupweightn@@;
av=weight/n;
cards;
134.54243.54346.55444.05
158.05248.05356.06444.06
160.06262.56361.07466.57
164.57264.57362.58466.08
174.08265.58376.09466.59
170.59276.09377.510477.510
179.010276.510383.511472.011
180.511284.511383.512482.512
179.012282.512
185.013292.513
;
procnpar1waywilcoxon;
classgroup;
varav;
run;
Kruskal-WallisTest
Chi-Square
1.5796
DF
3
Pr>Chi-Square
0.6640
P=0.6640>0.05,因此,接受
,即认为陆川母猪产的产仔断奶时的体重与选配的公猪没有多大关系。
三、双因素方差分析
3.12×2析因设计
3.1.1试验设计
析因试验设计(FactorialExperimentDesign)是一种多因素的交叉分组试验,它不仅可以检验每个因素各水平的差异,而且可以检验各因素间的交互作用。
两个或多个因素如存在交互作用,表示各因素不独立,而是一个因素有改变时,另一个或几个因素的效应也相应有所改变。
反之,如不存在交互作用,表示各因素具有独立性,即一个因素的水平有所改变时不影响其他因素的效应。
2×2析因设计表示有2上因素,每个因素有2个水平,共有4种组合。
3.2拉丁方设计
3.2.1拉丁方试验设计
试验处理数k=4,分别为0,100,200,300,在4个实验室(Lab),4天(Day)完成,试做拉丁方设计。
procplanseed=33373;
factorsrows=4orderedcols=4ordered/noprint;
treatmentstmts=4cyclic;
outputout=g
rowscvals=('Day1''Day2''Day3''Day4')random
colscvals=('Lab1''Lab2''Lab3''Lab4')random
tmtsnvals(0100200300)random;
run;
PROCTABULATE;
CLASSROWSCOLS;
VARTMT
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析