第十二章变异量数分析Word文档格式.docx
- 文档编号:5635013
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:9
- 大小:38.95KB
第十二章变异量数分析Word文档格式.docx
《第十二章变异量数分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《第十二章变异量数分析Word文档格式.docx(9页珍藏版)》请在冰点文库上搜索。
如果每個t-test是定在α=0.05之水準下進行測定,一連串這樣的t-tests會使犯下至少一次TypeIerror的機會增加。
換言之,即使每一個t-test是在α=0.05之水準下進行測定,其TypeIerror綜合起來事實上是大於0.05。
換個角度來說,t-test做多了,總有一個t-test之結果會rejectHO,但此HO可能為真。
用ANOVA來分析就可以避免這樣的問題。
貳、ANOVA之原理
ANOVA之虛無假設H0是μ1=μ2=μ3=……=μk,也就是所有樣本均是來自同一母群,或是各樣本來自的各個母群在平均數上沒有無差異。
更具體的說法是每類別或項目間在某一特性上並無差異(如:
不同宗教信仰者在支持墮胎之態度上並無差異)。
從這H0之型式可看出是兩樣本間t-test之延伸。
至於說H1則為「至少有一類別在某一特性上與其它類別有差異」。
如果上述之H0為真,則每類別樣本平均數之差別應不大,且各樣本之標準差大小差不多(見書中P.252之Table10.1)(如果由同一母群體中抽出多個樣本是否有同樣的結果?
)。
事實上ANOVA並不是問不同類別間是否有差異,因為即使是虛無假設為真,由於抽樣或測量的過程中會有誤差,所以會實際觀察到各類別的平均數不同。
因此,我們是在問:
這些差異是否大到可以拒絕H0。
和H0完全相反的情況是各類別之平均數相差極大,而各類別之標準差很小。
換言之,各類別內之異質性很小,而類別間異質性很大(見P.252之Table10.2)。
在這種情況下,如果我們將所有樣本合併,這個合併後之樣本的變異量(Variance)(Variance如何計算?
有何意義?
),主要來自原來樣本和樣本間之差異。
換言之,此合併後樣本之變異或離散之狀況主要源自原來各樣本間之差異。
而H0所假設的情況,是變異量主要是來自原各樣本(類別)內之差異,而非各樣本間之差異。
※了解上面的敘述後,就很容易了解ANOVA之原理,ANOVA之測定是建立在比較各類別(或樣本)間之變異量及各類別內之變異量。
與類別內之變異量相比較下,當類別間之變異量愈大時,拒絕H0之可能性愈大,反之,則愈小。
ANOVA之公式,即在比較兩種對母群體之變異量(σ2)之估計值。
其一估計值即是建立在各樣本內之變化,而另一則為樣本間之變化。
這即是ANOVA(ANalysisOfVAriance)之名稱的由來。
參、ANOVA之計算
要做ANOVA之測定需要介紹一些新概念及統計。
第一個新概念是變項分數之總離散的程度,這是由總離均差平均和(totalsumofsquares或SST)來測量。
計算SST是要將所有各樣本合併,然後計算所有分數離散之狀況,在此測量離散之方法是用下列公式
SST=Σ(Xi-
)2----
(1)
總離均差平方和
此式如果您還記得,是和標準差之公式中根號內分子的部分一樣。
在此SST中,Xi即合併樣本中之各分數,而
即合併樣本之平均數。
這SST事實上反映了兩種離散之狀況,一是各類別內之離散,另一為各類別間之離散,因此
SST=SSW+SSB
SSW(SumofSquaresWithin)(組內離均差平方和)之公式是
SSW=Σ(Xi-
)2----
(2)
是每類別或組別之平均數
因此,我們求SSW之方法是將各組每一分數減去此組之平均數,求其平方,然後加起來,每組都這麼做後,要全部加起來即得SSW。
而SSB(SumofSquaresBetween)之公式為
SSB=ΣNk(
-
)2----(3)
Nk是各組之樣本數
是各組之平均數
是合併樣本之平均數
知道SSW及SSB的目的是要知道類別間的差異是否夠大。
如果虛無假設為真,則相對於類別內的差異,類別間的差異並不會太大,也就是SSW與SSB應該差不多。
反之,如果兩個離散程度估計的差異越大的話,則拒絕虛無假設的可能性也愈大。
計算ANOVA的下一步是從SSW及SSB得到兩種對母群體之σ2的估計值,這兩種估計值稱為均方估計值(meansquareestimates)。
其中利用SSW之估計值是
組內估計值=SSW/dfw,
其中dfw=N-K,即degreesoffreedomassociatedwithSSW,
N=全部合併樣本數,K=組數。
利用SSB的估計值,則為
組間估計值=SSB/dfb,
dfb=K-1,即degreesoffreedomassociatedwithSSB。
而ANOVA即在求,兩估計值間的相對大小,更具體說是求一個Fratio。
F=Betweenestimate/Withinestimate=(SSB/dfb)/(SSW/dfw)─(4)
從公式可知,此F比值是與類別間的變異量及類別內的變異量的相對大小有關。
此外,這個F值之抽樣分配是隨dfb及dfw而變化,其分配之圖形如下:
圖一 變異數分析時之F分配
如果F=0,即表示組間變異數為0,即各組平均數相同。
上述之計算公式為依原理所設計的,事實上我們有些捷徑可循,其中SST可用下式來算,
SST=ΣX2-N
2,----(5)
此後用SSB之公式算出SSB後,以SST-SSB即得SSW。
SSW=SST-SSB,----(6)
這樣計算可省不少事。
ANOVA的計算步驟,可摘要如下:
1、計算SST
2、計算SSB
3、以SST減去SSB來算出SSW
4、計算兩個與SSB及SSW對應的degreesoffreedom
5、分別將SSB及SSW與相對應之自由度相除,以計算兩個均方估計值來推估母群體的變異量
6、計算F比值。
肆、ANOVA測定的步驟
以下即以一例來說明ANOVA之假設測定的步驟。
步驟一:
基本假定
-Model:
獨立樣本(Independentrandomsamples)
-Levelofmeasurementisinterval-ratio
-母群是常態分配(Populationsarenormallydistribution)
-母群之變異量是相同的(Populationvariancesareequal)
從以上的基本假定可知,ANOVA測定相當嚴格的要求依變項是以比較精確的方式測量的(interval-ratio測量尺度)。
但如各類別之樣本數是相同或很接近時,ANOVA之基本假定並不須如上述那樣嚴格,但如果你不確定其中任何一假定或是組和組之樣本數差別太大時,最好用別的方法如Chi-Square來做假設測定。
步驟二:
設定虛無假設
在下列之例子中,我們想要知道三種不同型態城市之謀殺率是否不同。
<例一>
謀殺率
工業城 商業城 政治城 Total
4.3 5.1 12.5
2.8 6.2 3.1
12.3 1.8 1.6
16.3 9.5 6.2
5.9 4.1 3.8
7.7 3.6 7.1
9.1 11.2 11.4
10.2 3.3 1.9
Sums68.6044.8047.6161.0
X8.58(X1) 5.60(X2)5.95(X3)6.71(X)
以上例來說,其H0為
H0:
μ1=μ2=μ3
即三種型態城市之母群的謀殺率是相等的。
而H1為至少有一母群之平均數是與其它的平均數不同。
步驟三:
選出抽樣分配及建立臨界區
Samplingdistribution=Fdistribution
α=0.05
dfw=(24-3)=21
dfb=(3-1)=2
F(critical)=3.47
F(critical)之值是查書中AppendixD(Pp.499-500)之值。
Pp.499是在α=0.05時之值,而Pp.500是α=0.01時之值。
n1是dfb,n2是dfw。
基本上ANOVA是一尾測定,我們只關心Betweenestimate是否大過Withinestimate,而且是否大到可以rejectH0之程度(F=1是什麼意思?
)
步驟四:
計算teststatistic
依例所得之 SST=373.538
SSB=42.303
SSW=331.235
所以Betweenestimateofvariance=42.303/(3-1)=21.152
Withinestimateofvariance=331.235/(24-3)=15.773
F(obtained)=21.152/15.773=1.34
我們可將所有計算所得之數列一表
<表一>
SumofdfEstimateofF
SquaresVariance
Total373.538N-1=23
Between42.303K-1=221.152
Within331.235N-K=2115.7731.34
步驟五:
決策
因為F(obtained)<F(critical),所以我們不能rejectH0,亦即三種型態城市之謀殺率無差異。
伍、ANOVA之限制
此處所介紹之ANOVA,又叫做單因子ANOVA或簡單ANOVA(one-wayANOVA或SimpleANOVA),這是因為我們只考慮一個自變項和一應變項之關係。
如前面的介紹,單因子ANOVA適用在比較一個以等距/比值尺度測量之應變項的平均數是否在屬於一個自變項的多個類別之間有顯著差異。
ANOVA之應用可延伸到多個自變項與一個應變項之關係,在此暫不多說。
ANOVA最大的限制是應變項要用interval-ratio之尺度測量,以及自變項各類別之樣本數要接近。
前個限制是因在社會科學研究中,常無法得到此類變項。
後個限制是因我們感興趣想比較之群體大小(如不同族群),也常常相當不一樣。
雖然有這些限制,但ANOVA的使用是可以允許略偏離基本假定,只是研究者要知道這些假定及限制為何,以便在從事研究設計時就考慮避免違反這些假定,也可做為判斷其他研究使用ANOVA時,是否得當。
其次,ANOVA只能告訴我們樣本間之差異是否到了顯著水準。
如同過去已經提示過的,統計上達到顯著差異,並不意味此差異是實質上重要的差異。
第三個限制是與研究假設有關。
當我們拒絕虛無假設時,與虛無假設對應的研究假設,並不能告訴我們是那個類別(或樣本)與其它類別(或樣本)不同。
因為,在從事ANOVA時,只要有其中一個類別之母群體的平均數與其他類別的母群體平均數間有顯著差異,我們就可以拒絕虛無假設。
當然,我們可以就實際觀察到的樣本平均數來推測,但這種目視推測的方法,可能並不正確。
要能進一步確認哪幾個類別樣本平均數與其他類別樣本平均數有顯著差異,我們可用事後分析(posthocanalysis)的方法。
這種事後分析方法是一一比較所有兩兩類別之間平均數的差異,然後讓我們知道是哪兩個類別間平均數的差異對於做ANOVA測定時得到之F值的貢獻最大。
由於做兩兩類別間之比較時,我們犯TYPEI錯誤的機率增加,因此事後分析法會以更嚴格的標準來判定哪兩各類別之平均數間的差異達到顯著水準。
一般統計軟體都會提供這類的事後分析方法。
*補充說明
文獻中用ANOVA做假設測定後,最常看到的事後分析法是theScheffétest。
此法在計算F比值時,分子的部份是用研究者想要比較的任何兩組間的SSB,但是相對應的dfb,則是原來做整個ANOVA的dfb,也就是k-1,而不是2-1=1。
其分母也是用原來做ANOVA的分母,也就是SSW/dfw。
得到Scheffétest的F比值後,也還是用原來做ANOVA測定時所用的F(critical)。
由此可見,此事後分析法是以更嚴格的方式,來測定任何兩組間的差異是否達到顯著。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二章 变异量数分析 第十二 变异 分析