變異數分析
變異數分析(英語:Analysis of variance,簡稱:ANOVA)為資料分析中常見的統計模型,主要是欲探討連紲型(Continuous)資料型態之應變數佮類別型資料型態之自變數的關係,當自變項的因為中包含等於或者是超過三个類別情形下,檢定其各類別間平均數是毋是相等的統計模式,廣義上會當將 T 檢定中變異數相等(Equality of variance)的合併 T 檢定(Pooled T-test)看做是變異數分析的一種,是因為 T 檢定做分析兩組平均數是毋是相等,而且採用仝款的計算概念,實際上變做異數分析套用佇合併 T 檢定的分析頂面的時陣,產生的 F 值得會等於 T 檢定的平方項。
變異數分析依靠 F-分布為機率分布的依據,利用平方佮(Sum of square)佮自由度(Degree of freedom)所計算的組間佮組內均方(Mean of square)估計出 F 值,若是有顯差異則考量進行事後較抑是講偌重較(Multiple comparison), 較捷看著的為薛費法 ( 事後較法 )、杜其範圍檢定佮邦佛洛尼校正,用佇探討其各組之間的精差是按怎。
佇變異數分析的基本運算概念,依照所有興趣的因為數量會當分做單因為變異數分析、雙因為變異數分析、多因為變異數分析三大類,因為按照因子的特性無仝款就有三種型態,固定效應變無分析(fixed-effect analysis of variance)、 隨機效應變異數分析(random-effect analysis of variance)佮混合效應變異數分析(Mixed-effect analaysis of variance), 毋過第三種型態佇尾期發展上予人認為是 Mixed model 的分支,關於閣較進一步的探討會當參考 Mixed model 的部份。
變異數分析是對兩組較的 T 檢定的所在,佇咧後者會致使偌重較(multiple comparisons)的問題致使型一錯誤(Type one error)的機會增加,所以較濟組平均數是毋是有差異無是變異數分析的主要命題。
佇統計學中,變異數分析(ANOVA)是一系列統計模型佮其相關的過程總講,其中某一變數的變異數會當分解做歸屬於無仝變數來源的部份。其中上簡單的方式內底,變異數分析的統計測試會當說明幾若組資料的平均值是毋是相等,所以得著兩組的 T 檢定。咧做多組雙變數 T 檢定的時陣,錯誤的機率會是愈來愈大,特別是型一錯誤,變化分析干焦佇二到四組平均值的時陣較有效。
背景佮名稱
變異數分析(ANOVA)是一種特殊形式的統計假講檢定,廣泛應用佇實驗資料的分析中。統計假講檢定是一種根據資料進行決策的方法。試結果(通過虛無假講進行計算)若毋是干焦因為運氣,是佇統計學上叫做顯著。統計顯示的結果(當可能性的 p 值小於臨界的「顯值」)會當推翻無假講。
佇變異數分析的經典應用中,虛無假講是假設所有資料組攏是整體測試物件的完全隨機抽樣。這說明所有方法攏有相仝的效果(抑是無效果)。 推翻虛無假說明無仝的方法,會得著無仝的效果。佇咧操作中,假使測試限定 I 類型錯誤(假日頭致使的假科學論斷)達到某一具體的值。實驗者嘛希望 II 型錯誤(假陰性致使的缺乏科學發現)有限。II 型錯誤受著多重因素的作用,親像取樣的範圍(真有可能佮試驗成本有關係), 相關度(當實驗標準懸的時陣,無注意發現的可能性嘛大)佮效果範圍(當對一般觀察者來講效果明顯,II 型錯誤發生率就低)。
ANOVA 的模式型態
變異數分析分做三種型態:
固定效應模式(Fixed-effects models)
用佇變異數分析模型中所考慮的因為固定的情形,換言之,其實所感興趣的因為是來自特定的範圍,比如講愛較五種無仝款的汽車銷售量的差異,感興趣的因為五種無仝的汽車,反應變數為銷售量,該命題就限定特定的範圍,所以模型的推論結果嘛共全部影目睭佇咧五種汽車的銷售差異上,故此種狀況下的因為固定效應。
隨機效應模式(Random-effects models)
和固定效應模式無仝款的因為特定性,佇隨機效應中所考量的因為是來自所有可能的母群體中的一組樣本,因為變異數分析所推論的並毋是目睭佇咧選定的因為上,是推論講因為背後的母群體,比如講,藉著一間擁有全部車廠種類的二手車公司,對車廠內底隨機揀五種車廠品牌,用佇咧較其銷售量的精差,最後推論到這間二手公司的銷售狀況。因此佇隨機效應模型下,研究者所關心的並非侷限佇所選定的因為上,是希望透過遮的因為推論背後的母群體特徵。
混合效應模式(Mixed-effects models)
此種混合效應絕對袂出現佇咧單因為變異數分析中,當雙因子抑是濟因子變異數分析同時存在固定效應佮隨機效應的時陣,這款模型便是典型的混合型模式。
ANOVA 的模式假使講
變異數分析之統計分析假使通常會依照各種模式的型態無仝款而有差別,毋過廣義來講,變異數分析攏總有三大進前提假設:
一 . 各組樣本背後所隱含的族群分布必須為常態分布或者是逼近常態分布。 二 . 各組樣本著愛獨立。 三 . 族群的變異數著愛相等。
總變數(TSS): $ \ sum _ { i } \ sum _ { j } ( Y _ { ij }-{ \ overline { Y } } _ { total } ) ^ { 二 } $
i 為組別(i=一 , 二 . . . , I), j 共觀測值一个數(j=一 , 二 , 三 , . . . , J), $ Y _ { ij } $ 為第 i 組第 j 一个觀測值,$ { \ overline { Y } } _ { total } $ 為所有觀測值的平均數。
組間變異量(BSS): $ \ sum _ { i } n _ { i } ( { \ overline { Y } } _ { i }-{ \ overline { Y } } _ { total } ) ^ { 二 } $
$ n _ { i } $ 為 i 組內觀測值總數,$ { \ overline { Y } } _ { i } $ 為第 i 組的平均數組內變異量(WSS): $ \ sum _ { i } \ sum _ { j } ( Y _ { ij }-{ \ overline { Y } } _ { i } ) ^ { 二 } $
由述的計算公式會當知影,BSS 代表所有觀測值的向望佮分組了後各組內的向望值差異,換言之,做各組的向望值無精差的時陣,BSS=零,這个時陣咱會認為講各組間平均值就無差別存在,但並無代表所有觀測值的一致性嘛會真懸,因此計算 WSS 來幫助阮判斷所有向望的差別,當 WSS=零的狀況,代表各組內的所有觀測值佮各組的向望值無差別佇咧,因此只有 WSS 佮 BSS 攏替零情況下,咱才會當斷定所有觀測值就達到完美的一致,毋過當 WSS > 零 , BSS=零的狀況,著是各組向望值達到一致,但組內煞存在變化,WSS=零 , BSS > 零,著是組內無變化存在,但是各組間煞是囥差別,然後真實的狀況無可能遮爾極端,因此著愛比 WSS 佮 BSS 的差異來判斷變化數分析的結果,這就是各組向望值敢有精差存在。啊若這个部份佇咧較變異量的過程內底,著愛考量著各組變易量會受著觀測數量佮組別數量濟少就愛精差,所致著愛進行自由度的調整,也就是算出均方值來較組內變異佮組間變異量。
組間均方 BMSS(between means sum of squares): $ BMSS $=$ { \ frac { BSS } { k 影一 } } $=$ { \ frac { \ sum _ { i } n _ { i } ( { \ overline { Y } } _ { i }-{ \ overline { Y } } _ { total } ) ^ { 二 } } { k 影一 } } $
組內均方 WMSS(within means sum of squares): $ WMSS $=$ { \ frac { WSS } { N-k } } $=$ { \ frac { \ sum _ { i } \ sum _ { j } ( Y _ { ij }-{ \ overline { Y } } _ { i } ) ^ { 二 } } { N-k } } $
其中 k 為組別數量,N 共觀測值總數。兩个均方值的較為 $ { \ frac { BMSS } { WMSS } } $
此較值也就是目前人講的 F 檢定值,F 愈大,則組間均方大於組內均方,也就是組間變異量大於組內變異量,各組間的差異遠超出總期望值離差,代表各組的平均數存在明顯的差異,顛倒反的,F 愈細甚至是愈來愈少,著是組間變異量小於組內變異量,代表各組間的精差真細,各組平均數是無存在明顯的差別。規个分析概念中,受著變化喔數分析所規範的族群的變異數就愛相等的條件之下,組內變異量成做是有基準,所以組間變異量的濟少就變做判定變異數分析結論的重要數值,毋過 F 值干焦提供判斷虛擬假設存在的可能性,為著方便落去結論,由 alpha 值決定會用得的錯誤判斷機率為百分之五,所以 F 值所計算的虛擬假設機率若是細漢佇咧零製品的零五,定定為各組存在的差別,其實揜貼的意義是毋是定著各組間無差的機率,也就是容允各組無差可能成真的錯誤判斷機率,因為判斷錯誤的機率傷細抑是會當容允,但並無代表無可能判斷錯誤,所以啥物 F 檢定的結果攏干焦會當下定論為著統計上的意義,毋是絕對意義。
隨機效應
雖然佇單因子變異數分析中有隨機效應的存在,但是運算上佮 Fixed-effect 無啥大差異,其實 F 檢定的結果仝款,唯一的差別是佇咧均方向望值上。
雙因為變異數分析(Two-way ANOVA)
佇真濟情境下,某現象並毋是干焦受單一因子的影響,甚至存在另外一个因子的效應,譬如講愛較五个都市的空氣汙染總指標差異,除了都市別个因素以外,閣愛考量汽機車密度的因素,佇這个情境內底,都市別佮汽機車密度可能就存在著某種效應的影響著空氣汙染的加寡,所以佇雙因為數分析中,除了考慮著雙因此的效應以外,嘛有可能佇咧因子之間的聯合效應,也就是因為子間的交互作用(interaction), 這嘛使得雙因為變異數分析變的較複雜。
一 . 固定效應
延續單因為變異數分析的基本概念,雙因為數字的分析嘛會當共總變異量分解做雙因囝的主效應佮雙因子的聯合效應,閣有表示精差項的組內差異量,為著簡化問題,其下列的計算攏表示為各組間樣本數一致的情形下,其實線性關係為著 TSS=ASS + BSS + WSS + ABSS。
- 總變異量(TSS): $ \ sum _ { i } \ sum _ { j } \ sum _ { z } ( Y _ { ijz }-{ \ overline { Y } } _ { total } ) ^ { 二 } $
- A 因為主效應(ASS): $ nb \ sum _ { i } ( { \ overline { Y } } _ { i }-{ \ overline { Y } } _ { total } ) ^ { 二 } $ 其均方 AMSS 為:$ { \ frac { ASS } { a 影一 } } $
- B 因為主效應(BSS): $ na \ sum _ { j } ( { \ overline { Y } } _ { j }-{ \ overline { Y } } _ { total } ) ^ { 二 } $ 其均方 BMSS 為:$ { \ frac { BSS } { b 影一 } } $
- AB 因為交互作用(ABSS): $ n \ sum _ { i } \ sum _ { j } ( { \ overline { Y } } _ { ij }-{ \ overline { Y } } _ { i }-{ \ overline { Y } } _ { j } + { \ overline { Y } } _ { total } ) ^ { 二 } $ 其均方 ABMSS 為:$ { \ frac { ABSS } { ( a 影一 ) ( b 影一 ) } } $
- 組內差異量(WSS): $ \ sum _ { i } \ sum _ { j } \ sum _ { z } ( Y _ { ijz }-{ \ overline { Y } } _ { ij } ) ^ { 二 } $ 其均方 WMSS 為:$ { \ frac { WSS } { ab ( n 影一 ) } } $
- 佇咧 F 檢定當中,因為考慮的雙因子的個別主效應佮交互作用,所以會出現三个檢定方向,其一為 A 因為檢定、B 因為檢定佮交互作用的檢定。
- A 因為 F 檢定做:$ { \ frac { AMSS } { WMSS } } $
- B 因為 F 檢定做:$ { \ frac { BMSS } { WMSS } } $
- 交互作用的 F 檢定做:$ { \ frac { ABMSS } { WMSS } } $
佇咧交互作用袂顯明的情況下,才會考慮依照各別因子主效應的檢定結果成做雙因為人變異數分析的結論。
二 . 隨機效應
三 . 混合效應
多因為變異數分析(Factorial ANOVA)
重複測量變異數分析(Repeated measure ANOVA)
把它變數分析(ANCOVA)
多變數變數分析(MANOVA)
事後檢定
當變異數分析檢定結果呈現統計顯著,代表反應變數的平均值在佮所有興趣的因為有差異在,所以檢定用佇咧進一步的探討其反應變數的平均數差異是按怎。佇其事後檢定的統計發展頂懸有袂少各具特色的方法,到今猶原陸續有新方法發表,毋過其運的理念攏大同小異,攏是為著欲修正第一型的誤差因為多重較出現誤差頂懸的狀況。較捷用的為 Bonferroni、Tukey、Duncan、Scheffé 四種,賰的方法如下所列:
一 . 邦佛洛尼檢定(Bonferroni T tests) 二 . 杜奇範圍檢定(Tukey's range test) 三 . 丹肯新多重範圍檢定(Duncan's new multiple range test) 四 . Dunnett's two-tailed test 五 . Dunnett's one-tailed test 六 . Gabriel's multiple-comparison procedure 七 . 雷文檢定 ( Levene's test ) 八 . Waller-Duncan test 九 . Ryan-Einot-Gabriel-Welsch multiple range test 十 . Scheffé's multiple-comparison procedure 十一 . Student-Newman-Keuls multiple range test 十二 . Fisher's least-significant-difference test 十三 . Waller-Duncan K-ratio T test
參考文獻
延伸閱讀
相關條目
- 假影檢定
- 變異數分析測試
- 總平方佮
- 單因子變異數分析 ( One Way ANOVA )
- 合併變異數
外部連結
- 變異數分析佇線計算
- SOCR ANOVA Activity and interactive applet .
- Examples of all ANOVA and ANCOVA models with up to three treatment factors , including randomized block , split plot , repeated measures , and Latin squares , and their analysis in R
- NIST / SEMATECH e-Handbook of Statistical Methods , section 七鼗四 . 三 : " Are the means equal ? "