實驗中我們會用 AONVA 表來檢定因素對結果是否是有影響的,這是 Compare。而 Contrast 則是更進一步分析,不同因素之間的主要差異在哪裡。
假設我們有 4 個因素 A,B,C,D,我們在獲得數據之前可能有下面幾個問題:
-
Is A different from C ? ⟹H0:μA=μC v.s. H1:μA=μC
-
Average of A and B =? Average of C and D ?
⟹H0:21(μA+μB)=21(μC+μD) v.s. H1:21(μA+μB)=21(μC+μD)
-
A=? average of B,C,D ? ⟹H0:μA=31(μB+μC+μD) v.s. H1:μA=31(μB+μC+μD)
以上這三個問題可以分別寫成和為 0 的線性方程組:
Contrast | μA | μB | μC | μD | |
---|
C1 | 1 | 0 | -1 | 0 | =0 |
C2 | 1 | 1 | -1 | -1 | =0 |
C3 | 3 | -1 | -1 | -1 | =0 |
k= number of trt. A contrast of trt totals:
Cm=i=1∑kCimYi⋅with m=1∑kCimni=0
i=1⋯,k, j=1,⋯,ni
⟹Yij=μi+εijwith εij∼iidN(0,σε2)Yi⋅=j=1∑niYij∼N(niμi,niσε2)
⟹⟹Cm=i=1∑kCimYi⋅∼N(i=1∑kCimniμi,i=1∑kCim2niσε2)∑Cim2niσε2Cm−E(Cm)∼N(0,1)with E(Cm)=i=1∑kCimniμi
⟹∑Cim2niMSECm−E(Cm)∼tN−k⟹∑Cim2niMSECm2∼F1,N−k
SScm=∑Cim2niMSECm2∼H0F1,N−kwith df=1⟹MScm=SScm
Note: balance case, ni=n,∀i
∑Cimni=0⟺∑Cim=0
E(Cm)=∑Cimniμi=0⟺∑Cimμi=0
EX: 繼續使用上一章 fabric 的數據
Contrast | μA | μB | μC | μD | Cm | SScm |
---|
1 | 1 | 0 | 0 | -1 | 8.76-9.26=-0.5 | 4(12+12)(−0.5)2=0.0312 |
2 | 0 | 1 | -1 | 0 | 1.05 | 0.1378 |
3 | 1 | -1 | -1 | 1 | | 0.3511 |
注意到,以上三個 Contrast 的係數如果作為向量,那麼是兩兩垂直的。同時 SSc1+SSc2+SSc3=0.5201=SStrt 且自由度為 3。
Two contrasts:
- Cm=∑ikCimYi⋅ with ∑ikCimni=0
- Cq=∑ikCiqYi⋅ with ∑ikCiqni=0
are orthogonal ⟺∑ikCimCiq=0
Since Cm,Cq are normal r.v.
Cm⊥Cq⟺Cov(Cm,Cq)=0=Cov(∑CimYi⋅,∑CiqYi⋅)=∑CimCiqniσε2⟺∑CimCiqni=0
Remark: with df=k−1, SStrt=∑m=1dfSScm, with Cm are orthogonal and each SScm has df=1
⟹ ANOVA table:
| df | SS | MS | F | p-value |
---|
trt | 3 | 0.5201 | 0.1734 | 8.53 | 0.0026 |
C1 | 1 | 0.0312 | 0.0312 | 1.53 | 0.238 |
C2 | 1 | 0.1378 | 0.1378 | 6.77 | 0.023 |
C3 | 1 | 0.3511 | 0.3511 | 17.27 | 0.001 |
Error | 12 | 0.2438 | 0.0203 | | |
- A,B,C,D 的平均值是顯著不同的
- B(A&D) 的平均值與 C(B&C) 的平均值是顯著不同的
要檢定的 contrasts 應該要在觀測數據之前就設定好。
“先收集數據,再從數據中找出有意義的 contrasts” 被成為數據嗅探( data snooping )。這會導致檢定的實際顯著水准比預期高,因為這種行為會更關注在數據看上去顯著的部分。
Multiple Comparisons Procedure
將 Cm 寫成與平均相關的形式:
Cm=i=1∑kCimYi⋅=i=1∑kCimniYˉi=∑dimYˉi,with ∑dim=∑Cimni=0E(Cm)=∑Cimniμi=∑dimμi=0
⟹H0:Γm≜E(Cm)=0⟺∑dimμi=0, with ∑dim=0
Cm∼N(Γm,∑Cim2niσε2)⟹∑Cim2niMSECm−Γm∼tN−k
⟹H0:Γm=0 v.s. H1:Γm=0
reject H0 at level α⟺0∈/1−α confidence interval for Γm
1−α=P(∑dim2niMSECm−Γm>tα/2,N−k)=PΓm∈CI(Γm;α)[Cm±tN−k,α/2∑Cim2niMSE]
∀Γm 以上的 CI 都是 1−α 的信心區間,但 P(Γm∈CI(Γm;α),∀Γm)≤1−α 。因此我們希望有一個特殊的 CI∗ 來保證可以得到一個 1−α 的信心區間。
Scheffe 's Method
Compare all contrasts with overall probability of type I error ≤1−α
Sα;cm=scm(k−1)Fk−1,N−k,αwith scm=∑cim2niMSE
Scheffe proves:
1−α=P(Γm∈[Cm±scm(k−1)Fk−1,N−k,α],∀Γm)=P(Γm∈[Cm±Sα;cm],∀Γm)
⟹H0:Γm=0vsH1:Γm=0, reject H0 at level α⟺∣Cm∣>Sα,m
Comparing Pairs of Treatment Means
Tukey's Method
用於比較兩個 trt 的平均值是否有顯著差異,並且保證所有的成對比較的總類型 I 錯誤率不超過 α
設有 k 個 trt ,它們的平均分別為 μ1,⋯,μk
∀i=i′ 用 Yˉi⋅−Yˉi′⋅ 來估計 μi−μi′
⟹Yˉi⋅−Yˉi′⋅∼N(μi−μi′,niσε2+ni′σε2)⟹MSE(ni1+ni′1)Yˉi⋅−Yˉi′⋅∼tN−k
⟹1−α=Pμi−μi′∈CI(μi−μi′;α)[Yˉi⋅−Yˉi′⋅±tN−k,α/2MSE(ni1+ni′1)]
但所有信賴區間都成功的幾率會小於 1−α ,因此我們希望能找到一個區間 CI∗ s.t. P(μi−μi′∈CI∗,∀i=i′)≥1−α
Tα=2qα(k,f)(ni1+ni′1)MSEbalqα(k,f)nMSE
- k= number of trt
- f= df of error
Tukey's Result:
P(μi−μi′∈[Yˉi⋅−Yˉi′⋅±Tα],∀i=i′)≥1−α
i.e. ∀i=i′ with H0:μ=μ′ vs H1:μ=μ′, reject H0 ⟺∣Yˉi⋅−Yˉi′⋅∣>Tα with overall sig. level ≤α
Fisher Least Significant Difference (LSD) Method
The Fisher Least Significant Difference (LSD) Method. P99-101
Student-Newman-Keuls (SNK) Method
檢驗一對 trt 的平均值中,數值較大的 trt 是否顯著大於數值較小的 trt。
H0:μi=μjv.s.H1:μi>μjwith Yˉi⋅>Yˉj⋅
使用 fabric 的數據在 α=0.05 下進行 SNK 檢定:
-
將所有的 trt 平均從小到大排序
fabric | A | D | C | B |
---|
sample mean | 2.19 | 2.32 | 2.42 | 2.68 |
將所有的 trt 進行兩兩比較,並且計算它們的差值
| A | D | C | B |
---|
A | | | | |
D | 0.13 | | | |
C | 0.23 | 0.10 | | |
B | 0.49 | 0.36 | 0.26 | |
-
從 ANVOA 表中得到數據 MSE=0.0203 和 df=12,並計算要比較的兩個 trt 的方差:
SAB=2MSE(ni1+nj1)balnMSE
在這組數據下 SYˉi⋅=40.0203=0.0712
-
通過查表得到 qα(p,df) ,其中 p=2,⋯,k 代表要比較的兩個 trt 在排序中的差距。
q0.05(2,12) | q0.05(3,12) | q0.05(4,12) |
---|
3.05 | 3.77 | 4.20 |
將 qα(p,df) 與 SAB 相乘得到 SNK(p,0.05)
| A | D | C | B |
---|
A | | | | |
D | 0.22 | | | |
C | 0.27 | 0.22 | | |
B | 0.30 | 0.27 | 0.22 | |
-
將所有的差值與 SNK(p,0.05) 進行比較,如果差值大於 SNK(p,0.05) 則拒絕 H0:μi=μj。
| A | D | C | B |
---|
A | | | | |
D | 0.13>0.22 | | | |
C | 0.23>0.27 | 0.10>0.22 | | |
B | 0.49>0.30 | 0.36>0.27 | 0.26>0.22 | |
得到結論:A,D,C 的平均值沒有顯著差異,但 B 的平均值顯著大於其他三個。
使用 Tukey's Method 和 Scheffe's Method 則會得到不同的結論:A,D,C 之間沒有顯著差異,C,B 之間有顯著差異,但 B 顯著大於 A,D,C。
並且 Tα=0.30,Sα,cm=4MSE∗23⋅F3,12,0.05=0.326 都是偏保守的檢定。
Yij=μ+τi+εij⟹τi{fixedrandom
⟹ ANOVA for testing H0: No trt effect v.s. H1: At least one trt effect →H0 usually rejected.
-
τi: fixed → contrast for detailed analysis
-
τi: random → Variance components estimation problem. Basic way to do this is by ANOVA method.
⟹ solve for each variance component and the solution is an est for that variance component.
e.g. One-fator CRD (random model)
E(MSE)=σε2setMSEE(MStrt)=σε2+nστ2setMStrt⟹σ^ε2=MSEσ^τ2=nMStrt−MSE
與 MOME 類似。估計量可能為負,在這種情況下,我們應該將估計量設為 0 (P510-511)。