Randomized Complete Block Design (RCBD)
這個實驗方法的策略是通過將實驗單元分組,消除組(Block)間可能出現的變異,以此來增加實驗的準確性。
One factor
EX: 有 4 種牌子的輪胎:A,B,C,D,Y= 跑 20000 公裡後的磨損量,我們想知道哪個牌子的輪胎最好。
⟹ factor: 4 levels and is fixed
-
Design 1: 4 台車,每台車裝 1 種牌子的輪胎。
這是一個不好的設計,因為輪子品牌的效應與車的效應混在一起,具有強相關性。
-
Design 2 (CRD): 16 個輪胎完全隨機的分配到 4 台車的 4 個位置上。
Yij=μ+τi+εij, 其中 τi 代表輪子的效應。收集到以下數據:
Car1 | Car2 | Car3 | Car4 |
---|
C∣12 | A∣14 | C∣10 | A∣13 |
A∣17 | A∣13 | D∣11 | D∣9 |
D∣11 | B∣14 | B∣14 | B∣8 |
D∣14 | C∣12 | B∣13 | C∣9 |
ANOVA:
Source | SS | df | MS | F | p-value |
---|
Brand | 30.69 | 3 | 10.23 | 2.44 | 0.115 |
Error | 50.25 | 12 | 4.19 | | |
Total | 80.94 | 15 | | | |
i.e. 四個牌子的輪胎的平均磨損量沒有顯著差異。
這個設計中同樣沒有控制車的效應。
-
Design 3 (RCBD): 為了消除因為車帶來的潛在的變異
Car1 | Car2 | Car3 | Car4 |
---|
C∣12 | A∣14 | C∣10 | A∣13 |
A∣17 | A∣13 | D∣11 | D∣9 |
D∣11 | B∣14 | B∣14 | B∣8 |
D∣14 | C∣12 | B∣13 | C∣9 |
RCBD 由以下幾個部分組成:
- 每組包含所有的 trt。
- 在一個組中,trt 隨機分配到實驗單元上。
設 trt 的數量為 k
Block 1 | Block 2 | ⋯ | Block b |
---|
π1 | π1 | ⋯ | π1 |
π2 | π2 | ⋯ | π2 |
⋮ | ⋮ | ⋱ | ⋮ |
πa | πa | ⋯ | πa |
其中 (π1,⋅,πa) 是 (1,⋯,a) 的隨機排列。
當我們得到具體數據:
Block 1 | Block 2 | ⋯ | Block b |
---|
Y11k | Y12k | ⋯ | Y14k |
Y21k | Y22k | ⋯ | Y24k |
⋮ | ⋮ | ⋮ | ⋮ |
Ya1k | Ya2k | ⋯ | Ya4k |
並建模為:
Yijk=μ+τi+βj+ε(ij)ki=1,⋯,a,j=1,⋯,b,k=1,⋯,nusually1
- τi: trt 的效應
- βj: block 的效應
我們通常會假設 trt 與 block 直接沒有交互作用。並且 block effect 通常假設為 random effect,以這個例子來說,這樣假設可以將沒有實驗的車種的效應也納入考慮。
⟹ 以上數據的 ANOVA(RCBD):
Source | df | SS | MS | F | p-value |
---|
Brand | 3 | 30.69 | 10.2 | 7.8 | P(F3,9>)=0 |
Block | 3 | 38.69 | 12.9 | | |
Error | 9 | 11.56 | 1.3 | | |
Total | 15 | 80.94 | | | |
⟹H0: No brand effect 可以在 5% 的顯著水準下被拒絕。
Remark:
- fixed effect 通常比 random effect 更重要。
- F 統計量的分母的自由度越高,則檢定的 power 越高。
When to use RCBD
在處理 paired data 時,我們將每對數據視為一個 block,來進行 RCBD。
AONVA with n=1⟹N=ab
- RCBD: Yij=μ+τi+βjεij
- CRD: Yij=μ+τi+εij
| df(RCBD) | df(RCBD) |
---|
Trt | a-1 | a-1 |
Block | b-1 | |
Error | (a-1)(b-1) | a(b-1) |
Total | ab-1 | ab-1 |
⟹⟹SSE,CRD=SSE,RCBD+SSBlockσ^ε,CRD2=a(b−1)SSE,CRD=a(b−1)SSE,RCBD+SSBlock
⟹ 比較 RCBD 和 CRD 產生的 σ^ε2 的差異。如果有很大差異,則代表 RCBD 的效果很好。如果沒有差異,代表我們沒有必要使用 RCBD。
e.g.
| df | SS | MS |
---|
Brand | 3 | 30.69 | 10.2 |
Block | 3 | 38.69 | 12.9 |
Error | 9 | 11.56 | 1.3 |
Total | 15 | 80.94 | |
⟹σ^ε,CRD2=3+938.69+11.56=4.1875⟹σ^ε,RCBD2σ^ε,CRD2=1.34.1875=3.22
RCBD 的效果比 CRD 好了 3.22 倍。也就是說,如果想要 CRD 有和 RCBD 一樣的效果,需要 3.22 倍的樣本數。
Nuisance factor: 可能有影響但不感興趣的 factor。
對於不同類型的 nuisance factor,我們可以使用不同的方法來處理:
- 未知且不可控:使用隨機化來平衡其影響。
- 已知但不可控:ANCOVA (Analysis of Covariance)。
- 已知且可控:Blocking。
Latin Square Design
在輪子的例子中,不僅車的不同可能會造成影響,輪子安裝位置的不同也可能有影響。如果兩個因素都考慮進去,那麼我們就會有兩個方向的 block,這就是 Latin Square Design。
p×p Latin Square Design
- 必須是正方形,其中 p 是 trt 的數量。
- 每行每列中,每個 trt 只能出現一次 (類似數獨)。
e.g. Latin square 4x4
不同邊長的 Latin square 的組合數是固定的。因此我們可以計算出所有可能的組合,然後隨機選擇一個,將對應的 trt 分配到實驗單元上。
等價的,我們也可以計算出最簡單的組合,然後將實驗單元隨機分配到每個格子上。
One factor Latin Square Design
Yijk=μ+τi+βj+γk+εijki=1,⋯,p,j=1,⋯,p,k=k(i,j)∈{1,⋯,p}
- τ: 感興趣的效應
- β: 一個方向的 block 的效應
- γ: 另一個方向的 block 的效應
| total | τ | β | γ | error |
---|
df | p2−1 | p−1 | p−1 | p−1 | (p−2)(p−1) |
繼續使用輪胎的例子,我們將輪子位置和車的效應都納入考慮:
pos\car | 1 | 2 | 3 | 4 | |
---|
1 | C∣12 | D∣11 | A∣13 | B∣8 | 44 |
2 | B∣14 | C∣12 | D∣11 | A∣13 | 50 |
3 | A∣17 | B∣14 | C∣10 | D∣9 | 50 |
4 | D∣13 | A∣14 | B∣13 | C∣9 | 49 |
| 56 | 51 | 47 | 39 | 193 |
⟹SSpos=4442+502+502+492−161932=6.19
ANOVA (Latin Square):
| df | SS | MS | F | p-value |
---|
Brand | 3 | 30.69 | 10.2292 | 11.42 | 0.007 |
Car | 3 | 38.69 | 12.8958 | | |
Pos | 3 | 6.19 | 2.062 | | |
Error | 6 | 5.37 | 0.8958 | | |
Total | 15 | 80.94 | | | |
⟹ Brands 之間有顯著差異。
用 SNK test 來選擇最好的品牌:
-
MSE=0.8958 with df=6 ⟹SYˉ⋅=nMSE=40.8958=0.047
-
p | 2 | 3 | 4 |
---|
q0.05(p,6) | 3.46 | 4.34 | 4.9 |
SNK0.05(p) | 1.63 | 2.04 | 2.3 |
-
| C | D | B | A |
---|
Sample mean | 10.75 | 11.00 | 12.25 | 14.25 |
diff&critical | D | B | A |
---|
C | 0.25>1.63 | 1.5>2.4 | 3.5>2.3 |
D | | 1.25>1.63 | 2.25>2.04 |
B | | | 2>1.63 |
⟹ A 显著大于其他品牌,而 B,C,D 之间没有显著差异。