Completely Randomized Design
完全隨機設計的重點在於:讓實驗單位(E.U.)完全隨機的分配 trt 以避免實驗單位間的差異性。這樣的設計方式可以讓我們更容易的去估計 trt 的效應。e.g. 實驗的唯一因素有 3 個 level,每個 level 進行 2 次實驗,共進行 6 次實驗。這 6 次實驗的順序應該是完全隨機,而不是固定的例如 1,2,3,1,2,3。
假設有 k 個 trt,每個 trt 分別收集 nj 個觀察值,實驗數據可以建模為:j=1,⋯,k; i=1,⋯,nj
Yij=μ+τj+εij,εij∼iidN(0,σε2)
- Yij: j-th trt 的 i-th 觀測值。
- μ: 整個實驗的共同效應,是未知的定值。
- τj: j-th trt 的效應,是未知的定值。
- εij: 隨機誤差項
Note: μj=μ+τj 代表 j-th trt 的平均效應,是未知的定值。
2 factor CRD Factorial experment
假設有 a 個水平的 factor A 和 b 個水平的 factor B,每個 trt 收集 nij 個觀測值。可以將原始模型擴展為:
Yijk=μij+εijk,εijk∼iidN(0,σε2),ijk=1,⋯,a=1,⋯,b=1,⋯,nij
⟹μij=E(Yijk)=E(Y∣A=i,B=j)
Factorial vs. OFAT
Factorial 實驗是對每個 treatment 都進行至少一次實驗,而 OFAT (One Factor At a Time) 則通過與選擇的 baseline trt 進行比較,來估計其他 trt 的效應,具體有以下步驟:
- 選擇一個 baseline trt
- 固定 B 因素,遍歷 A 因素的所有水平 => 得到最佳的 A 水平,記作 iA
- 固定 A 因素,遍歷 B 因素的所有水平 => 得到最佳的 B 水平,記作 iB
- 得到最佳 trt 組合 (iA,iB)
OFAT 並不會查看所有 trt 的組合,因此可能會錯過一些重要的交互作用。(iA,jB) 也可能並沒有觀測值。
EX: Y 為某集成電路的電流量,有以下因素,假設希望數值越大越好:
- A: 海拔(0k,3k)
- B: 溫度(25, 55)
以 OFAT 方式實驗收集到以下數據:
假設 baseline trt 為 (0k,25),則:
- 固定 B 因素,Yˉ:207.5→235⇒27.5
- 固定 A 因素,Yˉ:207.5→182.5⇒−25
得到結論,trt (0k,55) 是最佳的。
以 Factorial 方式實驗收集到以下數據:
比較所有觀測值,得到結論,trt (0k,55) 是最佳的。
兩種方法得到了相同的結論,但 Factorial 只需要 4 次實驗,OFAT 需要 6 次實驗。
如果我們將 B 因素設為 x 軸,觀察值設為 y 軸,並將 A 因素相同 level 的點連接起來,可以得到以下圖形:
可以從圖中看到 A 和 B 之間存在交互左右,因為不同 A 水平下會影響線 條的斜率。而這是 OFAT 無法發現的。
Graphical display of data
Yijk=μ+τi+βj+(τβ)ij+εijk
我們可以通過圖形化的方式來展示 μij 的效應:x 軸為 B 因素,y 軸為 μij 的效應,將 A 因素相同 level 的點連接起來。
如果 A 的 level 數 a=2,B 的 level 數 b=2,則有下列 3 中可能的圖像:
-
平行(Parallel)
⟹ A 的效應與 B 的 level 無關,B 的效應與 A 的 level 無關。
⟹ A 和 B 之間不存在交互作用。
-
相交(Crossed)
⟹ A 的效應隨 B 的 level 改變,B 的效應隨 A 的 level 改變。
⟹ A 和 B 之間存在強烈的交互作用。
-
介於 Parallel 和 Crossed 之間
⟹ 可能存在或不存在交互左右,需要進一步檢驗。
Note:μij 是未知真實值,但可以通過對 trt(i,j) 的觀察值進行平均來估計。i.e.
μij=nij1k=1∑nijYijk=Yˉij⋅
Interaction
Note: A 與 B 如果不存在交互作用 ⟺
- μij−μi′j=μij′−μi′j′∀i=i′,j=j′, i.e. A 的效應與 B 的 level 無關。
- μij−μij′=μi′j−μi′j′∀i=i′,j=j′, i.e. B 的效應與 A 的 level 無關。
合併以上兩點得到:
⟹⟹μij+μi′j′−μij′−μi′j=0∀i=i′,j=j′a⋅b1i′=1∑aj′=1∑b(μij+μi′j′−μij′−μi′j)=0∀i=1,⋯,a,j=1,⋯,bμij+μˉ⋅⋅−μˉi⋅−μˉ⋅j=0∀i=1,⋯,a,j=1,⋯,b
withμˉ=μˉ⋅⋅=a⋅b1i=1∑aj=1∑bμij,μˉi=μˉi⋅=b1j=1∑bμij,μˉj=μˉ⋅j=a1i=1∑aμij
- μ: Grand mean (整個實驗的平均效應)
- μi: E(Y|A=i) (A 的效應)
- μj: E(Y|B=j) (B 的效應)
Remark: H0:μij+μˉ−μˉi−μˉj=0∀i,j 如果被拒絕,則代表 H0: “A,B 之間不存在交互作用”被拒絕。
ABij=μij+μ−μi−μjis called the interation of A=i and B=j.
Main effect: A 因素從 level i→i′ 的效應。
b1j=1∑bμij−b1j=1∑bμi′j=μˉi⋅−μˉi′⋅=μi−μi′=(μi−μ)−(μi′−μ)=Ai−Ai′
Main effect of A at level i≜μi−μi=1,⋯,a donate Ai
Main effect of B at level j≜μj−μj=1,⋯,b donate Bj
模型也可以由以上定義進行解釋:
Yijk=μij+ε(ij)k=μ+(μij+μ−μi−μj)+(μi−μ)+(μj−μ)+ε(ij)k=μ+Ai+Bj+ABij+ε(ij)k
Fixed and Random effects
Effect 有兩種類型:
- Fixed effect:對特定的固定值感興趣。
- Random effect:對母體感興趣,而樣本只是其中的一部分。
對於不同類型效應的組合,可以形成不同的實驗模型,並且會對其加上不同的限制:
-
A, B both fixed effect ⟺ fixed model
⟹ Added:
i=1∑aAi=0,j=1∑bBj=0
i=1∑aABij=0,∀j,j=1∑bABij=0,∀i
這代表:A 有 a−1 個 degree of freedom,B 有 b−1 個 degree of freedom,AB 有 (a−1)(b−1) 個 degree of freedom。
-
A, B both random effect ⟺ random model
⟹ Added:
A1,⋯,Aa∼iidN(0,σA2),B1,⋯,Bb∼iidN(0,σB2)
ABij∼iidN(0,σAB2)i=1,⋯,a,j=1,⋯,b
且 Ai⊥Bi⊥ABij⊥ε(ij)k
Note: σA2=0⟹A1=⋯=Aa=0, i.e. No A effect
-
One fixed, one random ⟺ mixed model
⟹ Added:
∑Ai=0,B1,⋯,Bb∼iidN(0,σB2),ABij∼iidN(0,σAB2)
with i=1∑aAiBj=0∀j,j=1∑bAiBj=0∀i usually
以上三種不同的模型有相同的 SS, e.g.
SStotalSSASSBSSAB=i=1∑aj=1∑bk=1∑nij(Yijk−Yˉ