跳至主要内容

Completely Randomized Design

完全隨機設計的重點在於:讓實驗單位(E.U.)完全隨機的分配 trt 以避免實驗單位間的差異性。這樣的設計方式可以讓我們更容易的去估計 trt 的效應。e.g. 實驗的唯一因素有 3 個 level,每個 level 進行 2 次實驗,共進行 6 次實驗。這 6 次實驗的順序應該是完全隨機,而不是固定的例如 1,2,3,1,2,3。

假設有 kk 個 trt,每個 trt 分別收集 njn_j 個觀察值,實驗數據可以建模為:j=1,,kj=1,\cdots,k; i=1,,nji=1,\cdots,n_j

Yij=μ+τj+εij,εijiidN(0,σε2)Y_{ij} = \mu + \tau_j + \varepsilon_{ij},\quad \varepsilon_{ij}\overset{\text{iid}}{\sim}N(0,\sigma^2_{\varepsilon})
  • YijY_{ij}: jj-th trt 的 ii-th 觀測值。
  • μ\mu: 整個實驗的共同效應,是未知的定值。
  • τj\tau_j: jj-th trt 的效應,是未知的定值。
  • εij\varepsilon_{ij}: 隨機誤差項

Note: μj=μ+τj\mu_j=\mu+\tau_j 代表 jj-th trt 的平均效應,是未知的定值。

注意

以上下標存在符號濫用嫌疑。

2 factor CRD Factorial experment

假設有 aa 個水平的 factor A 和 bb 個水平的 factor B,每個 trt 收集 nijn_{ij} 個觀測值。可以將原始模型擴展為:

Yijk=μij+εijk,εijkiidN(0,σε2),i=1,,aj=1,,bk=1,,nijY_{ijk}= \mu_{ij}+\varepsilon_{ijk},\quad \varepsilon_{ijk}\overset{\text{iid}}{\sim}N(0,\sigma^2_{\varepsilon}),\quad \begin{align*} i&=1,\cdots,a\\ j&=1,\cdots,b\\ k&=1,\cdots,n_{ij} \end{align*}     μij=E(Yijk)=E(YA=i,B=j)\implies \mu_{ij}=E(Y_{ijk})=E(Y|A=i,B=j)

Factorial vs. OFAT

Factorial 實驗是對每個 treatment 都進行至少一次實驗,而 OFAT (One Factor At a Time) 則通過與選擇的 baseline trt 進行比較,來估計其他 trt 的效應,具體有以下步驟:

  1. 選擇一個 baseline trt
  2. 固定 B 因素,遍歷 A 因素的所有水平 => 得到最佳的 A 水平,記作 iAi_A
  3. 固定 A 因素,遍歷 B 因素的所有水平 => 得到最佳的 B 水平,記作 iBi_B
  4. 得到最佳 trt 組合 (iA,iB)(i_A,i_B)

OFAT 並不會查看所有 trt 的組合,因此可能會錯過一些重要的交互作用。(iA,jB)(i_A, j_B) 也可能並沒有觀測值。

EX: Y 為某集成電路的電流量,有以下因素,假設希望數值越大越好:

  • A: 海拔(0k,3k0^k, 3^k
  • B: 溫度(25, 55)

以 OFAT 方式實驗收集到以下數據:

alt text

假設 baseline trt 為 (0k,25)(0^k, 25),則:

  • 固定 B 因素,Yˉ:207.523527.5\bar{Y}:207.5\to 235\Rightarrow 27.5
  • 固定 A 因素,Yˉ:207.5182.525\bar{Y}:207.5\to 182.5\Rightarrow -25

得到結論,trt (0k,55)(0^k, 55) 是最佳的。

以 Factorial 方式實驗收集到以下數據:

alt text

比較所有觀測值,得到結論,trt (0k,55)(0^k, 55) 是最佳的。

兩種方法得到了相同的結論,但 Factorial 只需要 4 次實驗,OFAT 需要 6 次實驗。

如果我們將 B 因素設為 x 軸,觀察值設為 y 軸,並將 A 因素相同 level 的點連接起來,可以得到以下圖形:

alt text

可以從圖中看到 A 和 B 之間存在交互左右,因為不同 A 水平下會影響線條的斜率。而這是 OFAT 無法發現的。

Graphical display of data

Yijk=μ+τi+βj+(τβ)ij+εijkY_{ijk}=\mu+\tau_i+\beta_j+(\tau\beta)_{ij}+\varepsilon_{ijk}

我們可以通過圖形化的方式來展示 μij\mu_{ij} 的效應:x 軸為 B 因素,y 軸為 μij\mu_ij 的效應,將 A 因素相同 level 的點連接起來。

如果 A 的 level 數 a=2a=2,B 的 level 數 b=2b=2,則有下列 3 中可能的圖像:

alt text

  1. 平行(Parallel)

        \implies A 的效應與 B 的 level 無關,B 的效應與 A 的 level 無關。

        \implies A 和 B 之間不存在交互作用。

  2. 相交(Crossed)

        \implies A 的效應隨 B 的 level 改變,B 的效應隨 A 的 level 改變。

        \implies A 和 B 之間存在強烈的交互作用。

  3. 介於 Parallel 和 Crossed 之間

        \implies 可能存在或不存在交互左右,需要進一步檢驗。

Note:μij\mu_{ij} 是未知真實值,但可以通過對 trt(i,j) 的觀察值進行平均來估計。i.e.

μij^=1nijk=1nijYijk=Yˉij\widehat{\mu_{ij}}=\frac{1}{n_{ij}}\sum_{k=1}^{n_{ij}}Y_{ijk}=\bar{Y}_{ij\cdot}

Interaction

Note: A 與 B 如果不存在交互作用     \iff

  • μijμij=μijμijii,jj\mu_{ij}-\mu_{i'j}=\mu_{ij'}-\mu_{i'j'}\quad\forall i\neq i', j\neq j', i.e. A 的效應與 B 的 level 無關。
  • μijμij=μijμijii,jj\mu_{ij}-\mu_{ij'}=\mu_{i'j}-\mu_{i'j'}\quad\forall i\neq i', j\neq j', i.e. B 的效應與 A 的 level 無關。

合併以上兩點得到:

μij+μijμijμij=0ii,jj    1abi=1aj=1b(μij+μijμijμij)=0i=1,,a,j=1,,b    μij+μˉμˉiμˉj=0i=1,,a,j=1,,b\begin{align*} &\mu_{ij}+\mu_{i'j'}-\mu_{ij'}-\mu_{i'j}=0 \quad\forall i\neq i', j\neq j'\\ \implies&\frac{1}{a\cdot b}\sum_{i'=1}^a\sum_{j'=1}^b(\mu_{ij}+\mu_{i'j'}-\mu_{ij'}-\mu_{i'j})=0\quad\forall i=1,\cdots,a, j=1,\cdots,b\\ \implies&\mu_{ij}+\bar{\mu}_{\cdot\cdot}-\bar{\mu}_{i\cdot}-\bar{\mu}_{\cdot j}=0\quad \forall i=1,\cdots,a, j=1,\cdots,b \end{align*} withμˉ=μˉ=1abi=1aj=1bμij,μˉi=μˉi=1bj=1bμij,μˉj=μˉj=1ai=1aμij\text{with}\quad \bar{\mu}=\bar{\mu}_{\cdot\cdot}=\frac{1}{a\cdot b}\sum_{i=1}^a\sum_{j=1}^b\mu_{ij},\quad \bar{\mu}_i=\bar{\mu}_{i\cdot}=\frac{1}{b}\sum_{j=1}^b\mu_{ij},\quad \bar{\mu}_j=\bar{\mu}_{\cdot j}=\frac{1}{a}\sum_{i=1}^a\mu_{ij}
  • μ\mu: Grand mean (整個實驗的平均效應)
  • μi\mu_i: E(Y|A=i) (A 的效應)
  • μj\mu_j: E(Y|B=j) (B 的效應)

Remark: H0:μij+μˉμˉiμˉj=0i,jH_0:\mu_{ij}+\bar{\mu}-\bar{\mu}_i-\bar{\mu}_j=0 \forall i,j 如果被拒絕,則代表 H0:H_0: “A,B 之間不存在交互作用”被拒絕。

Definition
ABij=μij+μμiμjAB_{ij}=\mu_{ij}+\mu-\mu_i-\mu_j

is called the interation of A=iA=i and B=jB=j.

Main effect: A 因素從 level iii\to i' 的效應。

1bj=1bμij1bj=1bμij=μˉiμˉi=μiμi=(μiμ)(μiμ)=AiAi\begin{align*} \frac{1}{b}\sum_{j=1}^b\mu_{ij}-\frac{1}{b}\sum_{j=1}^b\mu_{i'j}&=\bar{\mu}_{i\cdot}-\bar{\mu}_{i'\cdot}=\mu_i-\mu_{i'}\\ &=(\mu_i-\mu)-(\mu_{i'}-\mu)\\ &=A_i-A_{i'} \end{align*}
Definition

Main effect of A at level iμiμi=1,,ai\triangleq \mu_i-\mu\quad i=1,\cdots,a donate AiA_i

Main effect of B at level jμjμj=1,,bj\triangleq \mu_j-\mu\quad j=1,\cdots,b donate BjB_j

模型也可以由以上定義進行解釋:

Yijk=μij+ε(ij)k=μ+(μij+μμiμj)+(μiμ)+(μjμ)+ε(ij)k=μ+Ai+Bj+ABij+ε(ij)k\begin{align*} Y_{ijk}&=\mu_{ij}+\varepsilon_{(ij)k}\\ &=\mu+(\mu_{ij}+\mu-\mu_i-\mu_j)+(\mu_i-\mu)+(\mu_j-\mu)+\varepsilon_{(ij)k}\\ &=\mu+A_i+B_j+AB_{ij}+\varepsilon_{(ij)k} \end{align*}

Fixed and Random effects

Effect 有兩種類型:

  • Fixed effect:對特定的固定值感興趣。
  • Random effect:對母體感興趣,而樣本只是其中的一部分。

對於不同類型效應的組合,可以形成不同的實驗模型,並且會對其加上不同的限制:

  1. A, B both fixed effect     \iff fixed model

        \implies Added:

    i=1aAi=0,j=1bBj=0 \sum_{i=1}^aA_i=0,\quad \sum_{j=1}^bB_j=0 i=1aABij=0,j,j=1bABij=0,i \sum_{i=1}^aAB_{ij}=0,\quad\forall j,\quad \sum_{j=1}^bAB_{ij}=0,\quad\forall i

    這代表:A 有 a1a-1 個 degree of freedom,B 有 b1b-1 個 degree of freedom,AB 有 (a1)(b1)(a-1)(b-1) 個 degree of freedom。

  2. A, B both random effect     \iff random model

        \implies Added:

    A1,,AaiidN(0,σA2),B1,,BbiidN(0,σB2) A_1,\cdots,A_a\overset{\text{iid}}{\sim}N(0,\sigma^2_A),\quad B_1,\cdots,B_b\overset{\text{iid}}{\sim}N(0,\sigma^2_B) ABijiidN(0,σAB2)i=1,,a,j=1,,b AB_{ij}\overset{\text{iid}}{\sim}N(0,\sigma^2_{AB})\quad i=1,\cdots,a, j=1,\cdots,b

    AiBiABijε(ij)kA_i\perp B_i\perp AB_{ij}\perp \varepsilon_{(ij)k}

    Note: σA2=0    A1==Aa=0\sigma^2_A=0\implies A_1=\cdots=A_a=0, i.e. No A effect

  3. One fixed, one random     \iff mixed model

        \implies Added:

    Ai=0,B1,,BbiidN(0,σB2),ABijiidN(0,σAB2) \sum A_i=0,\quad B_1,\cdots,B_b\overset{\text{iid}}{\sim}N(0,\sigma^2_B), \quad AB_{ij}\overset{\text{iid}}{\sim}N(0,\sigma^2_{AB}) with i=1aAiBj=0j,j=1bAiBj0i usually \text{with } \sum_{i=1}^a A_iB_j=0\quad\forall j,\quad \sum_{j=1}^b A_iB_j\neq 0\quad \forall i\quad \text{ usually}

以上三種不同的模型有相同的 SS, e.g.

SStotal=i=1aj=1bk=1nij(YijkYˉ)2SSA=i=1aj=1bk=1nij(YˉiYˉ)2SSB=i=1aj=1bk=1nij(YˉjYˉ)2SSAB=i=1aj=1bk=1nij(YˉijYˉiYˉj+Yˉ)2\begin{align*} SS_{\text{total}}&=\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^{n_{ij}}(Y_{ijk}-\bar{Y}_{\cdot\cdot\cdot})^2\\ SS_A&=\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^{n_{ij}}(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2\\ SS_B&=\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^{n_{ij}}(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2\\ SS_{AB}&=\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^{n_{ij}}(\bar{Y}_{ij\cdot}-\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot j\cdot}+\bar{Y}_{\cdot\cdot\cdot})^2 \end{align*}
(YijkYˉ)2=(YijkYˉij+YˉijYˉ)2(Y_{ijk}-\bar{Y}_{\cdot\cdot\cdot})^2=(Y_{ijk}-\bar{Y}_{ij\cdot}+\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2 knij(YijkYˉijYijkYˉYˉij2+YˉijYˉ)=nijYˉij2nijYˉijYˉnijYˉij2+nijYˉijYˉ=0\sum_k^{n_{ij}}(Y_{ijk}\bar{Y}_{ij\cdot}-Y_{ijk}\bar{Y}_{\cdot\cdot\cdot}-\bar{Y}_{ij\cdot}^2+\bar{Y}_{ij\cdot}\bar{Y}_{\cdot\cdot\cdot})=n_{ij}\bar{Y}_{ij\cdot}^2-n_{ij}\bar{Y}_{ij\cdot}\bar{Y}_{\cdot\cdot\cdot}-n_{ij}\bar{Y}_{ij\cdot}^2+n_{ij}\bar{Y}_{ij\cdot}\bar{Y}_{\cdot\cdot\cdot}=0     SStotal=ijk(YijkYˉij)2+ijk(YˉijYˉ)2+2ijk(YijkYˉij)(YˉijYˉ)=0=ijk(YˉijYˉ)2+ijk(YijkYˉij)2=SStrt+SSerror\begin{align*} \implies SS_{\text{total}}=&\sum_i\sum_j\sum_k(Y_{ijk}-\bar{Y}_{ij\cdot})^2+\sum_i\sum_j\sum_k(\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2+2\sum_i\sum_j\underbrace{\sum_k(Y_{ijk}-\bar{Y}_{ij\cdot})(\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot})}_{=0}\\ =&\sum_i\sum_j\sum_k(\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2+\sum_i\sum_j\sum_k(Y_{ijk}-\bar{Y}_{ij\cdot})^2\\ =&SS_{\text{trt}}+SS_{\text{error}} \end{align*}
(YˉijYˉ)2=[(YˉiYˉ)+(YˉjYˉ)+(YˉijYˉYˉj+Yˉ)]2(\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2=[(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot})+(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot})+(\bar{Y}_{ij\cdot}-\bar{Y}_{\cdot\cdot\cdot}-\bar{Y}_{\cdot j\cdot} +\bar{Y}_{\cdot\cdot\cdot})]^2     SStrt=SSA+SSB+SSAB\implies SS_{\text{trt}}=SS_A+SS_B+SS_{AB}

三種不同的模型都可以用相同的公式計算以上 SS ,但對於檢驗 H0:H_0: No (A/B/AB) effect/interaction 有不同的方法。( EMS rule )。

ANOVA

One-factor CRD

Level's # = k = # of trt's

Yij=μi+εij,i=1,k,j=1,,ni(=n if balanced)=μ+τi+εij,εijiidN(0,σε2)\begin{align*} Y_{ij}&=\mu_i+\varepsilon_{ij},\quad i=1\cdots,k, j=1,\cdots,n_i(=n\text{ if balanced})\\ &=\mu+\tau_i+\varepsilon_{ij},\quad \varepsilon_{ij}\overset{\text{iid}}{\sim}N(0,\sigma^2_{\varepsilon}) \end{align*}
  • μ\mu: Grand mean
  • τi\tau_i: ii-th trt effect
  • εij\varepsilon_{ij}: random error

Recall:

τi{fixed    τi=0random    τiiidN(0,στ2)\tau_i\begin{cases} \text{fixed}&\implies \sum\tau_i=0\\ \text{random}&\implies \tau_i\overset{\text{iid}}{\sim}N(0,\sigma^2_{\tau}) \end{cases}     E(SSE)=E[i=1kj=1n(YijYˉi)2]=E[i=1kj=1n(μ+τi+εijμτiεˉi)2]=E[i=1kj=1n(εijεˉi)2]\begin{align*} \implies E(SS_E)&=E\left[\sum_{i=1}^k\sum_{j=1}^n(Y_{ij}-\bar{Y}_{i\cdot})^2 \right]\\ &=E\left[\sum_{i=1}^k\sum_{j=1}^n(\mu+\tau_i+\varepsilon_{ij}-\mu-\tau_i-\bar{\varepsilon}_{i\cdot})^2 \right]\\ &=E\left[\sum_{i=1}^k\sum_{j=1}^n(\varepsilon_{ij}-\bar{\varepsilon}_{i\cdot})^2 \right]\\ \end{align*}

fixed ii, εi1,εi2,,εiniidN(0,σε2)\varepsilon_{i1},\varepsilon_{i2},\cdots,\varepsilon_{in}\overset{\text{iid}}{\sim}N(0,\sigma^2_{\varepsilon})

E[j=1n(εijεˉi)2σε2]=E[χn12]=n1E\left[\sum_{j=1}^n\frac{(\varepsilon_{ij}-\bar{\varepsilon}_{i\cdot})^2}{\sigma_\varepsilon^2} \right]=E[\chi^2_{n-1}]=n-1     E(SSE)=i=1k(n1)σε2=k(n1)σε2\implies E(SS_E)=\sum_{i=1}^k(n-1)\sigma^2_{\varepsilon}=k(n-1)\sigma^2_{\varepsilon}
Definition
MSE=SSEdf=SSEk(n1)    E(MSE)=E(SSE)k(n1)=σε2MS_E=\frac{SS_E}{df}=\frac{SS_E}{k(n-1)}\implies E(MS_E)=\frac{E(SS_E)}{k(n-1)}=\sigma^2_{\varepsilon}

    MSE\implies MS_E is an unbiased estimator of σε2\sigma^2_{\varepsilon}

E(SStrt)=E[i=1kj=1n(YˉiYˉ)2]=E[ikn(YˉiYˉ)2]=E[i=1kn(μτi+εˉiμτˉεˉ)2]=E[i=1kn[(τiτˉ)2+(εˉiτˉ)2+2(τiτˉ)(εˉiεˉ)]]=nE[i=1k(τiτˉ)2]+nE[i=1k(εˉiεˉ)2]+2nE[i=1k(τiτˉ)(εˉiεˉ)]=0,τi: fixed or random\begin{align*} E(SS_{trt})&=E\left[\sum_{i=1}^k\sum_{j=1}^n(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2 \right]\\ &=E\left[\sum_i^k n(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2 \right]\\ &=E\left[\sum_{i=1}^k n(\mu-\tau_i+\bar{\varepsilon}_{i\cdot}-\mu-\bar{\tau}_{\cdot}-\bar{\varepsilon}_{\cdot\cdot})^2 \right]\\ &=E\left[\sum_{i=1}^k n[(\tau_i-\bar{\tau}_{\cdot})^2+(\bar{\varepsilon}_{i\cdot}-\bar{\tau}_{\cdot\cdot})^2+2(\tau_i-\bar{\tau}_{\cdot})(\bar{\varepsilon}_{i\cdot}-\bar{\varepsilon}_{\cdot\cdot})] \right]\\ &=nE\left[\sum_{i=1}^k(\tau_i-\bar{\tau}_{\cdot})^2 \right]+nE\left[\sum_{i=1}^k(\bar{\varepsilon}_{i\cdot}-\bar{\varepsilon}_{\cdot\cdot})^2 \right]+2n\underbrace{E\left[\sum_{i=1}^k(\tau_i-\bar{\tau}_{\cdot})(\bar{\varepsilon}_{i\cdot}-\bar{\varepsilon}_{\cdot\cdot}) \right]}_{=0,\quad \tau_i: \text{ fixed or random}} \end{align*} εˉ1,,εˉkiidN(0,σε2n)    i=1k(εˉiεˉ)2σε2/nχk12    E[i=1k(εˉiεˉ)2]=(k1)σε2\bar{\varepsilon}_{1\cdot},\cdots,\bar{\varepsilon}_{k\cdot}\overset{\text{iid}}{\sim}N(0,\frac{\sigma^2_{\varepsilon}}{n})\implies\sum_{i=1}^k \frac{(\bar{\varepsilon}_{i\cdot}-\bar{\varepsilon}_{\cdot\cdot})^2}{\sigma^2_\varepsilon/n}\sim\chi^2_{k-1}\implies E\left[\sum_{i=1}^k(\bar{\varepsilon}_{i\cdot}-\bar{\varepsilon}_{\cdot\cdot})^2 \right]=(k-1)\sigma^2_{\varepsilon} nE[i=1k(τiτˉ)2]={ni=1kτi2τi: fixed    τi=0    τˉ=0n(k1)στ2τi: random    k(τiτˉ)2στ2χk12nE\left[\sum_{i=1}^k(\tau_i-\bar{\tau}_{\cdot})^2 \right]=\begin{cases} n\sum_{i=1}^k\tau_i^2 & \tau_i: \text{ fixed}\implies\sum\tau_i=0\implies\bar{\tau}_{\cdot}=0\\ n(k-1)\sigma^2_{\tau} & \tau_i: \text{ random}\implies \sum^k\frac{(\tau_i-\bar{\tau}_\cdot)^2}{\sigma^2_\tau}\sim\chi^2_{k-1} \end{cases}     E(SStrt)={(k1)σε2+ni=1kτi2τi: fixed(k1)σε2+n(k1)στ2τi: random={(k1)σε2+n(k1)i=1kτi2k1τi: fixed, i=1kτi2k1 donated by ϕτ(k1)σε2+n(k1)στ2τi: random\begin{align*} \implies E(SS_{trt})&=\begin{cases} (k-1)\sigma_\varepsilon^2+n\sum_{i=1}^k\tau_i^2 & \tau_i: \text{ fixed}\\ (k-1)\sigma_\varepsilon^2+n(k-1)\sigma^2_{\tau} & \tau_i: \text{ random} \end{cases}\\ &=\begin{cases} (k-1)\sigma_\varepsilon^2+n(k-1)\frac{\sum_{i=1}^k\tau_i^2}{k-1} & \tau_i: \text{ fixed, } \frac{\sum_{i=1}^k\tau_i^2}{k-1}\text{ donated by }\phi_\tau\\ (k-1)\sigma_\varepsilon^2+n(k-1)\sigma^2_{\tau} & \tau_i: \text{ random} \end{cases} \end{align*}
  • Fixed: ϕτ=0    τi=0    \phi_\tau=0\iff\forall\tau_i=0\iff No trt effect
  • Random: στ2=0    \sigma_\tau^2=0\iff No trt effect
Definition

df of trt = k-1

MStrt=SStrtk1    E(MStrt)={σε2+nϕττi: fixedσε2+nστ2τi: randomMS_{trt}=\frac{SS_{trt}}{k-1}\implies E(MS_{trt})=\begin{cases} \sigma^2_{\varepsilon}+n\phi_{\tau} & \tau_i: \text{ fixed}\\ \sigma^2_{\varepsilon}+n\sigma^2_{\tau} & \tau_i: \text{ random} \end{cases}

我們對 trt 是否有效應感興趣,因此會檢驗:

H0: No trt effect v.s. H1: Sig. trt effectH_0: \text{ No trt effect v.s. } H_1: \text{ Sig. trt effect}     H0:{ϕτ=0στ2=0v.s. H1:{ϕτ>0 fixedστ2>0 random\iff H_0:\begin{cases} \phi_\tau=0 \\ \sigma^2_{\tau}=0 \end{cases}\quad\text{v.s. }\quad H_1:\begin{cases} \phi_\tau > 0 & \text{ fixed}\\ \sigma^2_{\tau}> 0 & \text{ random} \end{cases}
  • Under H0H_0: No trt effect     E(MSE)=σε2=E(MStrt)\implies E(MS_E)=\sigma_\varepsilon^2=E(MS_{trt}), i.e. MStrtMS_{trt} and MSEMS_E should be similar.
  • Under H1H_1: Sig. trt effect     E(MStrt)=σε2+n[ϕτστ2]>σε2=E(MSE)\implies E(MS_{trt})=\sigma_\varepsilon^2+n\cdot[\phi_\tau|\sigma_\tau^2]>\sigma_\varepsilon^2=E(MS_E), i.e. MStrtMS_{trt} tend to be larger than MSEMS_E.

    \implies Reject H0H_0 if MStrt>>MSE    MS_{trt}>>MS_E\iff reject H0H_0 if MStrt/MSE>>1MS_{trt}/MS_E>>1

Definition
FMStrtMSEH0F(dftrt,dfE)=Fk1,NkF^*\triangleq\frac{MS_{trt}}{MS_E}\overset{H_0}{\sim}F(df_{trt},df_E)=F_{k-1,N-k}

REmark:

N1=(k1)+dfE    dfE=Nk=nkk=k(n1)N-1=(k-1)+df_E \implies df_E=N-k=nk-k=k(n-1)

Hence, reject H0H_0 at level α    \alpha \iff

α=P(reject H0H0 is true)=PH0(F>Fk1,Nk,α)\begin{align*} \alpha&=P(\text{reject }H_0|H_0\text{ is true})\\ &=P_{H_0}(F^*>F_{k-1,N-k,\alpha})\\ \end{align*}
Definition
Fl,m,α is s.t. P(Fl,mFl,m,α)=αF_{l,m,\alpha} \text{ is s.t. }P(F_{l,m}\ge F_{l,m,\alpha})=\alpha

    \implies Reject H0H_0 at level α    F>Fk1,Nk.α\alpha\iff F^*>F_{k-1,N-k.\alpha} with F=MStrt/MSEF^*=MS_{trt}/MS_E

    \implies ANOVA table:

SourcedfSSMS=SS/dfEMS=E(MS)F-valuep-value
trtk-1SStrtSS_{trt}MStrtMS_{trt}σε2+n[ϕτστ2]\sigma_\varepsilon^2+n[\phi_\tau \mid \sigma_\tau^2]MStrt/MSE=fMS_{trt}/MS_E=f^*P(Fk1,Nk>f)P(F_{k-1,N-k}>f^*)
ErrorN-kSSESS_EMSEMS_Eσε2\sigma_\varepsilon^2
TotalN-1SStotalSS_{total}

Note: k=2k=2

<Y11,Y12,,Y1n1N(μ1,σ2)Y21,Y22,,Y2n2N(μ2,σ2)\perp\bigg<\begin{align*} Y_{11},Y_{12},\cdots,Y_{1n_1}\sim N(\mu_1,\sigma^2)\\ Y_{21},Y_{22},\cdots,Y_{2n_2}\sim N(\mu_2,\sigma^2) \end{align*}

To test H0:μ1=μ2H_0:\mu_1=\mu_2 v.s. H1:μ1μ2H_1:\mu_1\neq\mu_2 by two-sample t-test:

Yˉ1Yˉ2(1n1+1n2)Sp2>tN2,α/2with Sp2=1n1+n22(j=1n1(Y1jYˉ1)2+j=1n2(Y2jYˉ2)2)\left|\frac{\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot}}{\sqrt{(\frac{1}{n_1}+\frac{1}{n_2})S_p^2}}\right|>t_{N-2,\alpha/2}\qquad\text{with }S_p^2=\frac{1}{n_1+n_2-2}\left(\sum_{j=1}^{n_1}(Y_{1j}-\bar{Y}_{1\cdot})^2+ \sum_{j=1}^{n_2}(Y_{2j}-\bar{Y}_{2\cdot})^2\right)

Note:

tH0tn1+n22=balancediftn2N(0,1)χ2n222n2>t^*\overset{H_0}{\sim}t_{n_1+n_2-2}\xlongequal[\text{balanced}]{\text{if}}t_{n-2}\triangleq\frac{N(0,1)}{\sqrt{\frac{\chi^2_{2n-2}}{2n-2}}}\bigg>\perp     (t)2H0(tn2)2H0χ12/1χ2n22/(2n2)>F1,2n2=F21,N2\implies (t^*)^2\overset{H_0}{\sim}(t_{n-2})^2\overset{H_0}{\sim}\frac{\chi^2_1/1}{\chi^2_{2n-2}/(2n-2)}\bigg>\perp\sim F_{1,2n-2}=F_{2-1,N-2}

if n1=n2=nn_1=n_2=n

(t)2=(Yˉ1Yˉ2(1n+1n)Sp2)=(Yˉ1Yˉ2)22nSp2=n2(Yˉ1Yˉ2)1Sp2=MStrtMSE=F(t^*)^2=\left(\frac{\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot}}{\sqrt{(\frac{1}{n}+\frac{1}{n})S_p^2}} \right)=\frac{(\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot})^2}{\frac{2}{n}S_p^2}=\frac{n}{2}(\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot})\frac{1}{S_p^2}=\frac{MS_{trt}}{MS_E}=F^* MStrt=SStrt21=i=12j=1n(YˉiYˉ)2=i=12n(Yˉi12(Yˉ1+Yˉ2))2=n2(Yˉ1Yˉ2)2\begin{align*} MS_{trt}&=\frac{SS_{trt}}{2-1}=\sum_{i=1}^2\sum_{j=1}^n(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2\\ &=\sum_{i=1}^2n(\bar{Y}_{i\cdot}-\frac{1}{2}(\bar{Y}_{1\cdot}+\bar{Y}_{2\cdot}))^2\\ &=\frac{n}{2}(\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot})^2 \end{align*} SSE=i=12j=1n(YijYˉi)2=j=1n(Y1jYˉ1)2+j=1n(Y2jYˉ2)2MSE=SSENk=SSE2n2=Sp2\begin{align*} SS_E&=\sum_{i=1}^2\sum_{j=1}^n(Y_{ij}-\bar{Y}_{i\cdot})^2\\ &=\sum_{j=1}^n(Y_{1j}-\bar{Y}_{1\cdot})^2 + \sum_{j=1}^n(Y_{2j}-\bar{Y}_{2\cdot})^2\\ MSE&=\frac{SS_E}{N-k}=\frac{SS_E}{2n-2}=S_p^2 \end{align*}

Paired data:

(Y11Y21),(Y12Y22),,(Y1nY2n)iidN(μ1,μ2,σ12,σ22,ρ)\begin{pmatrix} Y_{11}\\ Y_{21} \end{pmatrix},\begin{pmatrix} Y_{12}\\ Y_{22} \end{pmatrix},\cdots,\begin{pmatrix} Y_{1n}\\ Y_{2n} \end{pmatrix}\overset{\text{iid}}{\sim}N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)

    \implies test H0:μ1=μ2H_0:\mu_1=\mu_2 v.s. H1:μ1μ2H_1:\mu_1\neq\mu_2 by paired t-test:

DjY1jY2j,j=1,,niidN(μ1μ2,σε2),σε2= func of σ12,σ22,ρD_j\triangleq Y_{1j}-Y_{2j},\quad j=1,\cdots,n\quad\overset{\text{iid}}\sim{N(\mu_1-\mu_2,\sigma^2_\varepsilon)},\quad\sigma^2_\varepsilon=\text{ func of }\sigma_1^2,\sigma_2^2,\rho nDˉSD>tn1,α/2    nDˉ2SD2>F1,n1,α    n2(Yˉ1Yˉ2)MStrt1SD2/2>F1,n1,α\left|\frac{\sqrt{n}\bar{D}}{S_D}\right|>t_{n-1,\alpha/2}\iff\frac{n\bar{D}^2}{S_D^2}>F_{1,n-1,\alpha}\iff \underbrace{\frac{n}{2}(\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot})}_{MS_{trt}}\frac{1}{S_D^2/2}>F_{1,n-1,\alpha} SD21n1j=1n(DjDˉ)2=1n1j=1n[(Y1jY2j)(Yˉ1Yˉ2)]2\begin{align*} S_D^2&\triangleq\frac{1}{n-1}\sum_{j=1}^n(D_j-\bar{D})^2\\ &=\frac{1}{n-1}\sum_{j=1}^n[(Y_{1j}-Y_{2j})-(\bar{Y}_{1\cdot}-\bar{Y}_{2\cdot})]^2\\ \end{align*}

Two-factor CRD with balanced

Yijk=μ+Ai+Bj+ABij+ε(ij)ki=1aj=1bk=1nY_{ijk}=\mu+A_i+B_j+AB_{ij}+\varepsilon_{(ij)k}\quad\begin{align*} &i=1\cdots a\\ &j=1\cdots b\\ &k=1\cdots n \end{align*}

Number of trt = abab

Note: for fixed model, i.e. both A and B are fixed effect

    i=1aAi=0,j=1bBj=0,j,i=1aABij=0=j=1bABij,i\implies\sum_{i=1}^aA_i=0,\quad\sum_{j=1}^bB_j=0,\quad\forall j, \sum_{i=1}^aAB_{ij}=0=\sum_{j=1}^bAB_{ij},\forall i

    E(SSE)=E[i=1aj=1bk=1n(YijkYˉij)2]=E[ijk(μ+Ai+Bj+ABij+εijkμAiBjABijεˉij)2]=E[ijk(εijkεˉij)2]=ab(n1)σε2\begin{align*} \implies E(SSE)&=E\left[\sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n(Y_{ijk-\bar{Y}_{ij\cdot}})^2 \right]\\ &=E\left[\sum_i\sum_j\sum_k (\mu+A_i+B_j+AB_{ij}+\varepsilon_{ijk}-\mu-A_i-B_j-AB_{ij}-\bar{\varepsilon}_{ij\cdot})^2 \right]\\ &=E\left[\sum_i\sum_j\sum_k(\varepsilon_{ijk}-\bar{\varepsilon}_{ij\cdot})^2 \right]\\ &=ab(n-1)\sigma^2_{\varepsilon} \end{align*}

    E(MSE)=E(SSE/[ab(n1)])=σε2\implies E(MSE)=E(SSE/[ab(n-1)])=\sigma_\varepsilon^2

E(SSA)E[ijk(YˉiYˉ)2]=E[ijk(μ+Ai+Bˉ+ABˉi+εˉiμAˉBˉABˉεˉ)2]=ijkAi2bnE(i=1a(εˉiεˉ)2)+2ijkAiE(εˉiεˉ)=0=bniAi2+bnσε2bn(a1)=bn(a1)iAi2a1+(a1)σε2,iAi2a1+(a1) donated by ϕA\begin{align*} E(SSA)&\triangleq E\left[\sum_i\sum_j\sum_k(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot})^2 \right]\\ &=E\left[\sum_i\sum_j\sum_k(\mu+A_i+\bar{B}_\cdot+\bar{AB}_{i\cdot}+\bar{\varepsilon}_{i\cdot\cdot}-\mu-\bar{A}_\cdot-\bar{B}_\cdot-\bar{AB}_{\cdot\cdot}-\bar{\varepsilon}_{\cdot\cdot\cdot})^2\right]\\ &=\sum_i\sum_j\sum_k A_i^2-bn\cdot E(\sum_{i=1}^a(\bar{\varepsilon}_{i\cdot\cdot}-\bar{\varepsilon}_{\cdot\cdot\cdot})^2)+2\sum_i\sum_j\sum_k A_i\underbrace{E(\bar{\varepsilon}_{i\cdot\cdot}-\bar{\varepsilon}_{\cdot\cdot\cdot})}_{=0}\\ &=bn\cdot\sum_iA_i^2+bn\frac{\sigma_\varepsilon^2}{bn}(a-1)\\ &=bn(a-1)\frac{\sum_iA_i^2}{a-1}+(a-1)\sigma_\varepsilon^2,\quad \frac{\sum_iA_i^2}{a-1}+(a-1)\text{ donated by }\phi_A \end{align*}

    E(MSA)=E(SSA)/(a1)=bnϕA+σε2\implies E(MS_A)=E(SS_A)/(a-1)=bn\phi_A+\sigma_\varepsilon^2


SourcedfSSMS=SS/dfEMS=E(MS)F-valuep-value
Aa-1SSAMSAMS_Aσε2+bnϕA\sigma_\varepsilon^2+bn\phi_AMSA/MSEMS_A/MS_EP(Fa1,ab(n1)>f)P(F_{a-1,ab(n-1)}>f^*)
Bb-1SSBMSBMS_Bσε2+anϕB\sigma_\varepsilon^2+an\phi_BMSB/MSEMS_B/MS_EP(Fb1,ab(n1)>f)P(F_{b-1,ab(n-1)}>f^*)
AB(a-1)(b-1)SSABMSABMS_{AB}σε2+nϕAB+\sigma_\varepsilon^2+n\phi_{AB}+MSAB/MSEMS_{AB}/MS_EP(F(a1)(b1),ab(n1)>f)P(F_{(a-1)(b-1),ab(n-1)}>f^*)
Errorab(n-1)SSEMSEMS_Eσε2\sigma_\varepsilon^2
Totalabn-1SST
  • PAP_A: for H0H_0: No A effect     ϕA=0\iff\phi_A=0 v.s. H1H_1: Sig. A effect     ϕA>0\iff\phi_A>0
  • PBP_B: for H0H_0: No B effect     ϕB=0\iff\phi_B=0 v.s. H1H_1: Sig. B effect     ϕB>0\iff\phi_B>0
  • PABP_{AB}: for H0H_0: No AB interaction     ϕAB=0\iff\phi_{AB}=0 v.s. H1H_1: Sig. AB interaction     ϕAB>0\iff\phi_{AB}>0

Note: MSA+MSB+MSAB=MStrtMS_A+MS_B+MS_{AB}=MS_{trt} and (a1)+(b1)+(a1)(b1)=ab1=(a-1)+(b-1)+(a-1)(b-1)=ab-1= df of trt