跳至主要内容

簡單假設(Simple Hypothese)

Definition

如果 supθω0Eθϕ(X~)=α\sup_{\theta\in\omega_0}E_\theta \phi^*(\utilde{X})=\alpha 是 level α\alpha 的檢定,並且對於所有的 level α\alpha 的檢定 ϕ(X~)\phi(\utilde{X})

Eθϕ(X~)Eθϕ(X~)θω1uniformlyE_\theta\phi^*(\utilde{X})\ge E_\theta\phi(\utilde{X})\quad \forall \underbrace{\theta\in\omega_1}_{\text{uniformly}}

ϕ(X~)\phi^*(\utilde{X}) 被稱爲 level α\alpha最強檢定(Uniformly Most Powerful Test, UMP Test)

如果 H1H_1 是 simple,則 UMP 被稱為 MP 檢定。

MP 檢定(MP test)

我們獲得單筆數據 XX,並且有以下分佈:

X=X=1234567
θ0\theta_00.010.010.020.010.010.010.93
θ1\theta_10.090.080.070.060.050.040.61

在顯著水平 α=0.05\alpha=0.05 下檢定 H0:θ=θ0H_0: \theta=\theta_0 v.s. H1:θ=θ1H_1: \theta=\theta_1

ϕ1(X)={1if X=1,2,4,5,60o.w.\phi_1(X)=\begin{cases} 1 & \text{if } X=1,2,4,5,6\\ 0 & \text{o.w.} \end{cases}

with level =Eθ0ϕ1(X)=Pθ0(X=1 or X=2 or X=4 or X=5 or X=6)=0.05=E_{\theta_0}\phi_1(X)=P_{\theta_0}(X=1 \text{ or } X=2 \text{ or } X=4 \text{ or } X=5 \text{ or } X=6)=0.05

power of ϕ1=0.32\phi_1=0.32

ϕ2(X)={1if X=1,2,3,40o.w.\phi_2(X)=\begin{cases} 1 & \text{if } X=1,2,3,4\\ 0 & \text{o.w.} \end{cases}

with level =Eθ0ϕ2(X)=Pθ0(X=1 or X=2 or X=3 or X=4)=0.05=E_{\theta_0}\phi_2(X)=P_{\theta_0}(X=1 \text{ or } X=2 \text{ or } X=3 \text{ or } X=4)=0.05

power of ϕ2=0.3\phi_2=0.3

ϕ3(X)={1if X=3,4,5,60o.w.\phi_3(X)=\begin{cases} 1 & \text{if } X=3,4,5,6\\ 0 & \text{o.w.} \end{cases}

with level =Eθ0ϕ3(X)=Pθ0(X=3 or X=4 or X=5 or X=6)=0.05=E_{\theta_0}\phi_3(X)=P_{\theta_0}(X=3 \text{ or } X=4 \text{ or } X=5 \text{ or } X=6)=0.05

power of ϕ3=0.22\phi_3=0.22

ϕ4(X)={0.050.93if X=70o.w.\phi_4(X)=\begin{cases} \frac{0.05}{0.93} & \text{if } X=7\\ 0 & \text{o.w.} \end{cases}

with level =Eθ0ϕ4(X)=0.050.93Pθ0(X=7)=0.05=E_{\theta_0}\phi_4(X)=\frac{0.05}{0.93}P_{\theta_0}(X=7)=0.05

power of ϕ4=0.050.930.61\phi_4=\frac{0.05}{0.93}\cdot 0.61

當我們想從這 4 中檢定中選擇一個最好的時,我們需要比較他們的 power。通過比較發現 ϕ1\phi_1 是最好的檢定。

但為什麼 ϕ1\phi_1 能得到最好的 power 呢?因為他選擇拒絕 H0H_0XX 是在 θ1\theta_1 下概率最大而在 θ0\theta_0 下概率最小的。

X=X=1234567
θ0\theta_00.010.010.020.010.010.010.93
θ1\theta_10.090.080.070.060.050.040.61
f(x;θ1)f(x;θ0)\frac{f(x;\theta_1)}{f(x;\theta_0)}983.56546193\frac{61}{93}

最下面一行可以認為是“CP 值”,我們只要選擇讓 CP 值最大的 XX 來拒絕 H0H_0,就能得到最好的 power。比如在這個例子中,ϕ1\phi_1 就選擇了 "CP 值" 大於等於 4 的 XX,i.e.:

ϕ1(X)={1if f(x;θ1)4f(x;θ0)0o.w.\phi_1(X)=\begin{cases} 1 & \text{if } f(x;\theta_1) \ge 4f(x;\theta_0)\\ 0 & \text{o.w.} \end{cases}
Theorem

Neyman-Pearson Fundamental Lemma: Let X~f(x~;θ)\utilde{X}\sim f(\utilde{x};\theta) for testing

Simple H0:θ=θ0 v.s. Simple H1:θ=θ1\text{Simple } H_0: \theta=\theta_0 \text{ v.s. Simple } H_1: \theta=\theta_1

with a given 0<α<10<\alpha<1,除非存在一個 power=1 & sig. level <α<\alpha 的檢定函數

我們會有以下結論:

  1. 存在性 \exist a test ϕ(X~)\phi(\utilde{X}) and a constant c>0c>0 s.t.

    1. Eθ0ϕ(X~)=αE_{\theta_0}\phi(\utilde{X})=\alpha
    2. ϕ(X~)={1if f(x~;θ1)>cf(x~;θ0)0if f(x~;θ1)<cf(x~;θ0)\phi(\utilde{X})=\begin{cases} 1 & \text{if } f(\utilde{x};\theta_1) > cf(\utilde{x};\theta_0)\\ 0 & \text{if } f(\utilde{x};\theta_1) < cf(\utilde{x};\theta_0) \end{cases}
  2. 充分條件 如果 ϕ\phi^* 滿足存在性的兩個條件,則 ϕ\phi^* 在所有 level α\le \alpha 檢定下都是 MP 檢定。

  3. 必要條件 如果 ϕ\phi^* 是 level α\alpha 的 MP 檢定,則 ϕ\phi^* 滿足存在性的兩個條件。

Remark:

  1. 根據 Lemma 的第 1 點,通常可以得到唯一的 MP α\alpha 檢定(反例:U(0,θ)U(0, \theta)

  2. 滿足以下條件的檢定函數 ϕ\phi 被稱爲 N-P 檢定函數:

    ϕ(X~)={1if f(x~;θ1)>cf(x~;θ0)0if f(x~;θ1)<cf(x~;θ0)γif f(x~;θ1)=cf(x~;θ0)with c>0γ[0,1] \phi(\utilde{X})=\begin{cases} 1 & \text{if } f(\utilde{x};\theta_1) > cf(\utilde{x};\theta_0)\\ 0 & \text{if } f(\utilde{x};\theta_1) < cf(\utilde{x};\theta_0)\\ \gamma & \text{if } f(\utilde{x};\theta_1) = cf(\utilde{x};\theta_0) \end{cases} \quad \text{with }c>0\quad \gamma\in[0,1]

    使得 Eθ0ϕ(X~)=Pθ0(f(x~;θ1)>cf(x~;θ0))+γPθ0(f(x~;θ1)=cf(x~;θ0))=αE_{\theta_0}\phi(\utilde{X})=P_{\theta_0}(f(\utilde{x};\theta_1) > cf(\utilde{x};\theta_0))+\gamma P_{\theta_0}(f(\utilde{x};\theta_1) = cf(\utilde{x};\theta_0))=\alpha

    因此,ϕ\phi 滿足 Lemma 的兩個條件,所以 N-P 檢定函數是 MP 檢定函數。

Corollary

如果 ϕ\phi 滿足 N-P Lemma 的兩個條件(因此 ϕ\phi 是 MP level ϕ\phi 檢定)

Eθ1ϕ(X~)α=Eθ0ϕ(X~)E_{\theta_1}\phi(\utilde{X})\ge \alpha = E_{\theta_0}\phi(\utilde{X})

Proof: 令 ϕα(X~)=α    Eθϕα(X~)=α\phi_\alpha(\utilde{X})=\alpha\implies E_\theta\phi_\alpha(\utilde{X})=\alpha

ϕ\because \phi is MP level α\alpha     Eθ1ϕ(X~)Eθ1ϕα(X~)\implies E_{\theta_1}\phi(\utilde{X})\ge E_{\theta_1}\phi_\alpha(\utilde{X})

如果等於號成立,則 ϕα(X~)\phi_\alpha(\utilde{X}) 也會是 MP level α\alpha 檢定。

Remark:事實上,除非 X~\utilde{X}θ1\theta_1θ0\theta_0 的 cdf 相同,否則等號不會成立。

by N-P Lemma, c>0\exist c>0 s.t.:

α=ϕαX~={1if f(x~;θ1)>cf(x~;θ0)0if f(x~;θ1)<cf(x~;θ0)γif f(x~;θ1)=cf(x~;θ0)\alpha=\phi_\alpha\utilde{X}=\begin{cases} 1 & \text{if } f(\utilde{x};\theta_1) > cf(\utilde{x};\theta_0)\\ 0 & \text{if } f(\utilde{x};\theta_1) < cf(\utilde{x};\theta_0)\\ \gamma & \text{if } f(\utilde{x};\theta_1) = cf(\utilde{x};\theta_0) \end{cases}     γ=α\implies \gamma=\alpha

因此

  1. θ1>θ0\theta_1>\theta_0, Eθϕ(X~)E_\theta\phi(\utilde{X}) 是沿着 θ\theta 遞增     supθθ0Eθϕ(X~)=Eθ0ϕ(X~)=α\implies \sup_{\theta\le\theta_0}E_\theta\phi(\utilde{X})=E_{\theta_0}\phi(\utilde{X})=\alpha。因此我們可以把 H_0 擴產爲 H0:θθ0H_0: \theta\le\theta_0
  2. θ1<θ0\theta_1<\theta_0, Eθϕ(X~)E_\theta\phi(\utilde{X}) 是沿着 θ\theta 遞減     supθθ0Eθϕ(X~)=Eθ0ϕ(X~)=α\implies \sup_{\theta\ge\theta_0}E_\theta\phi(\utilde{X})=E_{\theta_0}\phi(\utilde{X})=\alpha。因此我們可以把 H_0 擴產爲 H0:θθ0H_0: \theta\ge\theta_0

EX: 我們得到單個數據 XX,並且作以下檢定:

H0:XU(0,1) v.s. H1:Xf(x;θ1)=2xx(0,1)H_0: X\sim U(0,1) \text{ v.s. } H_1: X\sim f(x;\theta_1)=2x\quad x\in(0,1)

根據 N-P Lemma,我們可以在 f(x;θ1)>cf(x;θ0)f(x;\theta_1) > cf(x;\theta_0) 時拒絕 H0H_0。而 f(x;θ1)>cf(x;θ0)    x>kf(x;\theta_1) > cf(x;\theta_0) \iff x>k,i.e.:

ϕ(X)={1if X>k0if X<kwith α=Eθ0ϕ(X)=Pθ0(X>k)=1k\phi(X)=\begin{cases} 1 & \text{if } X>k\\ 0 & \text{if } X<k \end{cases} \quad \text{with } \alpha=E_{\theta_0}\phi(X)=P_{\theta_0}(X>k)=1-k

    k=1α\implies k=1-\alpha。因此我們可以得到 MP:

ϕ(X)={1if X>1α0if X<1α\phi(X)=\begin{cases} 1 & \text{if } X>1-\alpha\\ 0 & \text{if } X<1-\alpha \end{cases}

而它的 power 是:

Eθ1ϕ(X)=Pθ1(X>1α)=1(1α)2E_{\theta_1}\phi(X)=P_{\theta_1}(X>1-\alpha)=1-(1-\alpha)^2

但假如我們現在獲得了 n2n\ge 2 筆數據,i.e. X1,,Xniidf(x;θ)X_1,\cdots,X_n\overset{\text{iid}}{\sim}f(x;\theta),並且有以下檢定:

H0:XU(0,1) v.s. H1:Xf(x;θ1)=2xx(0,1)H_0: X\sim U(0,1) \text{ v.s. } H_1: X\sim f(x;\theta_1)=2x\quad x\in(0,1)

根據 N-P Lemma,ϕ(X~)=1\phi(\utilde{X})=1 if i=1nXi>k    i=1n(2lnX)<k=2lnk\prod_{i=1}^nX_i > k \iff \sum_{i=1}^n(-2\ln X)<k'=-2\ln k

    α=Eθ0ϕ(X~)=Pθ0(i=1n(2lnXi)<k)=Pθ0(χ2n2<k)2lnU(0,1)χ22=Pθ0(w<k)where wχ2n2\begin{align*} \implies \alpha=E_{\theta_0}\phi(\utilde{X})&=P_{\theta_0}\left(\sum_{i=1}^n(-2\ln X_i)<k'\right)\\ &=P_{\theta_0}\left(\chi^2_{2n}<k'\right) \quad \because -2\ln U(0,1)\sim \chi^2_2\\ &=P_{\theta_0}\left(w<k'\right) \quad \text{where } w\sim \chi^2_{2n} \end{align*}

我們可以定義一個數字 χm,α2\chi^2_{m,\alpha} 使得 P(w>χm,α2)=αP(w>\chi^2_{m,\alpha})=\alpha。因此我們可以得到 MP:

ϕ(X~)=1 if i=1n(2lnXi)<χ2n,1α2\phi(\utilde{X})=1 \text{ if } \sum_{i=1}^n(-2\ln X_i)<\chi^2_{2n,1-\alpha}

EX: X1,,XniidU(0,θ)X_1, \cdots, X_n \overset{\text{iid}}{\sim} U(0, \theta)

給定 θ1θ0R+\theta_1\neq\theta_0\in\R^+,做以下檢定:

H0:θ=θ0 v.s. H1:θ=θ1H_0: \theta=\theta_0 \text{ v.s. } H_1: \theta=\theta_1

根據 N-P Lemma,我們可以得到 level α\alpha 的 MP 檢定是:

ϕ(X~)={1if f(x~;θ1)cf(x~;θ0)0if f(x~;θ1)<cf(x~;θ0)with c>0 s.t. Eθ0ϕ(X~)=α\phi(\utilde{X})=\begin{cases} 1& \text{if } f(\utilde{x};\theta_1)\ge cf(\utilde{x};\theta_0)\\ 0& \text{if } f(\utilde{x};\theta_1)<cf(\utilde{x};\theta_0) \end{cases} \quad \text{with } c>0 \text{ s.t. } E_{\theta_0}\phi(\utilde{X})=\alpha

因為 X(n)X_{(n)} 是 sufficient statistic,我們可以得到:

    ϕ(X~)={1if X(n)k0if X(n)<k\iff \phi(\utilde{X})=\begin{cases} 1 & \text{if } X_{(n)}\ge k\\ 0 & \text{if } X_{(n)}<k \end{cases}

with

α=Eθ0ϕ(X~)=Pθ0(X(n)k)=1(kθ0)n    k=θ0(1α)1/n<θ0\alpha=E_{\theta_0}\phi(\utilde{X})=P_{\theta_0}(X_{(n)}\ge k)=1-\left(\frac{k}{\theta_0}\right)^n \quad\implies k=\theta_0(1-\alpha)^{1/n}<\theta_0

而它的 power 是:

Eθ1ϕ(X~)=Pθ1(X(n)k)=1(kθ1)n=1(θ0(1α)1/nθ1)n=1(θ0θ1)n(1α)E_{\theta_1}\phi(\utilde{X})=P_{\theta_1}(X_{(n)}\ge k)=1-\left(\frac{k}{\theta_1}\right)^n=1-\left(\frac{\theta_0(1-\alpha)^{1/n}}{\theta_1}\right)^n=1-\left(\frac{\theta_0}{\theta_1}\right)^n(1-\alpha)

但對於這種情況,可以發現如果有 XX 落在 θ0\theta_0θ1\theta_1 之間,那我們可以立馬得知 θ1\theta_1 是真的。因此我們可以造另一個檢定函數:

ϕ1={1if X(n)>θ0αif 0<X(n)θ0\phi_1 = \begin{cases} 1 & \text{if } X_{(n)}> \theta_0\\ \alpha & \text{if } 0<X_{(n)}\le \theta_0\\ \end{cases}

with

Eθ0ϕ1(X~)=Pθ0(X(n)>θ0)+αPθ0(0<X(n)θ0)=0+α1=αE_{\theta_0}\phi_1(\utilde{X})=P_{\theta_0}(X_{(n)}>\theta_0)+\alpha P_{\theta_0}(0<X_{(n)}\le \theta_0)=0+\alpha\cdot 1=\alpha

而它的 power 同樣會是:

Eθ1ϕ1(X~)=Pθ1(X(n)>θ0)+αPθ1(0<X(n)θ0)=1Pθ1(X(n)θ0)+αPθ1(0<X(n)θ0)=1(θ0θ1)n+α(θ0θ1)n=1(θ0θ1)n(1α)\begin{align*} E_{\theta_1}\phi_1(\utilde{X})&=P_{\theta_1}(X_{(n)}>\theta_0)+\alpha P_{\theta_1}(0<X_{(n)}\le \theta_0)\\ &=1-P_{\theta_1}(X_{(n)}\le \theta_0)+\alpha P_{\theta_1}(0<X_{(n)}\le \theta_0)\\ &=1-\left(\frac{\theta_0}{\theta_1}\right)^n+\alpha\left(\frac{\theta_0}{\theta_1}\right)^n\\ &=1-\left(\frac{\theta_0}{\theta_1}\right)^n(1-\alpha) \end{align*}

因此我們造出了兩個不同但都是 MP 的檢定函數。