在得到數據 X ~ = ( X 1 , ⋯ , X n ) ∼ f ( x ~ ; θ ) \utilde{X}=(X_1, \cdots, X_n)\sim f(\utilde{x};\theta) X = ( X 1 , ⋯ , X n ) ∼ f ( x ; θ ) with θ ∈ Ω ⊆ R n \theta\in\Omega\subseteq\R^n θ ∈ Ω ⊆ R n 時,假設檢定問題旨在決定是否要拒絕 H 0 H_0 H 0 虛無假設(null hypothese)。
假設是關於 θ \theta θ 的敘述。 ⟺ \iff ⟺ 對於母體分佈的敘述。
如何假設只描述了一種分佈,那麽稱之爲簡單假設(Simple Hypothese) 。否則成爲複合假設(Composite Hypothese) 。
EX : X ∼ N ( μ , σ 2 ) X\sim N(\mu, \sigma^2) X ∼ N ( μ , σ 2 )
H : μ = 20 , σ 2 = 1 ⟺ H : X ∼ N ( 20 , 1 ) H: \mu=20, \sigma^2=1 \iff H: X\sim N(20,1) H : μ = 20 , σ 2 = 1 ⟺ H : X ∼ N ( 20 , 1 ) is Simple 。
H : μ ≥ 60 , σ 2 : H: \mu\ge 60, \sigma^2: H : μ ≥ 60 , σ 2 : unkonwn ⟺ H : X ∼ N ( μ , σ 2 ) \iff H: X\sim N(\mu, \sigma^2) ⟺ H : X ∼ N ( μ , σ 2 ) with μ ≥ 60 , σ 2 \mu\ge 60, \sigma^2 μ ≥ 60 , σ 2 unknow is Composite 。
通常來説,我們關注的是參數的範圍,i.e. H : θ ∈ ω ⊆ Ω H: \theta\in \omega \subseteq \Omega H : θ ∈ ω ⊆ Ω 。
∣ ω ∣ = 1 ⟹ H |\omega|=1\implies H ∣ ω ∣ = 1 ⟹ H is simple.
∣ ω ∣ > 1 ⟹ H |\omega|>1\implies H ∣ ω ∣ > 1 ⟹ H is composite.
而我們檢定的是 H 0 : θ ∈ ω 0 H_0: \theta\in\omega_0 H 0 : θ ∈ ω 0 v.s. H 1 : θ ∈ ω 1 H_1: \theta\in\omega_1 H 1 : θ ∈ ω 1 ,并且 ω 0 ∩ ω 1 = ∅ \omega_0\cap \omega_1=\empty ω 0 ∩ ω 1 = ∅
假設檢定
在真實的情況中,我們永遠無法知道 θ \theta θ 的值是什麽。而我們同樣無法知道 H : θ ∈ ω , ∀ ω H: \theta\in\omega, \forall\omega H : θ ∈ ω , ∀ ω 是真的還是假的。
所以再給檢定結果下結論時,我們不會説我們接受了某個假設。而是拒絕或不拒絕某個假設。
因此檢定 H 0 : θ ∈ ω 0 H_0: \theta\in \omega_0 H 0 : θ ∈ ω 0 v.s. H 1 : θ ∈ ω 1 H_1: \theta\in\omega_1 H 1 : θ ∈ ω 1 時
H 0 H_0 H 0 是默認的假設,稱爲虛無假設(null hypothese) 。
H 1 H_1 H 1 是對立假設(attenative hypothese) ,是我們想要説明的假設。
E.G. :
H 0 : H_0: H 0 : 無罪 v.s. H 1 : H_1: H 1 : 有罪
H 0 : H_0: H 0 : 及格 v.s. H 1 : H_1: H 1 : 不及格
H 0 : H_0: H 0 : 不及格 v.s. H 1 : H_1: H 1 : 及格
檢定函數(Test Function)
當我們拿到一組數據 X ~ = x ~ \utilde{X}=\utilde{x} X = x ,希我們會需要在這組數據的基礎上利用檢定函數 ϕ \phi ϕ 來決定是否拒絕 H 0 H_0 H 0 。
任何函數 ϕ \phi ϕ 滿足
ϕ : R n → [ 0 , 1 ] \phi:\R^n\to[0,1] ϕ : R n → [ 0 , 1 ] 都可以稱爲檢定函數(Test Function) 。
並且 ∀ x ~ ∈ R n , ϕ ( x ~ ) \forall \utilde{x}\in \R^n, \phi(\utilde{x}) ∀ x ∈ R n , ϕ ( x ) 是拒絕 H 0 H_0 H 0 的 pdf。
e.g. :
ϕ ( x ~ ) = 1 ⟺ \phi(\utilde{x})=1 \iff ϕ ( x ) = 1 ⟺ 在 x ~ \utilde{x} x 下拒絕 H 0 H_0 H 0 。
ϕ ( x ~ ) = 1 ⟺ \phi(\utilde{x})=1 \iff ϕ ( x ) = 1 ⟺ 在 x ~ \utilde{x} x 下不拒絕 H 0 H_0 H 0 。
ϕ ( x ~ ) = 1 2 ⟺ \phi(\utilde{x})=\frac{1}{2} \iff ϕ ( x ) = 2 1 ⟺ 丟一枚公平硬幣決定是否拒絕 H 0 H_0 H 0 ,i.e. 拒絕 H 0 H_0 H 0 的概率是 1 2 \frac{1}{2} 2 1 。
型 I 和型 II 錯誤
在檢定問題中,有 4 中可能的情況:
reject H 0 H_0 H 0 not reject H 0 H_0 H 0 θ ∈ ω 0 , H 0 \theta\in\omega_0,H_0 θ ∈ ω 0 , H 0 is trueType I Error Correct Decision θ ∈ ω 1 , H 1 \theta\in\omega_1,H_1 θ ∈ ω 1 , H 1 is trueCorrect Decision Type II Error
E.G. :
Type I Error : 無辜的人被判有罪。
Type II Error: 有罪的人被判無罪。
我們的目標是最小化 Type I Error 和 Type II Error 發生的概率。
假設我們不能容忍 Type I Error ⟹ \implies ⟹ 我們永不拒絕 H 0 H_0 H 0 ⟹ \implies ⟹ 一定會發生 Type II Error。
假設我們不能容忍 Type II Error ⟹ \implies ⟹ 我們永遠拒絕 H 0 H_0 H 0 ⟹ \implies ⟹ 一定會發生 Type I Error。
P ( Type I eror ) + P ( Type II Error ) ≠ 1 P(\text{Type I eror})+P(\text{Type II Error})\neq 1 P ( Type I eror ) + P ( Type II Error ) = 1 它們的參數是不同的。Type I Error 是在 H 0 H_0 H 0 是真的情況下發生的概率,而 Type II Error 是在 H 1 H_1 H 1 是真的情況下發生的概率。
通常,我們會認為 Type I error 更嚴重。因此我們或設定 一個底線 α \alpha α ,即發生 Type I error 的機率不超過 α \alpha α 。而在不越過底線的前提下,找可以使 Type II error 最小的決定策略。
Note : test function ϕ \phi ϕ 是在得到數據 X ~ = x ~ \utilde{X}=\utilde{x} X = x 下,拒絕 H 0 H_0 H 0 的概率,i.e.:
ϕ ( X ~ ) = P ( rej H 0 ∣ X ~ = x ~ ) = E [ I ( rej H 0 ) ∣ X ~ = x ~ ] \phi(\utilde{X})=P(\text{rej }H_0|\utilde{X}=\utilde{x})=E[I(\text{rej }H_0)|\utilde{X}=\utilde{x}] ϕ ( X ) = P ( rej H 0 ∣ X = x ) = E [ I ( rej H 0 ) ∣ X = x ]
⟹ E θ ϕ ( X ~ ) = E θ ( E [ I ( rej H 0 ) ∣ X ~ ] ) = E θ [ I ( rej H 0 ) ] = P θ ( rej H 0 ) \implies E_\theta\phi(\utilde{X})=E_\theta(E[I(\text{rej }H_0)|\utilde{X}])=E_\theta[I(\text{rej }H_0)]=P_\theta(\text{rej }H_0) ⟹ E θ ϕ ( X ) = E θ ( E [ I ( rej H 0 ) ∣ X ]) = E θ [ I ( rej H 0 )] = P θ ( rej H 0 )
⟹ E θ ϕ ( X ~ ) θ ∈ ω 0 ⟺ H 0 is true = P θ ( rej H 0 ) = P ( rej H 0 ∣ H 0 is true ) = P ( Type I Error ) and ⟹ E θ ϕ ( X ~ ) θ ∈ ω 1 ⟺ H 1 is true = P θ ( rej H 0 ) = P ( rej H 0 ∣ H 1 is true ) = 1 − P ( not rej H 0 ∣ H 1 is true ) = 1 − P ( Tpye II Error ) \begin{align*}
&\begin{align*}
\implies& E_\theta\phi(\utilde{X}) \quad \theta\in\omega_0 \iff H_0 \text{ is true} \\
=&P_\theta(\text{rej }H_0)=P(\text{rej }H_0|H_0\text{ is true})\\
=&P(\text{Type I Error})
\end{align*}\\
&\text{and}\\
&\begin{align*}
\implies& E_\theta\phi(\utilde{X}) \quad \theta\in\omega_1 \iff H_1 \text{ is true} \\
=&P_\theta(\text{rej }H_0)=P(\text{rej }H_0|H_1\text{ is true})=1-P(\text{not rej }H_0|H_1\text{ is true})\\
=&1-P(\text{Tpye II Error})
\end{align*}
\end{align*} ⟹ = = E θ ϕ ( X ) θ ∈ ω 0 ⟺ H 0 is true P θ ( rej H 0 ) = P ( rej H 0 ∣ H 0 is true ) P ( Type I Error ) and ⟹ = = E θ ϕ ( X ) θ ∈ ω 1 ⟺ H 1 is true P θ ( rej H 0 ) = P ( rej H 0 ∣ H 1 is true ) = 1 − P ( not rej H 0 ∣ H 1 is true ) 1 − P ( Tpye II Error )
Power Function: β ϕ ( θ ) = E θ ϕ ( X ~ ) θ ∈ ω 1 \text{Power Function: } \beta_\phi(\theta)=E_\theta\phi(\utilde{X})\quad \theta\in\omega_1 Power Function: β ϕ ( θ ) = E θ ϕ ( X ) θ ∈ ω 1
我們設定一個底線 α \alpha α 。我們希望在保證 ∀ θ ∈ ω 0 , E θ ϕ ( X ~ ) ≤ α \forall \theta\in\omega_0, E_\theta\phi(\utilde{X})\le \alpha ∀ θ ∈ ω 0 , E θ ϕ ( X ) ≤ α 的前提下,最大化 E θ ϕ ( X ~ ) , ∀ θ ∈ ω 1 E_\theta\phi(\utilde{X}), \forall \theta\in\omega_1 E θ ϕ ( X ) , ∀ θ ∈ ω 1 。
i.e. max E θ ϕ ( X ~ ) , θ ∈ ω 1 \max E_\theta\phi(\utilde{X}), \theta\in\omega_1 max E θ ϕ ( X ) , θ ∈ ω 1 s.t. sup θ ∈ ω 0 E θ ϕ ( X ~ ) = α \sup_{\theta\in\omega_0}E_\theta\phi(\utilde{X})= \alpha sup θ ∈ ω 0 E θ ϕ ( X ) = α
sup θ ∈ ω 0 E θ ϕ ( X ~ ) = α \sup_{\theta\in\omega_0}E_\theta\phi(\utilde{X})=\alpha sup θ ∈ ω 0 E θ ϕ ( X ) = α 被稱為檢定函數 p h i ( X ~ ) phi(\utilde{X}) p hi ( X ) 的顯著水平(Significance Level)。而 ϕ ( X ~ ) \phi(\utilde{X}) ϕ ( X ) 被稱為 level α \alpha α 的檢定。
令 θ 0 \theta_0 θ 0 使得 E θ 0 ϕ ( X ~ ) = sup θ ∈ ω 0 E θ ϕ ( X ~ ) = α E_{\theta_0}\phi(\utilde{X})=\sup_{\theta\in\omega_0}E_\theta\phi(\utilde{X})=\alpha E θ 0 ϕ ( X ) = sup θ ∈ ω 0 E θ ϕ ( X ) = α ,θ 0 \theta_0 θ 0 通常 會在 ω 0 \omega_0 ω 0 的邊界。為了使 θ 0 ∈ ω 0 \theta_0\in\omega_0 θ 0 ∈ ω 0 ,我們需要讓 ω 0 \omega_0 ω 0 是閉區間。因此檢定假設的等號會放在 H 0 H_0 H 0 上。