最大概式估計量(Maximum Likelihood Estimation, MLE)
給定一組從母體得到的樣本。MLE 的目標是找到那個最有可能得到這組樣本的母體參數。
Given X=x
- Likelihood function: L(θ∣x)≜f(x;θ),是 θ 的函數,x 是固定的。
- θ^=θ^(X) 如果滿足以下條件:
- θ^(x)∈Ω
- L(θ^∣x)=maxθ∈ΩL(θ∣x), i.e. θ^ 是最有可能得到結果 x 的參數。
- η(θ) 的 MLE 可以直接用 θ^MLE 代入得到,i.e. η(θ)=η(θ^)
- MLE 不一定是唯一的
- MLE 不一定是最小充分統計量的函數,因此可以用 Rao-Blackwell 定理進行改進
- 如果 MLE 是唯一的,則它一定是最小充分統計量的函數
EX: Ω={0,1} and X is continuous
X∼iidf(x;θ)={12xθ=0θ=1
因为当 x∈(21,1) 时,θ=1 的概率密度函数比 θ=0 的大,而 x∈(0,21) 时,θ=0 的概率密度函数比 θ=1 的大。
⟹θ^(X)={010<x≤2121<x≤1
Eθ[θ^(X)]=0⋅Pθ(θ^(X)=0)+1⋅Pθ(θ^(X)=1)=Pθ(21<X≤1)={2143θ=0θ=1=θ
因此 θ^(X) 不是無偏的。
如果 Ω 包含了一個開區間,那麼 maxL(θ∣x)⟺maxlogL(θ∣x)
EX: X1,⋯,Xn∼iidB(1,p),p∈Ω=[0,1]
⟹L(p∣x)=pt(1−p)n−t,t=i=1∑nxi⟹logL(p∣x)=tlogp+(n−t)log(1−p)
因為 logL(p∣x) 是 p 的函數,所以可以用微分的方法找到最大值。為了避免用二次微分來確定是最大值還是最小值,我們用判斷一次微分的正負來確定峰值的位置。
⟺⟺⟹dpdlogL(p∣x)=pt−1−pn−t>0t>npp<Xˉp^MLE=Xˉ
If η(θ)=p(1−p), then η(θ)=p^MLE(1−p^MLE)=Xˉ(1−Xˉ)
現在令 p∈Ω=[41,54]。因為 MLE 要求估計值是合理的,即 θ^∈Ω: