這裡,我們使用常態誤差歸回模型來進行相關性分析。
Yi=β0+β1Xi+εi
估計量的分佈
之前我們已經證明了 b0,b1 是線性的,也就是可以表達為:
b1=∑kiYiwith ki=∑(Xi−Xˉ)2Xi−Xˉ
b0=∑ciYiwith ci=n1−kiXˉ
因為 ki 是 Xi 的函數,而 Xi 是固定的,所以 ki 和 ci 是常數。因此 b0,b1 是 Yi 的線性組合。因為 Yidεi∼iidN(0,σ2),所以 b0,b1 也是常態分佈。
b1∼N(E[b1],σ2[b1])dN(β1,σ2{b1})with σ2{b1}=∑(Xi−Xˉ)2σ2b0∼N(E[b0],σ2[b0])dN(β0,σ2{b0})with σ2{b0}=σ2(n1+∑(Xi−Xˉ)2Xˉ2)
⟹σ{bi}bi−βi∼N(0,1)with σ{bi}=σ2{bi}
σ{wtY,dtY}⟺=σ2⋅wtd=0wtd=0,w,d are linearly independent
這可以證明
SSE⊥b0,b1
σ2SSE∼χn−p2SLPχn−22
之前我們說 (bj−βj)/σ{bj} 是標準常態分佈。但在實際應用中,我們並不知道 σ2,所以我們應該要用 SSE 來估計 σ2。
S{bi}bi−βj=σ{bi}bi−βi/σ2{bi}S2{bi}=σ2MSE=σ{bi}bi−βi/(n−p)σ2SSEnote σ2SSE∼χn−p2=dχn−p2/(n−p)N(0,1)∼tn−p分子分母獨立
⟹S{bi}bi−βi∼tn−pSLRtn−2
信賴區間