Introduction
數據根據得到的方式不同,可以做的統計分析也不同。
觀察值(Observational) | 實驗數據 | |
---|---|---|
獲得方式 | 被動收集數據 Passive data collection | 主動生產數據 Active data production |
統計結論 | 描述數據(Descriptive) | 結論推導(Inferential) |
兩種的主要區別在於,產生數據的因素是否能夠被控制。如果研究者能夠控制因素,那麼可以通過觀察改變因素的結果來推論相關性或因果關係(cause-effec)。
在實驗中,統計學可以提供以下幫助:
- 對於問題的解釋
- 統計推論,如點估計、區間估計、假設檢驗
- 隨機化處理(Function of randomization)
- 在限制條件(道德、成本、etc.)下,提供最佳的實驗設計(Concept of local control)
問題的解釋
在實驗中,在特定因素(Treatment)下不同次的實驗結果往往是不同的。在這種結果下得到的結論是不確定的(uncertainty)。因此 需要統計的方法來處理這種不確定性。
EX.1:A,B 兩台電腦做 10 次實驗,每次計算 27 組觀察值的方差。記錄兩者的計算秒數。
Replication | A | B | (A - B) |
---|---|---|---|
1 | 30 | 14 | 16 |
2 | 21 | 21 | 0 |
3 | 22 | 5 | 17 |
4 | 22 | 13 | 9 |
5 | 18 | 13 | 5 |
6 | 29 | 17 | 12 |
7 | 16 | 7 | 9 |
8 | 12 | 14 | -2 |
9 | 23 | 8 | 15 |
10 | 23 | 24 | -1 |
Means | 21.6 | 13.6 | 8.0 |
目標:比較兩者的計算速度
- 速度是否有差異?(Hypothesis testing)
- 差異的大小是多少?(Estimation)
單純從數據,我們可以得到以下結論:
- 10 次實驗中,有 7 次 B 速度比 A 快,2 次 A 比 B 快,1 次兩者相同
- B 平均比 A 快 8 秒
但這只是數據的描述,無法提供任何數據可靠性相關的信息。比如重複進行實驗,最後的結論還會是一樣的嗎?
統計給出的觀點是,想象實驗可以無限進行下去,最後的平均差異會收斂到一個未知的定值,而這個定值則是 A,B 之間真實的差異。對於實驗的結論則變為:根據實驗的結果,可以得到真實值的一個估計。
統計推論
假設那個真實值是 ,基於以上數據,我們可以做下面幾種統計推論:
- 點估計:
- 的 95%, 80%, 99% 信賴區間:
- 檢定: 在顯著水準 5%, 20%, 1% 下的拒絕
在實踐中,信賴區間往往比檢定更有用。並且永遠不能期望能夠推論出真實值的確切值。
假設針對某一數據得到的 95% 信賴區間為 ,則我們不會拒絕 ,這代表兩台電腦在統計上沒有顯著差異。但這並不代表兩台機器的速度完全一樣,只是從實際操作的角度可以認為兩者的速度是一樣的。
如果相同實驗但不同批次得到的 95% 信賴區間為 ,這並不能讓人相信兩台機器的速度是一樣的。這樣的數據並不準確,可能存在一些未知的因素影響了實驗結果,導致方差過大。
不同批次(branches)的實驗結果往往是不同的。而統計推論則是將可變性(variability)包含在內的情況下,提供一種行動的標準。
隨機化處理(Function of Randomization)
在實驗過程中,可能會出現某些因素導致數據產生偏差,使得難以得出可靠的推論。
例如,在 EX.1 中,讓同一操作員依次操作 A、B 兩台機器。這樣觀察到的計算速度為 的估計值加上操作速度的差異(如操作員的熟練度)。因此,我們無法保證最終的推論是無偏的。