跳至主要内容

Introduction

數據根據得到的方式不同,可以做的統計分析也不同。

觀察值(Observational)實驗數據
獲得方式被動收集數據
Passive data collection
主動生產數據
Active data production
統計結論描述數據(Descriptive)結論推導(Inferential)

兩種的主要區別在於,產生數據的因素是否能夠被控制。如果研究者能夠控制因素,那麼可以通過觀察改變因素的結果來推論相關性或因果關係(cause-effec)。

在實驗中,統計學可以提供以下幫助:

  • 對於問題的解釋
  • 統計推論,如點估計、區間估計、假設檢驗
  • 隨機化處理(Function of randomization)
  • 在限制條件(道德、成本、etc.)下,提供最佳的實驗設計(Concept of local control)

問題的解釋

在實驗中,在特定因素(Treatment)下不同次的實驗結果往往是不同的。在這種結果下得到的結論是不確定的(uncertainty)。因此需要統計的方法來處理這種不確定性。

EX.1:A,B 兩台電腦做 10 次實驗,每次計算 27 組觀察值的方差。記錄兩者的計算秒數。

ReplicationAB(A - B)
1301416
221210
322517
422139
518135
6291712
71679
81214-2
923815
102324-1
Means21.613.68.0

目標:比較兩者的計算速度

  • 速度是否有差異?(Hypothesis testing)
  • 差異的大小是多少?(Estimation)

單純從數據,我們可以得到以下結論:

  • 10 次實驗中,有 7 次 B 速度比 A 快,2 次 A 比 B 快,1 次兩者相同
  • B 平均比 A 快 8 秒

但這只是數據的描述,無法提供任何數據可靠性相關的信息。比如重複進行實驗,最後的結論還會是一樣的嗎?

統計給出的觀點是,想象實驗可以無限進行下去,最後的平均差異會收斂到一個未知的定值,而這個定值則是 A,B 之間真實的差異。對於實驗的結論則變為:根據實驗的結果,可以得到真實值的一個估計。

統計推論

假設那個真實值是 θ\theta,基於以上數據,我們可以做下面幾種統計推論:

  • 點估計:θ=8\theta=8
  • θ\theta 的 95%, 80%, 99% 信賴區間:[3.3,12.7],[5.1,10.9],[1.1,14.9][3.3,12.7],[5.1,10.9], [1.1,14.9]
  • 檢定:θ=0\theta=0 在顯著水準 5%, 20%, 1% 下的拒絕

在實踐中,信賴區間往往比檢定更有用。並且永遠不能期望能夠推論出真實值的確切值。

假設針對某一數據得到的 95% 信賴區間為 [2,4][-2,4],則我們不會拒絕 H0H_0,這代表兩台電腦在統計上沒有顯著差異。但這並不代表兩台機器的速度完全一樣,只是從實際操作的角度可以認為兩者的速度是一樣的。

如果相同實驗但不同批次得到的 95% 信賴區間為 [30,32][-30,32],這並不能讓人相信兩台機器的速度是一樣的。這樣的數據並不準確,可能存在一些未知的因素影響了實驗結果,導致方差過大。

不同批次(branches)的實驗結果往往是不同的。而統計推論則是將可變性(variability)包含在內的情況下,提供一種行動的標準。

隨機化處理(Function of Randomization)

在實驗過程中,可能會出現某些因素導致數據產生偏差,使得難以得出可靠的推論。

例如,在 EX.1 中,讓同一操作員依次操作 A、B 兩台機器。這樣觀察到的計算速度為 θ\theta 的估計值加上操作速度的差異(如操作員的熟練度)。因此,我們無法保證最終的推論是無偏的。

為了避免在連續實驗中,由於某些持續或未知的外界因素引起的偏差,我們需要採用一定的方法來應對。這正是隨機化處理的目的。

隨機化在一定程度上可以被視為一種保險措施,它預防了可能發生或不會發生的干擾,且這些干擾可能對結果影響重大或微小。因此。即使預期的干擾不會發生,也應該採取隨機化處理,以確保實驗結果的可靠性。

在 EX.1 中,可以有多重隨機化處理的方法,例如:

  1. 在每組批次(Replication)中,隨機選擇 A 或 B 先進行實驗。
  2. 在 10 組批次(Replication)中,隨機選 5 組先進行 A 實驗,5 組先進行 B 實驗。

不同的實驗設計實際上就是不同的隨機化方法。而不同的隨機化方法將會影響推論的結果。

術語(Terminology)

  • Factor:影響實驗結果的因素。
  • Factor Level:Factor 的不同取值。
  • Experimental Unit:實驗的基本單位,可能與觀察單位不同。例如,在一個對象上進行一次實驗,觀察對象的不同部位。
  • Treatment:Factor Level 的組合。
  • Response Variable:感興趣的變量。
  • Effect:改變 Factor Level 對 Response Variable 的影響。
  • Main effect:固定其他因素,改變一個因素對 Response Variable 的影響。
  • Interaction:改變多個因素對 Response Variable 的影響。
  • Factorial experimaent:對每個 treatment 都進行至少一次實驗。