大1 · 第2學期生物統計推論統計

t檢定

t-Test

難度 2 · 基礎statistics

t 檢定的理論基礎和現代擴展涉及精確分布推導、穩健替代和貝氏方法。

精確分布推導

若 X₁,...,Xₙ iid ~ N(μ, σ²)，則 x̄ ~ N(μ, σ²/n)，且 (n−1)s²/σ² ~ χ²(n−1)，且 x̄ 和 s² 獨立（僅在常態分布下成立——Basu 定理的推論）。t = (x̄−μ)/(s/√n) = Z/√(V/ν)，其中 Z ~ N(0,1)，V ~ χ²(ν)，ν = n−1，因此 t ~ t(ν)。Gosset（1908, Biometrika）以模擬和幾何論證得出此分布，Fisher 後來給出嚴格證明。

非中央 t 分布

當 H₁ 為真時（μ ≠ μ₀），t 統計量服從非中央 t 分布 t(df, δ)，其中非中央參數 δ = (μ−μ₀)/(σ/√n)。檢定力 = P(|t| > t_α/2 | δ)，以非中央 t 分布的 CDF 計算。

Welch-Satterthwaite 近似

不等方差時 t = (x̄₁−x̄₂)/√(s₁²/n₁+s₂²/n₂) 不服從精確 t 分布。Welch（1947）以 Satterthwaite 有效自由度近似：df = (s₁²/n₁ + s₂²/n₂)² / [(s₁²/n₁)²/(n₁−1) + (s₂²/n₂)²/(n₂−1)]。模擬顯示此近似在多數情境下控制型一錯誤率良好。Zimmerman（2004）建議總是使用 Welch's t-test。

穩健替代

Yuen's trimmed t-test：以 trimmed mean 和 Winsorized variance 取代，對重尾分布維持正確的型一錯誤率。
Permutation test：在 H₀ 下，隨機重新分配組別標籤，計算 t 統計量的排列分布。不需分布假設，精確控制型一錯誤率。B ≥ 10000 次排列通常足夠。

貝氏 t 檢定

Rouder et al.（2009, Psychonomic Bull Rev）的 JZS（Jeffreys-Zellner-Siow）prior：δ ~ Cauchy(0, r)，r = √2/2（default）。輸出 BF₁₀ 量化支持 H₁ vs H₀ 的證據強度。JASP 和 R 的 BayesFactor 套件提供簡便實作。

等價性檢定（TOST）

假說檢定只能拒絕 H₀，不能證明等同。Two One-Sided Tests（TOST, Schuirmann, 1987）用於生物等效性（bioequivalence）：H₀: |μ₁−μ₂| ≥ Δ vs H₁: |μ₁−μ₂| < Δ。同時拒絕兩個單尾 H₀ 才宣告等效。FDA 要求 90% CI of μ_T/μ_R 落在 80-125% 範圍內。

文獻參考：Student (1908). Biometrika, 6, 1-25. / Welch, B.L. (1947). Biometrika, 34, 28-35. / Rouder, J.N. et al. (2009). Psychonomic Bull Rev, 16, 225-237.

互動工具

動手玩玩看

用互動元件直接感受這個概念，比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關

↑ 先搞懂這些

假說檢定

生物統計 · 推論統計

難度 2 · 基礎