t 檢定的理論基礎和現代擴展涉及精確分布推導、穩健替代和貝氏方法。
精確分布推導
若 X₁,...,Xₙ iid ~ N(μ, σ²),則 x̄ ~ N(μ, σ²/n),且 (n−1)s²/σ² ~ χ²(n−1),且 x̄ 和 s² 獨立(僅在常態分布下成立——Basu 定理的推論)。t = (x̄−μ)/(s/√n) = Z/√(V/ν),其中 Z ~ N(0,1),V ~ χ²(ν),ν = n−1,因此 t ~ t(ν)。Gosset(1908, Biometrika)以模擬和幾何論證得出此分布,Fisher 後來給出嚴格證明。
非中央 t 分布
當 H₁ 為真時(μ ≠ μ₀),t 統計量服從非中央 t 分布 t(df, δ),其中非中央參數 δ = (μ−μ₀)/(σ/√n)。檢定力 = P(|t| > t_α/2 | δ),以非中央 t 分布的 CDF 計算。
Welch-Satterthwaite 近似
不等方差時 t = (x̄₁−x̄₂)/√(s₁²/n₁+s₂²/n₂) 不服從精確 t 分布。Welch(1947)以 Satterthwaite 有效自由度近似:df = (s₁²/n₁ + s₂²/n₂)² / [(s₁²/n₁)²/(n₁−1) + (s₂²/n₂)²/(n₂−1)]。模擬顯示此近似在多數情境下控制型一錯誤率良好。Zimmerman(2004)建議總是使用 Welch's t-test。
穩健替代
- Yuen's trimmed t-test:以 trimmed mean 和 Winsorized variance 取代,對重尾分布維持正確的型一錯誤率。
- Permutation test:在 H₀ 下,隨機重新分配組別標籤,計算 t 統計量的排列分布。不需分布假設,精確控制型一錯誤率。B ≥ 10000 次排列通常足夠。
貝氏 t 檢定
Rouder et al.(2009, Psychonomic Bull Rev)的 JZS(Jeffreys-Zellner-Siow)prior:δ ~ Cauchy(0, r),r = √2/2(default)。輸出 BF₁₀ 量化支持 H₁ vs H₀ 的證據強度。JASP 和 R 的 BayesFactor 套件提供簡便實作。
等價性檢定(TOST)
假說檢定只能拒絕 H₀,不能證明等同。Two One-Sided Tests(TOST, Schuirmann, 1987)用於生物等效性(bioequivalence):H₀: |μ₁−μ₂| ≥ Δ vs H₁: |μ₁−μ₂| < Δ。同時拒絕兩個單尾 H₀ 才宣告等效。FDA 要求 90% CI of μ_T/μ_R 落在 80-125% 範圍內。
文獻參考:Student (1908). Biometrika, 6, 1-25. / Welch, B.L. (1947). Biometrika, 34, 28-35. / Rouder, J.N. et al. (2009). Psychonomic Bull Rev, 16, 225-237.
