多重檢定的理論從 FWER 控制延伸至 FDR、局部 FDR 與高維推論,是現代基因組學和高通量實驗的統計核心。
FWER 的封閉檢定原則
Marcus, Peritz & Gabriel(1976):FWER 控制當且僅當所有包含 Hᵢ 的交集假設都被拒絕時才拒絕 Hᵢ。Holm 是 closure 的特例。Hommel(1988)procedure 基於 Simes inequality 進一步提升 power。
FDR 理論深度
Benjamini & Hochberg(1995, JRSSB):BH 在 independent 或 PRDS(positive regression dependency on each from a subset)下控制 FDR ≤ q。Benjamini & Yekutieli(2001):在任意相依結構下,BH with q' = q / Σ(1/i) 仍控制 FDR,但過度保守。
Local FDR 與 Empirical Bayes
Efron(2001, JASA)的 local fdr:fdr(z) = π₀f₀(z) / f(z),其中 f(z) 是 z-score 的混合分布,f₀ 是 null 分布。以 empirical Bayes 估計 π₀ 和 f。Storey(2003, Ann Stat)的 q-value 是 BH 的 Bayesian 詮釋:q-value = posterior FDR 的最小值。
高維推論
Genome-wide significance threshold 5×10⁻⁸ 來自 ~1M effective independent tests(Dudbridge & Gusnanto, 2008, Genet Epidemiol)。Permutation-based thresholds 精確控制 FWER(Westfall & Young, 1993, Resampling-Based Multiple Testing)。MaxT/minP procedure 考慮統計量的聯合分布。
Bayesian 多重檢定
Scott & Berger(2010, Ann Stat):以 two-group mixture model π₀ N(0, σ₀²) + (1−π₀) N(0, σ₁²) 進行 Bayesian FDR 控制。Posterior inclusion probability(PIP)替代 p-value。在 GWAS fine-mapping 中以 credible set 控制 coverage。
結構化假設
利用假設之間的結構(如 gene ontology 的層級、染色體位置)提升 power。Hierarchical FDR(Yekutieli, 2008)、TreeBH(Bogomolov et al., 2021)。Weighted BH 以先驗權重 wᵢ 調整 p-value 閾值:p₍ᵢ₎/wᵢ(Genovese et al., 2006, Biometrika)。
文獻參考:Benjamini, Y. & Hochberg, Y. (1995). JRSSB, 57, 289-300. / Storey, J.D. (2003). Ann Stat, 31, 2013-2035. / Efron, B. (2001). JASA, 96, 1151-1160.
