Hardy-Weinberg 平衡是族群遺傳學的奠基定理,其重要性遠超教科書例題,是現代分子演化、人類遺傳學與 GWAS 分析的理論基石。
理論基礎與推導
以 Wright-Fisher 模型在無限族群極限下,等位基因頻率為隨機變數,但其期望值在世代間不變。HWE 嚴格成立的條件需 (1) 二倍體 (2) 雌雄同等 (3) 隨機交配 (4) 世代不重疊 (5) 上述五大假設。
X 染色體 HWE
X 染色體因雌雄拷貝數不同(XX vs XY),HWE 需要更多世代才能達成。對二等位基因 X-linked locus:
- 雌性:p² + 2pq + q²
- 雄性:p + q
初代差異會經 1-2 代後收斂至共同 p。
HWE 偏離的偵測
- χ² 適合度檢定:χ² = Σ(O-E)²/E,自由度 = 基因型數 - 等位基因數
- Fisher 精確檢定:小樣本或稀有等位基因時更可靠
- F-statistic:F_IS = 1 - (H_obs / H_exp),量化近親繁殖程度
- F_IS > 0:缺乏異型合子(近交)
- F_IS < 0:過度異型合子(負同類交配)
- F_IS = 0:HWE
Wahlund 效應
當分析數據混合自多個有結構的子族群,總體會表現出 HWE 偏離(異型合子缺乏),即使每個子族群本身符合 HWE。F_ST = 1 - (H_S / H_T) 量化族群分化程度。GWAS 中 cryptic population structure 必須以 PCA 或 mixed model 校正避免偏誤。
Inbreeding 與 HWE
近親繁殖增加異型合子缺乏:
- 全同胞交配:F = 0.25
- 表親結婚:F = 0.0625
- 自交:F = 0.5
基因型頻率:AA: p² + Fpq, Aa: 2pq(1-F), aa: q² + Fpq
多等位基因 HWE
對 k 個等位基因,基因型數為 k(k+1)/2。HLA 系統有數百個等位基因,HWE 檢定需精確檢定或 Markov chain 方法。HLA HWE 偏離常與感染、自體免疫疾病關聯。
HWE 在 GWAS 的應用
- 品管 QC:對照組顯著偏離 HWE 暗示基因型錯誤或族群結構問題
- 病例對照分析:病例組偏離 HWE 可能反映疾病關聯(但需謹慎,可能是測序錯誤)
- 遺傳力估算:HWE 為許多 heritability 估算方法的前提
Linkage Disequilibrium 與 HWE
HWE 限於單一 locus;多個 locus 的 LD 為其延伸。LD 計算:D = pAB - pA × pB;標準化 r² = D² / (pA × pa × pB × pb)。LD pattern 反映族群歷史,是 GWAS 的核心工具。
現代延伸
- Quasi-Bayesian 估計:在小族群中使用 Beta 先驗
- HWE 在古 DNA 研究:分析古人類遺骨族群結構與混合
- HWE 在保育遺傳學:評估瓶頸後恢復程度
- HWE 與 selection scan:偏離程度可指出近期強選擇位點
