跳至主要內容
2 · 第1學期遺傳學孟德爾遺傳學

上位

Epistasis

難度 3 · 進階genetics想做成互動版

上位效應(Epistasis)的定義在遺傳學和統計學中有重要差異。Bateson(1909)的經典遺傳學定義指一個基因座遮蔽另一個基因座的表現型效果(compositional epistasis)。Fisher(1918)的統計學定義則是指多基因座對表現型的效果偏離加成性預期(statistical epistasis / non-additivity)。這兩種定義描述的不完全是同一現象,在複雜性狀的遺傳分析中需要仔細區分。

生化途徑與上位效應的機制邏輯

Beadle & Tatum 的「一個基因一個酶」概念建立了基因互作的代謝框架。在線性代謝途徑中:

A → (酶1, 基因 A) → B → (酶2, 基因 C) → C(最終產物)

如果基因 A 的同合隱性(aa)導致酶1 失能,不管基因 C 的基因型如何,最終產物 C 都不會生成。在這個框架中,上位性的方向反映基因在代謝途徑中的位置——上游基因對下游基因呈上位。

然而,在分支途徑或訊號網路中,上位效應變得更複雜。GTP 酶信號通路中的上位效應分析(epistasis analysis)是鑑定基因在通路中先後順序的經典遺傳學工具:如果基因 A 的功能獲得(gain-of-function)突變表型被基因 B 的功能喪失(loss-of-function)突變所抑制,則 B 作用在 A 的下游。

統計上位效應與 GWAS

Fisher 的統計框架中,表現型方差可分解為:

V_total = V_A + V_D + V_I + V_E

其中 V_A 是加成性遺傳方差,V_D 是顯性方差,V_I 是上位方差(包括 A×A、A×D、D×D 交互作用),V_E 是環境方差。

GWAS 主要捕捉的是加成性效應(V_A),因為標準的線性回歸模型假設基因座效應是加成的。上位效應在 GWAS 中難以偵測,原因包括:

  1. 多重比較負擔:測試 n 個 SNP 的兩兩交互作用需要 n(n-1)/2 次測試,以 100 萬 SNP 計需要 ~5×10¹¹ 次測試
  2. 統計效力不足:交互作用效應通常比主效應小,需要更大樣本量
  3. 編碼問題:統計上位效應的大小取決於等位基因頻率和效應的編碼方式

Zuk et al.(2012)提出上位效應可能是「遺失的遺傳率」(missing heritability)的部分解釋——GWAS 可解釋的表現型方差遠小於雙生研究估計的遺傳率,上位效應的方差會「膨脹」在窄義遺傳率估計中但不被 GWAS 的加成模型捕捉。

合成致死與合成適應度(Synthetic Lethality & Synthetic Fitness)

上位效應在酵母系統遺傳學中被大規模量化。Costanzo et al.(2010, 2016)的合成遺傳互作圖譜(Synthetic Genetic Array, SGA)系統性測試了酵母中 ~23 million 個基因對的雙突變表型。定義遺傳互作分數 ε = f_ab - f_a × f_b(f 為適應度),ε < 0 為負向互作(包括合成致死),ε > 0 為正向互作(抑制或緩衝)。約 3% 的基因對顯示顯著互作,且互作模式反映功能模組——同一蛋白質複合體或通路的基因傾向顯示負向互作。

合成致死在癌症治療中有直接應用:BRCA1/2 突變(同源重組修復缺陷)的腫瘤對 PARP 抑制劑敏感——單獨的 PARP 抑制或 BRCA 缺失都可存活,但兩者同時存在則致死(Farmer et al., 2005; Bryant et al., 2005)。

系統生物學中的上位效應

基因調控網路(GRN)和蛋白質交互作用網路中,上位效應反映網路的拓撲結構。Beerenwinkel et al.(2007)建立了用上位效應推斷通路結構的計算框架。在適應度地景(fitness landscape)理論中,上位效應決定了地景的「粗糙度」——高上位效應使適應度地景多峰,限制演化的可預測路徑(Weinreich et al., 2006 的 β-lactamase 抗性研究顯示 5 個突變的 120 種排列中只有 18 條是適應度單調遞增的路徑)。這對預測抗生素抗藥性演化和蛋白質工程設計都有深遠影響。

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關