基因複製(Gene Duplication)自 Ohno(1970)的開創性專論以來,被視為基因組演化與功能創新的核心引擎。基因組學時代為此命題提供了前所未有的量化支持。
複製保留的理論框架
Force et al.(1999, Genetics)提出 DDC(Duplication-Degeneration-Complementation)模型:亞功能化不需要正向選擇——中性的互補退化即可維持兩個拷貝。Lynch & Force(2000, Genetics)將此模型定量化,預測亞功能化在小族群(N_e 小)中更常見。Innan & Kondrashov(2010, Nat. Rev. Genet.)整合了更多命運模式:(1) 劑量選擇(dosage selection)——某些基因的額外拷貝因劑量效應而被正向選擇保留;(2) 基因轉換(gene conversion)——同源重複基因間的序列同質化可延遲分化。
新功能化的基因組學證據
Zhang et al.(2002, Genetics)在酵母 WGD 後的同源基因對中檢測到不對稱的序列演化——快速演化的拷貝有更高的 dN/dS 比,暗示新功能化。Chen et al.(2013, Science)以 Drosophila 12 個物種的基因組比較識別了 ~566 個新基因(new genes),其中 ~30% 源自 DNA-based duplication,~12% 源自 retroposition。de novo gene birth(從非編碼序列產生全新基因)是近年發現的補充機制——Tautz & Domazet-Lošo(2011, Nat. Rev. Genet.)估計約 ~10% 的「孤兒基因」可能源自 de novo origin。
球蛋白基因家族的分子演化
Hardison(2012, Proc. Natl. Acad. Sci.)回顧球蛋白基因家族的演化:α/β 分歧約在 ~450 Ma(脊椎動物祖先),γ/β 分歧約 ~200 Ma,δ/β 分歧約 ~40 Ma。各發育階段球蛋白的 O₂ 親和力差異(胎兒 γ > 成人 β)是亞功能化/新功能化的經典範例。調控區域(如 LCR, Locus Control Region)的順式演化使基因在不同發育時間點的表達得以精確切換。
反轉錄基因(Retrogenes)
Kaessmann et al.(2009, Nat. Rev. Genet.)回顧指出 ~5-10% 的反轉錄拷貝獲得功能。一個著名例子是 GLUD2(glutamate dehydrogenase 2),在人猿祖先中由 GLUD1 反轉錄產生,獲得腦特異性表達和對 GTP 抑制的不敏感性——可能與靈長類腦代謝增強有關(Burki & Kaessmann, 2004, Nat. Genet.)。
基因家族的出生-死亡模型
Nei & Rooney(2005, Annu. Rev. Genet.)的 birth-and-death model 描述基因家族的動態:新拷貝不斷產生(birth),大部分假基因化(death),少數被正向選擇保留。此模型適用於免疫基因(MHC、免疫球蛋白)和感覺受體(OR)家族,取代了協同演化(concerted evolution)模型作為主流框架。
前沿:CRISPR 驗證重複基因的功能分化(如敲除個別拷貝測試表型效應);單細胞轉錄組學揭示重複基因在不同細胞類型中的表達分化;以及利用合成基因組學(synthetic genomics, Sc2.0 計畫)系統測試基因複製對適應度的影響。
