基因組演化(Genome Evolution)是比較基因組學的核心議題,其理論框架涉及群體遺傳學、分子演化、轉位子生物學與基因組建築學。
C 值悖論的解消:Lynch 的突變風險理論
Gregory(2005, The Evolution of the Genome)的全面回顧指出 C 值變異的非適應性成分。Lynch & Conery(2003, Science)提出以有效族群大小(N_e)解釋基因組複雜化:大 N_e 物種(如細菌)中純化選擇高效移除「垃圾 DNA」,維持精簡基因組;小 N_e 物種(如哺乳動物)中漂變允許轉位子、內含子等「略微有害」元素累積。此假說預測 N_e 與基因組大小、內含子密度、轉位子比例成反比——大量比較資料支持此趨勢。
轉位子的基因組生態學
Doolittle & Sapienza(1980, Nature)與 Orgel & Crick(1980, Nature)提出轉位子為「自私 DNA」的觀點。現代認識更為複雜:(1) 轉位子是基因調控創新的來源——Chuong et al.(2017, Science)發現 MER41 內源性反轉錄病毒元素被 co-opt 為干擾素刺激基因的增強子;(2) Bourque et al.(2008, Genome Res.)顯示 ~25% 的人類轉錄因子結合位點位於轉位子衍生序列中;(3) 轉位子-宿主軍備競賽驅動 KRAB-ZFP 的快速擴張(Jacobs et al., 2014, Nature)。
基因組結構演化的機制
Murphy et al.(2005, Science)以比較基因組重建哺乳動物祖先基因組(ancestral karyotype reconstruction),推斷始祖有 ~2n=46。斷裂點(breakpoints)常位於段複製(segmental duplications)和轉位子富集區域。Feuk et al.(2005)估計人類和黑猩猩之間有 ~1,500 個倒位差異,其中部分可能影響基因表達並貢獻於物種分化。
非編碼 DNA 的功能性爭議
ENCODE 計畫(2012, Nature)聲稱 ~80% 人類基因組具「生化功能」(biochemical function),引發激烈辯論。Graur et al.(2013, Genome Biol. Evol.)批評「生化活性」不等於「功能」——以選擇約束為標準,僅 ~8-15% 基因組受純化選擇(Rands et al., 2014, PLoS Genet.)。Kellis et al.(2014, PNAS)的 ENCODE 回應重新定義功能層次,承認不同定義下的比例差異巨大。
比較基因組學的技術革命
T2T(Telomere-to-Telomere)Consortium(Nurk et al., 2022, Science)首次完成人類基因組的完全無間隙組裝,揭示先前缺失的 ~8% 序列——主要為異染色質區域、著絲粒和短臂的衛星 DNA。此成就使基因組結構演化分析首次涵蓋這些以往的「暗區」。
前沿:pangenome(如 Human Pangenome Reference, Liao et al., 2023, Nature)取代單一參考基因組;基因組大小的演化動態模型(如 Kapusta et al., 2017 的 TE-deletion 平衡模型);以及利用 long-read 定序解析大型重複區域和結構變異的演化。
