基因組組織(Genome Organization)涵蓋從一級 DNA 序列到三維核內空間配置的多層級架構,是理解基因調控、複製時序、突變機率和疾病致因的基礎框架。
染色質的階層式壓縮與動態性
核小體是染色質的基本重複單元。Roger Kornberg(1974)提出此模型,Luger et al.(1997)解出 2.8 Å 晶體結構。組蛋白八聚體的 N 端尾巴延伸出核心之外,是翻譯後修飾(PTM)的主要靶點——乙醯化(H3K27ac,活化標記)、甲基化(H3K4me3 活化 / H3K9me3 和 H3K27me3 沉默)、磷酸化、泛素化等,構成所謂的「組蛋白密碼」(histone code, Strahl & Allis, 2000),由 writer/reader/eraser 酶系統解讀和維護。
關於 30 nm 纖維的存在性,Ou et al.(2017)以 ChromEMT 結合多色 PAINT 超解析成像,在完整細胞核內僅觀察到 5-24 nm 直徑的不規則鏈,挑戰了教科書的螺線管(solenoid)和之字形(zigzag)模型。目前共識傾向於:有絲分裂染色體的壓縮是通過凝縮蛋白 I/II(condensin I/II)介導的 loop extrusion 實現,而非簡單的纖維層級摺疊。
三維基因組學(3D Genomics)
Hi-C 技術(Lieberman-Aiden et al., 2009)揭示基因組在 Mb 尺度上分為 A(活化,富含基因,早期複製)和 B(沉默,晚期複製)兩類染色質區隔(compartments)。在亞 Mb 尺度,拓撲關聯域(TAD, Dixon et al., 2012)界定了增強子-啟動子的搜索空間。TAD 邊界富含 CTCF 結合位點(收斂方向的 CTCF 對)和 cohesin,由 loop extrusion 模型解釋:cohesin 作為分子馬達在染色質上滑行擠出環,遇到反向 CTCF 則停止。
Lupiáñez et al.(2015)的經典研究顯示小鼠 WNT6/IHH/EPHA4 位點的 TAD 邊界倒位或刪除可導致增強子劫持(enhancer hijacking),造成肢體畸形。癌症中頻繁觀察到 TAD 邊界的結構變異導致致癌基因的異常活化(如 IDH 突變膠質瘤中的 PDGFRA 增強子劫持)。
在更大尺度上,染色體佔據各自的染色體領域(chromosome territory, Cremer & Cremer),基因貧乏的染色體傾向位於核膜附近(與 lamin B 交互作用),基因豐富的染色體位於核內部。核膜結合域(LAD, lamina-associated domains)通常是轉錄沉默的區域。
基因組暗物質與功能性爭議
ENCODE 計畫(2012)宣稱 ~80% 基因組具生化活性引發激烈辯論。Graur et al.(2013)從演化角度指出,若 80% 基因組具功能性,以人類突變率估算,維持選擇所需的生育率將不可行(遺傳負荷悖論)。目前估計具功能性的基因組比例為 8-15%(基於跨物種保守性分析),但這可能低估了物種特異性功能元件(如靈長類特有的 HERVH 調控元件在胚胎幹細胞中的角色)。
轉位子佔人類基因組 ~45%:Alu(SINE, ~11%)、L1(LINE, ~17%)、DNA 轉位子(~3%)、內源性反轉錄病毒(ERV, ~8%)。多數已喪失轉位能力,但仍有 ~100 個活躍的 L1 拷貝可在體細胞中跳躍(特別是在神經前驅細胞和某些癌症中),造成體細胞嵌合。部分轉位子已被「馴化」為調控元件——MER41 元件提供了 STAT1 結合位點,參與先天免疫基因的干擾素應答。
複製時序與突變景觀
基因組的複製不是同時進行的。早期複製區域(A compartment)突變率較低,晚期複製區域(B compartment)突變率較高,這與 DNA 修復效率、核苷酸池濃度和染色質可及性相關。Stamatoyannopoulos et al.(2009)發現複製時序可解釋癌症體細胞突變密度 ~40% 的變異。
臨床轉譯
大規模結構變異(SV)佔基因組變異的鹼基總量遠超 SNV。光學圖譜(Bionano)和長讀長定序(PacBio HiFi、ONT)技術正在系統性揭示先前被短讀長定序遺漏的 SV,包括複雜重排(chromothripsis, chromoplexy)和著絲粒/端粒區域的序列組裝(T2T 聯盟,Nurk et al., 2022 完成首個真正完整的人類基因組裝配 T2T-CHM13)。
