表觀基因體學整合將非編碼調控層資訊系統化注入基因調控網路模型,是理解發育、疾病和細胞可塑性的關鍵。
計算方法:從數據到調控邏輯
ChromHMM / Segway:多軌道 ChIP-seq → multivariate HMM 學習 chromatin states。ChromHMM 用 multivariate Bernoulli emissions,Segway 用 Dynamic Bayesian Network 加入空間依賴性。Roadmap 定義了 15-state 和 25-state 模型作為社群標準。
ABC Model(Activity-By-Contact):Fulco et al.(Nat Genet, 2019)提出 enhancer-gene scoring:ABC_score = Activity(enhancer) × Contact(enhancer, promoter) / Σ_all_enhancers Activity × Contact。Activity 由 H3K27ac / ATAC-seq 量化,Contact 由 Hi-C 數據量化。ABC score 預測 CRISPR 增強子擾動的功能影響準確率 ~70%。
Causal Epigenetics:mQTL(methylation QTL)和 haQTL(histone acetylation QTL)作為 Mendelian Randomization 工具,推斷表觀遺傳→基因表達→疾病的因果鏈。Gaunt et al.(PLoS Med, 2016)用此方法推斷因果性 methylation-disease associations。
單細胞表觀遺傳
- scATAC-seq:10x Genomics Multiome 可對同一個細胞同時做 scATAC-seq + scRNA-seq。ArchR / Signac 分析管線:peak calling → 細胞聚類 → peak-gene correlation → TF motif enrichment。
- scCUT&Tag:在單細胞層級做組蛋白修飾 profiling。Bartosovic et al.(Nat Biotechnol, 2021)在小鼠腦組織上驗證 H3K27me3 的 cell-type-specific pattern。
- scBS-seq / scNMT-seq:單細胞甲基化 + 轉錄組 + 染色質可及性三組學同時測量。Argelaguet et al.(Nature, 2019)用 MOFA+ 整合 scNMT-seq 數據揭示小鼠胚胎發育中 epigenomic coordination。
Epigenetic Clocks 與系統老化
Horvath(Genome Biol, 2013)以 353 個 CpG 位點的甲基化程度建構 epigenetic clock(multi-tissue predictor of age, R > 0.96)。Acceleration(生物年齡 > 時序年齡)與全因死亡率相關。GrimAge(Lu et al., Aging, 2019)整合 DNA methylation surrogates of plasma proteins + smoking pack-years,是目前最佳死亡預測器。系統生物學研究將 clock CpGs 映射到 pathway 上,發現與 Polycomb target, stem cell maintenance, 和 metabolic regulation 相關。
文獻:Roadmap Epigenomics Consortium (2015) Nature 518:317-330 / Fulco et al. (2019) Nat Genet 51:1664-1669 / Argelaguet et al. (2019) Nature 576:487-491.
