跳至主要內容
4 · 第2學期系統生物學生物網路

基因調控網路建模

Gene Regulatory Network Modeling

難度 4 · 專業systems-biologymolecular-biology想做成互動版

基因調控網路建模是系統生物學的核心任務,從結構推斷到動態預測涉及圖論、動態系統理論、統計推斷與機器學習的深度整合。

連續 ODE 框架的數學細節

典型 GRN ODE 系統:

dxᵢ/dt = Σⱼ βᵢⱼ · H(xⱼ, Kᵢⱼ, nᵢⱼ) + β₀ᵢ − αᵢ · xᵢ

其中 H 為 Hill 函數(活化:H⁺ = x^n/(K^n+x^n);抑制:H⁻ = K^n/(K^n+x^n))。多輸入整合用乘法(AND logic)或加法(OR logic)。

穩態分析:令 dxᵢ/dt = 0,解聯立非線性方程組得到不動點。線性穩定性分析:在不動點附近 Taylor 展開得 Jacobian 矩陣 J_ij = ∂f_i/∂x_j,特徵值決定穩定性——所有特徵值實部 < 0 則穩定。複數特徵值帶來振盪(spiral point)。

分岔分析(Bifurcation Analysis):以參數(如 Hill 係數 n 或 K 值)為控制變數,追蹤不動點的穩定性轉變。Saddle-node 分岔:兩個不動點碰撞消失,系統突然跳到另一穩態(all-or-none switch)。Hopf 分岔:穩定不動點失穩、產生極限環(limit cycle oscillation)。工具:MATCONT / XPPAUT / PyDSTool。

網路推斷的統計框架

  • Bayesian Network + MCMC:定義先驗分布 P(G)(如 Erdős-Rényi)和似然函數 P(D|G,θ),用 MCMC 採樣後驗分布 P(G|D)。BDe score 適合離散數據,BGe score 適合連續高斯數據。計算瓶頸:DAG 空間的 super-exponential size(n 個節點有 ~2^(n²) 種可能 DAG)。
  • GENIE3 / GRNBoost2:tree-based ensemble regression。對每個基因 i,以其他所有基因為 predictor 訓練 Random Forest 或 Gradient Boosting,predictor importance 作為調控可能性。GRNBoost2(Moerman et al., 2019)與 SCENIC 管線整合,可在 scRNA-seq 數據上推斷 cell-type-specific GRN。
  • SCENIC+ pipeline:scRNA-seq + scATAC-seq 聯合推斷:先用 GRNBoost2 找 co-expression modules,再以 cisTarget 資料庫驗證啟動子區域有對應 TF binding motif(RcisTarget enrichment),最後用 AUCell 計算每個細胞的 regulon activity score。

單細胞層級的 GRN 推斷

scRNA-seq 的 dropout 和 snapshot nature 使得傳統方法失效。RNA velocity(La Manno et al., Nature, 2018)利用 spliced/unspliced reads 比例推斷基因表達的時間導數,提供方向性資訊。CellOracle(Kamimoto et al., 2023)結合 scATAC-seq peak-gene linking + GRN perturbation simulation 預測轉錄因子 knockout 對細胞命運的影響。

多尺度建模:GRN 與信號轉導網路、代謝網路的整合。whole-cell model(Karr et al., Cell, 2012)將 Mycoplasma genitalium 的 525 個基因整合為 28 個子模型,首次實現整個細胞週期計算模擬

文獻:Huynh-Thu et al. (2010) PLoS ONE 5:e12776 / Peter & Davidson (2015) Dev Biol 397:3-17 / Karr et al. (2012) Cell 150:389-401.

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關