基因調控網路建模是系統生物學的核心任務,從結構推斷到動態預測涉及圖論、動態系統理論、統計推斷與機器學習的深度整合。
連續 ODE 框架的數學細節
典型 GRN ODE 系統:
dxᵢ/dt = Σⱼ βᵢⱼ · H(xⱼ, Kᵢⱼ, nᵢⱼ) + β₀ᵢ − αᵢ · xᵢ
其中 H 為 Hill 函數(活化:H⁺ = x^n/(K^n+x^n);抑制:H⁻ = K^n/(K^n+x^n))。多輸入整合用乘法(AND logic)或加法(OR logic)。
穩態分析:令 dxᵢ/dt = 0,解聯立非線性方程組得到不動點。線性穩定性分析:在不動點附近 Taylor 展開得 Jacobian 矩陣 J_ij = ∂f_i/∂x_j,特徵值決定穩定性——所有特徵值實部 < 0 則穩定。複數特徵值帶來振盪(spiral point)。
分岔分析(Bifurcation Analysis):以參數(如 Hill 係數 n 或 K 值)為控制變數,追蹤不動點的穩定性轉變。Saddle-node 分岔:兩個不動點碰撞消失,系統突然跳到另一穩態(all-or-none switch)。Hopf 分岔:穩定不動點失穩、產生極限環(limit cycle oscillation)。工具:MATCONT / XPPAUT / PyDSTool。
網路推斷的統計框架
- Bayesian Network + MCMC:定義先驗分布 P(G)(如 Erdős-Rényi)和似然函數 P(D|G,θ),用 MCMC 採樣後驗分布 P(G|D)。BDe score 適合離散數據,BGe score 適合連續高斯數據。計算瓶頸:DAG 空間的 super-exponential size(n 個節點有 ~2^(n²) 種可能 DAG)。
- GENIE3 / GRNBoost2:tree-based ensemble regression。對每個基因 i,以其他所有基因為 predictor 訓練 Random Forest 或 Gradient Boosting,predictor importance 作為調控可能性。GRNBoost2(Moerman et al., 2019)與 SCENIC 管線整合,可在 scRNA-seq 數據上推斷 cell-type-specific GRN。
- SCENIC+ pipeline:scRNA-seq + scATAC-seq 聯合推斷:先用 GRNBoost2 找 co-expression modules,再以 cisTarget 資料庫驗證啟動子區域有對應 TF binding motif(RcisTarget enrichment),最後用 AUCell 計算每個細胞的 regulon activity score。
單細胞層級的 GRN 推斷
scRNA-seq 的 dropout 和 snapshot nature 使得傳統方法失效。RNA velocity(La Manno et al., Nature, 2018)利用 spliced/unspliced reads 比例推斷基因表達的時間導數,提供方向性資訊。CellOracle(Kamimoto et al., 2023)結合 scATAC-seq peak-gene linking + GRN perturbation simulation 預測轉錄因子 knockout 對細胞命運的影響。
多尺度建模:GRN 與信號轉導網路、代謝網路的整合。whole-cell model(Karr et al., Cell, 2012)將 Mycoplasma genitalium 的 525 個基因整合為 28 個子模型,首次實現整個細胞週期的計算模擬。
文獻:Huynh-Thu et al. (2010) PLoS ONE 5:e12776 / Peter & Davidson (2015) Dev Biol 397:3-17 / Karr et al. (2012) Cell 150:389-401.
