跳至主要內容
4 · 第2學期系統生物學數學建模

計算模擬

Computational Modeling

難度 4 · 專業systems-biologybioinformatics想做成互動版

計算模擬在系統生物學中扮演從理論到轉化的橋樑角色,其方法論涵蓋模型建構、校正、選擇、預測與模型驅動實驗設計。

模型校正(Parameter Estimation)

給定模型結構 M 和實驗數據 D,求參數向量 θ 使 likelihood P(D|M,θ) 最大化:

θ̂_MLE = argmax_θ P(D|M,θ)

對 ODE 模型,P(D|M,θ) 常假設觀測噪音為高斯:D_i ~ N(y_i(θ), σ_i²),y_i(θ) 為 ODE 解在觀測時間點的值。非線性 ODE 使似然函數面高度非凸,需要全域最佳化(如 scatter search、evolutionary algorithm、multi-start local optimization)。

Bayesian 參數推斷

後驗分布 P(θ|D) ∝ P(D|θ) · P(θ)。MCMC(如 adaptive Metropolis、affine-invariant ensemble sampler / emcee)或 Sequential Monte Carlo (SMC/ABC) 採樣後驗。優勢:自然量化參數不確定性,可計算 Bayesian model evidence P(D|M) = ∫P(D|θ)P(θ)dθ 做模型比較(Bayes factor)。

Optimal Experimental Design (OED)

不是所有實驗對模型辨識同等有價值。OED 找最大化預期資訊增益的實驗條件:

u* = argmax_u E_D[KL(P(θ|D,u) || P(θ))]

等價於最大化 expected log-likelihood ratio。實作上常用 Fisher Information Matrix (FIM) 的行列式最大化(D-optimal design)作為近似。

Whole-Cell Modeling

Karr et al.(Cell, 2012)的 M. genitalium 模型是里程碑:525 genes → 28 submodels(包含 FBA 代謝、ODE 細胞週期、stochastic transcription、agent-based chromosome replication 等),每秒同步一次。模型成功預測了 ~80% 的基因必要性。後續 Macklin et al.(Science, 2020)將 E. coli 的 whole-cell model 提升至數千基因規模。

Digital Twin 與精準醫學

將 whole-cell / tissue-level 模型個人化(patient-specific parameter fitting)→ 創建患者的「數位雙胞胎」。概念驗證:EU Virtual Physiological Human (VPH) project 建立心臟電生理的 patient-specific model 指導心律不整治療。

Machine Learning 與 Mechanistic Modeling 的整合

  • Physics-Informed Neural Networks (PINNs):在 NN loss function 中加入 ODE 殘差項 ||dx/dt − f(x,θ)||²,使 NN 學到符合物理 / 生物規律的解。
  • Neural ODE:用 NN 參數化 f(x),dx/dt = NN(x,t)。可從數據學到未知的動態方程,但可解釋性較低。
  • Scientific Machine Learning (SciML):Julia 的 DiffEqFlux.jl 結合 ODE solver 和自動微分,實現 UDE(Universal Differential Equations;Rackauckas et al., 2021)——部分已知結構 + 部分 NN,兼顧機理和數據驅動。

文獻:Karr et al. (2012) Cell 150:389-401 / Raue et al. (2013) Bioinformatics 29:1722-1729 / Rackauckas et al. (2021) arXiv 2001.04385.

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關