跳至主要內容
1 · 第2學期普通生物學(下)演化概論

親緣關係概論

Introduction to Phylogenetics

難度 3 · 進階evolutionbioinformatics想做成互動版

系統發育學(Phylogenetics)旨在從可觀察的特徵資料(形態、分子序列、基因體結構)推論物種或基因的演化歷史,並以樹狀或網狀拓撲表示譜系關係。

建樹方法論
距離法(如 Neighbor-Joining, Saitou & Nei, 1987)將多序列比對轉換為距離矩陣再建樹,計算效率高但丟失位點層級資訊。字元基礎法包括最大簡約法(Maximum Parsimony)和以統計模型為基礎的最大似然法(Maximum Likelihood, Felsenstein, 1981)與貝氏推論(Bayesian Inference, Huelsenbeck et al., 2001)。ML 和 BI 需指定核苷酸替換模型(如 GTR+Γ+I),模型選擇可用 AIC 或 BIC 準則(Posada, 2008)。bootstrap(非參數重抽樣)或後驗概率(posterior probability)用以評估節點支持度。

基因樹與物種樹的不一致
不完全譜系分選(incomplete lineage sorting, ILS)、基因水平轉移和雜交會導致基因樹與物種樹拓撲不一致(Maddison, 1997)。多位點聯合估計法(如 *BEAST, Heled & Drummond, 2010)和概要法(ASTRAL, Mirarab et al., 2014)試圖在多基因框架下推估物種樹,同時考慮溯祖隨機性。

分子鐘與歧異時間估算
Zuckerkandl & Pauling(1965)提出分子鐘假說;嚴格分子鐘很少成立,寬鬆分子鐘模型(uncorrelated lognormal, Drummond et al., 2006)允許各分支速率獨立變異。化石校準以均勻或對數常態先驗加入節點年齡約束,tip-dating 方法則直接將化石末端的年代納入分析(Ronquist et al., 2012)。

網狀演化與系統發育網路
原核生物大量水平基因轉移使樹狀模型不足以描述演化歷史,split network 和 hybridization network 提供替代表示(Huson & Bryant, 2006)。在真核生物中,雜交物種形成(如向日葵屬 Helianthus, Rieseberg et al., 2003)同樣需要網狀系統發育方法。

應用前沿
COVID-19 疫情中,Nextstrain 平台(Hadfield et al., 2018)即時整合全球 SARS-CoV-2 序列進行系統發育追蹤,輔助公衛決策;保育遺傳學利用演化獨特性指標(ED, Isaac et al., 2007)評估物種的演化不可取代性。

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關