族譜分析(Pedigree Analysis)在臨床遺傳學和遺傳諮詢中仍是不可或缺的工具,即使在全基因體定序(WGS)時代,族譜模式的判讀能力仍是變異解讀(variant interpretation)和遺傳諮詢的基礎。
族譜分析的統計學框架
經典的族譜分析本質上是一個假設檢定問題——給定觀察到的族譜表現型分佈,判斷哪一種遺傳模型最可能。嚴格的統計方法是分離分析(segregation analysis),透過最大概似估計法(MLE)比較不同遺傳模型的概似值(likelihood)。Morton(1955)的連續 LOD 分數法(sequential LOD score method)為連鎖分析奠定了統計基礎:LOD = log₁₀[L(θ)/L(θ=0.5)],LOD ≥ 3 視為連鎖的顯著證據。
確認偏差(Ascertainment Bias)
直接計算族譜中受影響者比例會出現偏差,因為「進入研究」的家庭通常至少有一個受影響者。修正方法取決於確認方式:完全確認(complete ascertainment)用 proband 法;單一確認(single ascertainment)需從家族計數中減去先證者。Li & Mantel(1968)的方法和 Ewens & Shute(1986)的 EM 算法提供了更精確的修正框架。
複雜遺傳模式的分析
真實族譜常偏離簡單孟德爾模式:
不完全穿透度(Reduced Penetrance):如 BRCA1 的乳癌穿透度約 60-80%,使 AD 遺傳看起來像「跳代」。分析時需引入年齡依賴穿透度函數 f(t),通常用 survival analysis 的 Kaplan-Meier 曲線估計。
表型擬似(Phenocopies):環境因素導致與遺傳病相同的表現型,使非遺傳案例混入族譜。在癌症遺傳學中特別重要——散發性乳癌(非 BRCA 相關)的高發生率使族譜解讀困難。
遺傳異質性(Genetic Heterogeneity):同一表現型可由不同基因突變引起(基因座異質性,locus heterogeneity),如遺傳性耳聾有超過 100 個已知基因座。Smith(1963)的異質性 LOD 分析(admixture LOD)引入混合比例 α 來估計連鎖家庭的比例。
基因印記(Genomic Imprinting):基因的表現取決於親代來源。Prader-Willi 症候群和 Angelman 症候群都涉及 15q11-q13 區域,但前者是父源缺失/母源 UPD,後者是母源缺失/父源 UPD。印記基因在族譜上會出現親代來源特異性的表現模式。
粒線體遺傳(Mitochondrial Inheritance):完全母系遺傳,但因異質體(heteroplasmy)的隨機分離,同一母親的不同子代可能有不同的突變負荷量和臨床嚴重度。瓶頸效應(bottleneck effect)在卵母細胞發育期間減少 mtDNA 拷貝數至約 200 個,導致後代間的異質體比例大幅波動。
貝氏定理與遺傳風險計算
貝氏定理在遺傳諮詢中的應用遠比教科書例子複雜。以 DMD 為例:當一位女性的兄弟有 DMD,她的帶因者先驗機率為 2/3。如果她已有兩個正常兒子,每個正常兒子都是 1/2 機率不帶突變(條件機率),貝氏更新後:
P(帶因者|2正常兒子) = [2/3 × (1/2)²] / [2/3 × (1/2)² + 1/3 × 1] = (1/6) / (1/6 + 1/3) = 1/3
現代遺傳諮詢結合基因檢測結果進一步更新:CK 檢測、連鎖分析或直接定序的結果都可以作為額外的條件機率納入貝氏計算。
現代基因體學時代的族譜角色
WGS/WES 產生大量變異,族譜的共分離(cosegregation)分析是 ACMG/AMP 變異分類標準中的重要證據等級:受影響者帶有變異、未受影響者不帶(PP1/BS4 標準)。計算共分離的統計顯著性時,仍需回到 LOD 分數——每個資訊性減數分裂(informative meiosis)提供 log₁₀(2) ≈ 0.301 的 LOD 值,達到 LOD ≥ 3 需要約 10 個獨立的資訊性減數分裂。
三人組(trio)分析(先證者 + 父母)是目前罕見病診斷的標準流程,可直接鑑定 de novo 突變和確定變異的親代來源。
