跳至主要內容
1 · 第2學期生物統計實驗設計

抽樣方法

Sampling Methods

難度 2 · 基礎statistics

抽樣理論的數學基礎涵蓋設計基礎推論、模型輔助估計和複雜調查設計的方差估計。

設計基礎推論 (Design-based Inference)

Horvitz-Thompson estimator:Ŷ_HT = Σᵢ∈s yᵢ/πᵢ,πᵢ = inclusion probability。Var(Ŷ_HT) = ΣΣ (πᵢⱼ − πᵢπⱼ) yᵢyⱼ/(πᵢπⱼ)。Sen-Yates-Grundy 方差估計量在 fixed-size designs 下非負(Särndal, Swensson & Wretman, 1992, Model Assisted Survey Sampling)。

模型輔助估計

GREG estimator(Generalized Regression Estimator):Ŷ_GREG = Ŷ_HT + (X̄ − X̂_HT)ᵀβ̂_w。利用輔助資訊(如行政登記)提升效率。在超群體模型 yᵢ = xᵢᵀβ + εᵢ 下,GREG asymptotically design-unbiased(Sarndal, 1980)。Calibration estimator(Deville & Särndal, 1992)調整權重使輔助變數的加權總和等於已知總值。

複雜調查的方差估計

Taylor linearization(delta method):一階近似 Var(f(Ŷ)) ≈ [∂f/∂Ŷ]² Var(Ŷ)。Jackknife replication:刪一個 PSU 重複估計 n 次。BRR(Balanced Repeated Replication)以 Hadamard matrix 建構半樣本。Bootstrap 在 two-stage designs 下需特殊調整(Rao & Wu, 1988, JASA)。

雙重抽樣與自適應設計

Two-phase sampling(Neyman, 1938):第一階段以廉價方式分層,第二階段在各層中精確測量。自適應群集抽樣(Thompson, 1990, JASA):遇到稀有事件時擴展取樣。

小區域估計(Small Area Estimation)

直接估計量在小域中方差過大。Fay-Herriot model(1979):θ̂ᵢ = θᵢ + eᵢ,θᵢ = xᵢᵀβ + uᵢ。EBLUP(Empirical Best Linear Unbiased Predictor)以 shrinkage 借鑑其他區域的資訊(Rao & Molina, 2015, Small Area Estimation, 2nd ed.)。

缺失資料與無回應

單位無回應以 propensity weighting 校正;項目無回應以多重插補處理(Rubin, 1987, Multiple Imputation for Nonresponse in Surveys)。MCAR/MAR/MNAR 假設決定方法的有效性。Sensitivity analysis 評估 MNAR 的影響。

文獻參考:Särndal, C.-E. et al. (1992). Model Assisted Survey Sampling. Springer. / Rao, J.N.K. & Molina, I. (2015). Small Area Estimation, 2nd ed. Wiley. / Rubin, D.B. (1987). Multiple Imputation for Nonresponse in Surveys. Wiley.

互動工具

動手玩玩看

用互動元件直接感受這個概念,比純文字快 10 倍搞懂。三個 tier 共用同一個工具。

這個和什麼有關