IDNote: 5月 2010

整理一下幾種單一比例的信賴區間估計方法。

令

X 代表成功次數

N 代表試驗次數

p = X/N 代表比例

z (alpha/2) = 1.960 at alpha level = 0.05 (i.e., 95% confidence interval)

sqrt = 開平方根

I. Wald method (Wald interval)

教科書裏面最常提到的為 Wald method，又稱為 Wald Interval。

下限 (LL) = p + z * sqrt (p(1-p)/N)

上限 (UL) = p - z * sqrt (p(1-p)/N)

Wald Interval 雖便於計算，但還是有使用上的限制。由於是透過常態分佈近似而來的區間，在樣本數不足，或是 p 接近 0 或 1 時，計算得出的並不是真正的 95% 信賴區間，有 overshooting (大於一) 或 degeneracy (小於零) 的問題。甚至有人證明即使樣本數很大，也不能保證其區間機率 (coverage probability) 近似 95%。但是好算好教好懂是它的最大優點，大部分教科書也是以 Wald Interval 為例子。

II. Exact method (Clopper-Pearson Interval)

由 Clopper 與 Pearson 提出的方法，計算方法較為複雜，可由查表或數值方法或跟 F distribution 的關係作計算。現在電腦很方便，excel 運算功能強大，利用 excel 的 F 分佈反函數即可算出特定單一比例的上下限。以 excel 的內建函數 FINV 則 95% 上下限可用下面的式子表示:

LL = IF(X=0,0,X/(X+(1+N-X)*FINV(0.025,2*(1+N-X),2*X)))
UL = IF(X=N,1,(X+1)*FINV(0.025,2*(X+1),2*(N-X))/(N-X+(X+1)*FINV(0.025,2*(X+1),2*(N-X))))

對於一般的醫學研究，可以用這個方法快速求出某個比例的 95% 信賴區間，例如二維列聯表的 sensitivity 或 specificity，這也是 Graphpad 統計軟體計算所使用的方法。缺點是可能 over conservative。

III. Wilson's score method (Wilson interval)

LL = (2*n*p + z*z - z*sqrt(z*z+4*n*p*(1-p)))/(2*(n+z*z))
UL = (2*n*p + z*z + z*sqrt(z*z+4*n*p*(1-p)))/(2*(n+z*z))

這個 interval 被近來許多的統計學家用模擬的方法證實，coverage probability 較為接近 95%，即使在樣本數少的狀況下。另外，計算上也還不算太繁複，相較於 exact method 所估計出來的區間比較窄一些。

IV. Modified Wald method (Agresti-Coull Interval)

在 Newcombe 比較七種方法和推崇 Wilson's score method 的差不多時間 (1998)，UF 的一個統計學教授 Alan Agresti 發表文章，原本的 Wald method 經由分子加二，分母加四 (作者稱為 pseudo-observations) 可以大大地改進原本的 Wald method 的 coverage probability，使之接近 95% 名目機率。作者還進一步闡述，經過變換，其實加上 pseudo-observations 使得原本的 Wald interval 可以作為 Wilson's score interval 的近似。也就是說，大部分的狀況，都可以用這個改變後的 p' 數值代入原本的 Wald method 得到接近 95% coverage probability 的信賴區間。這個方法有可能產生 overshooting，也就是區間大於一或小於零的狀況，這時候要把他裁掉。

令 p'= (X+2)/(N+4)

下限 (LL) = p' + z * sqrt (p'(1-p')/N)

上限 (UL) = p' - z * sqrt (p'(1-p')/N)

其實加上的 pseudo-observations:
2 是 z*z/2 的近似值
4 是 z*z 的近似值
因此也可以拿來套用在不同的 alpha level。

在 Agresti 與 Caffo 合著的文章 (2000) 中提到，即使沒有資料也可以計算信賴區間，因為分子為二分母為四可以帶入運算，這是 Agresti 提出的方法一個有趣的地方。

CONCLUSIONS

以應用上來說，若要好算又嚴謹，可以直接使用 Agresti-Coull interval。若要名字好聽，那就用所謂的 exact confidence interval，這是多數統計軟體提供的，也是所謂的金標準。雖然它已經被證實不比起 Agresti-Coull interval 跟 Wilson's interval 精確，而且它的信賴區間過度保守 (conservative ~ 比較寬)，不過一般的接受度應該是很高的。

個人是傾向 Newcombe 提倡的 Wilson's interval 或 Agresti-Coull interval，除了用 excel 方便計算，區間在小樣本的時候看起來窄一點之外，更重要的是它們都可以應用在建立兩個比率的差異的信賴區間。最後，忘了在哪一篇文章中曾提到，樣本數若偏小 (N<40)，Wilson's interval 可能是最好的選擇。

REFERENCES:

Newcombe RG. Two-sided confidence intervals for the single proportion: comparison of seven methods. Stat Med. 1998;17(8):857-872.
Clopper-Pearson Interval. Available at: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Clopper-Pearson_interval [Accessed May 26, 2010]
Agresti A, Coull BA. Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions. The American Statistician. 1998;52(2):119-126.
Agresti A, Caffo B. Simple and Effective Confidence Intervals for Proportions and Differences of Proportions Result from Adding Two Successes and Two Failures. The American Statistician. 2000;54(4):280-288.

IDNote

2010年5月27日星期四

單一比例的信賴區間估計 (Confidence Interval Estimation for Proportions)

2010年5月24日星期一

A 2x2 contigency table calculator

2010年5月27日 星期四

單一比例的信賴區間估計 (Confidence Interval Estimation for Proportions)

2010年5月24日 星期一

A 2x2 contigency table calculator

2010年5月27日星期四

2010年5月24日星期一