heardThe Reversal Paradox 統計悖論
林學銘、白其卉前言
統計學是觀察並收集、整理及分析資料的學問,然而,在推導結果的過程會發生與直觀相違背的現象,稱為統計悖論(paradox)。統計悖論不僅具有學術上的價值,對於研究結果的解釋與推論亦息息相關。本文簡介常見的三種統計悖論,以流行病學資料為例,比較連續型、類別型資料或者二者兼具的資料型態下,可能發生的悖論現象與成因。
Simpson’s Paradox
辛普森悖論或稱作Yule –Simpson’s Paradox,由英國統計學家(Edward H. Simpson)於1951年提出,是一種常見的統計悖論,指探討二組類別型變項是否具有相關性時,可能因為加入第三個類別型變項而得到完全相反的結果。舉例來說,某研究者想知道出生體重(birth weight, BW)是否與日後得到高血壓(high blood pressure, BP)有關。由下表可觀察到:
表1. 高血壓者(>135 mmHg)以出生體重及成年體重分組之數目與百分比
在整體評估時,出生體重輕者比出生體重高者有較低的高血壓發生百分比,亦即低的出生體重具有保護性;但若考慮成年體重(current weight, CW)亦會影響高血壓的發生,以現在體重為作分組(大於90 kg versus 小或等於90 kg),此時不論是高或低的成年體重,出生體重輕者在發生高血壓的風險皆較高,低的出生體重反而具危險性。
圖1. 圖示說明Simpson’s Paradox。圖上半部二個圓表示較低的成年體重(小或等於90 kg),下半部二個圓為較重成年體重(大於90 Kg),圓面積大小則為樣本數的比例。虛線表示在成年體重分組的情況下,出生體重較輕者(birth weight: 0)比出生體重較重者(birth weight: 1)成年後發生高血壓的風險皆較高。整體來看時,出生體重較輕者有較低風險發展成高血壓(粗實線)。
悖論以純數學角度來看並無特殊之處,但在統計學解釋上卻具有重要意義。上述例子說明當考慮另一個類別變項的影響時,變項之間的相關性可能完全被扭轉(reversal)。此一相反結論的現象來自於資料本質上的差異,由於出生體重較輕者在成年後被分組的樣本數差距過大(428 versus 58),使得在整體觀察上成年體重輕的人有較大的比重,進而影響(降低)了整體低的出生體重者的高血壓發生百分比(如圖1所示)。
Lord’s Paradox
Lord’s Paradox是由Frederic M. Lord利用共變異數分析(ANCOVA)討論一非實驗性研究設計(non-experimental design)的文章後所命名。當研究者欲探究二因子的關係時,其Y是連續型資料而暴露X1是類別型資料,此時需校正另一個連續型的變項X2而發生相反結論的情形即為Lord’s Paradox。此現象常見於長期追縱的世代研究分析時,校正基線的共變量後對於結果的影響。
同樣以上述出生體重對於日後成人發生高血壓為例,成年體重與血壓為連續變項,出生體重則為二項
式變項(BWb)。Two-sample t-test顯示出生體重較重者相對於出生體重較輕者具有較高的平均血壓,然而成年體重做為共變項以ANCOVA進行校正後,結果呈現出生體重較重者反而較出生體重者較輕者有相對較低的平均血壓。
此悖論來自當現在體重與血壓及出生體重都具有正相關時,血壓與二組出生體重之間的關係會發生改變;當出生體重不為隨機分組,組別間會存在系統性的差異,亦即出生體重與成年體重兩者不獨立。圖2說明此一現象:只考慮血壓與類別型變項出生體重時,出生體重較重組有較高的血壓平均值(粗黑色
注册会计师含金量
線)。若校正了現在體重的影響,則對於每個成年體重來說,平均血壓在出生體重較輕者都高於出生體重較重者(紅色水平線)。
圖2. 3D散布圖說明Lord’s Paradox。粗黑色線表示高的出生體重者平均血壓高於低的出生體重者。然而,水平紅色線表示成年體重的影響,平均血壓由低的出生體重傾斜向高的出生體重。
Suppression
相對於Simpson’s Paradox與Lord’s Paradox,Suppression是線性迴歸分析中較不常見卻重要的現象。Suppression的定義為:當一個變項X1與Y變項沒有相關性時,但X1變項加入迴歸模型時,卻增加該模型(Y=X2)的解釋力(R2增加),此一違反直覺的現象即為Supression。
幻觉英文Y
X2
X1
考慮一迴歸方程式為:
Y = b0 + b1X1 + b2X2pk英语
do you know
r y1:X1與Y的相關係數(r y1= 0)
r y2:X2與Y的相關係數初恋这件小事 女主角>derek anderson
r12:X1與X2的相關係數
由方程式可得迴歸係數b1與b2分別為:
決定係數R2則表示為:
。
cmd是什么在r y1為0的情況下,
,
由於永遠小於1,故可知永遠大於r2y2。
雖然X1與Y的相關性不存在(r y1=0),但X2與Y之間有相關,此時方程式加入X1而壓抑或過濾掉(suppresd)X2與Y之間不相關的部分,因此增加了X2對模型的解釋力。
同樣以上述體重與血壓研究為例,此時出生體重、血壓及成年體重皆為連續型資料,Y為血壓,X1為成年體重,X2為出生體重。由表下可知,出生體重與成年體重與血壓都有正相關,這表示當出生體重或成年體重增加時,血壓會隨之上升。然而,同時考慮二者與血壓的關係時,由表2複迴歸(model 3)方程式可知:
iso22000认证
Y = -3.708 X1 + 0.465 X2 + 104.330,
此方式程表示血壓會隨著出生體重增加而下降,與簡單迴歸(mode 1 & model 2)呈現相反結論,此即所謂Suppression現象。
表2. 簡單與複迴歸表,說明出生體重、成年體重與血壓之間的關係。三個模型Y皆為血壓。fucking什么意思
圖3亦顯示,雖然出生體重與血壓呈現明顯的正相關(粗黑色線),然而同時考慮成年體重的效應下,出生體重愈高則血壓愈低(水平紅色線),與原本結論相左。
此簡單迴歸與複迴歸結果相反的情形,何者能真實的反映出真正的因果關係?端看成年體重是否需被校正以及現在體重是否為出生體重與血壓之間的干
擾因子,此關係也有賴生物學與臨床上的知識來判斷。
圖3. 3D散布圖說明Suppression。粗黑色線表示出生體重與血壓具正相關。然而,水平紅色線則顯示考量成年體重,出生體重與血壓的關係呈相反結果。
結論
本文列舉的三個統計悖論雖然出現於不同資料類型的變項(如下表3),其相同之處為在於,非隨機分派
的研究中,加入第三個因子做為校正時,X變項與Y變項的關係可以是被減弱、增強甚至是反轉(reversal)的。了解統計悖論的概念與成因有助於洞察許多研究的爭議與矛盾之處,不正確的使用統計模型也可能會導致錯誤的結論。是故,對於非隨機分派的資料的研究,在建立統計模型時,不只需考量統計的因果推論準則,研究前的先驅知識與理論建立也扮演致關重要的角色。
表3. Simpson’s paradox、Lord’s paradox與Suppression比較表
Reference
Tu YK, Gunnell D, Gilthorpe MS. Simpson's Paradox, Lord's Paradox, and Suppression Effects are the same phenomenon--the reversal paradox.
Emerg Themes Epidemiol 2008, 22;5:2. doi: 10.1186/1742-7622-5-2. Simpson EH. The interpretation of interaction in contingency tables. J R Stat Soc Ser B 1951, 13:238-41.
Yule GU. Notes on the theory of association of attributes in statistics.