第二節(jié) 計數(shù)資料的顯著性檢驗
作者:徐榮祥 出版社:中國科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
對于計數(shù)資料這些相對數(shù)我們只知它們的高低,不知其有無統(tǒng)計學(xué)意義,只有通過相對數(shù)的顯著性檢驗方能明確。常用方法為U檢驗與χ2檢驗。
一、率的u檢驗
率的u檢驗是應(yīng)用范圍較為廣的一種顯著性檢驗方法,但是在用于樣本率與總體率比較時,或兩個樣本率比較時,應(yīng)當(dāng)考慮其差異是否由于抽樣誤差所造成的。大樣本的樣本率分布近似正態(tài)分布,可用正態(tài)分布的規(guī)律檢驗樣本率與總體率或兩個樣本率差異的顯著性。其判斷標(biāo)準(zhǔn)為:
(一)樣本率與總體率的比較
樣本率與總體率比較的目的是推斷該樣本所代表的總體率與已知總體率是否相同。公式為:
p為樣本率,π為總體率,σP為率的標(biāo)準(zhǔn)誤,由總體計算得出
示例343根據(jù)臨床經(jīng)驗,胃十二指腸潰瘍患者中,一般情況下有20%的病人會發(fā)生胃出血癥狀,現(xiàn)某醫(yī)院觀察燒傷病人152例,其中48例傷前有過胃出血病史,問傷前患有胃十二指腸潰瘍的燒傷病人是否容易發(fā)生胃出血?
【解題步驟】
可將該例中胃十二指腸潰瘍患者有20%發(fā)生胃出血率視為總體率π(是把人們公認(rèn)或經(jīng)驗數(shù)值作為總體率)。
1建立檢驗假設(shè):假設(shè)患有胃十二指腸潰瘍病的燒傷病人胃出血率(p)與一般胃十二指腸潰瘍患者的出血率(π)無差別,即樣本率(P)是由總體率(π)中隨機抽取的,兩者無差別。事實上,實驗研究結(jié)果總是有兩種情況:一種是接受所建立的檢驗假設(shè),一種是拒絕建立的檢驗假設(shè)。
①設(shè)前者為H0:π=π0;②設(shè)后者為H1:π≠π0。
2確立顯著性水準(zhǔn):α=005
3計算u值:將示例343中數(shù)據(jù)代入公式(346):
4確定P值:因為u=358,而358>258,故P<001。
5推斷結(jié)論:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<001,所以有非常顯著性差異,傷前患有胃十二指腸潰瘍的燒傷病人,其胃出血率與一般胃十二指腸潰瘍患者的出血率有本質(zhì)差異,可認(rèn)為患胃十二指腸潰瘍的燒傷病人較一般胃潰瘍患者容易發(fā)生胃出血。
(二)兩個樣本率比較的U檢驗
兩個樣本率比較的目的是推斷兩個樣本各自代表的兩個總體率是否相同。常用U檢驗和χ2檢驗:
U檢驗計算公式:
示例344如某醫(yī)院對1 329例燒傷病人進行應(yīng)激性潰瘍出血的預(yù)防性治療,有56例發(fā)生了胃出血,發(fā)病率為421%,1 670例傷情相似的病人未進行預(yù)防性治療,其出血率達832%,問兩組樣本應(yīng)激性潰瘍出血的發(fā)病率有無差異?
【解題步驟】
1建立檢驗假設(shè):H0:π1=π2,H1:π1≠π2。
2確定顯著性水平:α=005。
3計算u值:n1=1329,X1=56,P1=00421(56/1329),n2=1670,X2=139,P2=00823(139/1670)。
代入公式(349)、(3410)、(347):
4確定P值:因425>258,故P<001。
5推斷結(jié)論:在α=005的水準(zhǔn)上,拒絕H0,接受H1。因P<001,差異有高度顯著性,故認(rèn)為預(yù)防性治療組與對照組的應(yīng)激性潰瘍出血率有本質(zhì)不同,預(yù)防組應(yīng)激性潰瘍出血發(fā)生率低于對照組,預(yù)防治療有效。
二、χ2檢驗
χ2檢驗是英國統(tǒng)計學(xué)家Kpearson提出的,后經(jīng)Yates校正改進,現(xiàn)已成為專用于兩組百分率的常用顯著性檢驗公式。“χ”為希臘字母,讀音為“Kai”,故χ2檢驗法又稱“卡方法”。應(yīng)用范圍與U檢驗不完全相同,前者主要針對樣本率與總體率進行比較,也可用于兩個樣本率的比較;而χ2檢驗主要用于推斷兩個及兩個以上總體率(或構(gòu)成比)之間的檢驗,檢查兩個分類變量之間有無關(guān)系(或關(guān)聯(lián))。
(一)χ2檢驗基本公式與計算方法
χ2檢驗的基本公式:
A為實際觀察數(shù),T為理論計算值, ∑(希臘字母,讀音Sigma)表示總和。舉例解釋其方法及原理。
示例345某醫(yī)院對過去治療的燒傷并發(fā)敗血癥的病例進行回顧性總結(jié),205例大面積燒傷病人并發(fā)敗血癥的例數(shù)為43,而134例中等燒傷面積病人并發(fā)敗血癥的例數(shù)為13,問敗血癥的發(fā)生與燒傷面積有無關(guān)系?
【解題步驟】
1將調(diào)查資料列入表(表342)中:
2建立“檢驗假設(shè)”(無效假設(shè)),即假如大面積與中等面積燒傷組的敗血癥發(fā)生率之間沒有本質(zhì)差別,說明敗血癥的發(fā)生率(21%和97%)來自同一總體,這種差別是由抽樣誤差造成的。根據(jù)這個假設(shè),可以用兩個組的合計發(fā)病率(165%)為假設(shè)的理論總體,并以此作為計算值的理論基礎(chǔ)。
3計算各組的理論數(shù)T值:理論數(shù)值是根據(jù)檢驗假設(shè)推論的兩組病人數(shù)中應(yīng)有的發(fā)生敗血癥人數(shù),即兩組都按165%患病率計算,應(yīng)當(dāng)有多少人患病與不患病。大面積燒傷組205人,乘以合計患病率165%,便是大面積燒傷組理論上應(yīng)當(dāng)發(fā)生敗血癥的人數(shù)(205×165%=3383),即為理論值;而未發(fā)生敗血癥的人數(shù)為(205-3383=17117)17117。同理,再求出中等燒傷面積組病人的理論值為2211,不發(fā)生敗血癥的理論值為(134-2211=11189)11189。
將計算的理論值匯入表343中。
4代入χ2值公式(3411)計算χ2值:
χ2值無單位,與它相應(yīng)的概率為5%的χ2值(χ2 005)和概率為1%的χ2值(χ2001),可由卡方簡明界值表344中查出。
如果上述檢驗正確,A-T差值不會太小,如A-T相差太大,檢驗假設(shè)成立的可能性就不大。
5根據(jù)χ2值與自由度查χ2值表:首先確定自由度(df或n′或r,),因四格表中有四個理論值,只要先用乘除法求出任何一個,其余三個可用減法求出。這種必須先用乘除法求出理論值的格子數(shù)叫自由度。計算方法:
n′=(行數(shù)-1)(列數(shù)-1),四格表中為兩行、兩列,故:
n′=(2-1)(2-1)=1。
查簡明χ2值表(表344,或查有關(guān)書籍卡方界值表):當(dāng)n′=1時,χ2005=663,本例χ2=747,大于663,已超過χ2005=663水平,但小于χ20005=788水平,故P<001。
(二)四格表資料的χ2檢驗(兩個樣本率的比較)
四格表資料的χ2檢驗法是應(yīng)用最為廣泛和最為方便的一種方法,它所檢驗的僅是兩個率的比較。基本模式圖、公式和結(jié)果判斷標(biāo)準(zhǔn)如下:
4計算步驟:
(1)先將題目中的數(shù)據(jù)按四格表模式圖形式制表排列(用實際數(shù)字,不用百分率)。
(2)代入公式(3412),計算χ2值,χ2值是統(tǒng)計值,數(shù)值越大統(tǒng)計意義越大。
(3)根據(jù)χ2值的大小,按P值判斷標(biāo)準(zhǔn)確定P值大小。
(4)做出統(tǒng)計結(jié)論。
示例346用甲法治療大面積燒傷(甲組)71例,有52例并發(fā)全身性感染,用乙法治療的大面積燒傷(乙組)42例,有3例并發(fā)全身性感染。問兩組感染發(fā)生率有無統(tǒng)計學(xué)差異?
【解題步驟】
1按四格表模式重新制表(表347):
2計算χ2值(公式342):
3計算自由度:因為自由度(n′)=1{(行-1)(列-1)=(2-1)(2-1)},故本研究自由度為1(1×1)。
4按表344標(biāo)準(zhǔn)確定P值:因χ2值在384和663之間,故P<005,組間有顯著性差異。
5結(jié)果判斷:因P<005,說明乙法治療的大面積燒傷病人并發(fā)全身性感染的機會低于甲組。
(三)行×列表資料的χ2檢驗
以上講的是兩個樣本率的檢驗,用四格表法,但當(dāng)行數(shù)或列數(shù)大于2時,應(yīng)當(dāng)用行×列表資料的χ2檢驗,又稱R×C表資料。基本公式:
A為各格子的實際頻數(shù),nR、nC為各實際頻數(shù)所對應(yīng)的行的合計數(shù)和列的合計數(shù),N為總合計數(shù)。
該公式是由基本公式轉(zhuǎn)換而來,不需要求理論頻數(shù),方便實用。
示例337甲乙丙三所醫(yī)院同期對某藥進行抗感染療效觀察,甲院觀察了29例,有效(23例)率為793%,乙院觀察了44例,有效(14例)率為318%,丙醫(yī)院觀察了11例,有效(3例)率為273%(資料見表348)。問3所醫(yī)院抗感染治療的總體有效率是否有顯著意義?
【解題步驟】
1建立檢驗假設(shè):H0:3所醫(yī)院的有效率相等,π1=π2;H1:3所醫(yī)院的有效率不相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3根據(jù)χ2基本計算公式(3413)計算χ2值:
4確定自由度(n′)=(2-1)(3-1)= 2。
5查χ2值表確定P值:查表344可知,χ2005(2)=1060,今χ2=17907,>χ20005(2),故P<0005。
6推斷結(jié)論:在α=005水準(zhǔn)上,拒絕H0,接收H1,故該藥在三所醫(yī)院的抗感染效果存在統(tǒng)計學(xué)差異(P<0005)。
(四) 二列多格資料χ2值檢驗
二列多格資料χ2值檢驗也稱多個樣本率的比較,其目的是推斷它們所代表的總體率是否相等。該類資料的基本數(shù)據(jù)有R行(樣本個數(shù)),2列(指樣本的陽性數(shù)與陰性數(shù)),所以又叫R×2列聯(lián)表或列聯(lián)表(contingency table)。
公式同基本公式(3413),計算出的資料可以進行相關(guān)分析。
示例348(百分比相互比較):某醫(yī)院觀察嚴(yán)重?zé)齻∪嗽缙谘舆t治療對休克發(fā)生率有無影響,觀察時間分別為傷后大于18小時(甲組)、傷后6~18小時(乙組)和6小時以內(nèi)(丙組)3個接受治療小組,結(jié)果匯于表349中。問延遲治療對燒傷休克的發(fā)生率有無統(tǒng)計學(xué)差異,或相互之間有無關(guān)聯(lián)?
【解題步驟】
1建立檢驗假設(shè):設(shè)H0:三種不同治療時間休克發(fā)生率相等;設(shè)H0:π1=π2;三種不同治療時間休克發(fā)生率不完全相等,H1:π1≠π2。
2確定顯著性水平:α=005。
3計算χ2值:將表349中的數(shù)字代入公式3413,得:
4計算自由度:(n′)=(2-1)(3-1)= 2。
5確定P值:因n′=2,查χ2值表(344),χ20005(2)=1060,本研究χ2=24776>χ20005(2)(1060)水平,P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認(rèn)為嚴(yán)重?zé)齻∪嗽缙诮邮苤委煂π菘税l(fā)生率有明顯影響作用,即可降低休克發(fā)生率。
7為了進一步說明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式計算關(guān)聯(lián)系數(shù):
根據(jù)四格表的pearson列聯(lián)系數(shù)值r在0~1之間。r值愈接近0,說明兩個分類變量的關(guān)系愈弱,r值愈接近1,說明關(guān)系愈密切。因為r=0462,說明延遲治療時間與休克發(fā)生率具有一定的關(guān)聯(lián)性。
示例349(樣本結(jié)構(gòu)比相互比較):某院2004年收治小兒燒傷145例,致傷因素:熱液150例,火焰10例,電流7例,其他23例;成人燒傷188人,致傷因素:熱液50例,火焰48例,電流18例,其他72例(資料見表3410),問小兒燒傷原因與成人燒傷原因相互之間是否有關(guān)聯(lián)性?
【解題步驟】
1建立檢驗假設(shè)和確定顯著性水平:①設(shè)H0:兩組病人傷因構(gòu)成相等,H0:π1=π2;②設(shè)H1:兩組病人傷因構(gòu)成不完全相等,H1:π1≠π2。
2顯著水平:α=005。
3計算χ2值:可將表3410中的數(shù)字代入公式(3413),得:
4計算自由度:(n′)=(2-1)(4-1)= 3。
5確定P值:n′=3,查χ2值表(344),χ20005(3)=1284,今χ2=7014,故P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有非常顯著意義,故認(rèn)為小兒燒傷病人的致傷因素構(gòu)成比與成人不同,說明小兒以熱液燙傷多見,其他傷因構(gòu)成比低于成人組。
7為了進一步說明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式3414計算關(guān)聯(lián)系數(shù):
因為r=0417,說明兒童燒傷傷因與成年人燒傷傷因之間具有一定的關(guān)聯(lián)性。由于兒童熱液燙傷發(fā)生率為724%,成人熱液燙傷發(fā)生率為266%,兩者是否存在顯著性差異,需要進行兩兩比較方可明確。
(五) 多列多格資料χ2值檢驗
臨床經(jīng)常遇到3組或3組以上的多格資料,其計算方法仍以公式(3413)為基礎(chǔ) ?,F(xiàn)舉例說明:
示例3410(計數(shù)資料相關(guān)分析):某燒傷中心觀察了176例吸入性損傷病人的不同傷情與呼吸困難的各自例數(shù),問呼吸困難程度與吸入損傷傷情之間有無關(guān)聯(lián)性(數(shù)據(jù)資料匯于表3411中)?
【解題步驟】
本例的設(shè)計和分析目的與上述例子不同。它并非是兩個樣本率與總體率、多個樣本率與總體率或構(gòu)成比之間的比較,而是單一樣本自身的比較,每個對象分別按兩種標(biāo)志分級(傷情與呼吸困難),屬于雙相率的計算,目的是推測兩種標(biāo)志之間有無相關(guān)性。
1建立檢驗假設(shè):①設(shè)H0:呼吸困難程度與吸入性損傷程度無關(guān);②設(shè)H1:呼吸困難程度與吸入性損傷程度有關(guān)。
2確定顯著水準(zhǔn):α=005。
3計算χ2值:將表3411中的數(shù)字代入公式3413,得:
4計算自由度:(n′)=(3-1)(3-1)= 4。
5確定P值:n′=4,查χ2界值表(324),χ20005(4)=1486,本研究χ2=179623,>χ20005(4)(1486)水準(zhǔn),P<0005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<0005,差異有高度顯著性,故認(rèn)為呼吸困難程度與吸入性損傷程度關(guān)聯(lián)密切。
7為了進一步說明它們之間的密切關(guān)聯(lián)程度,可根據(jù)公式(3414)計算關(guān)聯(lián)系數(shù):
因為r=07316,說明呼吸困難程度與吸入損程度具有明顯的關(guān)聯(lián)性,即吸入損傷越重,呼吸困難越嚴(yán)重。
(六) 配對計數(shù)資料的χ2檢驗
計數(shù)資料的配對設(shè)計常用于兩種檢驗方法,如培養(yǎng)方法、診斷方法的比較。其特點是對樣本中的各觀察單位分別用兩種方法處理,然后觀察兩種方法的結(jié)果。此類資料可用配對χ2檢驗,比較兩個率之間是否有差異。從配對設(shè)計來說,配對計數(shù)資料與前邊所介紹的配對計數(shù)資料是相同的,都是把兩種處理因素分別施加于條件相似的受試對象上,或先后施于同一對象上。配對記錄試驗結(jié)果如為計量資料,即屬計量配對資料;若結(jié)果為計數(shù)資料,即屬于計數(shù)配對資料。配對計數(shù)資料的χ2檢驗包括兩個內(nèi)容:①分析它們的相關(guān)關(guān)系;②分析處理結(jié)果有無差異。
示例3411:100個深Ⅱ度燒傷創(chuàng)面,每個創(chuàng)面分別用兩種方法(甲法與乙法)診斷。結(jié)果:甲法陽性者為67個,乙法陽性者50個;其中甲乙兩法均陽性者(a)39個,甲乙兩法均陰性者(d)22個,甲法陽性乙法陰性者(d)28個,乙法陽性甲法陰性者(c)11個(資料見表3412)。問甲乙兩種方法的診斷結(jié)果有無關(guān)聯(lián)及統(tǒng)計學(xué)差異?
【解題步驟】
第一步:分析兩種診斷結(jié)果有無相關(guān)關(guān)系,每個對象按兩種處理結(jié)構(gòu)分組,故可用四格χ2檢驗公式計算,推斷兩種診斷方法之間有無相關(guān)關(guān)系:
1建立檢驗假設(shè):①設(shè)H0:甲乙診斷方法之間無關(guān);②設(shè)H1:甲乙診斷方法之間有關(guān)。
2確定顯著水準(zhǔn):α=005。
3計算χ2值:將表3412中的數(shù)字代入公式3412,得:
4計算自由度:(n′)=(2-1)(2-1)=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<005,差異有顯著性,故認(rèn)為兩種診斷程度關(guān)聯(lián)密切。
第二步:計算兩種處理結(jié)果有無差別:計算公式為(3415):
1建立檢驗假設(shè):①設(shè)H0:兩總體b=c;②H1:兩總體b≠c。
2確定顯著水準(zhǔn):α=005
3計算χ2值:將表3412中的數(shù)字代入公式3415,得:
4自由度:n′=1。
5確定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本研究χ2=6564,介于χ20005和χ2001水準(zhǔn)之間,故P<005。
6推斷結(jié)果:在α=005水準(zhǔn)上,拒絕H0,接受H1,因P<005,差異有顯著性,故認(rèn)為甲乙兩種診斷方法的確診率不同,甲法的確診率高于乙法。
7關(guān)聯(lián)性分析:根據(jù)公式3414計算關(guān)聯(lián)系數(shù):
因為r=0629,說明甲乙兩種方法的診斷結(jié)果關(guān)聯(lián)性較強,甲法優(yōu)于乙法。
(七)兩個小樣本的χ2檢驗方法
因為χ2檢驗是以一條光滑曲線為基礎(chǔ),大樣本所得的概率與其真正概率很接近。當(dāng)為小樣本時,如n<40(有人認(rèn)為n<50)時,用前邊講的大樣本比較的u檢驗或χ2檢驗公式計算結(jié)果都不準(zhǔn)確,或偏倚較大,需要采用小樣本校正公式計算。兩個小樣本的檢驗方法有兩種:一種是樣本(n)偏??;一種是四格表中有理論頻數(shù)中出現(xiàn)0或1時。現(xiàn)舉例說明:
1小樣本校正公式(3416):
示例3312:用甲乙兩種藥物治療糖尿病壞疽創(chuàng)面各30個,甲藥組瘢痕發(fā)生率為70%,乙藥組癜痕發(fā)生率為50%。問兩組之間的療效有無統(tǒng)計學(xué)差異?
【解題步驟】
(1)根據(jù)題中數(shù)據(jù)列表3413:
(2)將表3413中數(shù)字代入公式(3416),得:
(3)結(jié)果判斷:因n′=1,χ2值=7050<χ2001(6635),故P<001。組間有非常顯著差異。
(4)結(jié)論:甲藥治療的創(chuàng)面瘢痕發(fā)生率低于乙藥治療組。
小樣本率的χ2公式計算結(jié)果優(yōu)于大樣本率的χ2公式,尤其在其他檢驗公式所得概率接近檢驗水準(zhǔn)時,宜用小樣本率的χ2公式。目前許多統(tǒng)計學(xué)者認(rèn)為:①小樣本率的χ2公式誤差最小,最為常用;②過去有一種誤解,只有當(dāng)例數(shù)小于30時,或理論頻數(shù)小于5時,χ2原公式計算值中有誤差,否則不必進行校正。實踐證明,只要是判斷P=005或P=001的顯著檢驗,用校正公式肯定優(yōu)于基本公式,即使例數(shù)大于30,或理論頻數(shù)大于5,采用校正公式也比χ2原計算方法誤差小。
2 兩組數(shù)據(jù)中有1或0的小樣本資料計算:前邊已敘述了小樣本率的χ2計算公式與方法,但在實際工作中,小樣本資料經(jīng)常出現(xiàn)理論頻數(shù)小于1的情況,即T<1。這種資料不宜用小樣本計算公式計算,更不能用四格表公式計算,但宜用四格表確切概率法計算。確切概率法是由RAFisher提出的,故又稱Fisher確切概率檢驗。此法本不屬于χ2檢驗范疇,但可作為四格表資料假設(shè)檢驗的補充。介紹如下:
確切概率法各種組合概率的計算公式(3417)為:
式中a、b、c、d的意義同表345,!為階乘符號,N!=1×2×3×4×…×N,數(shù)學(xué)上規(guī)定!=1。一般計算器不能計算N≥70的階乘,這種情況下用對數(shù)計算。
四格表中|A-T|值的特點:①各格相等,如表3414的A-T,a、d兩格均為-14,b、c兩格均為+14,其絕對值相等。因而計算某一四格表的|A-T|值時,只需計算表中任一格的|A-T|值即可;②依次增減四格表中任何一格的數(shù)據(jù),可列出周邊合計不變條件下各種組合的四格表,如示例3413中的五個四格表,分別計算其|A-T|值,列于表下。由此可見,兩側(cè)的|A-T|值較大,而中間的較小。
各種組合下累計概率的計算:①雙側(cè)檢驗:按公式3417分別計算兩側(cè)所有|A-T|值的各四格表的P值,然后相加,即為雙側(cè)檢驗的P值;②單側(cè)檢驗:按研究目的,只計算一側(cè)的所有|A-T|值等于及大于樣本|A-T|值得四格表的P值,然后相加,即為單側(cè)檢驗的P值。
示例3313:某醫(yī)生用新舊兩種方法治療燒傷后貧血病人共計27例,結(jié)果匯于表3414中,問新舊藥物的療效有無差異?
【解題步驟】
(1)建立檢驗假設(shè):H0:新藥與舊藥治愈率相等,即π1=π2;H1:新藥與舊藥治愈率不相等,即π1≠π2。
(2)確定顯著水準(zhǔn):α=005。
(3)計算概率P:本組N=25<40,且又T<5,故宜用確切概率法。由表3414可見,最小周邊合計數(shù)為4,故所有可能的組合有5種,分別為:
(4)確定P值,做出推斷結(jié)論:P值應(yīng)等于所有小于樣本點的各種概率之和,本例符合樣本點要求者為(1)、(2)、(5),因此,P值的組合為上述三點之和,即P=00166+01423+01079=02668。按α=005水準(zhǔn),P>005。不能認(rèn)為兩種療法的治愈率有統(tǒng)計學(xué)差異。
3查四格表顯著性檢驗用表(C值表)法:此方法簡便易行,本文不再敘述,可參照有關(guān)資料查詢。