第一節(jié) 計數(shù)資料常用指標(biāo)
作者:徐榮祥 出版社:中國科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月
一、 率的抽樣誤差和標(biāo)準(zhǔn)誤
關(guān)于抽樣誤差的概念已在第一章中作了介紹,在抽樣研究中,獲得的樣本率與總體率或各樣本率之間必然也存在著“率”的抽樣誤差。均數(shù)抽樣誤差產(chǎn)生的原因與之相同。表示率(比)抽樣誤差大小的統(tǒng)計指標(biāo)叫率的標(biāo)準(zhǔn)誤。如某醫(yī)生調(diào)查了某鄉(xiāng)某種疾病的患病率為15%(即調(diào)查1 000人有150人患這種疾?。诔闃舆^程中必然會有抽樣誤差。被調(diào)查的這個鄉(xiāng)是一個整體,如果再次重復(fù)調(diào)查1 000人,其患病率不一定是15%,可能高一點,也可能低一點。這種差異是由于抽樣所造成的。率的標(biāo)準(zhǔn)誤根據(jù)公式計算:
式中αp為率的標(biāo)準(zhǔn)誤,π為總體率,n為樣本的含量。
由于π為總體率,實際工作中一般不知道它的數(shù)值,故常用樣本率p來代替,從而計算出率的標(biāo)準(zhǔn)誤的估計值(Sp),計算公式為:
式中Sp為率的標(biāo)準(zhǔn)誤估計值; p為樣本率;n為樣本的含量
示例341某醫(yī)生用一種新藥治療燒傷康復(fù)期貧血,100例病人有75例血液血紅蛋白增加至10g/L以上,求血紅蛋白增加率的標(biāo)準(zhǔn)誤。
【解題步驟】
1計算血紅蛋白增長率:75÷100=075,或750%。
2將數(shù)值代入公式342,計算血紅蛋白增加率的標(biāo)準(zhǔn)誤:
3分析:血紅蛋白增加率為750%,其標(biāo)準(zhǔn)誤為185%。由此可見,率的標(biāo)準(zhǔn)誤反映率的抽樣誤差大小,是衡量樣本率的穩(wěn)定性和可靠性的指標(biāo)。率的標(biāo)準(zhǔn)誤越小,表示率的抽樣誤差越小,用以估計總體率的可靠性越大。反之,率的標(biāo)準(zhǔn)誤也越大,則由樣本估計總體率的可靠性就越小。
4意義:有了率的標(biāo)準(zhǔn)誤,可以用其來確定總體率的可信區(qū)間;還可用于樣本率與總體率及兩個樣本率之間差異的顯著性檢驗。
二、總體率的可信區(qū)間
由于樣本率與總體率之間存在誤差,所以我們只能根據(jù)樣本率來推算總體率的可能性。當(dāng)總體率π不太接近0或1時,且每次抽樣的樣本觀察數(shù)n又不是太小時,樣本率的分布也屬正態(tài)分布。因此可以根據(jù)率的標(biāo)準(zhǔn)誤,仿照估計均數(shù)可信區(qū)間方法估計總體率所在的范圍,這個范圍即為總體率的可信區(qū)間。
總體率的可信區(qū)間公式為:
式中p為標(biāo)準(zhǔn)率,Sp為率的標(biāo)準(zhǔn)誤,U為常量。
總體率區(qū)間的表達參數(shù)與公式:①求95%可信區(qū)間的參數(shù)采用196; ②求99%可信區(qū)間的參數(shù)采用258。
即:總體率95%可信區(qū)間為:
總體率99%可信區(qū)間為:
示例342某醫(yī)院用新療法治療大面積燒傷病人243例,治愈236例,死亡7例,病死率為288%。求其總體病死率95%和99%的可信區(qū)間。
【解題步驟】
1根據(jù)例中提供的資料已知:病死率P=288%,(1-P)=9712%,n=243。
2將以上數(shù)據(jù)代入公式(342),求病死率的標(biāo)準(zhǔn)誤:
3根據(jù)公式(344)、(345),求出95%、99%的可信區(qū)間:
(1)總體率95%的可信區(qū)間范圍為:P±196SP,即288%±196×(107)=288%±210%。說明總體病死率有95%的可能性在078%~498%之間。
(2)總體率99%的可信區(qū)間范圍為:P±258SP,即288%±258×(107)=288%±276%。說明總體病死率有99%的可能性在012%~564%。
4分析:由于抽樣誤差的存在,當(dāng)發(fā)現(xiàn)兩個率或兩個以上的率之間存在差異時,應(yīng)考慮到差異是真正存在的,還是由于抽樣誤差造成的,故應(yīng)進行顯著性檢驗。