第二節(jié) 相關(guān)系數(shù)的計(jì)算

作者:徐榮祥 出版社:中國科學(xué)技術(shù)出版社 發(fā)行日期:2009年7月

一、小樣本計(jì)算法
示例391測得8例燒傷病人的血漿白蛋白與膠體滲透壓數(shù)值(表391),確定它們之間是否存在直線關(guān)系?

【解題步驟】
1根據(jù)表391中的數(shù)字,以橫坐標(biāo)表示血漿白蛋白(x),縱坐標(biāo)表示滲透壓(y),繪成散點(diǎn)圖(示圖391)。從所繪制的圖中可以看出,這些點(diǎn)子基本呈直線趨勢。


2列相關(guān)系數(shù)計(jì)算表(表392)

3計(jì)算r值:根據(jù)以下公式計(jì)算r值。

4結(jié)論:r為0953,表示血漿膠體滲透壓隨血漿白蛋白濃度的增加而上升。
二、大樣本分組資料計(jì)算法
因?yàn)榇髽颖镜脑假Y料較多,應(yīng)先編制相關(guān)的頻數(shù)表,再用簡捷法計(jì)算均數(shù)(x)。相關(guān)頻數(shù)制表方法與單變量頻數(shù)表相似,所不同的是單變量頻數(shù)表只按一種變量x分組,而相關(guān)頻數(shù)表有兩個變量(x、y),取一個變量(x)為縱標(biāo)目,另一個變量(y)為橫坐標(biāo)目。縱標(biāo)目由左到右、由小到大寫在表的上端;橫標(biāo)目自上到下、由小到大寫在表的左側(cè)。然后劃記,接每對數(shù)據(jù)記在縱橫標(biāo)目相交處,計(jì)算各組段的頻數(shù),將縱行的總計(jì)寫在下面的fx橫行內(nèi),將橫行的總頻數(shù)寫在fy縱行內(nèi)。然后參照計(jì)量資料指標(biāo)的描述章節(jié)平均數(shù)的簡捷法,分別求x、y的簡捷值(x、fx),進(jìn)行運(yùn)算。

示例392某醫(yī)生測量了40例早期大面積燒傷病人的血漿黏度(CP),觀察結(jié)果匯入表393中,試求燒傷面積與血漿黏度之間相關(guān)系數(shù)?

【解題步驟】
(1)作相關(guān)計(jì)算表(表393):先將資料按燒傷面積(豎行)和血漿黏度(橫行)填入表中,再將豎行與橫行相交的病例數(shù)(頻數(shù))填入相應(yīng)之交叉處。如“~40%”TBSA組段血漿黏度在“16~”段處有1例,即在此處填1,余仿此。
(2)參照平均數(shù)值及標(biāo)準(zhǔn)差的簡捷法,分別求出x及y的dx簡化值(dx、dy)、∑fxdx、∑fydy、 ∑fxd2x及fyd2y,填入表的響應(yīng)位置(注:∑fx=∑fy,本例均為40)。
(3)表中∑fdx的計(jì)算方法:各小格的頻數(shù)(f)乘相應(yīng)的dx,再將各乘積相加。如y為“~70”段的行內(nèi),∑fdx =4×0+1×1+1×2+1×4=7;y=“~90”段行內(nèi),∑fdx=1×(-1)+2×0+1×1+3×2+2×3+1×4=16。(注:∑fdx的總計(jì)應(yīng)等于∑fxdx ,本例皆為43)。
(4)∑fdxdy的計(jì)算:為各行的∑fdX與dy相乘之積。
(5)求r值:因本例為大樣本資料,不能直接代入小樣本r公式,需采用分組公式計(jì)算r:
①求離均差平方和與離均差積和:
求離均差平方和(lxx,lyy):離均差積和(lxy);
本例n=40,x組距ix=02,y組距iy=10;


(5)結(jié)論:因r值為0494,說明燒傷早期血漿黏度隨燒傷面積的增大而上升。
三、相關(guān)系數(shù)的顯著性檢驗(yàn)
上述兩例的相關(guān)系數(shù)均是根據(jù)樣本資料計(jì)算出來的。和其他統(tǒng)計(jì)量一樣,根據(jù)樣本資料計(jì)算出來的相關(guān)系數(shù)也必然受到抽樣誤差的影響。也就是說,從相關(guān)系數(shù)為0的總體 (即無線性相關(guān))中隨機(jī)抽樣也可能抽到|r|>0的樣本。因此,通過計(jì)算得到相關(guān)系數(shù)后,還不能根據(jù)|r|的大小對x、y關(guān)系的密切程度作出判斷,需要進(jìn)行r顯著性檢驗(yàn),以便估計(jì)算得的r由抽樣誤差(即相關(guān)系數(shù)為0的總體)引起的可能性有多大。如果從相關(guān)系數(shù)為0的總體中隨機(jī)抽得樣本r的機(jī)會較大(P>005),則樣本r很可能抽自r為0的總體,兩者差別無顯著意義;此時(shí)即使|r|值比較大,也不能認(rèn)為x與y有相關(guān)關(guān)系。反之,如果從相關(guān)系數(shù)為0的總體中隨機(jī)抽取得到如此大的樣本r的機(jī)會較小 (P≤005),則認(rèn)為此樣本r很可能不是抽自r為0的總體,兩者(樣本r和總體)相差顯著。此時(shí)即使|r|比較小,我們也認(rèn)為x與y有相關(guān)關(guān)系。只有相關(guān)有顯著意義時(shí),我們才能根據(jù)相關(guān)系數(shù)絕對值的大小來說明x與y相互關(guān)系的密切程度。
相關(guān)系數(shù)的顯著性檢驗(yàn)可用t檢驗(yàn)法和查表法確定:

1以示例391為例,計(jì)算t值,得:

本例自由度為(n′)為6, P005界值為2447,P001界值為3707,本例t=8305,不僅大于2447,也大于3707,故P<001,即相關(guān)系數(shù)非常顯著。
2以示例392為例,計(jì)算t值,得:

本例自由度(n′)為38, P005界值為2024,P001界值為2712,P0001界值為3566,本例t=350,大于2024和2712,但小于3566,故P<0001,即相關(guān)系數(shù)非常顯著。