現(xiàn)舉例說明計算相關(guān)系數(shù)的一般步驟:
例9.1 測定15名健康成人血液的一般凝血酶濃度(單位/毫升)及血液的凝固時間(秒),測定結(jié)果記錄于表9.1第(2)、(3)欄,問血凝時間與凝血酶濃度間有無相關(guān)?
醫(yī)學(xué)全在.線gydjdsj.org.cn
1.繪圖,將表9.1第(2)、(3)欄各對數(shù)據(jù)繪成散點圖,見圖9.9。
2.求出∑X、∑Y、∑X2、∑Y2、∑XY,見表9.1下方。
3,代入公式,求出r值。
圖9.9 凝血時間與凝血酶濃度散點圖及回歸直線
表9.1 相關(guān)系數(shù)計算表
本例的相關(guān)系數(shù)r=-0.9070,負值表示血凝時間隨凝血酶濃度的增高而縮短;絕對值∣-0.9070∣表示這一關(guān)系的密切程度。至于此相關(guān)系數(shù)是否顯著,則要經(jīng)過下面的分析。 (二)相關(guān)系數(shù)的假設(shè)檢驗 雖然樣本相關(guān)系數(shù)r可作為總體相關(guān)系數(shù)ρ的估計值,但從相關(guān)系數(shù)ρ=0的總體中抽出的樣本,計算其相關(guān)系數(shù)r,因為有抽樣誤差,故不一定是0,要判斷不等于0的r值是來自ρ=0的總體還是來自ρ≠0的總體,必須進行顯著性檢驗。檢驗假設(shè)是ρ=0,r與0的差別是否顯著要按該樣本來自ρ=0的總體概率而定。如果從相關(guān)凳?0的總體中取得某r值的概率P>0.05,我們就接受假設(shè),認為此r值的很可能是從此總體中取得的。因此判斷兩變量間無顯著關(guān)系;如果取得r值的概率P≤0.05或P≤0.01,我們就在α=0.05或α=0.01水準上拒絕檢驗假設(shè),認為該r值不是來自ρ=0的總體,而是來自ρ≠0的另一個總體,因此就判斷兩變量間有顯著關(guān)系。 由于來自ρ-0的總體的所有樣本相關(guān)系數(shù)呈對稱分布,故r的顯著性可用t檢驗來進行。本例r=-0.9070,進行t檢驗的步驟為: 1.建立檢驗假設(shè),H0:ρ=0,H1:ρ≠0,α=0.01 2.計算相關(guān)系數(shù)的r的t值: (9.3) 3.查t值表作結(jié)論 ν=n-2=15-2=13 根據(jù)專業(yè)知識知道凝血酶濃度與凝血時間之間不會呈正相關(guān),故宜用單側(cè)界限,查t值表得 t0.01,13=2.650 今∣tr∣>t0.01,13,P<0.01,在α=0.01水準上拒絕H0,接受H1,故可認為凝血時間的長短與血液中酶濃度有負相關(guān)。 為簡化tr檢驗的計算過程,數(shù)理統(tǒng)計工作者根據(jù)t分配表,已把不同自由度時r的臨界值求出,并列成相關(guān)系數(shù)界值表(見附表11)。故求相關(guān)系數(shù)后,只需查表就可知道該r值是否顯著,而不必再計算tr值。 r的顯著性界限為 |r| r0.05,,≤|r|<r0.01,, 0.05≥P>0.01 在α=0.05水準上相關(guān)顯著 |r|≥r0.01,, P≤0.01 在α=0.01水準上相關(guān)顯著 例9.1的ν =15-2=13,查附表11中P(1)的界值,得: r0.05,13=0.441r0.01,13=0.592 現(xiàn)r=-0.9070,∣r∣>r0.01,13,P<0.01,按α=0.01水準,拒絕HO,接受H1。認為ρ≠0,說明凝血時間的長短與血液中凝血酶濃度有負相關(guān)。結(jié)論與計算所得一致。 相關(guān)系數(shù)的顯著性與自由度的大小有關(guān),如n=3,ν=1時,雖r=-0.9070,卻為不顯著;若ν=400時,即使r=0.1000,亦為顯著。因此不能只看r的值,不考慮ν就下結(jié)論。 |