第十一章 兩醫(yī)學招聘網(wǎng)變量關聯(lián)性分析
在這章之前講的所有統(tǒng)計分析方法,就算是計算公式在麻煩也只是研究一個指標,比如說方差分析,計算公式很多,但最終分析的就是各組的總體均數(shù)是否相同;秩和檢驗最終分析的就是總體分布是否相同。而本章研究的2個指標(變量)間的關系。
在中學時學習的兩個變量間的關系是確定性的關系,比如:在黑板高度一定的情況下,黑板的面積與黑板的長度的關系是確定性的關系,一旦長度確定,面積就一定是這么多。
而我們現(xiàn)在研究的兩個指標間的關系是非確定性的,比如:人的肺活量和體重之間的關系,不能一個人的體重是多少,那他的肺活量就是多少。雖然是非確定性的關系,但也是有關系,到底是什么關系,通過本章要學習的內(nèi)容,可以找出一定的規(guī)律。
變量之間的關系,可以分成依從(因果)關系和相關關系。比如說,器皿中盛有NaCl溶液,在溶液未飽和之前,隨著溫度的上升,溶解度增加,此時,溶解度和溫度之間的關系就是依從關系,我們在溶液中放一個氣球,那么給容器加熱,隨著溫度的升高,溶解度增加,氣球的體積也會增大,此時溶解度和氣球體積之間有關系,但這種關系就不是因果關系,而是相關關系。家庭中兒女身高和父親身高之間的關系,子女的身高和父親身高之間有關,這種關系是因果關系,但同一家庭中子女之間身高的關系就不是因果關系,而是相關關系。
第二節(jié) 秩相關
秩相關又稱等級相關,是一種統(tǒng)計方法。研究兩個變量間的線性相關關系的一種統(tǒng)計方法。前面學習的直線相關要求的條件非常嚴格,要求兩個變量服從雙變量正態(tài)分布,但在實際工作中,人體中的許多指標不滿足該條件,所以不能用直線相關,此時可使用秩相關,它是一種非參數(shù)檢驗的方法。秩相關適用于以下幾種情況:
1.不服從雙變量正態(tài)分布而不宜作直線相關分析。
2.總體分布類型未知。(是否服從雙變量正態(tài)分布不知道)
3.原始數(shù)據(jù)用等級表示,即等級資料。
等級相關的方法有很多種,書中介紹的為Spearman秩相關。
一、Spearman秩相關
1.表示符號及其意義
Spearman秩相關是用等級相關系數(shù)表示兩個變量間的直線相關關系的密切程度與相關方向。樣本等級相關系數(shù)——rs;總體等級相關系數(shù)——ρs
ρs =-1,兩個變量完全負相關
-1<ρs<0,兩個變量負相關
ρs =0,兩個變量零相關
0<ρs<1,兩個變量正相關
ρs =1,兩個變量完全正相關
由于很少出現(xiàn)ρs =±1的時候,通常ρs的取值范圍為:(-1,1),當越接近1,表示兩變量的關系越密切;越接近0,表示兩變量的關系越疏遠。
2.秩相關系數(shù)的計算
基本思想:將幾對觀察值Xi、Yi,分別從小到大編秩,用Pi表示Xi的秩次,Qi表示Yi的秩次,每對的Pi和Qi可能相等也可能不等,考慮使用Pi和Qi之差來反映X、Y變量的秩次排列一致性的情況。令:di=Pi-Qi,由于di可以有正有負,不能完全反映其差值的大小,故。。在n一定時,當每對Xi、Yi對應的秩次完全相等即Pi=Qi時,Xi、Yi完全正相關,此時;而當每對Xi、Yi對應的秩次完全相反時,Xi、Yi完全負相關,此時達最大值,所以:從0到其最大值的范圍內(nèi)的變化,反映了X、Y變量的相關程度。
為了和積差相關系數(shù)r表示相關程度和方向的形式一致,統(tǒng)計學及推導出了一個公式,即rs的計算公式:
3.秩相關系數(shù)的假設檢驗
計算出的是樣本等級相關系數(shù),所以需要對總體等級相關系數(shù)進行假設檢驗。假設檢驗的方法有兩種:
1)當n≤50時,可以通過查表法進行檢驗。rs<界值,P>α;rs>界值,P<α
2)當n>50時,使用下面的公式計算統(tǒng)計量t,然后查t界值表確定P值。
4.例題
P151例9-8
1)編秩:分別對X、Y分別編秩,編秩的原則:①兩個變量要分別從小到大編秩;②遇到觀察值相同的一定要求平均秩次
2)計算每對觀察的秩次之差:di=Pi-Qi
3)計算秩相關系數(shù)rs:
4)假設檢驗:
1.計算公式
當相同秩次較多時求出的rs和ρs的偏差較大,故而需要進行校正求rs’
其中,tj——X(或Y)中第j個相同秩次的個數(shù)
2.例題
P167 習題3
3.簡便算法
此種方法無論有無相同的秩次均可使用,計算公式:
其本質(zhì)就是使用秩次代替原變量值作積差相關計算。