參數法中介紹的直線相關只適用于正態(tài)雙變量資料,但實際資料有時不能滿足這些條件。如兩事物有相關,但其觀測結果不是計量資料而是等級資料,此時即可用秩相關來表達和分析。
本節(jié)介紹常用的Spearman秩相關。今以例10.8介紹其一般計算步驟:
1.將資料列成便于計算用的表,見表10.10,為便于編秩號,在列表時可按資料中一個變量的原始數據由小到大排隊,但另一變量中各相應數值必須隨成對關系變動,不能打亂。
2.兩變量各自從小到大編秩號,同一變量數值相等時求平均秩號,見表10.10中的“秩號”欄。
3.求各對變量值秩號之差數d,再求∑d2。
4.代入式10.11,計算秩相關系數ra(又稱Spearman秩相關系數)
(10.11)
式中n為變量值的對子數。算得的r8與直線相關系數的意義相同,其范圍在-1~+1之間,也分為正相關和負相關。
5.查表作結論
當n>50時,秩相關系數顯gydjdsj.org.cn/job/著性的界值與直線相關系數相近似,故可根據ν=n-2查附表11來作判斷:當n≤50時,則查閱附表16。
例10.8 通過普查得到七個地區(qū)居民中單純性甲狀腺腫患者百分比與當地食物、水中的含磺量如表10.10右側第一、第三兩欄所列。問該兩事物是否顯著相關?
表10.10 單純性甲狀腺腫患者百分數
與當地食物水中含碘量的秩相關分析
含 碘 量 | 患者百分數 | 秩號差d | d2 | ||
X1 | 秩號 | X2 | 秩號 | ||
71 | 1gydjdsj.org.cn/yishi/ | 16.9 | 7 | -6 | 36 |
81 | 2 | 4.4 | 6 | -4 | 16 |
126 | 3 | 2.5 | 5 | -2 | 4 |
154 | 4 | 0.8 | 3 | 1 | 1 |
155 | 5 | 1.1 | 4 | 1 | 1 |
178 | 6 | 0.6 | 2 | 4 | 16 |
201 | 7 | 0.2 | 1 | 6 | 36 |
n=7∑d2=110
將n,∑d2代入式10.11得:
本例n=7,查例表16,得r80.05,7=0.786,r8 0.01,7=0.929,今∣r8∣>r80.01,7故P<0.01,α=0.01水準上拒絕H0,接受H1,故某地居民單純性甲狀腺腫患者百分數與當地食物、水中含碘量之間呈顯著的負相關。