用秩號代替原始數(shù)據(jù)后,所得某些秩號之和,稱為秩和,用秩和進(jìn)行假設(shè)檢驗(yàn)即為秩和檢驗(yàn)。其檢驗(yàn)假設(shè)在兩組比較(成對或不成對)時(shí),H0:F(X1)=F(X2),即兩總體的分布函數(shù)相等,備擇假設(shè)H1:F(X1)≠F(X2)。本法由于部份地考慮了數(shù)據(jù)的大小,故檢驗(yàn)效力較符號檢驗(yàn)大大提高。至于其方法、步驟,不論是查表法或計(jì)算法、也都相當(dāng)簡便,現(xiàn)舉例說明如下。
此法由Wilcoxon氏首次提出,故又稱Wilcoxon氏法。
處理時(shí)可用查表法或計(jì)算法,今以例10.3分別說明如下。
查表法步驟:
1.排隊(duì),將差數(shù)按絕對值從小至大排列并標(biāo)明原來的正負(fù)號,見表10.3第(5)欄,排隊(duì)后與原豚鼠號已無對應(yīng)關(guān)系。
2.編秩號,成對資料編秩號時(shí)較為復(fù)雜,要注意三點(diǎn):
(1)按差數(shù)的絕對值自小至大排秩號,但排好后秩號要保持原差數(shù)的正負(fù)號;
(2)差數(shù)絕對值相等時(shí),要以平均秩號表示,如表10.3中差數(shù)絕對值為4者共三人,其秩號依次應(yīng)為2、3、4,現(xiàn)皆取平均秩號3;
(3)差數(shù)為0時(shí),其秩號要分為正、負(fù)各半,若有一個(gè)0,因其絕對值最小,故秩號為1,分為0.5與-0.5,若有兩個(gè)0,則第二個(gè)0的秩號為2,分為1與-1等等。
3.求秩號之和即將正、負(fù)秩號分別相加,本例得正秩號之和為68,負(fù)秩號之和為10,正負(fù)秩號絕對值之和應(yīng)等于1/2n(n+1),可用以核對,如本例68+10=12/1(12+1)=78,證明秩號計(jì)算正確。
4.以較小一個(gè)秩號之和(R),查附表12進(jìn)行判斷,該表左側(cè)為對子數(shù),表身內(nèi)部是較小秩號和,與上端縱標(biāo)目之概率0.05,0.01相對應(yīng),其判斷標(biāo)準(zhǔn)是
R>R0.05時(shí)P>0.05
R0.05≥R>R0.01時(shí)0.05≥P>0.01
P≤R0.01時(shí) P≤0.01
例10.3 請以表10.1資料用秩和檢驗(yàn)處理之。
表10.3 豚鼠給藥前后灌流滴數(shù)及其秩號
豚鼠號 (1) | 每分鐘灌流滴數(shù) | 按差數(shù)絕對值排隊(duì) (5) | 秩號 | |||
用藥前 (2) | 用藥后 (3) | 差數(shù) (4) | 正 (6) | 負(fù) (7) | ||
1 | 30 | 46 | 16 | -2 | 1 | |
2 | 38 | 50 | 12 | -4 | 3 | |
3 | 48 | 52 | 4 | 4 | 3 | |
4 | 48 | 52 | 4 | 4 | 3 | |
5 | 60 | 58 | -2 | -8 | 6 | |
6 | 46 | 64 | 18 | 8 | 6 | |
7 | 26 | 56 | 30 | 8 | 6 | |
8 | 58 | 54 | -4 | 10 | 8 | |
9 | 46 | 54 | 8 | 12 | 9 | |
10 | 48 | 58 | 10 | 16 | 10 | |
11 | 44 | 36 | -8 | 18 | 11 | |
12 | 46 | 54 | 8 | 30 | 12 |
68 R=10
將表中10.1中用藥前后的數(shù)據(jù)求出差數(shù),并按差數(shù)絕對值排隊(duì),結(jié)果見表10.3第(5)欄。再編秩號,為計(jì)算方便,正、負(fù)秩號分列兩欄,見表10.3第(6)、(7)欄。
上例,n=12,∣R∣=10,查附表12得
R0.05=14R0.01=7
今R0.05>R>R0.01,故0.05>P>0.01,在概率0.05水平上拒絕H0,接受H1,即用藥前后的相差是顯著的,給藥后每分鐘灌流滴數(shù)比用藥前增多了。
附表12中只列有n≤25時(shí)的臨界值。當(dāng)n值較大時(shí)亦可采用計(jì)算法。
計(jì)算法步驟:
在計(jì)算法時(shí),對差數(shù)的排隊(duì),編秩號及求秩號之和同查表法,不同的是求得秩號之和以后的算,所用公式是:
u0.05=1.96u0.01=2.58 (10.5)
式中n為原始資料中數(shù)據(jù)的對子數(shù),R為正秩號之和或負(fù)秩號之和,為計(jì)算方便,通常取絕對值較小的秩號之和為r 。
本例,n=12,R=-10,代入得:
U0.05<U<0.01,故0.05>P>0.01,在α=0.05水準(zhǔn)上拒絕H0,接受H1,結(jié)論與查表法相同。
據(jù)研究,當(dāng)n大于10時(shí),上式算得的u近似正態(tài)分布,故計(jì)算法只用于n值較大時(shí)。
因本例資料接近正態(tài)分布,故曾用t檢驗(yàn)的個(gè)別比較方法處理過,結(jié)果是:t=2.653 0.05>P>0.01,與秩和檢驗(yàn)結(jié)論相同,但與符號檢驗(yàn)結(jié)論不同(χ2=2.083,P>0.05),說明符號檢驗(yàn)的檢驗(yàn)效率比秩和與t檢驗(yàn)都要低,比較粗糙,而秩和檢驗(yàn)的效率與t檢驗(yàn)較接近。
此法又稱為wilcoxon氏兩樣本法。
處理時(shí)也可用查表法或計(jì)算法,今以例10.4分別說明之。
查表法步驟:
1.各自排隊(duì),統(tǒng)一編秩號,即將兩組數(shù)據(jù)分別從小到大排列,但編秩號時(shí)要兩組統(tǒng)一進(jìn)行,凡分屬于兩組的相等數(shù)據(jù)用平均秩號,如本例0.042共三個(gè),取平均序號皆為8。
2.令較小樣本秩號之和為r ,例數(shù)為n1。
3.計(jì)算R',公式為:
R'=n1(n1+n2+1)-r (10.6)
R'是同一個(gè)樣本資料,當(dāng)秩號倒排(即由大至小)時(shí)較小樣本秩號之和。
4.以R和R'兩秩號之和中較小者與附表13中R的臨界值比較,以作出判斷,其標(biāo)準(zhǔn)仍是:
R>R0.05時(shí) P>0.05
R0.05≥R>R0.01時(shí) 0.05≥P>0.01
P≤R0.01時(shí) P≤0.01
例10.4 請以表10.2資料用本法處理之。
表10.4 九名健康人與八名鉛作業(yè)工人的尿鉛值(mg/L)
健康人 | 秩號 | 鉛作業(yè)工人 | 秩號 |
0.001 | 1 | 0.042 | 8 |
0.002 | 2 | 0.042 | 8 |
0.014 | 3 | 0.048 | 10 |
0.020 | 4 | 0.050 | 11 |
0.032 | 5 | 0.082 | 14 |
0.032 | 6 | 0.086 | 15 |
0.042 | 8 | 0.092 | 16 |
0.054 | 12 | 0.098 | 17 |
0.064 | 13 | ||
n2=9 | 54 | n1=8 | R=99 |
先將本表10.2中兩組數(shù)據(jù)各自排隊(duì)并統(tǒng)一編秩號,結(jié)果見表10.4。
較小樣本為鉛作業(yè)工人組,n1=8,R=99,代入式(10.6)
R'=8(8+9+1)-99=45
R與R'兩者中以R'較小,故以P'值與附表13數(shù)值比較,得R0.05=51,R0.01=45;今R'=R0.01,故P=0.01,在α=0.05水平上拒絕H0,接受H1,差別顯著,故鉛作業(yè)工人尿鉛值比健康人高。
計(jì)算法步驟:
兩組資料比較時(shí),也可用計(jì)算法。用計(jì)算法時(shí),對兩組數(shù)據(jù)各自排隊(duì)、統(tǒng)一編秩號同查表法,不同的是求得秩號之和以后計(jì)算,公式是:
u0.05=1.96u0.01=2.58 (10.7)
為便于計(jì)算和前后符號一致,n1作為較小樣本例數(shù),R為較小樣本的秩和,n2則為較大樣本的例數(shù)。
本例n1=8,R=99,n2=9代入公式得:
今∣u∣>u0.01,故P<0.01,在α=0.01水準(zhǔn)上拒絕H0接受H1,其結(jié)論同查表法,
據(jù)研究,當(dāng)n1、n2都大于8時(shí),算得的u近于正態(tài)分布,若例數(shù)太少,則以查表法更為精確。
本例如用t檢驗(yàn)的團(tuán)體比較處理,則t=3.169,P<0.01,二者結(jié)論一致,但與符號檢驗(yàn)結(jié)論不同(χ2=2.930,P>0.05)同樣說明符號檢驗(yàn)較粗糙,檢驗(yàn)效率低,而秩和檢驗(yàn)與t檢驗(yàn)的結(jié)論較近。
等級資料又稱為半計(jì)量資料,當(dāng)兩組等級資料比較時(shí),用秩和檢驗(yàn)來比較其相差是否顯著比用χ2檢驗(yàn)要恰當(dāng)。兩組等級資料,通常例數(shù)都較多,故一般都用計(jì)算法,其步驟與兩組資料的秩和檢驗(yàn)相似,不同的是要求各等級的平均秩號,為此,先要求得各等級的秩號范圍。今舉例10.5說明之。
1.求各等級的平均秩號。為此,先要求出各等級的秩號范圍,如等級“-”共18+8=26例,共秩號范圍自1~26。要注意的是各等級的秩號范圍必須緊相聯(lián)接。最后一組秩號范圍的上限一定等于兩組例數(shù)之和。求得各等級秩號范圍后,再求其下限和上限的平均,即可算得平均秩號,如等級“一”的平均秩號為(1+26)/2=13.5。余類推。
2.求出R及其n1,為計(jì)算方便,把例數(shù)少的正常人組的秩號之和作為R其例數(shù)為n1得R=308,n1=20,n1=32
3.代入式(10.7)得u值,即可作結(jié)論。
例10.5,今有20名正常人和32名鉛作業(yè)工人尿棕色素定性檢查結(jié)果如下表10.5,試問其相差是否顯著?
表10.5 20名正常人和32名鉛作業(yè)工人尿棕色素定性檢查結(jié)果
尿棕色素定性結(jié)果 | 正常人 | 鉛作業(yè)工人 | 合計(jì) | 秩號范圍 | 平均秩號 | 例數(shù)較小組的秩和 |
- | 18 | 8 | 26 | 1—26 | 13.5 | 243 |
+ | 2 | 10 | 12 | 27—38 | 32.5 | 65 |
++ | — | 7 | 7 | 39—45 | 42.0 | — |
+++ | — | 3 | 3 | 46—48 | 47.0 | — |
++++ | — | 4 | 4 | 49—52 | 50.5 | — |
n1=20 n2=32 R=308
代入式(10.7)
u0.01=2.58,今u>u0.01,故P<0.01,在α=0.01水準(zhǔn)上拒絕H0,接受H1。兩組相差顯著,鉛作業(yè)工人尿棕色素比正常人為高。
多組資料的比較也是從排秩號開始,但不是直接用秩和進(jìn)行檢驗(yàn),有的書籍稱之為秩檢驗(yàn)(rank test),以示與秩和檢驗(yàn)有別,其檢驗(yàn)假設(shè)也較復(fù)雜:在處理完全隨機(jī)設(shè)計(jì)的資料時(shí),H0:F(X1)=F(X2)=F(X3)=……,即比較的各樣本所對應(yīng)的各總體的分布函數(shù)相等,H1:各總體的分布函數(shù)不相等或不全相等;在處理隨機(jī)單位組設(shè)計(jì)的資料時(shí),H0:P(χij=r)=1/n,即內(nèi)組各秩號r之概率相等,都是1/n(r=1,2,……,n)而H1為:P=(χij=r)≠1/n。
因不同實(shí)驗(yàn)設(shè)計(jì)所得資料的處理也有別,故下面分別舉例說明之。
(一)完gydjdsj.org.cn/yishi/全隨機(jī)設(shè)計(jì)所得資料的比較
用的方法是單因素多組秩檢驗(yàn),稱為Kruskal-Wallis氏法,或H檢驗(yàn)。其計(jì)算步驟如下。
1.各自排隊(duì),統(tǒng)一編秩號。即將各組數(shù)據(jù)在本組內(nèi)從小到大排隊(duì),見表10.6各含量欄,再將各組數(shù)值一起考慮編出統(tǒng)一秩號,見表10.6各“秩號”欄,分屬不同組的相同數(shù)值用平均秩號;
2.求各組秩號之和R1以及各組數(shù)n1:
3.代入下式計(jì)算H值:
(10.8)
式中N為各組例數(shù)之和,Ri和ni為各組的秩號之和以及例數(shù):
4.查表作結(jié)論
當(dāng)比較的組數(shù)多于三組,或組數(shù)雖只有三組但每組例數(shù)大于5時(shí),H值的分布近于自由度等于組數(shù)-1的χ2分布,故可用對應(yīng)的χ2值作界值。當(dāng)三組比較時(shí)每組例數(shù)均不超過5時(shí),H值與χ2值有較大偏離,此時(shí)可查附表14,直接查得H0.05和H0.01。
例10.6 雄鼠20只隨機(jī)分為四組,第1、2組在皮膚上涂用放射性錫(Sn113)標(biāo)記的三乙基硫酸錫,涂后將皮膚暴露于空氣中;第3、4組涂藥后用密閉小玻璃管套使皮膚與外界空氣隔開,三小時(shí)后殺死,測肝中放射物,結(jié)果如表10.6,試比較各組含量間有無顯著相差?
表10.6 白鼠皮膚涂藥后,肝中放射性Sn113的含量
涂干藥后敞開 | 涂濕藥后敞開 | 涂干藥后密閉 | 涂濕藥后密閉 | ||||
含量 | 秩號 | 含量 | 秩號 | 含量 | 秩號 | 含量 | 秩號 |
0.00 | 1 | 1.82 | 11 | 0.66 | 5 | 3.67 | 14 |
0.42 | 2.5 | 2.79 | 12 | 0.71 | 6 | 4.46 | 16 |
0.42 | 2.5 | 3.07 | 13 | 0.75 | 7 | 4.51 | 18 |
0.59 | 4 | 4.19 | 15 | 0.83 | 8 | 5.07 | 19 |
0.97 | 9 | 4.47 | 17 | 1.49 | 10 | 6.02 | 20 |
Ri | R1=19 | R2=68 | R3=36 | R4=87 | |||
ni | n1=5 | n2=5 | n3=5 | n4=5 |
各組資料各自排隊(duì),統(tǒng)一編秩號,以及求各組的秩號之和Ri和例數(shù)ni見表10.6
代入gydjdsj.org.cn/shiti/式(10.8)得
本例組數(shù)為4(>3),查χ2值表,ν=4-1=3,得χ20.05,3=7.81,χ20.01,3=11.34,今H>χ20.01,3,故P<0.01,在α=0.01水準(zhǔn)上拒絕H0,接受H1,即各組肝中放射性Sn113含量差別顯著。
(二)隨機(jī)單位組設(shè)計(jì)所得資料的比較
用的方法是雙因素多組秩檢驗(yàn),即Friedman氏法。
處理這種資料時(shí)可分成兩步,對兩個(gè)因素分別進(jìn)行檢驗(yàn),F(xiàn)用例10.7說明其計(jì)算步驟:
先比較四種防護(hù)服對脈搏的影響
1.將穿四種防護(hù)服的每一受試者的脈搏數(shù)從小到大編秩號,當(dāng)數(shù)值相等時(shí)用平均秩號,見表10.7各秩號欄。
2.求各防護(hù)服組秩號之和Ri
3.代入式10.9求H值
(10.9)
式中t(treatment)為處理組數(shù),b(block)為單位組數(shù)。
4.查表作結(jié)論
當(dāng)t>4或t=4且b>5或t=3且b>9時(shí),H值的分布近于自由度ν=t-1時(shí)的χ2分布,故可查相應(yīng)的χ2值與H值比較作出判斷:如t、b不能滿足上述條件,則所算得的H值與χ2分布有較大偏離,需查附表15作判斷。
例10.7 受試者5人,每人穿四種不同的防護(hù)服時(shí)的脈搏數(shù)如表10.7,問四種防護(hù)服對脈搏的影響有無顯著差別?又五個(gè)受試者的脈搏數(shù)有無顯著差別?
表10.7 比較穿四種防護(hù)服時(shí)的脈搏數(shù)(次/分)
受試者 | 防護(hù)服A | 防護(hù)服B | 防護(hù)服C | 防護(hù)服D | ||||
編 號 | 脈搏 | 秩號 | 脈搏 | 秩號 | 秩號 | 秩號 | 脈搏 | 秩號 |
1 | 144.4 | 4 | 143.0 | 3 | 133.4 | 1 | 142.8 | 2 |
2 | 116.2 | 2 | 119.2 | 4 | 118.0 | 3 | 110.8 | 1 |
3 | 105.8 | 1 | 114.8 | 3 | 113.2 | 2 | 115.8 | 4 |
4 | 98.0 | 1 | 120.0 | 3 | 104.0 | 2 | 132.8 | 4 |
5 | 103.8 | 2 | 110.6 | 4 | 109.8 | 3 | 100.6 | 1 |
秩秩號和Ri | 10 | 17 | 11 | 12 |
t=4b=5
排隊(duì)、編秩號、求各比較組的Ri見表10.7所示。
將表10.7中各數(shù)代入式10.9,得
本例t=4,b=5查附表15,得H0.05=7.80,今H>H0.05,故P>0.05,在α=0.05水準(zhǔn)上接受H0,無顯著差別,故四種防護(hù)服對脈搏的影響無顯著差別。
再比較五名受試者的脈搏數(shù):
將數(shù)據(jù)列出(同表10.7),但秩號是按每種防護(hù)服中受試者脈搏的數(shù)值從小到大編定,然后求出各受試者秩號之和R1,詳細(xì)見表10.8
表10.8 比較五名受試者的脈搏數(shù)
受試者 | 防護(hù)服A | 防護(hù)服B | 防護(hù)服C | 防護(hù)服D | Ri | ||||
編 號 | 脈搏 | 秩號 | 脈搏 | 秩號 | 脈搏 | 秩號 | 脈搏 | 秩號 | |
1 | 144.4 | 5 | 143.0 | 5 | 133.4 | 5 | 142.8 | 5 | 20 |
2 | 116.2 | 4 | 119.2 | 3 | 118.0 | 4 | 110.8 | 2 | 13 |
3 | 105.8 | 3 | 114.8 | 2 | 113.2 | 3 | 115.8 | 3 | 11 |
4 | 98.0 | 1 | 120.0 | 4 | 104.0 | 1 | 132.8 | 4 | 10 |
5 | 103.8 | 2 | 110.6 | 1 | 109.8 | 2 | 100.6 | 1 | 6 |
t=5b=4
將表10.8 所得各數(shù)據(jù)代入式10.9得
此處t>4,故查ν=5-1=4時(shí)的χ2值表,得:χ20.05,4=9.49,χ20.01,4=13.28,今χ20.05,4<H<X20.01,4,故0.05>P>0.01,在α=0.05水準(zhǔn)上拒絕H0,接受H1,差別顯著;即五名受試者脈搏數(shù)相差顯著,1號受試者最高,5號受試者最低。
當(dāng)多組間的差別顯著時(shí),則需進(jìn)一步判斷那些組之間的差別有顯著性,這個(gè)問題的解決方法與第八章第二節(jié)中的多個(gè)均數(shù)間的兩兩比較很相似,在例10.6四個(gè)實(shí)驗(yàn)組涂放射性錫的例子中,結(jié)果為H>χ20.01,3,P<0.01,現(xiàn)以此為例,進(jìn)一步作各組兩兩間比較,步驟如下:
1.將各組秩和從大到小依次排隊(duì),并求得兩兩間的相差,見表10.9
2.計(jì)算標(biāo)準(zhǔn)誤,計(jì)算公式是:
(10.10)
式中σ為任意兩個(gè)秩和之差的標(biāo)準(zhǔn)誤,n為各組例數(shù),a為處理數(shù),此式要求各組例數(shù)相等,
3.查q值表定界限作結(jié)論
仍查方差分析時(shí)用的q值表,v→∝
各q值須與處理數(shù)相同的標(biāo)準(zhǔn)誤相乘,如處理數(shù)為2的q值要乘以處理數(shù)為2時(shí)的標(biāo)準(zhǔn)誤,2.77×6.77=18.75,3.64×6.77=24.64等,余類推。
例10.6資料兩兩間比較如下:
表10.9 每兩組秩和之間的相差及其顯著性
組別 | 秩和Ri | Ri—19 | Ri—36 | Ri—68 |
涂濕藥后密閉 | 87 | 68** | 51** | 19* |
涂濕藥后敞開 | 68 | 49** | 32** | |
涂干藥后密閉 | 36 | 17 | ||
涂干藥后敞開 | 19 |
計(jì)算標(biāo)準(zhǔn)誤:n=5,用式10.10
查q值表,得:
處理數(shù) | 2 | 3 | 4 |
q0.05,∞ | 2.77 | 3.31 | 3.63 |
q0.01,∞ | 3.64 | 4.12 | 4.40 |
q0.05,∞σ | 18.75 | 33.10 | 48.02 |
q0.01,∞σ | 24.64 | 41.20 | 58.21 |
兩兩比較后的結(jié)論見表10.9所示,結(jié)合起來看,結(jié)論是:涂濕藥的比涂干藥肝中放射性Sn113含量要高,涂濕藥中,密閉的比敞開的含量高。