前面幾章介紹了常用的統(tǒng)計(jì)方法。在實(shí)驗(yàn)工作中,必須根據(jù)研究目的與資料性質(zhì),并結(jié)合專(zhuān)業(yè)知識(shí),恰當(dāng)?shù)剡\(yùn)用統(tǒng)計(jì)方法,才能做出正確的、符合實(shí)際的結(jié)論。例如:某院為探明胃液及胃組織的瘤胚抗原(Carcino embryonic Antigen CEA)在胃癌診斷、癌前病變篩選及隨訪方面的意義,胃液、胃組織CEA含量的相互關(guān)系,以及CEA與胃組織病理學(xué)改變的關(guān)系,測(cè)定了各種胃病患者的胃液、胃組織及血清中CEA含量,并用同樣方法測(cè)定了部分正常人胃液CEA含量作為對(duì)照。表1、表2是測(cè)量結(jié)果的一部分。下面我們簡(jiǎn)要介紹統(tǒng)計(jì)處理的一般程序及統(tǒng)計(jì)方法的選擇。
表1 三組不同人員胃液癌胚抗原(CEA)測(cè)定結(jié)果
組別 |
胃液CEA含量(ng/ml) |
定性結(jié)果 | ||||||
陽(yáng)性 |
陰性 | |||||||
正常人組 |
20.4 |
30.2 |
210.4 |
365.0 |
56.8 |
37.8 |
2 |
30 |
265.3 |
175.0 |
169.8 |
256.4 |
254.0 |
262.3 | |||
170.5 |
360.0 |
78.4 |
86.4 |
128.0 |
24.1 | |||
28.5 |
108.5 |
472.5 |
158.6 |
238.7 |
253.6 | |||
57.0 |
189.6 |
59.3 |
259.3 |
380.2 |
210.5 | |||
64.6 |
87.3 |
|||||||
萎縮性胃炎組 |
281.0 |
377.1 |
230.0 |
537.9 |
248.7 |
571.4 |
21 |
14 |
766.2 |
495.o |
87.3 |
389.8 |
423.9 |
577.3 | |||
66.8 |
521.3 |
327.8 |
421.4 |
149.7 |
47.5 | |||
425.7 |
270.8 |
378.5 |
228.0 |
538.4 |
245.6 | |||
584.1 |
648.8 |
485.6 |
110.8 |
398.7 |
452.6 | |||
587.7 |
86.8 |
532.1 |
311.6 |
442.2 |
||||
胃癌組 |
480.0 |
488.9 |
350.7 |
652.8 |
1400.0 |
850.0 |
24 |
4 |
725.6 |
590.0 |
765.0 |
1200.0 |
231.2 |
485.3 | |||
600.0 |
1380.0 |
438.5 |
652.4 |
432.8 |
296.1 | |||
608.8 |
688.5 |
630.5 |
750.0 |
815.0 |
664.0 | |||
348.6 |
550.0 |
640.0 |
464.8 |
表2 10例胃癌患者胃液CEA含量與胃組織腫瘤CEA含量的關(guān)系
病例號(hào) |
胃液CEA含量 |
胃組織腫瘤CEA含量 |
(ng/ml) |
(cm2·ng/mg) | |
1 |
432.8 |
6.6 |
2 |
488.9 |
8.2 |
3 |
600.0 |
15.7 |
4 |
608.4 |
14.8 |
5 |
640.2 |
16.2 |
6 |
750.0 |
15.8 |
7 |
815.0 |
18.2 |
8 |
1200.0 |
20.0 |
9 |
1380.0 |
20.0 |
10 |
1400.0 |
20.0 |
一、了解研究目的、資料搜集情況、數(shù)據(jù)意義、整理分析要解決什么問(wèn)題
無(wú)論動(dòng)物實(shí)驗(yàn)、臨床觀察或現(xiàn)場(chǎng)調(diào)查,應(yīng)當(dāng)目的明確,周密設(shè)計(jì),精心操作,認(rèn)真記錄,務(wù)必使獲得的原始資料完整、準(zhǔn)確、真實(shí)、可靠。如果是替別人整理分析資料,在接受任務(wù)時(shí),也首先必須把這些問(wèn)題搞清楚,才能做出正確的、符合要求的分析。若發(fā)現(xiàn)某些資料不全或有可疑數(shù)值,應(yīng)及時(shí)查明原因,加以改進(jìn),必要時(shí)補(bǔ)做實(shí)驗(yàn)或重新調(diào)查。本例研究目的已如上述。所觀察的病人診斷都是明確的,標(biāo)本采集,數(shù)據(jù)測(cè)定都是在實(shí)驗(yàn)室進(jìn)行,儀器性能穩(wěn)定,操作者技術(shù)熟練,資料是可靠的。統(tǒng)計(jì)分析的主要目的在于比較正常人、良性胃病患者、胃癌病人的胃液CEA含量有無(wú)顯著差別,從而考慮該項(xiàng)指標(biāo)能否作為胃癌早期診斷的一個(gè)輔助指標(biāo)和隨訪的一個(gè)手段。此外,對(duì)胃液與胃組織腫瘤CEA含量作相關(guān)分析,找出它們間有無(wú)直線關(guān)系。
二、區(qū)分資料類(lèi)型
這就是要分清所得到的資料哪部分是計(jì)量資料,哪部分是計(jì)數(shù)資料,爾后分別采用不同的統(tǒng)計(jì)分析方法來(lái)處理。本例表1左半部分是胃液中CEA含量,屬計(jì)量資料;右半部分是以95%正常值范圍單側(cè)上限值370(ng/ml)為界限,凡≥370(ng/ml)者為陽(yáng)性,<370(ng/ml)者為陰性,然后清點(diǎn)每組陽(yáng)性、陰性例數(shù),這是計(jì)數(shù)資料。表2是對(duì)確診的10例胃癌患者,既測(cè)定了胃液中CEA含量,又測(cè)定并計(jì)算出胃組織腫瘤CEA含量(根據(jù)前人經(jīng)驗(yàn)用腫瘤面積與胃粘膜中CEA含量相乘,cm2·ng/ml)。顯然,這是兩個(gè)變量的問(wèn)題。為方便敘述。我們按資料類(lèi)型依次分析。
三、計(jì)量資料的處理
先要了解樣本含量與頻數(shù)分布情況。因?yàn)榇髽颖净蛐颖、正態(tài)分布或偏態(tài)分布,統(tǒng)計(jì)方法的選擇與統(tǒng)計(jì)指標(biāo)的計(jì)算都有所不同。本例三組例數(shù)都在30左右,各組觀察值分布比較均勻、對(duì)稱(chēng),必要時(shí)可作正態(tài)性檢驗(yàn),故可按小樣本、正態(tài)分布處理。
(一)計(jì)算平均數(shù)與標(biāo)準(zhǔn)差,以說(shuō)明各觀察值的集中趨勢(shì)與變異情形。若觀察值呈偏態(tài)分布,則應(yīng)計(jì)算中位數(shù);若系對(duì)數(shù)正態(tài)分布或等比資料,則計(jì)算幾何均數(shù)。本例見(jiàn)表3第(3)第(4)欄。
(二)作為正常對(duì)照,用估計(jì)正常值范圍的方法計(jì)算正常人組單側(cè)上限95%正常值。宜用正態(tài)分布法;172.47+1.645×119.50=369.05,故以370(ng/ml)作為單側(cè)上限值。但由于例數(shù)較少,穩(wěn)定性受到影響,因而還不能作為正常值范圍來(lái)推廣應(yīng)用。
。ㄈ)計(jì)算標(biāo)準(zhǔn)誤,以說(shuō)明樣本均數(shù)的散布情形,描述抽樣誤差的大小。必要時(shí),用平均數(shù)與標(biāo)準(zhǔn)誤結(jié)合,計(jì)算可信區(qū)間,以估計(jì)總體均數(shù)所在范圍。見(jiàn)表3第(5)、第(6)欄。
表3 各組平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤及95%可信區(qū)間
組別 |
N |
X |
S |
Sχ |
95%可信區(qū)間 |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
正常人組 |
32 |
172.47 |
119.50 |
21.12 |
129.38<μ<215.55 |
萎縮性胃炎組 |
35 |
378.52 |
182.33 |
30.82 |
315.89<μ<441.15 |
胃癌組 |
28 |
649.25 |
285.66 |
53.98 |
538.48<μ<760.02 |
(四)均數(shù)之間的比較:自身對(duì)照或配對(duì)設(shè)計(jì)資料(即成對(duì)計(jì)量資料)用個(gè)別比較t檢驗(yàn),兩組均數(shù)比較用團(tuán)體比較t檢驗(yàn),三組以上均數(shù)比較用方差分析。在方差分析前應(yīng)作方差齊性檢驗(yàn),若方差不齊,則應(yīng)用秩和檢驗(yàn),或經(jīng)變量代換后再作方差分析。本例三組資料經(jīng)代入式(8.5)與式(8.6)求得校正χ2值為21.04,χ2>χ20.01,2,P<0.01,三組方差在α=0.01的水準(zhǔn)上相差顯著,故不宜用方差分析。所以我們用秩和檢驗(yàn),經(jīng)代入式(10.8)得H=50.321,H>χ20.01,2,P<0.01,在α=0.01的水準(zhǔn)上相差顯著。再用式(10.7)作兩組之間的比較,結(jié)果正常人組與萎縮性胃炎組之間u=4.475,萎縮性胃炎組與胃癌組之間u=4.150,正常人組與胃癌組之間u=6.253,均在α=0.01的水準(zhǔn)上相差顯著,正常人組最低,萎縮性胃炎次之,胃癌組最高。
四、計(jì)數(shù)資料的處理
。ㄒ)計(jì)算有關(guān)的相對(duì)數(shù),常用的是率與百分比。如本例,可求出三組的陽(yáng)性率,見(jiàn)表4。
表4 三組胃液CEA陽(yáng)性率(%)
組 別 |
檢查例數(shù) |
陽(yáng)性例數(shù) |
陰性例數(shù) |
陽(yáng)性率(%) |
正常人組 |
32 |
2 |
30 |
6.25 |
萎縮性胃炎組 |
35 |
21 |
14 |
60.00 |
胃 癌 組 |
28 |
24 |
4 |
85.71 |
合 計(jì) |
95 |
47 |
48 |
49.47 |
(二)必要時(shí),也可以計(jì)算率的標(biāo)準(zhǔn)誤,以描述率的抽樣誤差大;然后根據(jù)樣本大小,分別用計(jì)算法或查表法求得率的可信區(qū)間,以估計(jì)總體率所在范圍。
。ㄈ)幾個(gè)率之間的比較,常用χ2檢驗(yàn)。僅有兩組的用四格表計(jì)算(當(dāng)樣本較大時(shí)也可用u檢驗(yàn)),三組以上的用2×K表計(jì)算。本例共有三組,每組分為陽(yáng)性、陰性?xún)煞N類(lèi)型,所以應(yīng)用2×K表專(zhuān)用公式求χ2值。結(jié)果χ2=40.18,χ2>χ20.01,2,P<0.01,說(shuō)明三組陽(yáng)性率在α=0.01的水準(zhǔn)上相差顯著。再用四格表進(jìn)行檢驗(yàn),結(jié)果正常人組與萎縮性胃炎組之間得χ2=19.10,χ2>χ20.01,1,P<0.01;正常人組與胃癌組之間得χ2=25.53,χ2>χ20.01,1,P<0.01。以上均在α=0.01的水準(zhǔn)上相差顯著,而萎縮性胃炎組與胃癌組之間得χ2=3.86,χ2>χ20.05,1,P<0.05,相差顯著。我們?cè)谇懊鎸?duì)三組胃液CEA含量用秩和檢驗(yàn)作兩兩比較,結(jié)果都是在α=0.01的水準(zhǔn)上相差顯著,這說(shuō)明計(jì)量資料獲得信息多些。
五、兩個(gè)變量間直線關(guān)系的分析
如果兩變量的關(guān)系是相互的,分不清自變量與應(yīng)變量,沒(méi)有理由用一個(gè)變量去推算另一個(gè)變量,就只計(jì)算相關(guān)系數(shù),不建立回歸方程。如果兩變量間存在直線關(guān)系,且需要從一個(gè)變量推算另一個(gè)變量時(shí),可再建立回歸方程,必要時(shí)還可以編制用一個(gè)變量估計(jì)另一個(gè)變量的對(duì)照表,本例10名胃癌患者胃液CEA含量與胃組織腫瘤CEA含量屬于兩個(gè)變量的關(guān)系問(wèn)題,先計(jì)算相關(guān)系數(shù),得r=0.818,r>r0.01,8,P<0.01,在α=0.01的水準(zhǔn)上相關(guān)顯著。這說(shuō)明腫瘤越大,胃組織病變?cè)絿?yán)重,胃液中CEA含量就越高,所以,若需要根據(jù)胃液中CEA含量推算病變嚴(yán)重程度,亦可計(jì)算回歸方程。
根據(jù)以上統(tǒng)計(jì)分析,本例可得出如下結(jié)論:①胃癌病人的胃液CEA明顯升高,提示可作為胃癌診斷的一個(gè)輔助指標(biāo),在早期胃癌診斷中可能有一定作用;其含量高低與腫瘤大小及胃組織CEA含量有關(guān)。②胃癌良性病變,胃液CEA含量也增高,提示該項(xiàng)指標(biāo)可作為胃癌前疾病篩選和隨訪的一個(gè)手段。③良性病變與惡性病變胃液CEA含量重疊較多,所以應(yīng)用該項(xiàng)指標(biāo)作良性與惡性病變的鑒別診斷,尚待深入研究。