一、樣本均數(shù)與總體均數(shù)的比較
為了判斷觀察到的一組計(jì)量數(shù)據(jù)是否與其總體均數(shù)接近,兩者的相差系同一總體中樣本與總體之間的誤差,相差不大;還是已超出抽樣誤差的一般允許范圍而存在顯著差別?應(yīng)進(jìn)行假設(shè)檢驗(yàn),下面通過(guò)實(shí)例介紹t檢驗(yàn)的方法步驟。
例7.1 根據(jù)大量調(diào)查得知,健康成年男子脈搏均數(shù)為72次/分,某醫(yī)生在某山區(qū)隨機(jī)抽查健康成年男子25人,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分。根據(jù)這個(gè)資料能否認(rèn)為某山區(qū)健康成年男子的脈搏數(shù)與一般健康成年男子的不同?
在醫(yī)學(xué)領(lǐng)域中有一些公認(rèn)的生理常數(shù)如本例提到的健康成人平均脈搏次數(shù)72次/分,一般可看作為總體均數(shù)μ。已知在總體均數(shù)μ和總體標(biāo)準(zhǔn)差σ已知的情況下可以予測(cè)樣本均數(shù)分布情況,現(xiàn)缺總體標(biāo)準(zhǔn)差,則需用樣本標(biāo)準(zhǔn)差來(lái)估計(jì)它,那么樣本均數(shù)圍繞總體均數(shù)散布的情況服從t分布(尤其當(dāng)樣本含量n較小時(shí),)。t分布的基本公式即6.5。
從式中可知,t是樣本均數(shù)與總體均數(shù)之差(以標(biāo)準(zhǔn)誤為單位),t的絕對(duì)值越大也即X距μ越遠(yuǎn)。在t分布中距μ越遠(yuǎn)的樣本均數(shù)分布得越少(所占百分比小,P值小),后面附表3右上角的示意圖中展示了這種關(guān)系,如欲知各自由度下t值與其相應(yīng)的P值可查附表3。
下面回答本例提出的問(wèn)題而進(jìn)行假設(shè)檢驗(yàn)。按一般步驟:
(1)提出檢驗(yàn)假設(shè)H0與備擇假設(shè)H1。本例H0為某山區(qū)成年男子的脈搏均數(shù)與一般成年男子的相等,μ=μ0=72次/分;H1為兩者不相等μ≠μ0,即μ大于或小于μ0(這是雙側(cè)檢驗(yàn),如果事先已肯定山區(qū)人的脈搏不可能低于一般人,只檢驗(yàn)它是否高于一般人,則應(yīng)用單側(cè)檢驗(yàn),H1必為μ>μ)。
。2)定顯著性水準(zhǔn)α,并查出臨界t值。α是:若檢驗(yàn)假設(shè)為真但被錯(cuò)誤地拒絕的概率,F(xiàn)令α=0.05,本例自由度ν=n-1=25-1=24、查附表3得t0.05,24=2.064。若從觀察資料中求出的∣t∣值小于此數(shù),我們就接受H0;若等于或大于此值則在α=0.05水準(zhǔn)處拒絕H0而接受H1。
。3)求樣本均數(shù)X、標(biāo)準(zhǔn)差S及標(biāo)準(zhǔn)誤Sχ并進(jìn)而算出檢驗(yàn)統(tǒng)計(jì)量t,F(xiàn)已知X=74.2次/分,S=6.5次/分,只要求出Sχ及t值即可!
。4)下結(jié)論:因∣t∣t0.05,24=2.064,所以檢驗(yàn)假設(shè)H0得以接受,從而認(rèn)為就本資料看,尚不能得出山區(qū)健康成年人的脈搏數(shù)不同于一般人而具有顯著差別的結(jié)論。
二、成對(duì)資料樣本均數(shù)的比較
上面介紹了已知總體均數(shù)時(shí)的顯著性檢驗(yàn)方法,但有時(shí)我們并不知道總體均數(shù),且醫(yī)學(xué)數(shù)據(jù)資料中更為常見(jiàn)的是成對(duì)資料,若一批某病病人治療前有某項(xiàng)測(cè)定記錄,治療后再次測(cè)定以觀察療效,這樣,觀察n例就有n對(duì)數(shù)據(jù),這即是成對(duì)資料(也可對(duì)動(dòng)物做成病理模型進(jìn)行治療實(shí)驗(yàn)以收集類(lèi)似的成對(duì)資料);如果有兩種處理要比較,將每一份標(biāo)本分成兩份各接受一種處理,這樣觀察到的一批數(shù)據(jù)也是成對(duì)資料,醫(yī)學(xué)科研中有時(shí)無(wú)法對(duì)同一批對(duì)象進(jìn)行前后或?qū)?yīng)觀察,而只得將病人(或?qū)嶒?yàn)動(dòng)物)配成對(duì)子,盡量使同對(duì)中的兩者在性別、年齡或其它可能會(huì)影響處理效果的各種條件方面極為相似,然后分別給以一種不同的處理后觀察反應(yīng),這樣獲得的許多對(duì)不可拆散的數(shù)據(jù)同樣是成對(duì)資料。由于成對(duì)資料可控制個(gè)體差異使之較小,故檢驗(yàn)效率是較高的。
關(guān)于成對(duì)資料,每對(duì)數(shù)據(jù)始終相聯(lián)這是它的特點(diǎn),我們可以先初步觀察每對(duì)數(shù)據(jù)的差別情況,進(jìn)一步算出平均相差作為樣本均數(shù),再與假設(shè)的總體均數(shù)比較看相差是否顯著,下面舉實(shí)例說(shuō)明檢驗(yàn)過(guò)程。
表 7.1 豚鼠注入上腺素前后每分鐘灌流滴數(shù)
豚鼠號(hào) | 每分鐘灌流滴數(shù) | ||
用藥前 | 用藥后 | 增加數(shù)d | |
1 | 30 | 46 | 16 |
2 | 38 | 50 | 12 |
3 | 48 | 52 | 4 |
4 | 48 | 52 | 4 |
5 | 60 | 58 | -2 |
6 | 46 | 64 | 18 |
7 | 26 | 56 | 30 |
8 | 58 | 54 | -4 |
9 | 46 | 54 | 8 |
10 | 48 | 58 | 10 |
11 | 44 | 36 | -8 |
12 | 46 | 54 | 8 |
總 計(jì) | — | — | 96 |
例7.2 為了驗(yàn)證腎上腺素有無(wú)降低呼吸道阻力的作用,以豚鼠12只,進(jìn)行支氣管灌流實(shí)驗(yàn),在注入定量腎上腺素前后,測(cè)定每分鐘灌流滴數(shù),結(jié)果見(jiàn)表7.1,問(wèn)用藥后灌流速度有無(wú)顯著增加?
。1)假設(shè)用藥前后灌流滴數(shù)相同,則相差的總體均數(shù)μ為0;即H0:μ=μ0;H1:μ≠μ0。
。2)令顯著性水準(zhǔn)α=0.05,由本例ν=12-1=11查得臨界值t0.05,11=2.201。
(3)求樣本統(tǒng)計(jì)量平均相差數(shù)d、差數(shù)的標(biāo)準(zhǔn)差Sd、標(biāo)準(zhǔn)誤Sd及檢驗(yàn)統(tǒng)計(jì)量t值。
。4)下結(jié)論。今∣t∣t0.05,11,p <0.05,故認(rèn)為檢驗(yàn)假設(shè)μ=μ0難以接受,在α=0.05水準(zhǔn)外拒絕HO而接受H1,相差顯著,注入腎上腺素后每分鐘灌流滴數(shù)比注射前要多。
例7.3 從以往資料發(fā)現(xiàn),慢性支氣管炎病人血中膽堿酯酶活性常常偏高。某校藥理教研室將同性別同年齡的病人與健康人配成8對(duì),測(cè)量該值加以比較,資料如下。問(wèn)可否通過(guò)這一資料得出較為明確的結(jié)論?
表7.2 慢性氣管炎病人與健康人血液膽堿酯酶活性測(cè)定(μM/ml)
對(duì)子序號(hào) | 病人組,X1 | 健康人組,X2 | 差數(shù) D=X1-X2 |
1 | 3.28 | 2.36 | 0.92 |
2 | 2.60 | 2.40 | 0.20 |
3 | 3.32 | 2.40 | 0.92 |
4 | 2.72 | 2.52 | 0.20 |
5 | 2.38 | 3.04 | -0.66 |
6 | 3.64 | 2.64 | 1.00 |
7 | 2.98 | 2.56 | 0.42 |
8 | 4.40 | 2.40 | 2.00 |
(1)檢驗(yàn)假設(shè)H0:μ=μ0;H1:μ>μ0
。2)令α=0.05,得t0.05,7=1.895(單側(cè))
。3)用差數(shù)求統(tǒng)計(jì)量
。4)結(jié)論∣t∣=2.264>t0.05,7=1.895,P<0.05,在α=0.05水準(zhǔn)處拒絕H0,接受備擇假設(shè),認(rèn)為慢性氣管炎病人血中膽堿酯酶高于正常人。
上例用了單側(cè)檢驗(yàn)是因?yàn)槭孪炔⒉徽J(rèn)為該類(lèi)病人血中膽堿酯含量會(huì)出現(xiàn)低于健康人的情況。
三、兩組資料樣本均數(shù)的比較
在日常工作中,我們經(jīng)常要比較某兩組計(jì)量資料的均數(shù)間有無(wú)顯著差別,如研究不同療法的降壓效果或兩種不同制劑對(duì)殺滅鼠體內(nèi)鉤蟲(chóng)的效果(條數(shù))等。這時(shí)假若事先難以找到年齡、性別等條件完全一樣的人(或動(dòng)物)作配對(duì)比較,那么不能求每對(duì)的差數(shù)只能先算出各組的均數(shù),然后進(jìn)行比較。兩組例數(shù)可以相等也可稍有出入。檢驗(yàn)的方法同樣是先假定兩組相應(yīng)的總體均數(shù)相等,看兩組均數(shù)實(shí)際相差與此假設(shè)是否靠近,近則把相差看成抽樣誤差表現(xiàn),遠(yuǎn)到一定界限則認(rèn)為由抽樣誤差造成這樣大的相差的可能性實(shí)在太小,拒絕假設(shè)而接受H1,作出兩總體不相等的結(jié)論。
例7.4 為觀察中成藥青黛明礬片對(duì)急性黃疸肝炎的退黃效果,以單用輸液保肝的病人作為對(duì)照進(jìn)行了觀察,兩組患者均為成人,黃疸指數(shù)在30-50之間,各人退黃天數(shù)如下,試比較用藥組(1組)與對(duì)照組(2組)退黃天數(shù)有無(wú)顯著差別。
表7.3 急性黃疸性肝炎病人的退黃天數(shù)
中藥組,X1 | 5 | 10 | 14 | 21 | 17 | ∑X1=67 | |
對(duì)照組,X2 | 18 | 21 | 30 | 23 | 22 | 22 | ∑X2=136 |
。1)檢驗(yàn)假設(shè) 設(shè)該藥對(duì)縮短退黃天數(shù)無(wú)效,兩組的總體均數(shù)相等,即H0=μ1=μ2;H1:μ1≠μ2。
。2)求自由度ν
ν=n1+n2-2
=5+6-2=9 (7.1)
定α=0.05,ν=9時(shí)的t值為t0.05,9=2.262
(3)計(jì)算各組均數(shù),合并方差S2c及兩均數(shù)相差的標(biāo)準(zhǔn)誤Sχ1-χ2,然后求t值。
合并方差:(7.2)
代入得
兩均數(shù)相差的標(biāo)準(zhǔn)誤:
(7.3)
代入得
求t:
(7.4)
(4)下結(jié)論 因│t┃>t0.05,9,P<0.02,所以我們?cè)讦?0.05水準(zhǔn)處拒絕H0而接受H1,兩者平均退黃天數(shù)和有顯著差別,服青黛明礬片藥的病人退黃天數(shù)較短。如果檢驗(yàn)假設(shè)屬實(shí),這樣的結(jié)論也還可能下錯(cuò),但概率在2%以下。
上例為兩組資料均數(shù)間的比較,與前面成對(duì)資料的t檢驗(yàn)有些區(qū)別。前者每對(duì)中兩數(shù)據(jù)不能分離,后者任一組中的各數(shù)據(jù)可以在組內(nèi)前后互換位置;前者只有一個(gè)樣本平均差數(shù)d對(duì)應(yīng)于一個(gè)假設(shè)的總體平均差數(shù)μ0,后者,認(rèn)為X1為第一個(gè)總體的隨機(jī)樣本均數(shù),X2則來(lái)自μ2,所以后者要計(jì)算兩組合并的方差S2c(方差是標(biāo)準(zhǔn)差的平方)。再者,與前者相比標(biāo)準(zhǔn)誤、自由度的計(jì)算方法也不相同。
例7.5 某人測(cè)定半歲至1歲小兒、7至8歲兒童各9人的免疫球蛋白IgG(國(guó)際單位/ml),算得平均數(shù)與標(biāo)準(zhǔn)差前者(第1組)為55.1± 11.5,后者(第2組)為 95.5 ±17.8,試檢驗(yàn)這兩種不同年齡的人免疫球蛋白IgG有無(wú)顯著差別。
(1)檢驗(yàn)假設(shè)H0:μ1=μ2;H1:μ1≠μ2。
(2)令α=0.01,查自由度ν=9+9-2=16時(shí)的臨界值,得t0.01,16=2.921
(3)求統(tǒng)計(jì)量 已知X1=55.1,X2=95.5,至于求t值時(shí)作為分母的標(biāo)準(zhǔn)誤,在暫缺原始數(shù)據(jù)時(shí)由已知的兩個(gè)標(biāo)準(zhǔn)差先推算出合并方差Sc2進(jìn)而求出Sχ1-χ2即可,方法如下;
、僖话惴椒;根據(jù)標(biāo)準(zhǔn)差算式
則
于是
由式(7.2)
由式(7.3)
、谠趦山M例數(shù)相等時(shí)也可直接用S1、S2代入下式求Sχ1-χ2,結(jié)果一樣。
現(xiàn)已有了均數(shù)及標(biāo)準(zhǔn)誤可由X1、X2、Sχ1-χ2求出t值。
。4)結(jié)論 │t│>=5.719>t0.01,16=2.921,P<0.001,在α=0.01水準(zhǔn)處拒絕H0,接受H1,兩年齡組的人免疫球蛋白IgG的均數(shù)相差顯著,7-8歲組的高于小幾組。
關(guān)于檢驗(yàn)水準(zhǔn)α定在0.05還是0.01或其它處,要看檢驗(yàn)者事先對(duì)結(jié)論的可靠性要求之高低而定。本例定α=0.01,要求是較高的,最后查出P值小于0.001就更說(shuō)明X1-X2=-40.4隨機(jī)來(lái)自μ1-μ2=0的假設(shè)總體的可能性是很小的。