一、估計樣本含量的意義及條件
我們在第一節(jié)里曾提到重復(fù)的原則。所謂重復(fù),是指各處理組(對照在實驗研究中也被看作是一種處理,而且是必不可少的)的受試對象都應(yīng)有一定的數(shù)量,例數(shù)不能太少,所以在抽樣調(diào)查、臨床觀察或?qū)嶒炑芯恐校紫瓤傄紤]樣本含量(或叫樣本大小)問題。樣本太小,使應(yīng)有的差別不能顯示出來,難以獲得正確的研究結(jié)果,結(jié)論也缺乏充分的依據(jù);但樣本太大,會增加實際工作中的困難,對實驗條件的嚴(yán)格控制也不易做到,并且造成不必要的浪費(fèi)。所以這里所說的樣本含量估計,系指在保證研究結(jié)論具有一定可靠性的條件下,確定最少的觀察或?qū)嶒灷龜?shù)。
但是,樣本含量又是個比較復(fù)雜的問題。要講清在各種情況下估計樣本含量的方法和原理,那是很繁雜的。而且,不同的參考書上介紹的計算公式和工具表往往不一樣,以致同一問題所得的結(jié)果也可能有出入。所以,不論按哪種公式或工具表求得的結(jié)果,也只能是個近似的估計數(shù)。
估計樣本含量,必須事先明確一些條件與要求:
。ㄒ)根據(jù)研究目的與資料性質(zhì),要先知道一些數(shù)據(jù)。例如要比較幾組計數(shù)資料,先要知道百分?jǐn)?shù)或率;要比較幾組計量資料,先要知道平均數(shù)及標(biāo)準(zhǔn)差。這些數(shù)據(jù)可從以往的實踐,預(yù)備試驗的結(jié)果、兄弟單位的經(jīng)驗或文獻(xiàn)資料里得來。
。ǘ)確定容許誤差。由于抽樣誤差的影響,用樣本指標(biāo)估計總體指標(biāo)常有一定的誤差,因而要確定一個樣本指標(biāo)與總體指標(biāo)相差所容許的限度。此值要求越小,所需例數(shù)就越多。
。ㄈ)確定把握度(1—β)。β是第二型錯誤的概率;而1—β的意思是:如果兩組確有差別,則在每100次實驗中平均能發(fā)現(xiàn)出差別來的概率。把握度可用小數(shù)(或百分?jǐn)?shù))表示,一般取0.99、0.95、0.90、0.80、0.50。要求把握度越高,則所需例數(shù)直多。
。ㄋ)確定顯著性水平,即第一型錯誤的概率(α)。這就是希望在α=0.05的水準(zhǔn)上發(fā)現(xiàn)差別,還是希望在α=0.01的水準(zhǔn)上發(fā)現(xiàn)差別。α越少,所需例數(shù)越多。
此外,估計樣本含量時還應(yīng)當(dāng)根據(jù)專業(yè)知識確定用單側(cè)檢驗或雙側(cè)檢驗。同一實驗,若既可用單側(cè)檢驗又可用雙側(cè)檢驗,則前者所需例數(shù)要少些。
二、用計算法估計樣本含量
我們運(yùn)用前面學(xué)過的某些假設(shè)檢驗公式,就可以進(jìn)行樣本含量的計算。下面僅舉兩例略作介紹。這里的公式僅適用于α=0.05,1—β=0.50。而且都是雙側(cè)檢驗。
(一)兩個率比較時樣本含量的計算 令n為每組所需例數(shù),P1、P2為已知的兩個率(用小數(shù)表示),P為合并的率,當(dāng)設(shè)兩組例數(shù)相等時,即P=(P1+P2)/2。q=1=p,則
。11.1)
例11.5 據(jù)某院初步觀察,用甲、乙兩種藥物治療慢性氣管炎患者,近控率甲藥為45%,乙藥為25%,F(xiàn)擬進(jìn)一步試驗,問每組需觀察多少例,才可能在α=0.05的水準(zhǔn)上發(fā)現(xiàn)兩種療法近控率有顯著相差?
本例P1=0.45,P2=0.25,P=(0.45+0.25)÷2=0.25,q=1-0.35=0.65,代入式11.1
每組需觀察46人,兩組共觀察92人,注意:例數(shù)問題不同于一般數(shù)學(xué)計算中的四舍五入,凡是有小數(shù)的值,應(yīng)一律取稍大于它的正整數(shù),如本例45.5取46,若為45.1也應(yīng)取46。
。ǘ)個別比較t檢驗樣本含量的計算 令n為所需樣本數(shù),S為差數(shù)的標(biāo)準(zhǔn)差,X為差數(shù)的均數(shù),t0.05O為t值表上相當(dāng)于P=0.05的t值,4為n足夠大時t20.05=1.962的數(shù),則
大樣本 (11.2)
小樣本 。11.3)
例11.6 用某藥治療胃及十二指腸潰瘍病人,服藥四周后胃鏡復(fù)查時,患者潰瘍面平均縮小0.2cm2,標(biāo)準(zhǔn)差為0.4cm2,假定該藥確能使?jié)兠婵s小或愈合,問需多少病人作療效觀察才能在α=0.05的水準(zhǔn)上發(fā)出用藥前后相差顯著?
本例X=0.2,S=0.4,先代入式(11.2)
由于n<30,故用式(11.3)重算。當(dāng)n=16,ν=16-1=15,t0.05=2.131,
當(dāng)n=19(略大于18.16),ν=19-1=18,t0.05=2.101
當(dāng)n=18,ν =18-1=17,t0.05=2.110
故至少需用18人作療效觀察。
三、用查表法估計樣本含量
當(dāng)要求平均有80%、90%以上的機(jī)會能發(fā)出相差顯著或非常顯著時,計算公式比較復(fù)雜,數(shù)理統(tǒng)計上已編制成工具表,一查便得,附表19只是其中的一部分。我們?nèi)砸郧懊娴睦}來介紹這些表的用法。
。ㄒ)兩個率比較時所需樣本含量 對于兩個率的比較,單側(cè)檢驗可查附表19(1),雙側(cè)檢驗查附表19(2)
仍用例11.5來說明。本例P1=45%,P2=25%,δ=45%-25%=20%,設(shè)α=0.05,把握度為0.80。如果已知甲藥療效不可能低于乙藥,可用單側(cè)檢驗,查附表19(1)。我們從“較小率”欄中找到25橫行,再從上方找到δ=20直行,基相交處,讀上行數(shù)字得69,即每組最少需要69例,兩組共需138例。
如果兩個率(或百分?jǐn)?shù))都超過50%,怎樣使用這個表呢?假定甲組陽性率是80%,乙組陽性率是65%,兩組陽性率相差15%。這時先求兩組的陰性率,于是甲組陰性率為20%,乙組陰性率為35%,兩組陰性率相差仍為15%。若用雙側(cè)檢驗,我們查附表19(2),從“較小率”欄找到20橫行,再從上方找到δ=15直行,其相交處上行數(shù)字為135,即每組需檢查135例(兩組共270例)將有80%的機(jī)會在α=0.05的水準(zhǔn)上發(fā)現(xiàn)兩組陽性率相差顯著。
若表中查不到題中的“較小率”及δ,可用最接近的值或內(nèi)插法求n,但寧可使n偏大,以免估計的樣本含量偏少。
。ǘ)個別比較t檢驗所需的樣本含量 這是配對比較,應(yīng)查附表20。使用該表時,先要求出差數(shù)的總體均數(shù)μ與總體標(biāo)準(zhǔn)差σ之比,即δ=μ/σ,當(dāng)μ與σ未知時,可分別用X與S作為估計值。
仍用例11.6來說明,本例X=0.2,S=0.40,故δ=μ/σ=0.2/0.4=0.5。若設(shè)α=0.05,1—β=0.90,用雙側(cè)檢驗,查附表得20,得n=44,即需觀察44例病人。若設(shè)α=0.05,1—β=0.50,則n=18,同計算法結(jié)果一致。
(三)兩個均數(shù)比較所需樣本含量 應(yīng)查附表21。先要求出兩總體均數(shù)之差與總體標(biāo)準(zhǔn)差這比,即δ=(μ1-μ2)/σ。若μ1及μ2未知時,可分別以X1及X2估計之;σ未知時,可以合并標(biāo)準(zhǔn)差S估計之。
例11.7 某職業(yè)病防治所用兩種療法治療矽肺患者,一個療程后,患者血清粘蛋白下降值甲療法平均為2.6(mg%),乙療法平均為2.0(mg%,)兩種療法下降值之合并標(biāo)準(zhǔn)差為1.3(mg%)。若發(fā)現(xiàn)兩組療效相差顯著,每組至少應(yīng)觀察多少病人?
本例X1=2.6,X2=2.0,S=1.3,故δ=(μ1-μ2)/σ=(2.6-2.0)/1.3=0.46。若設(shè)α=0.05,1—β=0.50,用雙側(cè)檢驗,查附表21,δ=0.46查不到。在這種情況下,可用鄰近而略小的δ值代替,或用內(nèi)插法估計。本例若查δ=0.45,得n=39,即每組需要39例,兩組共需78例。若用內(nèi)插法計算,當(dāng)δ=0.45時所需例數(shù)是39,δ=0.50時所需例數(shù)是32,所以δ=0.46時所需例數(shù)是:
答案是:每組需要至少觀察38例,兩組共需觀察76例。