檢驗(yàn)兩個(gè)樣本均數(shù)相差的顯著性時(shí),我們先有假定:第一個(gè)樣本系從均數(shù)為μ1、方差為σ12的正態(tài)總體中隨機(jī)取出,第二個(gè)樣本取自另一個(gè)類似的總體,相應(yīng)的總體參數(shù)為μ2與σ22,兩個(gè)總體的方差應(yīng)相等即σ12=σ22,然后才可用上述方法進(jìn)行顯著性檢驗(yàn),如果資料呈顯著偏態(tài),或兩組方差相差懸殊,就要考慮用第十章非參數(shù)統(tǒng)計(jì)方法處理,或者通過(guò)變量代換,使上述條件得到滿足。那么,怎樣知道手頭的樣本資料是否服從正態(tài)分布及兩組方差是否相差顯著呢?要對(duì)手頭資料作正態(tài)檢驗(yàn)及方差齊性檢驗(yàn)。下面分別用實(shí)例介紹常用的正態(tài)性檢驗(yàn)和兩方差齊性檢驗(yàn)的方法。
一、正態(tài)性檢驗(yàn)
有些統(tǒng)計(jì)方法只適用于正態(tài)分布或近似正態(tài)分布資料,如用均數(shù)和標(biāo)準(zhǔn)差描述資料的集中或離散情況,用正態(tài)分布法確定正常值范圍及用t檢驗(yàn)兩均數(shù)間相差是否顯著等,因此在用這些方法前,需考慮進(jìn)行正態(tài)性檢驗(yàn)。
正態(tài)分布的特征是對(duì)稱和正態(tài)峰。分布對(duì)稱時(shí)眾數(shù)和均數(shù)密合,若均數(shù)-眾數(shù)>0,稱正偏態(tài)。因?yàn)橛猩贁?shù)變量值很大,使曲線右側(cè)尾部拖得很長(zhǎng),故又稱右偏態(tài);若均數(shù)-眾數(shù)<0稱負(fù)偏態(tài)。因?yàn)橛猩贁?shù)變量值很小,使曲線左側(cè)尾部拖得很長(zhǎng),故又稱左偏態(tài),見(jiàn)圖7.1(a)。
正態(tài)曲線的峰度叫正態(tài)峰,見(jiàn)圖7.1(b)中的虛線,離均數(shù)近的或很遠(yuǎn)的變量值都較正態(tài)峰的多的稱尖峭峰,離均數(shù)近或很遠(yuǎn)變量值都較正態(tài)峰的少的稱平闊峰。
圖7.1 頻數(shù)分布的偏度和峰度
正態(tài)性檢驗(yàn)的方法有兩類。一類對(duì)偏度、峰度只用一個(gè)指標(biāo)綜合檢驗(yàn),另一類是對(duì)兩者各用一個(gè)指標(biāo)檢驗(yàn),前者有W法、D法、正態(tài)概率紙法等,后者有動(dòng)差法亦稱矩法,F(xiàn)僅將W法與動(dòng)差法分述于下;
1.W法 此法宜用于小樣本資料的正態(tài)性檢驗(yàn),尤其是n≤50時(shí),檢驗(yàn)步驟如下;
。1)將n個(gè)變量值Xi從小至大排隊(duì)編秩。
X1 見(jiàn)表7.5第(1)欄,表中第(2)、第(3)欄是變量值,第(2)欄由上而下從小至大排列,第(3)欄由下而上從小至大排列。第(4)欄是第(3)欄與第(2)欄之差。 。2)由附表5按n查出ain系數(shù)列入表7.5第(5)欄,由于當(dāng)n為奇數(shù)時(shí),對(duì)應(yīng)于中位數(shù)秩次的ain為0,所以中位數(shù)只列出,不參加計(jì)算。第(6)欄是第(5)欄與第(4)欄的乘積。 。3)按式(7.8)計(jì)算W值 (7.8) 式中分子的∑,當(dāng)n是偶數(shù)時(shí),為的縮寫,當(dāng)n是奇數(shù)時(shí)為的縮寫,表7.5 第(6)欄的合計(jì)平方后即為分子。分母按原始資料計(jì)算。 。4)查附表6得P值,作出推斷結(jié)論,按n查得W(n,α),α是檢驗(yàn)前指定的檢驗(yàn)水準(zhǔn),若W>W(n,α)則在α水準(zhǔn)上按受H0,資料來(lái)自正態(tài)分布總體,或服從正態(tài)分布;若W≤W(n,α),則在α水準(zhǔn)上拒絕H0,接受H1,資料非正態(tài)。