教 案
2007 — 2008 學年 秋 季學期
所在單位 公共衛(wèi)生與熱帶醫(yī)學學院
系、教研室 生物統(tǒng)計學系
課程名稱 衛(wèi)生統(tǒng)計學
授課對象 2004級預防醫(yī)學本科
授課教師閻玉霞
職 稱 講師
教材名稱 衛(wèi)生統(tǒng)計學
南方醫(yī)科大學教案首頁
授課題目 | 相關分析 | 授課形式 | 講授 |
授課時間 | 2007-12-10 | 授課學時 | 3 |
教學目的 與 要 求 | 了解線性相關的概念 掌握線性相關系數的求解及其假設檢驗 了解相關系數的可信區(qū)間和相關系數的應用 | ||
基本內容 | 1. 線性相關的概念 2. 線性相關系數 3. 相關系數的假設檢驗 4. Spearman秩相關 5. 相關系數的可信區(qū)間 6. 相關系數應用的注意事項 7. 回歸與相關的區(qū)別和聯(lián)系 | ||
重 點 難 點 | 其中, 2、3、4為重點內容。 | ||
主要教學 媒 體 | 投影儀 | ||
主 要 外 語 詞 匯 | Correlation coefficient | ||
有關本內容的新進展 | |||
主要參考資料或相關網站 | http://www.smmu.edu。cn/zykj/~statistics/index/index.htm 1. 徐勇勇主編. 醫(yī)學統(tǒng)計學(第二版). 北京:高等教育出版社,2004 2. 楊樹勤主編. 衛(wèi)生統(tǒng)計學(第二版). 北京:人民衛(wèi)生出版社,1991 3. 方積乾主編. 醫(yī)學統(tǒng)計學與電腦實驗(第二版). 上海:上海科學技術出版社,2001 4. 孫振球主編. 醫(yī)學統(tǒng)計學(供研究生用). 北京:人民衛(wèi)生出版社,2004 | ||
系、教研室 審查意見 | |||
課后體會 |
南方醫(yī)科大學教案
教學內容 | 時間分配和 媒體選擇 |
第十一章 兩變量關聯(lián)性分析 導入 第一節(jié) 線性相關 一、線性相關的概念及其統(tǒng)計描述 二、相關系數的統(tǒng)計描述 三、線性相關應用中應注意的問題 第二節(jié) 秩相關 一、秩相關的概念及其統(tǒng)計描述 二、秩相關相關系數的統(tǒng)計推斷 第三節(jié) 分類變量的關聯(lián)性分析 一、交叉分類2*2表的關聯(lián)分析 二、2*2配對資料的關聯(lián)性分析 三、R*C表分類資料的關聯(lián)性分析 小結 | 幻燈片10分鐘 幻燈片20分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片20分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片10分鐘 |
教學進程
教學內容 | 時間分配 媒體選擇 | |||||||||||||||||||||||||||||||||||||||||||||||||||
第十一章 兩變量關聯(lián)性分析 第一節(jié) 線性相關 linear correlation a執(zhí)業(yè)獸醫(yī)nalysis 相關的例子: 體重~收縮壓 胰島素~血糖水平 藥物劑量~動物死亡率 父親身高~兒子身高 姐妹身高~兄弟身高 例11-1:隨機抽取15名健康成人,測定血液的凝血酶濃度(單位/毫升)及凝固時間,數據如表11-1所示。據此數據如何判斷這兩項指標是否相關? 表11-1 15例健康成人凝血時間與凝血酶濃度測量值記錄
繪制散點圖
| 幻燈片10分鐘 幻燈片10分鐘 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教學內容 | 時間分配 媒體選擇 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
一. 線性相關(linear correlation)的概念 直線相關(linear correlation)又稱簡單相關(simple correlation),用于雙變量正態(tài)分布(bivariate normal distribution)資料。直線相關的性質可由散點圖直觀的說明。 0<r<1 r=1
-1<r<0 r=-1
r=0 r=0 r=0 r=0 二. 相關系數(linear correlation coefficient) 又稱積差相關系數(coefficientof product-moment correlation),描述具有直線關系的兩個變量之間相關關系的密切程度與相關方向的指標,以符號r表示樣本相關系數。 | 幻燈片5分鐘 幻燈片5分鐘 幻燈片10分鐘 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
教學內容 | 時間分配 媒體選擇 | |||||||||||||||||||||||||||||||||||||||||||||||||||
相關系數的計算公式
相關系數沒有單位,其值為-1≤r≤1。r值為正表示正相關(positive linear correlation),r值為負表示負相關(negative linear correlation);r的絕對值等于1為完全相關,r=1為完全正相關(perfectpositivecorrelation),r=-1為完全負相關(perfect negative correlation);r=0,兩變量間沒有直線相關關系,稱為零相關(zero correlation)。 -1≤r≤1,|r|越大,線性相關越密切。 線性相關(linear correlation):(X, Y)服從正態(tài)分布,即適用于雙變量正態(tài)分布資料。 線性相關系數的計算 例11-2 計算例11-1中凝血酶濃度X與凝血酶時間Y之間樣本相關系數 解: 1. 繪制散點圖,如圖11-1 2. 計算相關系數 由公式11-3得
三、相關系數的假設檢驗 上面所求的相關系數r是樣本相關系數,它是總體相關系數r的估計值。要判斷X、Y間是否有相關關系,就要檢驗r是否來自總體相關系數r為零的總體。因為即使從r=0的總體作隨機抽樣,由于抽樣誤差的影響,所得r值也常不等于零。故當計算出r值后,接著做r=0的假設檢驗。 | 幻燈片10分鐘 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教學內容 | 時間分配 媒體選擇 | |||||||||||||||||||||||||||||||||||||||||||||||||||
常用t檢驗,檢驗統(tǒng)計量t值的計算公式如下: , 公式中Sr為相關系數的標準誤。求得t值后查t界值表得P值,按所取檢驗水準作出推斷結論;亦可按=n-2,直接查r界值表得P值,以節(jié)省計算。 例 根據樣本相關系數r=0.91,對總體相關系數r進行假設檢驗。 解: 1. 建立假設檢驗,確定檢驗水準 H0: р = 0 (變量間不存在線性相關關系) H1: р ¹ 0 (變量間有線性相關關系) a=0.05 2. 計算檢驗統(tǒng)計量 本例,n=15, r=-0.926,
3. 確定P值,下結論 本例v=13,查t 界值表得P<0.001,故拒絕H0,接受H1,認為凝血酶濃度與凝血酶時間之間存在負相關。此結果與查表的結果是一致的。 查表法 根據自由度df=13,查(附表13)相關系數r界值表,得r0.05/2,13=0.497,r0.01/2,13=0.623,本例r=0.926,故P<0.01,按a=0.05水準拒絕H0,接受H1。 與t檢驗結論相同。 第三節(jié) 線性相關中應注意的問題 • 1.樣本的相關系數接近零并不意味著兩變量間一定無相關性. • 2.一個變量的數值人為選定時莫作相關. • 3.出現(xiàn)異常值時甚用相關. • 4.相關未必真有內在聯(lián)系. • 5.分層資料盲目合并易出假象. | 幻燈片10分鐘 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教學內容 | 時間分配 媒體選擇 | |||||||||||||||||||||||||||||||||||||||||||||||||||
第二節(jié) 秩相關 問題:(X, Y)服從正態(tài)分布,則r可以較好的估計總體相關系數 r,若( X, Y )不服從二元正態(tài)分布呢? 等級相關(rank correlation)是用雙變量等級數據作直線相關分析,適用于下列資料: ①不服從雙變量正態(tài)分布而不宜作積差相關分析 ②總體分布型未知 ③原始數據是用等級表示。 Spearman提出對數據作秩變換后再計算直線相關系數。 一、Spearman秩相關 rs-----Spearman秩相關系數,說明兩個變量間相關關系的密切程度與相關方向,間接反映X、Y間的相關性,且不依賴X、Y的分布。
例11-4 某地研究2~7歲急性白血病患兒的血小板數與出血癥狀程度之間的相關性,結果見表11-2,試用秩相關進行分析 例11-5 表11-2 急性白血病患兒的血小板(109/L)和出血癥狀 解:不服從正態(tài)分布,故計算Spearman秩相關。故
| 幻燈片10分鐘 | |||||||||||||||||||||||||||||||||||||||||||||||||||
教學內容 | 時間分配 媒體選擇 |
1. 建立假設檢驗,確定檢驗水準 H0: pS = 0 (不存在相關關系) H1: pS ¹ 0 (有相關關系) a=0.05 2. • 查表法: 例11-4中算得rs=-0.422 查 r 臨界值表,-0.422<0.503 ,按a=0.05的水準,不能拒絕H0,可以認為急性白血病患兒的出血癥狀與血小板數之間無相關關系。 t檢驗法: 計算t統(tǒng)計量 五、相關系數的可信區(qū)間 必須先對r作z變換 或 或 公式中tanh為雙曲正切函數;tanh-1為反雙曲正切函數,r的取值范圍 -1<r<1,相應的z值范圍 -∞〈z<+∞。按正態(tài)近似原理,z的1-可信區(qū)間的計算公式 ),即 六、相關系數應用的注意事項 1. 首選繪制散點圖 2. 進行相關分析要有實際意義 3. 相關關系~因果關系 4. 必須對相關系數r作假設檢驗 | 幻燈片10分鐘 |
教學內容 | 時間分配 媒體選擇 | |||||||||
第三節(jié) 分類變量的關聯(lián)性分析 •適用條件 對定性變量之間的聯(lián)系通用的方法是根據兩個定性變量交叉分類基數所得的頻數資料(列聯(lián)表)作關聯(lián)性分析,即關于兩種屬性獨立性的卡方檢驗 計算公式
一、交叉分類2×2表的關聯(lián)分析 •例11-6 為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關,某醫(yī)院兒科隨機收集了消化不良的嬰兒82例,對每個個體分別觀察腹瀉與否和喂養(yǎng)方式兩種屬性,2×2種結果分類記述如表11-3所示,試分析兩種屬性的關聯(lián)性。 表11-3嬰兒腹瀉與喂養(yǎng)方式的關系 •假設檢驗 H0:喂養(yǎng)方式與嬰兒腹瀉之間相互獨立 H1:喂養(yǎng)方式與嬰兒腹瀉之間有關聯(lián) a=0.05 將表中各數據代入公式(7-7)得
, 拒絕原假設,說明嬰兒腹瀉與喂養(yǎng)方式之間存在關聯(lián)性. 二 2×2配對資料的關聯(lián)性分析 •例11-7 有56份咽喉涂抹標本,把每份標本一分為二,依同樣的條件分別接種于甲乙兩種白喉桿菌培養(yǎng)基上,觀察白喉菌生長的情況,結果如表11-5,問兩種培養(yǎng)基的結果有無關聯(lián)? 表11-5 兩種白喉桿菌培養(yǎng)結果 •假設檢驗 H0:兩種培養(yǎng)基的結果之間互相獨立 H1:兩種培養(yǎng)基的結果之間有關聯(lián) a=0.05 將本例數據代入公式(7-7)得
有理由拒絕零假設,可以認為甲、乙兩種培養(yǎng)基之間存在關聯(lián)性 三 R×C表分類資料的關聯(lián)性分析 •例11-8 某地居民主要有三種祖籍,均流行甲狀腺腫。為探索甲狀腺腫類型與祖籍是否有關聯(lián),現(xiàn)根據居民甲狀腺腫篩查結果,按甲狀腺腫類型與祖籍兩種屬性交叉分類,得表11-6的資料。問甲狀腺腫類型與祖籍見有否關聯(lián)? 表11-6 某地居民按甲狀腺腫類型與祖籍兩種屬性的交叉分類表 •假設檢驗 H0 :甲狀腺類型與祖籍無關 H1:甲狀腺類型與祖籍有關聯(lián) a=0.05 同樣作檢驗得 查界值表, ,拒絕零假設,說明甲狀腺腫類型與祖籍之間有關聯(lián)性 計算列聯(lián)系數 小結 | 幻燈片5分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片10分鐘 幻燈片5分鐘 | |||||||||