醫(yī)學(xué)雜志中量表類稿件的核查分析
知己者明,知人者智。行為研究的主要目的是要了解人們對問題或現(xiàn)象的認識與態(tài)度如何影響他們的行為。通過量表對人的行為進行研究是一門科學(xué),也是一種應(yīng)用心理學(xué)。這種研究在國內(nèi)外十分普遍,是社會學(xué)、管理學(xué)、心理學(xué)、教育學(xué)、醫(yī)學(xué)等科學(xué)研究領(lǐng)域的基本方法。目前,量表已成為現(xiàn)場調(diào)查常用的數(shù)據(jù)收集手段,醫(yī)學(xué)論文中的量表研究非常常見。隨著量表的廣泛應(yīng)用,醫(yī)學(xué)論文中關(guān)于量表分析的不恰當表述和統(tǒng)計學(xué)方法的誤用也接踵而來,大大降低了論文的科學(xué)性。雖然已有文獻對醫(yī)學(xué)期刊稿件中常見的統(tǒng)計學(xué)問題進行了總結(jié),并提出了防范對策,但這些統(tǒng)計學(xué)問題和對策并不適用于量表類稿件。由于量表有維度和條目信息,需采用特殊的分析方法,即信度分析、效度分析和因子分析等。為此,本文以《中國衛(wèi)生統(tǒng)計》雜志2011年11月1日至2018年11月1日投稿系統(tǒng)中的量表類稿件為研究對象,結(jié)合稿件的審理過程,對稿件中存在的統(tǒng)計學(xué)問題進行辨析,并總結(jié)稿件的核查要點。本研究一方面可以幫助作者對癥下藥,了解稿件問題所在,提高投稿的命中率;另一方面可以幫助編輯掌握相關(guān)統(tǒng)計學(xué)知識,提升審讀水平,以期為提高期刊的稿件質(zhì)量提供參考。
一、研究對象與方法
《中國衛(wèi)生統(tǒng)計》雜志在衛(wèi)生統(tǒng)計專業(yè)領(lǐng)域具有一定的代表性,有助于較集中地發(fā)現(xiàn)量表類稿件中存在的問題。本研究以《中國衛(wèi)生統(tǒng)計》雜志網(wǎng)上投稿系統(tǒng)為資料來源,檢索時限為2011年11月1日至2018年11月1日,以“量表”“調(diào)查問卷”為檢索關(guān)鍵詞,前者檢索出量表類稿件117篇,后者檢索出12篇,共計129篇稿件。截至目前,129篇量表類稿件中已正式發(fā)表稿件53篇,錄用待排刊期稿件2篇,被退稿件45篇,尚在審理狀態(tài)的稿件29篇。本文以129篇量表類稿件為研究對象,逐篇回顧其編校過程,結(jié)合外審專家審理意見,對量表類稿件中存在的問題進行分析。
二、結(jié)果與分析
針對量表類稿件中存在的稿件題目不貼切、描述性數(shù)據(jù)問題、討論欠佳和參考文獻格式不正確等共性問題,已有相關(guān)研究做出了總結(jié)[5-7],筆者在此不再贅述。本文主要針對量表類稿件中特有的統(tǒng)計學(xué)問題進行分析。
(一)研究對象不合理
任何科學(xué)研究必須明確研究對象,才能根據(jù)研究對象收集數(shù)據(jù)。量表類稿件的研究對象通常是人,主要涉及以下問題。(1)樣本量不足。某家庭一般功能正向評定量表(6條目)的研究中,研究對象僅51人。按照驗證性因子分析的要求,樣本量至少是觀測條目數(shù)的15倍,即90人,稿件中使用的樣本量明顯偏小,后期作者對樣本進行了擴充,樣本量達到了107人。(2)代表性差。某新疆地區(qū)的慢性病研究中,研究對象說是“新疆地區(qū)”其實只是“新疆醫(yī)科大學(xué)附屬及時醫(yī)院”的患者,用該醫(yī)院某時間段的慢性病數(shù)據(jù)代表“新疆地區(qū)”,不能反映研究總體的全貌。(3)選取標準和過程模糊不清。例如,某住院病人第三方滿意度量表的信度和效度研究中,研究對象來源只交代了“年齡大于18歲、意識清楚、能正確回答問題、住院3天以上的病人”,并未說明是如何選擇這些對象的,是簡單隨機抽樣還是方便抽樣方法,樣本的選取過程對調(diào)查結(jié)果會產(chǎn)生很大的偏倚。部分自愿參與調(diào)查的人通常會好評,不太情愿參與的患者往往會差評,特別是剛住院不久的患者,鑒于怕醫(yī)生打擊報復(fù)等原因,盡管是匿名評價,也有可能勉為其難地做出好評。又如,在大學(xué)生健康素養(yǎng)調(diào)查量表研究中,作者確定了308名大學(xué)生,但未指明所調(diào)查的大學(xué)生的納入、排除標準和選取方式,有可能影響量表今后的可推廣性與應(yīng)用價值。
(二)量表框架不明確
量表的框架是量表類稿件研究的核心內(nèi)容,這部分存在的問題主要有兩個。(1)稿件未交待量表內(nèi)容。某醫(yī)院行政管理人員服務(wù)保障能力測評量表的編制中,盡管提到了5個維度各自的編號,但每個維度各自的條目及對應(yīng)的編號并沒有一一列出,這些恰好是量表至關(guān)重要的部分。所以,筆者建議作者在修改稿中將32個條目詳細列出,以便讓讀者判斷這5個維度的每一維度的條目組成是否合理。(2)維度劃分不合理。某研究構(gòu)建的肺結(jié)核廢棄物危害干預(yù)IMB(Information-Motivation-Behavior,信息、動機、行為)量表包含4個維度12個條目,條目的歸屬難以理解。如廢棄物處置態(tài)度、害怕程度2個條目歸類于動機;行為技巧維度包含不亂扔廢棄物、主動獲取知識、與家人隔離、配備消毒設(shè)施4個條目;從稿件所列條目中很難看出“行為維度”與“行為技巧維度”的區(qū)別。此外,個別稿件中各維度的條目數(shù)量差異較大,多者一個維度包含9個條目,少者一個維度僅1個條目。
(三)條目評價不完整
通常作者需要對完成數(shù)據(jù)收集的量表進行條目鑒別度分析,刪除鑒別度不滿足要求的條目,以此來提高量表的效度。有些作者對量表的分析過程未掌握,常常會忽略此步驟而直接進行量表的信度和效度分析,這樣某些鑒別度不高的條目沒有被刪除,直接影響到量表的質(zhì)量分析結(jié)果。常見的問題如下。(1)Delphi法應(yīng)用不規(guī)范。某新疆包蟲病手術(shù)患者生存質(zhì)量測定量表的專家分析中,作者僅對及時輪結(jié)果進行分析,發(fā)現(xiàn)9名專家意見不統(tǒng)一。這個結(jié)果是必然的,因為研究尚未完成,中間結(jié)果沒有報告的價值,應(yīng)在全部研究過程結(jié)束后再報告完整的結(jié)果。理論上,Delphi法需對所選定的專家就研究問題進行多輪意見征詢,研究者對每一輪的專家意見進行匯總整理,并將整理過的材料再寄給每位專家,供其分析判斷,專家在整理材料的基礎(chǔ)上提出新的論證意見。如此多次反復(fù),直到意見逐步趨于一致,得到一個一致性較好并且性較大的結(jié)論或方案。通常需要3~4輪咨詢反饋,才能達成一致。此外,咨詢專家只有9名,人數(shù)偏少,應(yīng)在可能的情況下增加專家人數(shù)。(2)隨意刪減條目。某量表編制中,作者提到:“在文獻查閱及參照其他量表的基礎(chǔ)上,提出的理論構(gòu)架,形成條目池,通過半結(jié)構(gòu)式訪談和專家咨詢,研究工作組通過拆分、合并、添加等方式對備選條目逐條整理,形成哮喘患者生活質(zhì)量初始問卷”,但結(jié)果部分未見文獻查閱、專家咨詢和其他量表的相關(guān)內(nèi)容,70個條目擅自縮減至40個條目。
(四)信度和效度分析不正確
信度和效度分析是量表類稿件必不可少的一部分內(nèi)容,可是竟有三分之一的稿件缺少信度和效度分析的結(jié)果,導(dǎo)致無法確定調(diào)查數(shù)據(jù)的質(zhì)量。更有甚者,稿件中無信度、效度評價的相關(guān)內(nèi)容,摘要中卻得出“編制的最終量表”的結(jié)論,犯了學(xué)術(shù)論文憑空下結(jié)論的大忌。某稿件對SF-36量表(MOSitemshortfromhealthsurvey,健康調(diào)查簡表)做信效度研究,信度結(jié)果未提及,而效度結(jié)果中VT(Vitality,精力)、SF(SocialFunction,社會功能)、MH(MentalHealth,精神健康)3個維度所對應(yīng)的條目存在一定的紊亂情況,且BP(BodilyPain,軀體疼痛)、GH(GeneralHealth,一般健康狀況)、SF、RE(RoleEmotional,情感職能)4個維度與理論模型出現(xiàn)了生理和心理維度的顛倒,可能與此次調(diào)查信度較低有關(guān),這也許是作者未做信度分析的原因。信效度分析不合理還體現(xiàn)在作者對應(yīng)用條件理解不透徹。某老年肺結(jié)核患者自我健康管理評定量表的信效度檢驗中,作者對采用自我健康管理前后的50例患者進行重測信度。這一做法是不妥的,因為重測信度應(yīng)在研究對象狀態(tài)不變的情況下評價,并保障在適當?shù)臅r間周期內(nèi),而不是在自我管理前后。該量表第3個維度的信度偏低,作者未說明原因,應(yīng)適當采取措施變更條目或改為提問類問題,以提高量表的信度。
(五)因子分析不規(guī)范
通過因子分析,既能夠減少量表條目,又能夠盡量地保留原有條目所包含的信息。這部分涉及的問題如下。(1)作者對患者進行探索性和驗證性因子分析時,未說明是進行了分組還是同一批對象同時做了這兩種分析。(2)片面追求擬合效果,而忽略內(nèi)在聯(lián)系。例如,作者基于因子分析的結(jié)果刪除了兩個維度來保障后續(xù)的良好結(jié)果,這將會歪曲原量表代表的意義。此外,某Kogan老年態(tài)度量表研究中,提取兩個公因子的累積方差貢獻率僅31%,表明翻譯后形成的量表質(zhì)量太差。建議作者應(yīng)參考國外應(yīng)用此量表的累積貢獻率,如果中文版量表累積貢獻率遠低于英文版,則表明“引進”工作不夠成功。
三、核查要點
作為一名統(tǒng)計學(xué)專業(yè)的醫(yī)學(xué)期刊編輯,筆者通過分析本刊量表類稿件中的常見統(tǒng)計學(xué)問題,結(jié)合自身的統(tǒng)計學(xué)專業(yè)知識和工作實踐摸索,歸納出醫(yī)學(xué)期刊編輯在審理此類稿件時需關(guān)注的核查要點。
(一)量表的條目分析
編輯對量表類稿件進行審核時,應(yīng)首先關(guān)注作者是否對量表的條目鑒別度進行分析,其次判斷其分析方法是否正確。量表的條目分析主要有利用獨立樣本的t檢驗和利用相關(guān)分析兩種方法[8]。當采用隨機抽樣時,調(diào)查數(shù)據(jù)為樣本數(shù)據(jù),可以將調(diào)查對象劃分為高分組與低分組并對其平均分的差異進行t檢驗,即不僅計算高分組與低分組在某個項目上的平均分之差,還要對其差異進行顯著性檢驗。如果結(jié)論為“差異有統(tǒng)計學(xué)意義”,說明通過測試能夠?qū)⒏叻纸M與低分組區(qū)分出來,該條目的鑒別力是高的;反之,如果“差異無統(tǒng)計學(xué)意義”,那么此條目的鑒別度不高,應(yīng)予以刪除。對每個條目與所屬維度的總分做相關(guān)分析,是考察條目鑒別度的另一種有效方法。如果通過檢驗,某個條目與所屬維度總分相關(guān)性差異有統(tǒng)計學(xué)意義,說明這個條目的鑒別度較高,可以作為這個維度的一個測試題。理論上,當測試的條目是李克特量表時,可以采用積差相關(guān)系數(shù);當測試的條目為二項選擇題時,要使用點二列相關(guān)系數(shù)。采用不同的計算方法得到的相關(guān)系數(shù)數(shù)值是不同的,因此,作者在描述結(jié)果的同時需寫明具體相關(guān)系數(shù)的名稱。
(二)量表的信度分析
信度(Reliability)指測量的性,即隨機誤差造成的測定值的變異程度的大小。量表的信度反映調(diào)查結(jié)果的穩(wěn)定性和一致性。量表信度的高低是通過信度系數(shù)的大小來估計的。信度系數(shù)包括重測信度、分半信度和克朗巴哈α(Cronbach’sα)系數(shù)。其中,Cronbach’sα系數(shù)是最常用的信度系數(shù),用于描述量表的內(nèi)部一致性,可反映量表條目之間的相互關(guān)聯(lián)程度。編輯在審理量表類稿件中的信度分析內(nèi)容時,應(yīng)注意以下兩個方面。(1)分析多維度量表時應(yīng)對各維度子量表分別進行信度檢驗,以綜合評估總量表的信度情況,若僅對總量表的信度進行衡量,會造成信度估計的偏差。(2)針對量表信度檢驗結(jié)果的描述應(yīng)詳實具體,不能過于籠統(tǒng)。作者須用明確的統(tǒng)計術(shù)語報告采用的信度檢驗方法和檢驗結(jié)果,具體指出計算出來的是何種相關(guān)系數(shù),如內(nèi)部相關(guān)系數(shù)(IntraclassCorrelationCoefficients,ICC)、Spearman等級相關(guān)系數(shù)或Pearson相關(guān)系數(shù)等。
(三)量表的效度分析
效度(Validity)指測量的有效性,意在反映量表在多大程度上測定到研究者想要測量的態(tài)度或行為等。量表的效度主要包括內(nèi)容效度、效標關(guān)聯(lián)效度和結(jié)構(gòu)效度。
1.內(nèi)容效度。內(nèi)容效度指量表的條目在多大程度上代表了所要測量的全部內(nèi)容。確定內(nèi)容效度的方法主要通過專家判斷和相關(guān)分析。相關(guān)分析法進行內(nèi)容判斷的過程與前文條目分析中的相關(guān)系數(shù)法是相同的,在此不再贅述。專家判斷法是在調(diào)查實施之前,由相關(guān)的學(xué)者或?qū)<腋鶕?jù)專業(yè)理論來判斷量表本身所測量的內(nèi)容是否為調(diào)查者所要測量的內(nèi)容,以及量表的條目是否能夠體現(xiàn)調(diào)查的目的。例如,某項研究預(yù)考查護理人員風(fēng)險感知量表的內(nèi)容效度。首先,判斷量表中是否有與風(fēng)險感知無關(guān)的條目,然后再評估這些條目是否包含了護理人員在護理過程中對于風(fēng)險感知的內(nèi)容,即取樣的代表性。
2.效標關(guān)聯(lián)效度。效標關(guān)聯(lián)效度指測驗與外在效標間關(guān)聯(lián)的程度。量表的效標關(guān)聯(lián)效度是選擇一個與量表有直接關(guān)系的參照物作為獨立標準,以此來考察所設(shè)計的量表效度,最常用的檢驗方法是兩種測量工具得分的相關(guān)系數(shù),即目前所編制的量表測得的分數(shù)與效標測得的分數(shù)之間的相關(guān)系數(shù)。例如,對青少年亞健康多維評定量表(MultidimensionalSub-healthQuestionnaireofAdolescents,MSQA)進行信度和效度評價研究時,為了計算效標關(guān)聯(lián)效度的數(shù)值,從調(diào)查對象中抽取了85名學(xué)生,進行了癥狀自評量表(SymptomChecklist-90,SCL-90)的測評,結(jié)果表明SCL-90量表與MSQA心理子量表總得分的相關(guān)性具有統(tǒng)計學(xué)意義(P<0.05),SCL-90量表的精神癥狀部分各因子與對應(yīng)的MSQA量表各維度間的相關(guān)性均具有統(tǒng)計學(xué)意義(P<0.05),這說明該子量表具有良好的效標效度。
3.結(jié)構(gòu)效度。結(jié)構(gòu)效度是指測驗?zāi)軌驕y量到理論上構(gòu)想的內(nèi)在結(jié)構(gòu)的程度,也稱構(gòu)想效度或建構(gòu)效度,是問卷調(diào)查中最為常用的效度檢驗方法。結(jié)構(gòu)效度的測量實質(zhì)上是一個過程,主要是對研究理論上的假設(shè)和對假設(shè)的檢驗,在考慮問卷設(shè)計邏輯分析基礎(chǔ)上,更強調(diào)對于實測數(shù)據(jù)進行統(tǒng)計分析以檢驗理論研究的正確性。檢驗結(jié)構(gòu)效度最常用的方法是因子分析法,主要根據(jù)相關(guān)性對問卷中的變量進行歸類,每一類變量稱為一個公共因子,此公共因子就代表了問卷的基本結(jié)構(gòu),再對子分析所得出的結(jié)構(gòu)與理論構(gòu)想的結(jié)構(gòu)是否相符合進行分析。例如,研究者對某調(diào)查問卷的理論構(gòu)想是五個維度,并根據(jù)這五個維度編制一份問卷進行調(diào)查。如果對調(diào)查后收集的資料數(shù)據(jù)進行分析,得出了五個公共因子,而且每個公共因子所包含的項目與理論構(gòu)想一致,這說明問卷維度與理論構(gòu)想的維度相吻合,認為此問卷對于所要測量的概念具有良好的結(jié)構(gòu)效度。
(四)因子分析
因子分析是將描述某一事物(或概念)的多個觀測變量簡化為少數(shù)幾個潛在變量的多元統(tǒng)計分析方法。在進行因子分析之前,需要先判斷數(shù)據(jù)是否適合做因子分析。一般采用KMO(Kaiser-Meyer-Olkin)檢驗或巴特利特球形檢驗(Bartlett’sTestofSphericity)。在KMO檢驗中,KMO越接近1,說明變量間的相關(guān)性越大,原有變量越適合做因子分析。巴特利特球形檢驗是通過檢驗原始變量的相關(guān)系數(shù)矩陣是否為單位矩陣,進而判斷其是否適合進行因子分析。因子分析除用于尋求變量之間的基本結(jié)構(gòu)、簡化指標體系之外,還可以通過因子得分,將樣本或變量進行分類,主要分為探索性因子分析(ExploratoryFactorAnalysis,EFA)和驗證性因子分析(ConfirmatoryFactorAnalysi,CFA)。
1.探索性因子分析(EFA)。EFA是為了得到測度項與因子、因子與因子之間的關(guān)系。對于一個新的測量工具,我們往往不知道其中的條目是否具有足夠的區(qū)別效度,為此,我們好先假定因子的數(shù)目未知,讓數(shù)據(jù)根據(jù)一定的統(tǒng)計規(guī)則產(chǎn)生合適的因子數(shù)目[17]。作為一種重要且實用的數(shù)學(xué)統(tǒng)計方法,EFA在心理學(xué)、社會學(xué)和醫(yī)學(xué)等領(lǐng)域的調(diào)查問卷研制過程中得到廣泛的應(yīng)用。因此,期刊編輯掌握一定的EFA方法和理論,對于審理稿件大有裨益。在審理稿件EFA內(nèi)容時,編輯應(yīng)考慮以下方面。
(1)研究樣本容量及觀測變量數(shù)目是否達到分析的基本要求。EFA一般要求樣本容量至少為100,觀測變量的數(shù)目與所提取的因子數(shù)目之比至少為4。
(2)對因子進
行提取的方法是否正確。EFA中最常用的因子提取方法是主成分分析法和主軸因子法,兩者區(qū)別在于分析目的不同:前者利用降維思想,用最少的因子較大程度解釋原始數(shù)據(jù)的方差;后者用于確定數(shù)據(jù)結(jié)構(gòu)。
(3)EFA結(jié)果
描述的信息是否完整。作為EFA的基礎(chǔ),稿件中須提供相關(guān)矩陣的分析結(jié)果、旋轉(zhuǎn)前后因子所解釋的方差數(shù)值、因子載荷矩陣等信息,否則,研究結(jié)果缺乏重復(fù)驗證的可能。
2.驗證性因子分析(CFA)。CFA是研究者為再次確認量表中各維度及所包含的條目是否如原使用者所預(yù)期而采用的驗證方法。通常情況下,EFA和CFA是因子分析中不可分割的組成部分。在量表分析過程中,首先應(yīng)采用EFA建立模型,再用CFA對模型進行檢驗和修正,前提是在分析過程中必須要兩組分開的數(shù)據(jù)來做。例如,在血糖負荷相關(guān)飲食知信行量表的因子分析研究中,為確定量表的結(jié)構(gòu)和模型擬合程度,作者首先通過EFA對量表的所有條目進行篩選和分類,再根據(jù)EFA的分析結(jié)果,通過CFA對模型的擬合效果進行檢驗,以證實量表的結(jié)構(gòu)效度良好。隨著量表在醫(yī)學(xué)領(lǐng)域中的應(yīng)用越來越廣泛,醫(yī)學(xué)期刊中的量表類稿件也會越來越多,編輯掌握適當?shù)慕y(tǒng)計學(xué)知識對于此類稿件的審校意義重大。量表的質(zhì)量分析是量表研究中最重要的結(jié)果呈現(xiàn)形式,然而,現(xiàn)有的文獻無法具體指導(dǎo)期刊編輯對此類稿件的審編,加之一些期刊編輯對量表的質(zhì)量分析方法不是很熟悉,造成已發(fā)表的期刊論文中出現(xiàn)了質(zhì)量較差的量表類文獻。筆者結(jié)合本刊的實踐經(jīng)驗,對量表類稿件中的統(tǒng)計學(xué)問題和審查要點進行了總結(jié),方便同仁掌握其中的統(tǒng)計學(xué)方法。編輯掌握了量表類稿件的統(tǒng)計方法,可以對稿件進行高效的審核,從而降低出錯概率,提升期刊的稿件質(zhì)量。
更多醫(yī)學(xué)衛(wèi)生職稱職務(wù)資格評審條件和論文期刊要求相關(guān)信息推薦:
聯(lián)系方式詳見:醫(yī)學(xué)全在線論文投稿聯(lián)系方式
醫(yī)學(xué)全在線-論文頻道(gydjdsj.org.cn/lunwen/)第一時間整理發(fā)布全國各地醫(yī)學(xué)職稱評審公告、評審結(jié)果、論文評審條件、期刊目錄等通知。