醫學期刊編輯核查要點
時間:2022-03-16 02:33:26
導語:醫學期刊編輯核查要點一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
目前,醫學論文中的生存資料(survivaldata)非常常見。筆者在萬方數據庫中以“生存分析或預后分析或Cox”進行檢索(檢索條件為題名),共檢索出文獻2萬6476篇(其中2016—2017年的文獻1773篇),這還不包括其他中文數據庫中收錄的其他文獻,或者題目中沒有涵蓋這些表述但實際進行了生存分析的文獻,因此實際的生存分析文章遠不止檢索出的數量。這些論文中,生存分析涵蓋了醫學[1]、農業[2]、交通[3]等領域,可見目前生存分析的應用十分廣泛。由于生存資料蘊涵有結局和時間2個方面的信息,單純針對結局或時間的統計分析方法都不恰當,需采用特殊分析方法即生存分析。隨著生存分析的廣泛應用,醫學論文中關于一些生存分析不恰當的表述、甚至生存分析統計方法的誤用情況不斷出現,嚴重降低了文章的質量。因此,筆者總結了醫學期刊生存分析中的審查要點,以供編輯人員參考。
1統計描述部分
1.1注意生存概率和生存率的正確表述首先我們來看一下生存概率和生存率的定義。生存概率表示在某單位時段開始時存活的個體到該時段結束時仍存活的可能性大小。某年生存概率的計算公式為:p=N1/N0,其中N1為某年活滿1年人數,N0為某年年初觀察人數;而生存率是指觀察對象活過某時刻的概率,一般采用概率乘法原理估計生存率(如3年生存率等于第1年、第2年和第3年生存概率的連乘積)。醫學論文中“1年生存率”“3年生存率”“5年生存率”的表述非常常見。但這種表述是否正確呢?這還要看作者是如何得出該數值的。若作者是根據生存曲線,取值1、3及5年對應的生存率,則表述正確。但若作者是根據觀察例數和存活例數計算的,如3年生存率是計算的活滿3年的患者數量在隨訪患者中所占的比例,則其本質是3年生存概率,則3年生存率的表述就欠妥。1.2生存曲線的審查要點既往有學者[4]詳細總結了生存曲線的常見錯誤,包括曲線形狀不規則、曲線上沒有截尾數據、一批患者不同的分層曲線上截尾數據的有無不一致或例數不一致、曲線在后期或中期出現很長的平臺及生存曲線橫坐標為“0”時生存率不是“100%”,筆者在此不再贅述。本文總結了生存曲線的其他錯誤,如生存曲線包括了橫縱坐標以外的坐標、生存曲線存在交叉、生存曲線對應隨訪時間和文字結果不一致的問題。1.2.1生存曲線僅有橫、縱坐標生存曲線的本質是線圖。線圖的要求是:縱軸一般以0點作起點,否則需作特殊標記或說明;各測定值標記點間以直線連接,不可修勻成光滑曲線。在實際工作中,編輯往往要求作者提供可供編輯的矢量圖,通常是“emf”或“wmf”格式。而統計軟件輸出的統計圖,如最常用的SPSS,其生存分析圖片都是不符合編輯規范的,因此要求編輯在后期的校對時,將無關線條予以刪除。而目前的醫學論文中,很多生存分析曲線圖都不是規范的統計圖,如徐冉等[1]、傅文禕等[5]、張鵬等[6]的論文中,生存分析曲線圖中都有一些無關的線條。1.2.2僅進行單因素分析時生存曲線不能交叉有些醫學論文[5,7]中呈現的生存曲線是存在交叉的,這是生存曲線最常見的錯誤之一。關于生存曲線不能交叉的原因及應對策略,將在第二部分予以總結,此處不再贅述。1.2.3生存曲線最末一點對應的隨訪時間不應與文字相悖生存曲線依據生存時間繪制。醫學論文中往往報道了隨訪時間,而最長生存時間和最長隨訪時間的關系是,最長生存時間≤隨訪時間。因此,若生存曲線中的生存時間長于文中的隨訪時間,則數據就存在較大的問題,需要編輯提出質疑,請作者核查。
2統計推斷部分
2.1單因素分析時審查生存曲線是否存在交叉目前SPSS軟件用于比較生存曲線的方法有log-rank檢驗、Breslow(BS)檢驗(即Gehan-Wilcoxon檢驗)和Tar-one-Ware(TW)檢驗。目前醫學期刊的“主流”方法是log-rank檢驗。其實3種檢驗方法有其適用條件,各有側重:log-rank檢驗更注重“遠期效應”,即生存曲線開始差距小,隨時間推移逐漸分開的曲線適用log-rank檢驗(圖1);BS檢驗更注重“近期效應”,即生存曲線開始差距大,隨時間推移逐漸接近的曲線適用BS檢驗(圖2);TW檢驗介于兩者之間。由此可知,由于TW和BS檢驗在前期賦予較大的權重,因此該2種方法對生存曲線后期的差異不敏感,因此不適合后期差異較大的生存曲線的比較。由于醫學上對患者的隨訪,常常是開始生存情況較好,隨時間延長生存率降低,生存曲線逐漸分開,因此log-rank檢驗在醫學期刊中最常見。但log-rank檢驗有一重要條件(也是BS檢驗和TW檢驗的重要條件),就是生存曲線不能交叉[8-9],因此進行生存曲線的繪制非常有必要。假設2條生存曲線有1個交叉點,交叉之前和交叉之后的生存情況完全相反,則哪組的生存情況更好呢?無法判定。生存曲線交叉提示存在混雜因素。針對生存曲線交叉的情況,目前的處理方法有Reny(RE)、Lin-Wang(LW)和Two-stage(TS)法,其中尤以TS法具有較好的適用性與穩健性[10-12],也可進行分層分析或構建Cox比例風險回歸模型控制混雜因素的影響。2.2多組生存曲線有統計學意義時審查是否需進行兩兩比較當涉及3個組別及以上的生存曲線的比較時,若總體有統計學意義,只能得出至少有2組比較差異有統計學意義的結論,但具體哪組好?哪組差?則需要通過兩兩比較來回答。生存分析的兩兩比較一般通過校正α來實現,通過Bonferroni過程、Dunn-idák過程[13]、Benjamini-Hochbe過程、Benjamin-Yekutieli過程等[14]對α進行校正。但筆者認為這些方法較復雜,可通過構建多因素Cox比例風險回歸模型來解決,直接實現類別間的比較,而不需單獨校正α。2.3多因素分析Cox比例風險回歸模型為最常用的多因素生存分析方法。醫學期刊編輯在處理此類文章時,需從以下幾個方面進行核查。2.3.1多因素分析審查樣本量是否足夠進行Cox比例風險回歸模型分析時,樣本含量不宜過小。隨著納入變量的增加,樣本量應有所增加。孫振球等[9]認為,Cox比例風險回歸模型分析時,樣本量應該為納入變量的5~20倍。如《28例同時多原發肺癌的生存分析及預后影響因素研究》[15]中,擬合了Cox比例風險回歸模型,顯然樣本量過少,結論有待商榷。2.3.2變量納入方法審查Cox比例風險回歸模型和其他多因素模型一樣,變量的納入需考慮專業、臨床實際、既往研究、變量之間的關系,進行綜合選擇。尤其需注意的是,變量的納入不能單純依靠單因素分析結果,即只納入單因素分析時有統計學意義的變量[7,16-17],這是醫學期刊多因素分析文章中最常出現的問題。例如,眾所周知,腫瘤的TNM分期對于患者預后的影響是肯定的,分期越晚,預后越差。但如若單因素分析時,TNM分期并無統計學意義,多因素分析就不納入了嗎?答案是否定的。單因素分析之所以沒有統計學意義,即是因為單因素分析時只分析了TNM分期一個變量,并未對其他混雜因素進行控制,因此導致了和臨床實際相悖的結論。那據此就否定了單因素分析的價值嗎?答案也是否定的。當病例數量較少,難以進行多因素分析時,單因素分析作為一種探索方法,對于各因素對預后影響的探索,也是很有必要的。2.3.3不同類型變量納入形式核查在變量納入過程中,對于計量資料,直接納入模型即可,但對于計數資料,不同的計數資料類型有不同的納入形式。如閆麗等[18]構建了高血壓患者腦卒中發病影響因素的Cox比例風險回歸模型,得到表1;張小鵬等[19]構建了鼻咽癌生存影響因素的Cox比例風險回歸模型,得到表2。根據表1和表2可知,年齡和性別為二分類變量,文化程度為無序多分類資料,臨床分期為有序多分類資料即等級資料。那為何文化程度對應2行數據,而臨床分期對應1行數據呢?原因是無序多分類是作為啞變量納入模型(啞變量數量為分類數量-1,如三分類資料有2行數據、四分類資料有3行數據,以此類推);而臨床分期,作者是將其以線性變量納入模型,即將等級資料類似于計量資料納入模型,因此只有1行結果。若臨床分期是作為啞變量納入的,則也需有3行結果。但是,無序多分類不能以線性形式納入模型。編輯在編修論文時,需注意審查作者變量納入和結果表述的一致性,尤其對于無序多分類資料以啞變量形式納入模型時,需注意結果呈現是否完整或作者變量納入形式是否有誤。此外,對于以計數資料形式納入的變量,一定要寫明對照,如表1中,性別是以男性為對照,文化程度是以小學及以下為對照;表2中對照不是很明確,雖然作者給出了具體變量賦值(一般軟件擬合模型時常規以賦值為0的類別作為對照),但從科學性角度來講,明確對照也是必要的。2.3.4Cox比例風險回歸模型的模型診斷開展Cox比例風險回歸模型時,需重點考察比例風險假設是否滿足,因只有在滿足比例風險假設條件下進行擬合時,其參數估計值才是有效的。對于風險比例假設的驗證,常用的方法包括圖形法和構建時間依存性協變量的方法,前者只是粗略的評估方法,更嚴謹的是后者,一般采用軟件計算。筆者認為,比例風險性的檢驗結果作為模型擬合的前提,可常規呈現。2.3.5多因素分析結果是否呈現完整表1和表2呈現內容不同的地方在于,表1呈現了Waldχ2值,而表2呈現了標準誤信息。筆者認為,Cox比例風險回歸模型結果的呈現應同時包括回歸系數(β值)、Waldχ2值、標準誤、RR值及其95%置信區間(95%CI)、P值及擬合優度信息。這樣一方面可全面呈現分析結果,另一方面在一定程度上有助于審查模型的合理性。若某個變量標準誤特別大(如>100),則在很大程度上提示模型存在問題,需請作者進一步核查。模型的擬合優度即模型擬合實際觀測值的程度,建議常規呈現。2.3.6審查RR值、RR95%CI及P值之間的一致性RR值、RR95%CI及P值之間的關系是,RR值一定在95%CI區間范圍內;P值小于0.05時,RR95%CI是一定不包括1的。因此,表2中的臨床分期結果不正確(P值小于0.05,但95%CI卻包括了1),需請作者排查。2.3.7審查多因素分析方法是否優選Cox比例風險回歸模型生存分析中的死亡時間是一個廣義的概念,不單是指通常意義上的生物體死亡,而是泛指標志某種處理措施失效的特征事件,如腫瘤的復發[20]、患者的無復發生存[21]、股動脈內膜剝脫術后的再狹窄[22]等,都可使用生存分析。有時作者采用logistic回歸對這些資料進行分析,但該方法只利用了結局信息,而未利用時間信息,并不是最優的統計分析方法。編輯可對作者提出優選方法建議。隨著生存分析在醫學領域中應用的逐漸廣泛,涉及生存分析的醫學論文越來越多。醫學期刊編輯在處理涉及生存分析的文章時,需從統計描述、統計推斷兩部分進行審核,多方位把關,遇到疑問之處務必告知作者核查,以盡量降低出錯概率,提升論文質量。
- 上一篇:發電企業成本控制管理探討
- 下一篇:初中政治時政教學策略
精品范文
10醫學檢驗專題報告