糖尿病犯者醫療管理研究

時間:2022-11-15 09:16:38

導語:糖尿病犯者醫療管理研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

糖尿病犯者醫療管理研究

近十年來,我們面臨快速增長糖尿病患者人數,患者人群也成為了公共健康最為沉重的負擔之一。2000年,所有年齡層的糖尿病患病率達2.8%,預計到2030年該數據將達到4.4%[1]。2000年,因糖尿病導致的全球過量死亡率預計達到290萬人,相當于全年死亡人數的5.2%[2]。伴隨著不同的并發癥,糖尿病對個人生活質量以及醫療資源的使用造成了相當大的影響。預先血糖控制可以減緩或防止糖尿病并發癥的發生。一般來說,糖尿病患者的保健質量通過血紅蛋白A1C來評估。

1資料與方法

1.1分類算法及效果評估。為比較屬性選擇的效果,需要利用三種分類算法測試屬集:一個以樣例為基礎的學習法KNN,一個決策樹學習法C4.5,還有一個概率學學習法樸素貝葉斯分類法(NaïveBayesclassifier)。KNN是以樣例為基礎學習法的一個例子,列舉一個新的例子,KNN算法給最相似的一個或多個樣例分配類別。根據樣例間的差距計算相似度。本研究中,我們使用的分類精度和受試者工作特征曲線下的區域(藥時曲線下面積)評估分析模型的效果[3]。分類精度的研究原則,是使用最為普遍的原則。藥時曲線下面積有著重要的數據特性。一個模型的藥時曲線相當于概率,無論該模型中隨機選取正樣例的級別是否高于隨機所選負樣例[4]。一般而言,面積越大,模型越好。1.2數據描述。本研究使用的臨床數據庫來自于臺灣中部的一家醫學院附屬醫院,該院擁有110名醫生、600個床位,以及每年60000件的門診服務和10000件的住院服務。該數據集中有1498個樣例。本研究收集的特征包括連續數據,如年齡、發病期、身體質量指數(BMI);分類數據,如性別、受教育程度、家庭病史、定期鍛煉、日常飲酒、吸煙、自我護理、共病、血糖檢測使用情況、治療情況。ICD-9診斷碼,共病分為五類:腎臟并發癥、眼部并發癥、神經系統并發癥、血管并發癥以及足部并發癥。治療方法分為三類,包括飲食控制、口服液以及胰島素注射。決策屬性A1C分為兩個級別:認為A1C<9.0%是做到了良好的血糖控制;認為A1C≥9.0%是血糖控制非常不理想[5]。

2研究結果分析

實驗中使用的血糖控制數據。通過使用信息增益、增益率、對稱不確定性以及ReliefF評級算法的整套數據確定特征評級。數據集里使用三個連續特征,十個分類特征。四種特征評級方法提供不同的級別,明顯地生產不同的分類效果。血糖控制前五個重要特征是年齡、治療方式、自我護理條件、受教育程度以及定期鍛煉。C4.5分類法,KNN(k=1),樸素貝葉斯用于測試分類盒藥時曲線下面積。我們使用十倍的交叉效度分析作為標準,預測帶有固定數據樣本的學習法分類法的準確性和藥時曲線下面積。通過使用四種特征評級方法比較C4.5的分類準確性,使用五個和六個特征的ReliefF評級算法獲得最佳的分類準確性為73.56%。KNN分類法中,使用四個特征的ReliefF評級算法獲得的最佳分類準確性為73.56%。NB分類法中,使用五個特征的IG、GR、SU算法獲得的最佳分類準確性為74.10%。與C4.5和KNN分類法相比,NB獲得的準確性比C4.5和KNN模型更好。通過使用四種特征評級方式比較C4.5的藥時曲線下面積,采用七種特征的ReliefF的評級算法獲得最大的面積為6199。KNN分類法中,使用五個特征的ReliefF評級算法獲得的最大藥時曲線下面積為6251。NB分類法中,使用五個特征的IG、GR、SU算法獲得的最大藥時曲線下面積為6553。與C4.5和KNN分類法的藥時曲線下面積相比,NB獲得的準確性比C4.5和KNN模型更好。本研究意在探究血糖控制特征的評級,以及使用不同的分級法探究四種特性評級方法的效果。我們提出四種特征評級方法的一個對照,生成特性評級列表。結果顯示,特征選擇有利于改善常見學習法算法。研究表明,任何學習分類法都不能完美地處理所有情況。研究表明NB分類法和藥時曲線下面積要比C4.5和KNN分類法和藥時曲線下面積有更高的優越性。C4.5和KNN、ReliefF評級算法可以獲得最佳的準確性和最大藥時曲線下面積;NB、IG、GR、SU則獲得同樣的準確性和藥時曲線下面積。

本論文得出的結論對特征評級方法以及學習法算法有著重要的影響。其他特征選擇方式以及分類法模型能有益于將來的研究提高準確性和藥時曲線下面積。

作者:翁景德 唐維萍 許哲毓 單位:1.仰恩大學 2.華廈學院