數據挖掘疾病預測研究
時間:2022-01-30 09:20:02
導語:數據挖掘疾病預測研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
【摘要】隨著計算機和數據挖掘分析日益劇增,在醫學預測方面已經取得了很好的結果,具有非凡的意義,深度學習最近幾年已經有個初步的結果,并且用到了醫學領域。那么工作分為,數據歸一,基于DBN的數據構建,設計DBN模型,以及實現預測。設計模型,包括數據預測模塊,預測結果以及展示結果。將數據進行分析處理,預分析,以及初步的測試,得到結果。
【關鍵詞】大數據;疾病預測;醫學信息系統;數據挖掘,DBN算法的基本原理
1引言
近年來非典病毒在我國泛濫,出現這一問題有很大的社會因素。那就是危機意識。非典毫無疑問是一場公共衛生危機,這場危機之所以能夠爆發并造成嚴重影響,除了病毒的新發性之外,危機意識的淡薄以及由此導致的社會預警系統的缺乏和應有的防治措施的不力,這是一個決不可忽視的社會因素。再來說影響非典發病的因素。最主要的是疫苗因素,如今生產疫苗的工廠多,所以就造成了疫苗品種多,價格差異大,這樣就不能保證社會的總體免疫力良好,就給了病毒傳播的機會。其次是對藥品的濫用,長期過量使用氯霉素,鏈霉素,慶大霉素及皮質激素等藥物,因其破壞白細胞和淋巴細胞,而抗體均是由B淋巴細胞產生,因此大大影響了免疫效果,是人對非典抵抗下降加快病毒的擴散。疾病預測是疾病預防,準確的預測人群以及個體的疾病發展趨勢成為人們預測防范疾病是一個重要的手段,預測分為定性預測和定量預測,定性預測可以直觀的判斷預測主要是依靠經驗以及直觀判斷能力,不用或者用少量的計算,定性的預測能充分發揮人的主觀作用,考慮無法定量的因素,靈活省時省事,但缺乏數據的精確描述,而定量的預測,可以運用數學統計的方法對未來發展趨勢,增減速度以及可能達到發展的數量的說明。利用并構建DBN模型,設計實現疾病預測行為定性預測方面,建立模型進行預測的相關算法,利用波爾茲曼機以及BP網絡,采用貪婪逐層學習的方法對于疾病預測風險評估,利用模糊算法,回歸算法,支持向量機,預測年際變化。利用BP神經網絡預測每年疾病數目。由于疾病信息大,噪聲大,數據不完全以及隨機模糊性,疾病的風險預測顯得極其重要。本文采用了深度學習深度信念網絡的模型方法,來提高疾病的預測的準確性,采集疾病病人的體檢數據,對數據進行分析處理,歸一化,建立計算處理的基礎表示數據庫,對于數據進行分析,論文預測構建。分為預處理,疾病建立,開發DBN系統以及參考測試結果。
2學習方法
當前幾種疾病的預測方法,先已有的包含,回歸預測,時間序列預測,灰度預測,以及人工神經網絡等方法。但是此幾種方法各有缺陷,而深度學習的方法是基于數據特征進行學習,論文提出的DBN模型不僅可以學習特征還能自適應,也可以避免BP的局部極小的情況。2.1BP神經網絡。BP網絡是通過逆向傳輸,通過梯度下降得到一個較好的效果,BP網絡也稱為梯度下降網絡,通過誤差平方和最小,BP的神經網絡的拓撲結構,輸入輸出隱層,信息正向傳輸,誤差率反向傳播的過程,雙向并行進行。輸入層接收信息,輸出層輸出處理之后的結果,中間主要是通過數據轉換,信息變換,通過數據處理得到想要的答案。誤差則通過輸出層,按照誤差梯度下降的方法修正各個權值,向隱層以及輸入層傳播,去調節權值去達到誤差最小。最常見的就是一個三層的網絡機構,如圖1所示。此種網絡有很強的映射能力,非線性性能完備。那么在BP網絡中,隱層足夠的情況下,能夠實現任意非線性函數的逼近,但是BP存在他自身的局限性,譬如:梯度消失,局部最優,學習速度慢,無法控制隱層個數等等問題。2.2DBN學習預測疾病。DBN算法是數據挖掘技術中常用的一種分類和預測方法。深度信念機,是由多個波爾茲曼機組成的神經網絡,存在一個n層的網絡模型,針對隱層以及可視層實現聯合概率分布。進行預學習以及整個DBN的模型學習訓練,是對一個受限波爾茲曼機單獨進行訓練,之后疊加一層,作為下一層輸入,再通過反向學習算法進行調節,圖2所示。此模型的好處在于,首先對于數據特征進行一次學習,然后通過自學的方式再將結果輸出,作為下一層的輸入進行訓練學習。一步一步層層學習和訓練,作為深度學習的過程,對于特征分析可得到更好的結果。深度信念網絡實現了從上向下的學習結構,自生成的結構,處理模糊信息加以傳播,從而減少傳播的誤差。在此網絡用于各個網絡過程,實現了較好的結果。
3預測模型建立
基于DBN的模型,首先數據采集,采集心血疾病的各項體征,將數據分為測試和預測兩份。(1)數據采集,采集醫學數據以及劃分數據分析。(2)構造DBN的模型,采用疾病分析方法的網絡構架,包括輸入點,隱層點和輸出點的設計。(3)構造模型,以及利用訓練數據,對其加速訓練,以及設計最好的網絡結構進行分析,得到誤差函數。設計權值矩陣以及共軛梯度。(4)測試,將數據輸入模型進行測試。(5)分析結果。
4結論
本文基于DBN算法建立流程,通過驗證實驗結果準備率,相比與BP的網絡進行對比,DBN準確率高于深度學習的準確率。通過建立數據,以及樣本的歸一化,實現確定各個層數的隱層以及輸出,對數據進行學習,數據處理完成模型建立完畢。
參考文獻
[1]譚慭莘,田考聰.數學模型在人群疾病預測研究中的應用[J].中國醫院統計,2005,12(1):83~85.
[2]袁鶯楹,董建成.基于數學模型的疾病預測方法比較研究[J].軟件導刊,2009(5):108~110.
[3]涂德華,張理義,陶鳳燕.軍人心理疾病預測量表的信度及效度檢驗[J].江蘇大學學報(醫學版),2009,19(2):168~172.
[4]余凱,賈磊,陳雨強,徐偉.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,09:1799~1804.
[5]由清圳.基于深度學習的視頻人臉識別方法[D].哈爾濱:哈爾濱工業大學,2013.
[6]王山海,景新幸,楊海燕.基于深度學習神經網絡的孤立詞語音識別的研究[J].計算機應用研究,2015,8.
作者:高驍智 單位:陜西延安中學
- 上一篇:數據挖掘在建筑暖通空調的應用
- 下一篇:數據挖掘技術對手機應用市場的運用