復雜網絡方法在數據挖掘的應用
時間:2022-01-13 09:46:53
導語:復雜網絡方法在數據挖掘的應用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
使用復雜網絡方法進行中藥配伍規律挖掘相比于傳統方法擴展性更強,挖掘深度更深,目前已成為分析和研究重要配伍規律的有力工具。本文在介紹復雜網絡相關概念的基礎上,給出了使用重疊社團發現算法進行中藥配伍規律挖掘的三種主要方法,并介紹了這些方法在中藥配伍規律研究中應用的案例。最后對相關方法進行總結和展望。
中藥復方是指在遵循中醫用藥規則的前提下,使用多種藥物混合組成的方劑。方劑中藥物之間的配伍組合有著復雜的聯系和約束,這種聯系和約束是根據藥物作用、禁忌關系、藥性藥效、病癥原由等所建立的具有科學依據的相互關系。通過研究方劑中藥物配伍關系,對于揭示用藥配伍合理性、建立健全用藥科學依據具有重要的意義。傳統的中藥配伍數據挖掘方法基于統計學的研究方法,如統計值法、聚類算法、關聯規則方法等,這些方法只能挖掘淺層次的藥物間關系,但無法揭示藥物間深層次的聯系[1]。而復雜網絡方法的引入可以為研究重要配伍規律提供新的方法和手段。
1復雜網絡概述
復雜網絡(ComplexNetwork),是一種特殊的網絡結構,它是將復雜系統中的元素抽象為節點,元素間的關系抽象成邊的網絡結構模型,并不是所有的網絡都屬于復雜網絡,它需要滿足如下的三個特征:(1)小世界特性(SmallWorld),即網絡中點與點之間的特征路徑長度值小,接近隨機網絡,但網絡的聚合系數卻很高,接近規則網絡[2]。(2)無標度特性(Scale-free),即在網絡中少數節點的度值會很大,而大部分節點卻很小,節點的度值分布符合冪率分布規律[3]。(3)社團結構特性,復雜網絡中的節點往往會呈現出集群特性,即社團區域內部節點之間的聯系非常強,而社團內節點與社團外節點的聯系明顯減弱。由于中醫用藥博大精深,方劑中藥物類型多且配伍關系復雜,這種關系很適合利用復雜網絡模型來表達,同時諸多論文也驗證了使用藥物作為節點,藥物間關系作為邊所建立的網絡模型具有復雜網絡的相關特性,基于建立在中藥復雜網絡模型上的數據挖掘方法已經成為分析中醫用藥配伍規律,闡明中藥配伍科學內涵的有力工具。近年來,憑借復雜網絡良好的擴展性和內在發掘機制,使得復雜網絡與中藥理論得到了有機地結合,孫正等[4]提取藥物藥性中的“性味”“歸經”“功效”,在向量空間模型上建立藥物屬性模型,提出了一種基于藥物屬性相似度的度量方法,并使用復雜網絡方法進行分析;周偉等[5]從藥物與病癥關系角度,基于藥物在方劑中出現的次數,提出藥物效用度的概念,并進行組網和核心藥物配伍規律挖掘;劉思鴻等[6]通過網絡藥理學方法構建“中藥-成分-靶點-疾病”網絡,可從靶點的作用通路和功能角度,闡明中藥復方的多通路、多層次協同整合作用,為中藥治療疾病的分子機制提供了一種分析思路。這些嘗試使利用復雜網絡方法進行中藥配伍規律挖掘的應用更加廣泛。
2復雜網絡進行中醫藥數據挖掘的方法
中藥復雜網絡中藥物配伍發現的過程可以歸結為復雜網絡社團檢測算法的應用。社團檢測(CommunityDetection)又稱為社團發現,該方法基于聚類的思想來實現具有相同特性節點的聚集。2004年,Newman提出了一種模塊度(Modularity)的概念,從而使得網絡社團劃分的優劣可以有一個明確的評價指標來衡量[7],使得社團發現算法更加的系統化。按照聚集的結果可以將社團發現算法歸為非重疊社團發現和重疊社團發現兩種,這里的主要差別是同一節點是否會劃分到多個聚類社團當中,很明顯在中藥配伍規律研究中一種藥可以出現在多個配伍之中。因此,針對中藥配伍規律的研究主要采用的是重疊社團發現算法,目前常用的方法主要有如下三種[8]:
2.1派系過濾算法
派系過濾算法[9](CliquePercolationMethodCPM)是第一個被提出的重疊社團發現算法,該方法將社團定義為一類由全連通子圖構成的集合,從網絡中找出所有大小為k的全連通子圖作為一個社團,由于一個點可以在多個連通子圖中,因此可實現重疊社團的發現。使用CPM算法進行中藥配伍規律研究在早期應用的比較多。黃源等[10]針對慢性阻塞性肺疾病的4種證型(肺腎兩虛、痰濕蘊肺、痰瘀阻肺、痰熱壅肺)分別建立復雜網絡子網絡,使用派系過濾算法發現含藥在10以上的基本方;李茹等[11]通過引入屬性擴展圖建立治療肺痿中藥用藥的復雜網絡模型,使用CPM派系算法,設定k值為4,共獲得19個有價值的藥物社團。
2.2局部擴展算法
該方法主要采用局部擴張的方法,根據擴展特性而快速確定社團范圍的一種貪心算法。2009年,Lancichinetti等[12]首次提出了局域擴展的重疊社團挖掘算法(LocalFitnessMeasureLFM)。該方法首先隨機選擇一個種子節點,然后按照規則不斷地向外擴張構建社團,當適應函數達到局部最優時完成構建過程。這種方法由于設計簡單,快速有效,在中醫藥配伍挖掘領域應用廣泛;周偉等在建立肺痿用藥復雜網絡的基礎上,定義了一個節點對社團的效用度增量,采用LFM貪心算法的思想選擇核心藥物作為種子節點進行社團擴展,共發現30個藥物組合;韓楠等[13]根據中藥方劑特性并結合點互式信息構建TCM網絡模型,基于LFM算法改進社團擴展方法,實現中藥配伍組合的有效挖掘;楊銘等[14]通過對藥物配伍網絡的極大團求解算法(LFM算法的改進)得到中醫藥治療肺癌的核心有效處方;嚴明等[15]針對連花清瘟膠囊治療上呼吸道感染臨床用藥方案建立復雜網絡,使用基于Louvain聚類方法(一種局部擴展算法)進行分析與研究。
2.3標簽傳遞算法
Zhu等人[16]首先提出了標簽傳遞算法(LabelPropa-gationAlgorithmLPA)的概念,該算法的思想是首先為每一個節點添加一個唯一的標簽,然后根據該節點周圍鄰居節點中出現頻率最高的標簽來更新該節點的標簽,最后將具有相同標簽的節點歸為同一社團。該方法最早應用于非重疊社團的發現,Gregory[17]基于該算法進行了改進,將每個節點可標記標簽的個數設置為多個(COPRA算法),從而實現了重疊社區的發現,如圖1所示是該方法的運算過程。標簽傳遞算法是目前中藥配伍復雜網絡方法中應用較多的一種,孫道平等[18]根據方劑藥物貢獻度進行組網,使用改進的標簽傳遞算法COPRA進行社團發現,挖掘中藥配伍規律;呂慶莉[1]以腦血管疾病用藥為例構建中藥用藥屬性擴展網絡,并使用改進的重疊社團發現算法CO-PRA進行方劑配伍規律的發掘和分析;馬寧等[19]在構建中藥復雜網絡引入了方劑中“君臣佐使”藥物權重及藥量,使用一種保留歷史標簽的標簽傳遞算法SLPA進行配伍規律的挖掘;張胤穎[20]建立藥物節點、藥物性味節點、藥物歸經節點、藥物功效節點4種節點的風濕方劑用藥復雜網絡模型,并使用COPRA算法進行用藥社團獲取。
3總結與展望
本文探討了使用復雜網絡重疊社團發現算法進行中藥配伍規律挖掘的幾種方法,涵蓋面并不一定很全,但包含了幾種主要的挖掘方法,雖然這些方法各自有各自的優勢,但也都存在改進的地方,例如,派系過濾算法的挖掘效果受k值設定大小的影響很大,局部擴展算法受備選種子質量的好壞影響,標簽傳遞算法識別精度不穩定,需要人為設定閾值等諸多問題,但這些方法提供給了研究人員進行中藥復方配伍規律挖掘的一些新思路和新手段,同時提供了一些有價值的研究成果。在將來隨著在這些方法上的持續改進以及與中藥理論的深度結合,相信會產生更多有價值和意義的研究成果。
作者:馬寧 邢俊鳳 宋寬 單位:內蒙古科技大學包頭醫學院計算機科學與技術學院
- 上一篇:地面數字電視傳輸技術探索
- 下一篇:電視文化類綜藝節目價值觀表達邏輯