中藥的使用會威脅生物多樣性嗎?
時間:2022-11-15 04:09:00
導語:中藥的使用會威脅生物多樣性嗎?一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
【摘要】歷代中醫醫案對中醫理論的不斷發展起著重要作用,而海量的醫案數據遠遠超出了人的理解能力。從信息科學角度來看,中醫醫案數據是混亂而又復雜的經驗數據。這導致了醫案研究的困難,亟需新技術和新方法的引進,知識發現技術方法可能就是一種重要而有效的方法。本文簡要介紹了中醫醫案中的知識發現技術方法,并提出具體研究思路,以期有助于實現醫案研究技術創新。
【關鍵詞】中醫;醫案;知識;技術;數據
中醫醫案是中醫臨床醫師實施辨證論治過程的文字記錄,是保存、查核、考評乃至研究具體診療活動的檔案資料[1]。在中醫藥學領域中,自古至今,從散在于各種史料中記錄的醫案雛形,到醫案專著,醫案一直伴隨著中醫藥學的發展。隨著醫案記錄的不斷涌現,醫案分析研究也層出不窮,在中醫理論的形成發展傳承過程中一直充滿活力,是中醫理論不斷發展的搖籃。隨著新技術、新方法不斷引入中醫藥研究領域,應用現代科學技術方法對中醫醫案進行研究已經提上日程。
1中醫醫案的特征與新技術新方法的引進
中醫醫案是中醫理、法、方、藥綜合運用的具體反映形式,它不僅是醫療活動的真實記述,而且還反映了醫家的臨床經驗及思維活動。由于醫家所處時代不同,個人經歷、學識、愛好和修養等各異,因此歷代醫案的數量、形式、體裁、風格和內容等亦在不斷變化中。我國早在2000多年前,名醫淳于意就首先注意醫案(診籍)的記載。但秦漢以降,醫家崇尚方書,此后直至隋唐五代,醫案才逐漸散見于醫籍和文史書中,數量少且內容簡;宋金元時期醫案專著開始出現,醫籍附案逐漸增多,醫家立案蔚然成風,醫案風格異彩紛呈。醫案發展至明代,開始有名醫醫案的專著出版,如江灌的《名醫類案》。此期在醫案數量增加的同時,質量也有了明顯提高,主要表現為內容完整、客觀;格式多樣、規范;說理透徹、詳明;文筆秀美、流暢[2]。明末清初醫家喻嘉言在《寓意草》中撰“與門人定議病式”,在韓懋和吳昆等人的基礎上,對撰寫醫案的內容與格式提出了更高的要求,即態度應嚴肅認真,內容應詳盡,理法方藥應齊備。而張山雷在撰寫風格上,或繼承明清兩代的特點,或對傳統醫案加以變革,采用中西匯通的觀點敘述醫案。隨著時代的不斷進步,醫案的數量也呈“爆炸式”增長。如隋唐五代前千百年的醫案,數量少且內容簡;而僅在清代,醫家撰寫的醫案專著就達200余種,而且門類齊全,風格多樣,既有個人醫案、醫案類書、醫案叢書,又有專科醫案、專題醫案、會診醫案、醫案評注及宮廷醫案等;近十年公開出版的名老中醫醫案有近百種之多,每種收錄醫案數百則到千余則不等。古今醫案內容也發生了很大變化[3],向應用中醫基本理論研究現代醫學疾病的方向發展,注重記載現代醫學已診斷明確的病名。常見的記載方式為中西醫診斷并列,以利互參。醫案記載實驗室等客觀檢查的內容逐日增多,針對檢查結果的辨治內容如“微觀辨證”等隨之出現。現代醫案中處方用藥的內容變化也較明顯,醫者不僅根據中醫藥理論選方用藥,而且根據現代醫學病理生理和中藥藥理進展來選方用藥,醫案中合用西藥的現象越來越多。即便現代醫案也存在著記載缺雜混亂、現代醫學成分過多、文詞晦澀、夸張不實等諸多問題[4]。從以上分析可知,從信息科學角度來看,中醫醫案數據將是混亂又復雜的經驗數據。這些導致了中醫醫案研究的困難。隨著科學技術的飛速發展,醫學領域分工日益細化,跨專業的溝通變得更加困難,而某個專業領域的信息,可能對相關專業領域是有價值的,它們之間存在著某種隱含的有價值的關聯,而以常規方式通常檢索不到這種關聯性。中醫醫案不僅涉及到臨床內、外、婦、兒各科,還包含了中醫學中的哲學基礎、中醫對正常人體和疾病的認識,以及中醫食療、養生和診療疾病的原則等方方面面,如何對其中隱含的知識進行解析與發現,必將是今后研究的熱點與難點。而且中醫藥學科內仍然有大量的問題,甚至是一些基本性的問題得不到合理的、科學的解釋,研究的空白比比皆是,這些都可能通過中醫醫案研究得到解決或啟示。但以個人之力實難發現其中蘊含的有價值信息,而且以人工逐字研讀名老中醫醫案,容易產生遺漏,來回翻頁又很繁瑣。要完成普通人不能完成的任務,這就需要有新技術新方法的引進,知識發現技術方法可能就是這樣一種重要而有效的方法。
2知識發現方法及其在中醫醫案研究中的應用
知識發現是指從數據集中識別出有效的、新穎的、潛在有用的,以及最終可被理解的模式的非一般的過程[5,6]。知識發現是多學科交叉的新興邊緣學科。近年來,隨著數據獲取和數據存儲技術的快速發展,各種數據庫、數據集和數據倉庫中存儲的數據量飛速增長。如何從這些海量數據中提取出有用的知識呢?數據庫中的知識發現(knowledgediscoveryindatabase,KDD)的出現為人們提供了一條解決這種“數據豐富而知識貧乏”困境的有效途徑。當前國際上,知識發現的研究主要是以知識發現的任務描述、知識評價與知識表示為主線,以有效的知識發現算法為中心。知識發現過程一般由三個主要的階段組成:數據準備、數據挖掘、結果表達和解釋。知識的發現可以描述為這三個階段的反復過程。中醫醫案中的知識發現也不例外。
2.1數據準備要有效地利用KDD進行中醫醫案知識發現,首先必須進行數據準備工作。目前,在“中文科技期刊數據庫(引文版)”、“中國期刊全文數據庫”等數據庫中,以的形式實現了部分現代醫案的數據準備工作。此外僅少數專題性質的數據庫收錄了一些古今醫案。再加上散見于古今醫籍和文史書中的醫案,中醫醫案的數據準備工作將是一個龐大的系統工程。中醫醫案的數據準備中具體要解決的是:設定并明確中醫醫案知識發現的目標;對中醫醫案數據加以充分理解;對相關的中醫醫案數據進行必要的預處理,使其符合KDD算法的要求;選用合適的KDD方法進行數據建模。其中中醫醫案中的知識發現的目標,可以從指導中醫臨床應用角度,對醫案內容加以分析歸納研究,如對醫者臨證思維的闡釋,對各醫家、流派學術思想的探討,各專科、專病、專癥理法方藥運用特點的歸納,以供臨證學習參照,并可建立智能診療系統。也可以就其中蘊含的中醫醫理、藥理進行研究,尋求中醫藥基礎理論的新突破、中藥新藥的勘探等。
2.2中醫醫案中的知識發現可能運用的主要技術
2.2.1統計方法從歷史上看,統計工作主要集中在測試預先的假說以及使模型適合于數據等。研究上,統計方法通常依賴于一個明確的潛在概率模型。此外,人們假定這些方法是由統計學家來使用的;為了生成候選假說和模型,人的干預是必要的。目前已有中醫醫案論文中用了頻數統計的這種最粗淺的醫學統計方法來進行研究,通過這種計量的研究使得結論更有說服力。如姜良鐸[7]在董建華的指導下,運用統計學原理對古今700多醫家10009則溫病醫案進行分析,從而總結出溫病診斷指標及證治方藥規律。
2.2.2聚類分析又稱集群分析,是指利用物以類聚的原理,把大量無序的數據分成數類,有助于對大量數據中的規則予以認識,它是一種數理統計方法,可將一些觀察對象依據某些特征加以歸類,在生物學和醫學分類問題中有著廣泛的應用。在中醫醫案研究中,聚類分析能較好地避免分類過程中摻雜的主觀因素,能客觀地準確地反映研究對象,并從中可能發現其內在的客觀規律[8]。如周德生[9]統計了明清時期26部現存醫案中的津液虧損病案573例,采用R型系統聚類分析方法,得出津液虧損中每個亞型的幾個主要用藥,并揭示了明清時期津液理論的某些特征。
2.2.3人工神經網絡人工神經網絡是指模擬人腦工作機制的一種計算模型,它是由非處理單元組成的非線性大規模自適應系統,以類似于人腦神經網絡的并行處理結構進行信息的高級處理。由于它具有自適應性、并行處理能力和非線性處理的優點,所以在醫學領域被廣泛應用[10]。目前已有學者利用人工神經網絡原理實現對病案的分析,用病癥分類神經網絡來說明知識自動獲取方法的實現。它應用人工神經網絡的反向傳播算法(backpropagationalgorithm,BP),通過研究中醫醫案,形成專家知識,對BP網絡進行訓練,從而使網絡獲得一定的學習能力,將訓練所“學習”而來的“知識”運用到新的病癥判斷中,從而實現對新知識的獲取[11]。其雖然只是舉了一個例子,但引進了醫案分析的新方法。
2.2.4決策樹該樹的每個非終端點均表示被考察數據項目的一個測試或決策,根據測試結果選擇某個分支。為了分類一個特定數據項目,從報結點開始,一直向下判定,直到到達一個終端結點(或葉子)時為止。當到達一個終端結點時,一個決策便形成了。決策樹也可解釋成一種特殊形式的規則集,其特征是規則的層次組織關系。前已述及,中醫醫案數據是混亂又復雜的經驗數據。而處理大量混亂而復雜的經驗數據的一個很好的方法是決策樹分類技術。利用知識發現中的決策樹方法來對這些數據分析,可以為醫生提供極具價值的知識,從而對臨床醫療方案進行優化。目前已有研究者從醫院病案室保存的冠狀動脈粥樣硬化性心臟病(簡稱冠心病)病案中選取了一些數據作為挖掘的原始數據集,進行了基于決策樹的醫療數據分析,得到了良好的效果[12]。同樣,我們也可以進行基于決策樹的中醫醫案數據分析,從而優化傳統的中醫醫療方案。
2.2.5模糊集與粗糙集模糊集是一種表達和處理不確定性的重要方法。不確定性以多種形式發生在今天的數據庫模型中,如不精確、不完全、不典型、不一致、含糊,等等。模糊集利用不確定性使系統的復雜性變得可處理。當精確輸入不可能或太昂貴時,模糊系統就是一種強有力的模型方法。粗糙集合理論中的模糊性就是一種基于邊界的概念,即一個不精確的概念具有模糊的不可被明確劃分的邊界。粗糙集用一個集合的上下界來定義,下界中的每個成員都是這個集合的成員,而上界的每個非成員也一定是這個集合的非成員。粗糙集中的上界是下界和邊界區域的并集。邊界區域的成員可能(但是不能肯定)是這個集合中的成員。因此,粗糙集可以被看成是一個有三級成員函數(是,否,可能)的模糊集。象模糊集那樣,粗糙集是處理數據不確定性的一種數學概念。與模糊集類似,粗糙集很少單獨使用,而通常是與規則推導、分類、聚類等其他方法一起組合使用。已有學者基于奇異粗集及其元素遷移,研究其在中醫藥辨證診治過程和中藥方加減中的應用,設計一個基于雙向S粗集的中醫藥辨證診治知識支持系統,為人工智能技術在中醫藥診治領域中的應用開辟了一個新的思路[13]。我們也可以采用類似方法研究中醫醫案中蘊含的各醫家辨證診治思維過程,從而把中醫藥研究引向深入。
2.3結果表述和解釋是指根據最終用戶的決策目的,對提取的信息進行分析,把最有價值的信息區分出來,并且通過決策支持工具交給決策者。在中醫醫案研究中,根據設定的中醫醫案知識發現的目標,例如關于疾病的診斷治法遣方用藥的分析,對相關信息進行相應分析處理,由特定知識發現工具來實現。但結果仍需終端用戶來判定是否符合中醫藥基本理論或者通過臨床科研實踐來進行驗證。
3非相關文獻知識發現法及其在中醫醫案研究中的應用
3.1非相關文獻知識發現法概述隨著科學技術的高度發展,學科的分化越來越細,學科間交流越來越困難,知識總量與人類吸收能力之間的矛盾日益突出。一個專業領域的信息可能對另一個專業領域是有價值的,跨學科間一定存在著潛在的未被發現的關聯。這就是所謂“知識分裂理論”[14]。在大量分裂的知識或科學文獻之間存在著千絲萬縷的聯系,這些聯系既包括我們通過常規組配檢索可得到的顯性的聯系(或知識),也包括那些常規檢索得不到的隱性的聯系(或知識)。1985年Swanson偶然發現,兩篇醫學文獻放在一起會揭示出某一個問題的答案,而這個答案是從單獨一篇文獻得不到的。這預示著在醫學文獻中存在著大量的未被發現的隱含的關聯。Swanson認為,將兩類非直接相關的文獻結合在一起分析,會形成一種新的知識,而這種新的知識是通過單獨分析兩類文獻中的任何一類而得不到的。這就是他的非相關文獻的知識發現思想[15,16]。在大量的文獻中,一些文獻可能相互引用,文獻間存在著人們可利用數據庫檢索到的顯性聯系;有些文獻互不引用或很少被共同引用,則稱這兩類文獻是相互獨立的,也就是非相關的。一些非相關文獻通過各自提出的觀點聯系在一起,形成邏輯關聯。這種聯系通過常規的數據庫檢索是檢不到的,是未被發現的隱密的聯系,是新知識的源泉,可能對科研的發展具有重大意義[17]。常規的聯機醫學文獻分析檢索系統(MEDLINE)檢索方式是通過給定的題目檢索已發表的文獻。為了擴展MEDLINE檢索功能,克服其局限性,Swanson設計了一個人機交互的軟件系統,并制定了相應的數據庫檢索策略,稱為Arrowsmith,用于分析研究非相關的互補文獻,更加易于在兩組生物醫學文獻間發現互補性結構[18]。在Swanson的研究方法的基礎上,很多研究人員對基于非相關文獻的知識發現方法進行了改進。Gordon和Lindsay改進了Swanson的基于單詞的詞頻統計方法,利用基于短語的詞頻統計方法,引入了四個參數來獲得短語的最終詞頻,驗證了雷諾病(Raynaud),魚油(fishoil)之間的關聯[19,20]。Weeber等[21]利用一體化醫學語言系統(UnifiedMedicalLanguageSystem,UMLS)的語義類型實現了自然語言與UMLS概念的映射。這種語義篩選的機制能夠產生概念的聚類,尤其是中間集合的概念的聚類。Srinivasan[22]將Weeber的語義分析方法和Gordon的詞頻統計方法結合起來提出基于概念的詞頻統計方法,將自然語言通過醫學主題詞表(medicalsubjectheadings,MeSH)與UMLS的語義類型聯系起來,并利用Gordon的統計參數,計算概念之間的相關性。
3.2非相關文獻知識發現法及其在中醫醫案研究中的應用由于中醫醫案是中醫臨床醫師實施辨證論治過程的文字記錄,相互之間幾乎互不引用,兩篇中醫醫案相互獨立,也就是非相關的,這符合非相關文獻的定義。但是其中蘊含的醫理可能是一致的,這為非相關文獻知識發現法在中醫醫案研究中的應用提供了基礎。Arrowsmith系統是實現非相關文獻知識發現的軟件工具,其主要功能是:從兩類非相關文獻數據庫記錄的標題、主題詞及文摘當中,提取自然語言并加以分析排列,找到能表達兩類非相關文獻間關聯性的概念、詞語等,供研究人員參考。我們完全可以借鑒和參照Arrowsmith系統,結合相關技術研究最新進展,研制可處理中醫醫案的軟件系統。有研究者[23]提出了非相關文獻知識發現法在中醫研究中的應用需要依賴的幾項關鍵技術。非相關文獻知識發現軟件系統本身并不復雜,但是實現在中醫醫案研究中的應用同樣需要依賴幾項關鍵技術。
3.2.1中醫醫案數據庫的建立面對浩若煙海的中醫醫案文獻,面對因時代變遷而造成眾多歧義的中醫藥概念及詞匯,中醫醫案數據庫的建立是需要首先解決的問題。中醫醫案一般沒有標題、主題詞及摘要,甚至某些中醫醫案本身就帶有摘要性質。同時中醫醫案形式、體裁、風格、內容的多樣性也使中醫醫案數據庫的建立成為困難。我們可以采用先易后難的策略,先從較規范的現代醫家醫案入手,最終建立中醫醫案數據庫。
3.2.2中醫藥學中文文本自動分詞和詞性標注系統研制實施中醫藥古文獻的自動切分與標注,需要一個高性能的切分標注軟件。近年來,中文自動分詞技術,無論是自動分詞的算法方面,還是詞表的研制方面,都取得較大進展,技術已經日益成熟。將這些技術應用于中醫醫案研究當中還需要做一些軟件實現或集成的工作。但同時,中醫疾病病名、藥名、度量衡混亂,亟需穩定化、標準化[24],中醫理論術語的模糊性等,也是軟件設計中要解決的問題。
3.2.3停用詞表研制因為中醫語言的多義性與模糊性,有一些無意義的語詞,或者是在特定研究領域內無意義的語詞,應該列入停用詞表,在抽詞的過程加以刪除,降低運算的復雜程度,提高結果的準確性。但停用詞與停用范圍的確定本身也是個要解決的問題。
4結語
章太炎先生指出:“中醫之成績,醫案最著。欲求前人之經驗心得,醫案最有線索可尋,循此鉆研,事半功倍。”要挖掘中醫寶庫,就要總結前人經驗,研究其學術思想;要提高臨床療效,要升華形成新的理論,以推動中醫藥學科的整體發展。因此,有必要認真研究中醫醫案。我們有理由相信,隨著知識發現技術方法在中醫醫案研究中的應用,中醫藥學一定有著更廣闊的未來。
【參考文獻】
1ZhangXP.StudyontraditionalChinesemedicalcaserecords.Beijing:ChinaPressofTraditionalChineseMedicine.1995:1.Chinese.
張笑平.中醫病案學.北京:中國中醫藥出版社.1995:1.
2LiuGS,XuQH,WangCM.Briefdiscussiononmedicalcaserecords,medicalsayingandmedicaldiscussing.ShandongZhongYiYaoDaXueXueBao.1997;21(5):381384.Chinese.
劉更生,徐慶會,王長美.醫案、醫話、醫論說略.山東中醫藥大學學報.1997;21(5):381384.
3HuJB,HeL.Effectsofthechangesofmedicalcaserecords''''contentonthedevelopmentoftraditionalChinesemedicine.WannanYiXueYuanXueBao.1992;11(1):5961.Chinese.
胡劍北,何玲.醫案內容變化對中醫學發展的影響.皖南醫學院學報.1992;11(1):5961.
4HuJB.Exploringthestudyofsomeproblemsinmedicalcaserecords.WannanYiXueYuanXueBao.1991;10(4):264265.Chinese.
胡劍北.醫案中若干問題的討論.皖南醫學院學報.1991;10(4):264265.
5GuoM,WangJ.Datamininganddatabaseknowledgediscovery.MoShiShiBieYuRenGongZhiNeng.1998;11(3):292299.ChinesewithabstractinEnglish.
郭萌,王玨.數據挖掘與數據庫知識發現.模式識別與人工智能.1998;11(3):292299.
6LosiewiczP,OardDW,KostoffRN.Textualdataminingtosupportscienceandtechnologymanagement.JIntelInfoSyst.2000;15(2):99119.
7JiangLD.Studyonindexofepidemicfebrilediseasediagnosisanddisciplineofthesyndrome,treatment,recipeanddrugs:statisticanalysison10009casesofancientandmodernmedicalcaserecordsaboutepidemicfebriledisease.ZhongYiZaZhi.1987;30(11):30.Chinese.
姜良鐸.溫病診斷指標及證治方藥規律的研究—古今溫病醫案10009例次統計分析.中醫雜志.1987;30(11):30.
8LiuJ.TheapplicationofclusteringanalysisintraditionalChinesemedicalresearch.ZhongYiYaoXueKan.2004;22(5):927928.Chinese.
劉稼.聚類分析在中醫藥研究中的應用及意義.中醫藥學刊.2004;22(5):927928.
9ZhouDS.Statisticanalysisontreatmentaccordingtosyndromedifferentiation:573casesofmedicalrecordsaboutdeficiencyofbodyfluidintheMingandQingdynasties.ZhongYiYaoYanJiu.1998;14(4):1213.Chinese.
周德生.明清時期津液虧損病案573例辨證用藥統計分析.中醫藥研究.1998;14(4):1213.
10CaoXQ,MouYG.Artificialneuralnetworkstechnologyapplicationsformedicineresearch.XianDaiLinChuangYiXueShengWuGongChengXueZaZhi.2003;9(1):5760.ChinesewithabstractinEnglish.
曹顯慶,牟永閣.人工神經網絡技術在醫學研究中的應用.現代臨床醫學生物工程學雜志.2003;9(1):5760.
11YeJ,XingCD.ANNbasedillnessesdiagnoseprototypesystem.DongHuaDaXueXueBao(ZiRanKeXueBan).2003;29(4):4344.ChinesewithabstractinEnglish.
葉進,邢傳鼎.基于人工神經網絡的病癥診斷原型系統.東華大學學報(自然科學版).2003;29(4):4344.
12LiuK,LiuYZ.Analysisofmedicaltreatmentdatabasedondecisiontree.JiSuanJiGongCheng.2002;28(2):4143,78.ChinesewithabstractinEnglish.
劉昆,劉業政.基于決策樹的醫療數據分析.計算機工程.2002;28(2):4143,78.
13HuYM,JiaL.Knowledgesupportsystemofdoctordiagnosisrecognitionbasedonsingularroughsets.JiSuanJiGongChengYuYingYong.2004;40(16):3132.ChinesewithabstractinEnglish.
胡詠梅,賈磊.基于奇異粗集的中醫辨證診治知識支持系統.計算機工程與應用.2004;40(16):3132.
14Onthefragmentationofknowledge,theconnectionexplosion,andassemblingotherpeople''''sideas./Bulletin/Mar01/swanson.html.
15SwansonDR.Fishoil,Raynaud''''ssyndromeandundiscoveredpublicknowledge.PerspectBiolMed.1986;30(1):718.
16SwansonDR.Migraineandmagnesium:elevenneglectedconnections.PerspectBioMed.1988;31(4):526557.
17SwansonDR.Medicalliteratureasapotentialsourceofnewknowledge.BullMedLibrAssoc.1990;78(1):2937.
18SmalheiserNR,SwansonDR.UsingARROWSMITH:acomputerputMethodsProgramsBiomed.1998;57(3):149153.
19GordonMD,LindsayRK.Towarddiscoverysupportsystems:areplication,reexamination,andextensionofSwanson''''sworkonliteraturebaseddiscoveryofaconnectionbetweenRaynaud''''sandfishoil.JASIST.1996;47(2):116128.
20LindsayRK,GordonMD.Literaturebaseddiscoverybylexicalstatistics.JASIST.1999;50(7):574587.
21WeeberM,KleinH,deJongvandenBergLT,etal.Usingconceptsinliteraturebaseddiscovery:SimulatingSwanson''''sRaynaudfishoilandmigrainemagnesiumdiscoveries.JASIST.2001;52(7):548557.
22SrinivasanP.Textmining:generatinghypothesesfromMEDLINE.JASIST.2004;55(5):396413.
23ShaoYF,WengJ.TheapplicationofnoninteractiveliteratureknowledgediscoveryintraditionalChinesemedicalresearch.JiangxiZhongYiXueYuanXueBao.2005;17(3):89.Chinese.
邵運峰,翁捷.非相關文獻知識發現法在中醫研究中的應用.江西中醫學院學報.2005;17(3):89.
24ZhaoHY.IdeasonsystematizingtraditionalChinesemedicalcaserecords.ChangchunZhongYiXueYuanXueBao.2005;21(2):7.Chinese.