中醫藥數據狀況及發展透析

時間:2022-05-22 11:57:00

導語:中醫藥數據狀況及發展透析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

中醫藥數據狀況及發展透析

摘要:科學數據是人類社會科技活動所產生的基本數據、資料,以及按照不同需求而系統加工的數據產品和相關信息,具有明顯的潛在開發價值,并在應用過程中得以增值,是信息時代最基本、最活躍、影響面最寬的科技資源。擁有可靠、系統和積累豐厚的科學數據,就有可能把握更多的原始創新機會。

關鍵詞:中醫藥;科學數據

1科學數據共享工程

美國政府自20世紀90年代以來,在科學數據方面實行了“國有科學數據完全與開放共享國策”,聯邦財政設立專項資金連續支持數據中心群的建設,利用法律手段保障其信息暢通。據有關資料統計,在數據共享國策實施的10年間,美國平均年經濟增長率后5年比前5年增長了1.1%,其中0.5%是由于數據和信息的流通和應用所產生的[1]。目前,我國由各行業部門產生和積累的海量科學數據,得不到有效共享和利用,制約了我國科技創新和社會經濟發展的進程。在這種時代背景下,面對中國社會和科技發展的需要,2002年,我國開始實施“國家科學數據共享工程”。科學數據共享工程是在國家科技基礎條件平臺統一規劃、政策調控和相應法規的保障下,應用現代信息技術,整合離散的科學數據資源,構建面向全社會的網絡化、智能化的管理與共享服務體系,實現對科學數據資源的規范化管理及其高效利用,從而為科技進步與創新、政府決策、經濟增長、社會發展和國家安全提供科學數據資源的強有力支撐。它具有公益性、基礎性、持續性和基于現代信息技術的數據內容服務的明顯特征,是國家科技基礎條件平臺的重要組成部分,是國家創新體系中急需發展的現代科技基礎設施之一。

國家科學數據共享工程建設的指導思想是圍繞全面提升國家科技創新能力,實現推進現代化建設的國家目標,以科技創新為動力,以需求為導向,以政策、法規為保障,充分發揮國家長期布局的數據采集系統和各類國家科技計劃項目產生與積累的科學數據資源優勢,構建面向全社會的共享服務體系,實現科學數據資源的規范化管理與高效利用。以共享促進應用,最大限度地發揮科學數據的潛在價值,強化對科技進步與創新的支撐能力。

醫藥衛生科學數據共享網在國家科技部統一部署下,由四個主管部門聯合推薦,六大科研院所聯合申報,2003年在科技部立項,2004年4月正式啟動。其總體目標是建立一個物理上分布,邏輯上高度統一的醫藥衛生科學數據管理與共享服務系統,為政府衛生決策、科技創新、醫療保健、人才培養、百姓健康和企業發展提供數據共享和信息服務??茖W數據中心是數據集匯交、儲存和提供數據共享服務的物理中心,到2006年已經啟動的4個數據中心和依托單位分別是:基礎醫學科學數據中心——中國醫學科學院基礎所、臨床醫學科學數據中心——解放軍總醫院和北京協和醫院、預防醫學科學數據中心——中國疾病預防控制中心、中醫藥科學數據中心——中國中醫科學院。

2中醫藥科學數據中心的現狀

中醫藥科學數據中心是國家醫藥衛生科學數據共享網的成員單位之一。自科學數據共享工程實施以來,圍繞構建國家科學數據管理與共享服務體系、制定和完善科學數據共享政策、法規與標準體系、增強中醫藥科學數據資源積累,促進中醫藥科學數據增值的整合體系的目標,堅持“統一領導,統籌規劃,統一標準”的指導方針,確定以中醫藥科學數據資源的規劃為出發點,將資源的組織、分析、獲取、調度、整合和共享服務工作貫徹工程建設始末。

2.1頂層設計

以醫學衛生科學數據共享網為依托,在中醫藥科學數據匯交平臺基礎上研制中醫藥科學數據共建平臺與中醫藥科學數據規范標準平臺,整合與建立中醫藥科學數據主體數據庫群,形成中醫藥科學數據共享平臺,提供優質的中醫藥科學數據服務。全體系需要科學數據共建與共享的運行機制與管理;全工程需要信息網格的技術支撐。見圖1。

2.2中心建設

按照科學數據共享工程的建設規則,由中國中醫科學院中醫藥信息研究所承擔中醫藥科學數據共享與服務的物理中心。依托國家中醫藥管理局中醫藥文獻檢索中心機構基礎與國際互聯網,在全國選擇與建立了若干個分中心,形成了中醫藥科學數據建設虛擬專業隊伍。到2006年底,由全國中醫藥院校與研究單位組建了20余家分中心,專業人員約300余人。物理中心與虛擬中心共同承擔了中醫藥科學數據中心的建設。

2.3建立快速高效數據集成平臺

為適應中醫藥信息化、數字化的需求,中醫藥主體數據庫群組必須向多類型、多結構、快速信息存儲與高度集成方向發展,最終形成全方位的系統工程。在不同優劣硬件設備上,利用同樣的軟硬件環境、建立統一的加工界面、采用一致的加工方式,整合來源統一,這樣即保證數據信息的正確統一,又大幅減少重復勞動、節約信息采集費用,實現高速率的數據集成。所有成員單位基于統一平臺,實現無障礙的所有數據信息交流與共享,信息及時存儲與獲得更新;數據加工采用統一格式,避免管理方式多種多樣,節約大量的信息格式轉換費用;所有參建單位基于相同的信息質量控制平臺進行項目管理,極大縮短參建各方的技術水平差距,提高整個項目的管理水平,同時降低對管理人員的素質要求。利用數據共建平臺,實現了中醫藥科學數據的快速集成。

2.4建立主體數據庫

主體數據庫是中醫藥科學數據中心的基本任務,是提供權威、可靠的數據內容服務的基本單元。它是通過整合集成科學數據資源和整合改造已有數據庫而構成的。中醫藥數據庫資源的主體數據庫分為中藥數據體系、中醫數據體系、針灸數據體系與古代文獻數據體系。目前,中醫藥科學數據中心數據存儲量約120G,現代文獻數據庫收集年代跨越50年。

2.5標準和規范研究

規范化、標準化的建設是科學數據共享的前提,不僅可以保證工程建設伊始就能夠自上而下地遵循規范化途徑有序進行,還為科學數據的高度共享及其與其它應用系統的高速通信、聯網創造必要的條件。

中醫藥科學數據中心研制中醫藥語言系統,集成中醫藥術語近11萬條;修訂了中醫藥主題詞表8千條;研制了共建平臺固化的標準詞表29張。同時,制定了中醫藥衛生科學數據共享元數據標準與中醫藥科學數據分類標準。

2.6數據與共享體系

以多個大型數據庫群與數據檢索、統計能力為支撐,利用先進的計算機技術,構造了一個能夠在Internet環境下融合各個自治、異質異構的中醫藥數據資源的,并能為用戶提供一個統一的全局范圍內數據檢索環境的信息共享平臺,以支持數據庫資源的共享、綜合利用與開發。支持數據庫共享的主要數據為中藥、針灸、突發公共衛生、古代文獻等主體數據庫群。其中中藥數據占本領域數據量的80%以上。中醫藥科學數據中心可以實現的服務功能包括:對分布式數據庫和數據集的統一管理、目錄服務、數據服務、延伸服務等。

數據管理是利用分布式數據庫技術、數據倉庫管理技術、元數據技術和網絡技術,建立以分布式為主、集成式為輔的數據管理系統,開展數據匯交、整理加工、存儲和數據更新,實現對科學數據資源的有效管理。

目錄服務是以元數據為核心的目錄查詢,它將通過元數據標準的核心元素將信息以動態分類的形式展現給用戶。用戶通過瀏覽門戶網站提供的元數據摘要可以快速確定自己所需的信息范圍,然后要求門戶網站在該范圍內進一步搜索。

數據服務是在目錄服務基礎上的數據內容服務,所提供的數據類型是多樣的,能夠對各種空間、非空間數據以及結構化、非結構化數據提供瀏覽、查詢、下載和脫機服務等多種功能。

延伸服務是為用戶提供一系列工具,以便在眾多來源的海量數據中進行數據搜索、多源數據整合、數據挖掘,及時發現所需要的知識,提高科學數據的利用率。針對自身的優勢,構建其有特色的服務體系,例如專題查詢、統計分析等等。

2.7共享策略與運行機制

本著共建共享的原則,建立中醫藥科技數據的分布與集中管理方式,合理劃分共享數據的有償與無償。逐步制定數據開發與管理分級制度。

3中醫藥科學數據中心的發展

當代科學技術突破頻頻誕生于學科交叉的前沿領域表明,科學技術向著多學科綜合交叉的方向發展,而學科交叉與滲透需要多學科領域的知識、信息和數據的支持。在工程項目深入發展與技術需求強烈時,提出了若干值得思考的問題。

3.1中醫藥科學數據中心的功能擴充

中醫藥科學數據中心的定位決定了應該具備的功能。國家共享工程基礎目標是現有的數據資源盡可能的實現共享與利用。但是,隨著中醫藥信息資源的累積與增加,數據需求從量變發展到質變;從單純的數據發現轉變為知識發現,從數據應用到創新集成應用;這給數據中心發展提出了新的要求,特別是國家“十一五”、“973”等重大科學研究項目,對于知識發現與挖掘的需求更加強烈。這種需求變更不僅是中醫藥科學數據中心面臨的問題,而且是具有一定代表性的問題[2]。

科學數據共享中心功能細化為三個方面:一為資源整合管理,包括數據資源調查、匯交整合與共建管理;二為技術研究,包括信息標準與語言系統研究、數據分析與挖掘研究、計算機技術研究;三為服務管理,包括數據利用與服務研究、網絡平臺服務以及共享分級研究。

3.2中醫藥科學數據中心的工程技術

中醫藥科學數據中心的功能實現,離不開工程技術的支撐,主要是計算機技術與信息工程技術,從數據資源整合與共建,到數據存儲、服務、傳送的全過程,需要完整的、流暢的工程技術保障。領域專業人員與專職計算機人員的緊密結合是工程實施的必要保證。

3.3優質品牌數據庫的建立

當越來越多的系統建立起來的時候,可能并不是越多越好,反而會導致信息重疊、資源浪費、結果不統一,甚至相互矛盾。

建立數據庫評價體系,科學評價數據庫與數據質量,促進優質品牌數據庫的建立,是解決數據有效應用的關鍵。提倡共建與聯盟也是科學數據合理分布、有效管理的方法。中醫藥數據中心需要建立優質數據庫與優質數據質量的評價方法與機制。

在建立優質數據庫的評價體系的同時,應該建立科學數據共享平臺評價體系,包括從共建、共享、服務、應用、發展等多方面進行科學評價。

3.4科學數據匯交機制

科學實驗與科學研究的有效數據匯交是一個大問題,需要依靠政府與制度的保障,同時也需要科學數據中心對科學數據有效評價與認定。科學實驗數據匯交與提交級別的認定、不同研究專業提交數據的具體原則,都是數據中心需要認真研究的,需要最大限度保障數據提交,又嚴格審查數據質量,有效篩選。

3.5促進全球科學數據共享

空間因素對信息資源共享活動的根本制約,誘發了人們利用信息資源觀念的深刻變革,標志著中醫藥信息資源共享建設時代到來。中醫藥科學數據的共享目標與共享范圍的設定直接影響共享的分級。在保證我國科研人員充分利用科學數據的同時,也為全球科學數據共享做出貢獻,需要建立一種嶄新的共享管理理念。

【參考文獻】

[1]中國科學技術信息研究所.美國國有科學數據的“完全與開放”共享國策[EB/OL].http://,2002-08-20.

[2]李安虎,周玉斌,劉海行,等.基于WebGIS的海洋科學數據共享平臺的分析與設計[J].海洋科學進展,2004,(1):85-89.x