人工智能與檢驗醫學輔助診療現狀

時間:2022-11-11 09:59:51

導語:人工智能與檢驗醫學輔助診療現狀一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

人工智能與檢驗醫學輔助診療現狀

摘要:隨著互聯網、大數據及云計算等新興技術的快速發展,人工智能(AI)已被廣泛應用于影像和病理臨床輔助診療。檢驗醫學作為現代醫學的重要支撐,與AI的融合勢在必行。該文重點介紹了檢驗大數據如何與AI結合以構建檢驗AI,并展望了檢驗AI在疾病診斷、預測及風險評估等臨床輔助診療領域的應用前景。

關鍵詞:人工智能;檢驗醫學;檢驗人工智能系統;臨床輔助診療

人工智能(AI)是研究、開發用于模擬、延伸和擴展人類智能的一門新興的科學技術[1]。AI自誕生以來,經過不斷的演進與發展,在越來越多領域得以重視和應用。目前,AI技術已廣泛應用于醫療領域,出現了影像AI[2]、手術機器人[3]、藥物研發AI[4]等諸多應用場景。檢驗醫學作為臨床輔助診療體系中不可或缺的部分,貫穿患者入院、出院、藥物治療等過程,影響著患者的醫療服務質量[5-6]。檢驗醫學具有高度自動化、數據化及數據庫存儲等特點為檢驗AI的應用與研發創造了有利條件[7-8]。為此,本文結合AI在當下臨床輔助診療中的應用現狀,重點闡述檢驗醫學如何與AI融合構建檢驗AI,并展望檢驗AI在輔助臨床診療中的應用前景。

1AI與臨床輔助診療

隨著深度學習技術在目標檢測、圖像分類及圖像分割等領域取得突破性的進展,影像AI和病理AI已成為新的醫學研究熱點[9]。目前,影像AI和病理AI已成功應用于疾病的篩查、預測及診斷等領域。比如,ZHANG等[2]構建了一個包括新型冠狀病毒肺炎(COVID-19)、常見肺炎及正常對照人群的大規模CT數據集,并基于CT圖像開發了COVID-19AI診斷系統,用于幫助準確診斷COVID-19。TERAMOTO等[10]使用深卷積神經網絡開發了微觀圖像中的肺癌細胞病理自動分類模型,使約71%的肺癌細胞得到正確分類,且分類正確的圖像具有典型的細胞形態和排列。然而,影像和病理診斷具有局限性。一方面,病理切片后診斷周期較長、費用較高,影像學檢查相對迅速但費用也相對較高。另一方面,病理和影像檢查結果僅僅是一些特定疾病的部分參考指標,無法反映患者疾病的整體情況。相較于影像和病理檢查,實驗室檢驗具有顯著優勢。首先,實驗室檢驗方法簡單、快速且成本低,醫生通過分析患者的檢驗數據即可實現良好的診療效果,可提高臨床醫生的診療效率并減輕患者的醫療負擔。此外,血常規、血生化、尿液或糞便等檢驗結果可直接反映疾病的生理及病理變化過程。臨床上常用的檢驗數據具有足夠的有效性和穩定性,已經過大規模的臨床實踐和評估,并廣泛用于診斷、排查、分類或監測各種疾病,可以為臨床醫生疾病診療提供一個更為全面的指導建議[11]。目前,檢驗數據的真實診斷效能通常被低估,主要是由于個體化檢驗數據復雜多變,不同的異常檢驗結果對應的臨床意義不同,聯合意義則更多、更廣。臨床醫生面對眾多異常檢驗結果時,由于受限于人腦的推理和計算能力,即使是經驗豐富的醫學專家也經常忽略眾多結果之間隱藏的關鍵信息和重要趨勢,不可避免地造成疾病的漏診與誤診。因此,使用AI方法集成和分析檢驗數據為提高檢驗數據的診斷價值提供了巨大的應用前景[12]。

2基于檢驗數據的檢驗AI

2.1檢驗AI構建的基本條件

目前,構建檢驗AI的基本條件已經基本具備。首先可從醫院檢驗信息系統(LIS系統)中獲得大量檢驗數據。LIS已成為當今醫院管理信息(HIS)系統的重要組成部分,該系統存儲了海量的檢驗數據[13],能夠為檢驗AI的構建提供大數據支持。其次,機器學習(ML)算法層出不窮。比如,極端梯度提升(XGBoost)作為當前比較流行的集成學習算法,在提升樹模型中,具有非常強的擴展性和靈活性,能夠集成多個樹模型來建立一個更強的學習模型[14]。包括XGBoost在內的ML算法是一種通過自動分析數據以獲得特征規律,并利用這些規律對未知數據進行預測的算法,是實現AI的基本方法[15]。對于給定的任務,ML算法可以從數據中學習,篩選大量變量并尋找可靠的組合預測結果,所以其對數量龐大或復雜的數據進行挖掘分析具有絕對優勢。由此,使用ML算法對LIS中存儲的數千萬患者信息進行挖掘、訓練、建模是完全可行的。這種方法不僅解決了傳統統計模型參數限制的問題,還能減少人工誤差,提高篩選效率,更重要的是有助于發現數據間的潛在關聯及隱藏價值。最后,算力為檢驗AI提供了基本的計算能力支撐。算力的核心在于AI芯片。由于原有的CPU和傳統計算架構已無法支撐ML算法并行計算能力的要求,AI芯片的出現使得AI高強度、大數據的處理需求得以滿足。目前,針對AI領域運算特征,AI芯片已成功應用于圖像識別、語音識別、聲紋檢測、視頻檢索及自動駕駛等任務。在做智能處理任務時,AI芯片能夠使計算機以大規模、低成本、高通量、自動化等方式運行[16]。這些均為檢驗AI的實現和應用提供了強大的硬件平臺。

2.2檢驗AI的構建過程

檢驗數據只有與AI深度融合形成檢驗AI,才能充分挖掘檢驗指標與疾病之間隱藏的聯系與規律,為臨床提供更有意義的診療信息,體現檢驗醫學的價值。檢驗AI的構建(圖1)主要包括以下步驟(1)數據收集和預處理:檢驗數據來源廣泛,由于各數據庫(LIS、HIS系統)之間缺乏有效協調機制,聯系和溝通不同,采集和存儲標準不一,影響了檢驗數據的應用[17]。因此,檢驗數據在用于建模前需要經過預處理(包括結構化、標準化、歸一化等)轉變成ML算法能夠識別和學習的數據格式。模式識別作為AI技術的重要分支,能夠將多個標準來源數據分類并結構化,節省大量的人力物力,解決了不同數據庫的互聯互通[18]。(2)檢驗知識圖譜篩選:臨床醫生在疾病診斷過程中,一些疾病診斷結果可能不依賴于異常檢驗結果而直接通過B超、放射或病理等輔助檢查結果得出。由于檢驗AI是基于檢驗數據的AI模型,如果一些疾病診斷結果不能通過相應的異常檢驗結果推理得出,不僅增加了檢驗AI數據處理的難度,而且會降低模型預測疾病的準確率。通過人工鑒別異常檢驗結果是否與疾病診斷結果相關,往往會出現其復雜程度超越了臨床醫生知識范疇的情況。因此,通過檢驗知識圖譜從醫學專業角度將檢驗數據與診斷數據相關聯,排除了一些缺乏知識關聯的數據信息,提高了輸入數據的質量,同時也增強了模型學習的能力[19]。(3)特征選擇與建模:在開發檢驗AI時,特征變量的選擇非常重要,直接影響模型在臨床研究中的表現。從特征自身角度選擇利用的原理為重要的特征應該是攜帶信息較多,也就是特征值差異較大的變量。從輸入特征和輸出特征相關性角度選擇主要是利用一些模型算法本身的特點,構造不同特征與目標特征之間的相關重要程度,若重要性低的特征變量(如低于某閾值)則可以拋棄。建模方法主要包括監督學習和無監督學習[20]。監督學習是使用有診斷結果標注的檢驗數據訓練開發模型,之后,所得模型用于預測或診斷新數據集的結果變量。無監督學習則僅使用無診斷結果標注的輸入數據來建模。(4)模型評估:模型的性能可以使用同一來源(內部驗證)或獨立來源(外部驗證)數據進行評估。交叉驗證方法是一種準確的內部驗證方法[21]。交叉驗證的最簡單形式是將數據集劃分為訓練集(用于開發模型)和測試集(用于評估模型的性能)。訓練集和測試集之間沒有最佳劃分,例如研究人員習慣將80%的研究人群分配給訓練集,其余20%分配給測試集。然而,這種方法可能會使結果產生偏差,使得模型不具有普適性。n倍交叉驗證是一種替代方法,在這種方法中,數據集被劃分成n個大小相等的分區,執行多輪交叉驗證(即每輪使用不同的分區作為測試集),平均結果用于估計模型的性能。模型的外部驗證即用非建模數據集測試模型的性能,提高其推廣性以支持模型的普適性。(5)臨床驗證:為了證實檢驗AI具有很高的臨床應用價值,即可以有效輔助臨床醫生進行臨床決策,需要將檢驗AI診療性能與醫學專家進行比較。(6)模型應用:為了將檢驗AI運用到臨床實踐中,需要基于互聯網技術開發相應的應用程序以方便臨床醫生使用,使得檢驗AI可以在真實場景運行以獲得疾病的預測值等。

3檢驗AI在輔助診療中的應用前景

3.1疾病診斷

快速而準確的診斷對于指導患者的診療活動至關重要,檢驗AI基于檢驗數據可輔助臨床醫生進行疾病診斷。比如,GUNCAR等[22]使用了隨機森林ML算法并基于實驗室血液檢測結果,建立了兩種模型用于血液疾病診斷,一種預測模型(SBA-HEM168)使用所有可用的血液測試參數;另一種預測模型(SBA-HEM061)僅使用一組簡化的血液測試參數。兩種模型在診斷血液疾病上都具有良好的診斷性能,在預測患者5種最可能的疾病時,預測準確率分別為0.88和0.86;僅考慮患者最可能的疾病時,預測準確率為0.59和0.57[22]。此外,臨床試驗表明兩種預測模型的準確性與血液學專家相當[23]。本課題組采用了730113例合格參與者的89116949個檢驗數據和10423581個實驗診斷數據,構建了基于知識和數據雙驅動的多功能智慧檢驗平臺[23](即檢驗AI),能夠自動識別并綜合分析2071種檢驗指標,完成對包括呼吸系統及血液系統等在內的10種器官系統疾病和441種具體疾病診斷的多元關系推理,且所有推理過程具備良好的可解釋性。

3.2疾病預測

檢驗AI可深度挖掘常規檢驗指標隱藏的信息,能更好地預測疾病。目前,腫瘤的預測僅限于幾種特定的標志物。PATRíCIO等[24]開發了基于常規檢驗指標的乳腺癌預測模型,研究人員運用了邏輯回歸、隨機森林和支持向量機3種不同的ML算法以不同數量的變量(包括葡萄糖、抵抗素、年齡、體質量指數、胰島素抵抗指數、瘦素、胰島素、脂聯素、單核細胞趨化蛋白-1)作為預測因子構建了乳腺癌預測模型。該研究發現,支持向量機預測模型僅使用葡萄糖、抵抗素、年齡和體質量指數作為決定因素即可預測女性乳腺癌的存在。同時,該預測模型在測試集上實現了高靈敏度(82%、88%)和高特異度(84%、90%)的預測[24]。該研究充分證實基于檢驗AI,一些常規檢測參數完全可以替代一些腫瘤標志物成為新的癌癥早期篩查工具[24]。SOMNAY等[25]使用術前血清鈣、磷、甲狀旁腺激素、維生素D和肌酐水平作為原發性甲狀旁腺功能亢進的潛在預測因子構建了ML模型,在所測試的ML模型中,貝葉斯網絡模型被證明是最準確的,對95%的原發性甲狀旁腺功能亢進患者進行了正確分類[曲線下面積(AUC)=0.99],值得注意的是,從模型中省略預測因子甲狀旁腺激素并沒有明顯降低其準確性。該研究表明即使在患者出現輕微疾病病理變化的情況下,ML模型仍可準確預測出原發性甲狀旁腺功能亢進癥[25]。

3.3疾病風險評估

檢驗AI可以根據檢驗數據對患者疾病進行風險評估,為臨床醫生改進治療策略做出預警。對于COVID-19,快速準確地識別和評估疾病的嚴重程度至關重要。MA等[26]收集了COVID-19患者入院臨床數據,包括癥狀、合并癥、人口統計學、生命體征、CT掃描結果及檢驗數據,應用多元邏輯回歸方法確定具有統計學意義的臨床特征,研究人員最終使用了乳酸脫氫酶、C反應蛋白和年齡作為死亡預測因素構建了多元邏輯回歸模型,用于識別CO-VID-19入院患者的嚴重程度并評估其死亡風險。該模型預測292例患者病死率的效能(AUC=0.9521)優于肺炎CURB-65評分模型(AUC=0.8501)和XGBoost模型(AUC=0.4530)。由數十個臨床癥狀和檢驗數據(如靜脈曲張程度、纖維蛋白原水平和紅斑等)作為患者出血風險的潛在決定因素所構建的ML模型能夠預測肝功能受損兒童食管靜脈曲張出血的風險,該模型能夠準確地預測約85%兒童患者食管靜脈曲張破裂出血情況,使高危兒童患者能夠優先進行緊急肝移植,該研究結果已通過在線應用程序(ht-tp://hrs2c2.com),在獨立患者隊列中得到了驗證[27]。

3.4疾病治療與預后檢驗AI可根據檢驗數據評

估患者的疾病治療及預后情況。比如,鑒于華法林的復雜特性,LIU等[28]使用了兩個經典的檢驗數據即丙氨酸氨基轉移酶及血清肌酐,結合患者的華法林使用劑量、性別、年齡和體質量等數據構建了ML分類模型,用于預測華法林的治療是否充分。研究人員使用了377例住院患者的臨床數據,比較了7種不同ML分類模型的性能,最終C4.5決策樹和隨機森林得分最高,并發現相較于臨床醫生的主觀決定,ML模型更能準確預測華法林治療的充分性[28]。盡管急性腎損傷通常是可逆的,但一些患者發生腎功能恢復不全、慢性腎病,甚至腎功能衰竭的風險增加[29-30]。急性腎損傷患者住院治療后,對慢性腎病的預測可使患者獲得早期干預,并可能改善疾病預后,且可避免不必要的醫療資源使用。JAMES等[31]使用了常規檢驗數據(包括基線血清肌氨酸值、蛋白尿、急性腎損傷嚴重程度指標及出院血清肌氨酸值)開發了一個多變量風險分層模型,該模型能夠識別急性腎損傷住院后可能患有慢性腎病的高風險患者。該模型有助于患者向門診醫療過渡期間,臨床醫生做出合理的預后評估、隨訪指導和護理建議。

3.5亞健康的預測

生理生化指標量化檢測是亞健康檢測方法中較為客觀的檢測方法,可最大可能避免人為因素影響,利于亞健康的準確預測。目前,針對亞健康人群的亞健康實驗室檢測參考值很難界定。處于亞健康狀態的人雖然有諸多自覺不適癥狀,實驗室檢驗可能僅僅有某些指標的變化。如何在正常值范圍內劃分出健康人群和亞健康人群一直是研究的難點。檢驗AI的出現為亞健康的預測及診斷指明了方向。以預定時間內收集的亞健康患者與疾病人群的檢驗數據為預測因素,構建區分健康人群和亞健康人群的亞健康分類器,可實現亞健康的快速甄別。該分類器類似于健康狀態軌跡,可提示機體是否處于亞健康狀態,以及亞健康人群是否有疾病發生的可能[32]。比如,王嬙等[33]將采集到的出入境人員臨床檢驗指標等數據錄入計算機,基于極限學習機和支持向量機方法建立預測模型并自動分析錄入的信息,從而預測該個體發生亞健康的趨勢及可能性。

4檢驗AI的局限性和挑戰

檢驗AI在臨床實際應用中,還存在一些局限性和挑戰。首先,由于疾病診斷的復雜性,僅依靠檢驗AI提供的疾病預測或診斷存在局限性[34],臨床醫生仍需結合其他輔助檢查(如影像、病理及超聲等)結果對患者疾病進行綜合判斷。其次,數據質量問題是檢驗AI面臨的主要挑戰。檢驗AI的疾病預測是基于檢驗大數據,由于檢驗大數據的采集標準不一,導致檢驗數據缺乏質量保證,影響了檢驗AI模型預測疾病的準確性,進而限制了檢驗AI的臨床實際應用[35]。最后,受限于不同醫院檢驗科對檢驗數據的定義、檢測標準及檢測系統不同,導致不同醫院之間檢驗數據難以互通互用,而依據單中心檢驗數據構建的檢驗AI缺乏普適性,其預測結果在不同醫院之間存在偏差。

5結語

檢驗醫學是臨床輔助診療的重要支撐。隨著AI與醫學領域的深度融合,檢驗醫學與AI的結合作為一種新的醫療模式正在快速發展。檢驗AI通過對檢驗大數據的分析,可為臨床醫生提供及時準確的輔助診斷信息,這將徹底改變傳統檢驗醫學的傳統運用模式,推動檢驗醫學的智能化發展。

作者:井杰 綜述 黃曉春 單位:中國人民解放軍海軍軍醫大學第一附屬醫院檢驗科