智慧醫療怎麼做?專案成果大解密

雖然距離大家想像中的大量臨床使用還有一大段距離,但最不需要花大力氣解釋人工智慧好處的產業,也非醫療業莫屬。相較於其他產業,第一線醫療人員很清楚知道,人工智慧可以提供精準的預測,減少發病率與就診率,大幅降低醫療成本。

智慧醫療應用大爆發,需要科技與醫療人才的積極投入與跨域合作。人工智慧科技基金會在過去二、三年除了辦理台灣人工智慧學校培育AI人才,也同時與多家醫學中心攜手,開展許多AI醫療應用專案研究,例如分析病患病情惡化的預警系統、以AI模型估計心臟/胸廓比作為心室肥大的判斷依據,以及利用心電圖判斷罹患心臟疾病的風險。

成果一》以AI模型自動化估計心臟/胸廓比(Cardiothoracic ratio, CTR)

現代人生活忙碌壓力大,各式文明病紛紛找上門。其中各式壓力、肥胖、飲酒過量等問題,是造成心室肥大的元兇之一,患有心室肥大的患者,有較高機率發生心肌梗塞、心臟衰竭、腦中風、心率不整等問題。因此在臨床上,多會以心臟/胸廓比的數值,作為判斷病情是否持續惡化的依據。

既然如此,CTR如何測量以保持準確性就至關重要。本專案即在解決因為測量不準確而導致誤判的問題,希望透過導入人工智慧工具,協助醫護人員更精準評估病症。

痛點:一般在胸腔X光影像上估計CTR,臨床上主要是作為判斷心室肥大的依據,然而在醫療現場經常發生的狀況是,醫生以手動的方式估計與測量CTR相對耗時耗力,而且每位醫生的衡量標準不同,可能因此導致病狀誤判。

方法:首先使用深度學習分類模型對胸腔X光影像進行分類,只挑選適合估計CTR的PA-view(poster-anterior,即X光影像由後往前拍)影像,並且使用深度學習中的卷積神經網路(Residual U-Net)進行語義分割(Semantic Segementation),得到心臟與胸腔的位置後,即可計算出心臟/胸廓比。

成果:第一階段分類作業precision 92%(即用AI判斷心室肥大的患者,有92%的比例真的心室肥大 )recall 95%;(真的心室肥大的患者,有95%被AI判斷出有心室肥大),第二階段估計CTR誤差3%以內的命中率達99%,目前已開始嘗試導入現有系統作為醫療輔助參考之用。

負責本次專案的工程師提到,透過AI模型實現自動化估計心臟/胸廓比,可應用範圍除了心室肥大診斷,也可以用來監測病人從過去到現在的CTR變化,幫助醫生看出變化趨勢(例如,即使沒被診斷出心室肥大但CTR卻持續上升),或者用以探討CTR是否會跟其他疾病有關聯。

對醫生而言,本專案成果將能輔助醫生快速且縱貫性的做出評估,例如結合病患的其他病史,更全面地了解病患情況;從病人的角度來看,則可以受到更即時且良好的照顧,甚至將來相關的應用也可以在醫療資源相對不足的偏鄉地區來使用。


成果二》病情惡化預警系統(Early Warning System)

過去常見的廣泛性評估檢核表為NEWS (National Early Warning System),然而其雖然能以量化數值描述病患大致上的狀況,但對未來病情的評估仍然需要臨床專業醫護人員的判斷。另外過去雖然也有使用統計方法進行預測,但相對而言成效並不顯著。

痛點:住院病患與醫護人員的人數比過高,無法以人力全面監測每一位住院病患的健康狀況與病情變化。此外,新進醫護人員的經驗不同,導致評估內容也可能產生落差,導致無法在第一時間對高風險患者進行適當的處置。

目標:以目前人工智慧技術發展一套自動化病情預警系統,可廣泛地針對一般住院病患進行監測,並且提前偵測病患病情惡化的情況。

方法:使用遞迴神經網路(Recurrent Neural Network, RNN)進行預測。專案團隊輸入4萬個患者,過去10年,共10萬次的住院資料與生命徵象,如血壓、血氧、心跳、體溫、意識狀況等資訊(為時間序列資料,例如這半天量測的體溫或血壓),讓模型判斷患者未來是否有可能發生病情惡化的狀況,例如心跳過快、 血壓下降幅度過大,或是停止呼吸等,統計出病人的病情惡化風險係數預測規則。同時結合物聯網概念,即時收集病人的最新資料。

成果:以AI方法建立的模型可提早三小時進行預警且 Recall 為 93%,且比起傳統統計模型與機器學習模型表現都來得佳,以此醫院病患數量做估計,預計每年能嘉惠900位患者,讓他們能在早期就受到較好的治療與處置。

此外,醫院也串聯這些資訊,建立一套風險儀表板供現場人員參考,讓醫護人員可以即時看到最近48小時的風險分數變化趨勢,並且根據風險分數掌握未來6至12小時病況惡化風險度,如此一來更能清楚掌握病患情況,輔助醫護團隊提供即時、合適的醫療照護,最終使得醫生省心,病患安心。

或許會問,資料這麼多,該如何選擇或是採用適合的資料?專案團隊提到,當初對於挑選的資料區間以及決定病患類型花了許多時間討論。首先,不同疾病的病患表現狀況會有很大的差異,因此需要事先定義本次專案要針對的疾病類型。

其次,資料區間的選取也決定模型的準確度。在最一開始團隊採用病患最近12次歷史資料來建立模型,但是問題在於,如果只固定12筆歷史記錄的,會因為看病頻率不一而產生影響,例如有些病患可能會取到3年的資料,有些則可能會取到過去14天的資料。因此團隊最終決定只取某個區間的歷史記錄,以確保每個人的資料區間一致。