挖掘醫療數據中的價值,優化保險業的風險管控

許多人為了降低日後可能發生的醫療負擔,會選擇投保醫療保險,隨著年齡增長,保險的費用也會隨之提升。大多數的保險公司,會依據保戶的年齡與性別評估潛在的疾病風險,但是,隨著環境與生活習慣變化,影響個人健康的風險因子也逐漸不同;加上保險商品越來越多元,多數民眾在選購保險商品時,往往不清楚自己的健康狀況適合哪些產品組合,甚至必須要提出多種健康文件讓保險公司作為納保評估。無論是對保戶或是保險公司而言,都十分不方便。

客觀輔助評估,保障民眾受保權

新創團隊 Lydia AI 意識到個人保險的需求,透過NLP(自然語言處理)技術,運用三、四個亞洲國家,逾2000萬筆數據、橫跨 10 年以上的健康資料訓練模型,以「健康分」概念,與金融、保險等應用場域連結互動,提供消費者完善的保障規劃,打造「HaaS(Health-as-a-Service),健康即服務」數位應用平台。透過健康數據搭配疾病風險分析,幫助民眾了解自身健康狀況,達到更快速完整的風險預測,進而優化保險業的風險管控,提出相對應的保障規劃建議。

Lydia AI共同創辦人暨執行長李俊毅解釋,目前保險費用的計算方式,主要是以保費的費率乘上涵蓋單位,其中,保費的費率包括健康風險評估與執行風險兩者總和。如果能透過人工智慧預測健康風險評估的數值,輸入相關的資料並得到高信心的預測結果,就可以直接套用至現行商業規則中;反之,如果得到低信心的預測結果,就只能作為人類決策的輔助。

Lydia AI主要使用電子醫療紀錄(Electronic Health Record, EHR),這也是每個人資料記錄中占比最高的資料。透過Text2Node的技術將EHR的文本投影到Lydia AI研發的醫療知識圖(Graph)中,並從中找到EHR中的醫療概念。

要做到這點,首先要建立一個完整的Graph,Graph中的節點(Node)以及連線(Edge)分別表徵不同的醫療概念(如:疾病、藥物)以及彼此間的關聯。而Node的表徵(Node Embedding)生成方式則是Lydia AI將Graph透過Random Walk的技術產生樣本,並以此樣本訓練得出。接著,製作一個對應函數(Mapping function),將電子醫療紀錄文本的Embedding對應到Node Embedding中。最後,藉由距離最近的幾個Node Embeddings找到最核心的醫療概念。這個核心的醫療概念讓我們了解每個人的健康狀況,以進一步的健康風險評估。

李俊毅說,過去以機器學習進行核保預測時,往往需要考慮多種不同因素,並建立多個模型,如抽菸者的模型、基於信用的死亡率模型等。Lydia AI的健康風險評估則是以全面的角度重新定義問題,透過EHR紀錄幫助保險公司進行更佳的風險控管、提升客戶體驗。

了解NLP模型的可解釋性簡易指南:BERT也懂人話?NLP模型的可解釋性簡易指南

精彩影片分享: