走向不確定的未來 數據治理是轉型關鍵

沒有人可以精準預測未來,尤其面對充滿不確定、瞬息萬變的全球局勢,企業都設法找出一個可以與之抗衡的方法。然而,台灣企業多年以來因長期代工所仰賴的SOP(標準作業流程),在面臨轉型時似乎就成了一大障礙。

另一方面,為了增加競爭優勢,代工廠壓低成本謀求利潤,但往往只專注於短期效益,鮮少願意將資源投放在需要時間積累的基礎建設,例如:資料治理。不論是數位轉型,或是AI導入,資料是決勝關鍵,如果沒有好的資料,或是資料沒有妥善的管理,資料終究只是一堆數字,無法產生價值。

財團法人人工智慧科技基金會(AIF)三年多來,陪伴許多企業走過 AI 轉型的歷程,深刻體會企業數位轉型的痛點,因此與工業局、資策會合作,共同推動「AI新創孵化結合傳產轉型實證輔導計畫」,並且於 2021 年 8 月 6 日舉行「AI 加速營」,邀請東吳大學巨量資料管理學院胡筱薇副教授,以「數據治理」與「產業轉型天堂路」為題,給予中小企業務實的資料治理與轉型觀念,當天吸引近 200 人上線參加。

AI 轉型不是大企業的專利 中小企業仍有希望

共同執行本次計劃的資策會數位服務創新研究所正工程師謝東翰表示,政府推動 AI 不遺餘力,本次計劃從 AI 產業化與產業 AI 化兩方面著手,透過媒合新創公司的 AI 技術能找到應用場景,讓企業能以 AI 技術解決痛點,並藉此找到更多的新創共同參與,協助台灣新創發揮影響力。

人工智慧科技基金會執行長溫怡玲提到,本次計劃執行到目前為止,媒合的企業涵蓋自行車業、鋼鐵業、科技製造業,以及因為疫情受影響最慘烈的餐飲服務業。可以發現,要解決的不是單一企業的問題,而是整個產業共通的痛點。

她也認為,這次參與計劃的企業,多是以中小企業為主,由此可見,AI 並非大企業的專利,中小企業只要能夠善用機會,大家同心協力,同樣能夠在 AI 世代創造價值。因此,「AI 加速營」可以說是這系列活動中相當關鍵的一部分,協助想要導入 AI 或是數位轉型的中小企業,可以建立對於資料與人工智慧的正確觀念,去除不必要的恐懼與想像,找到用 AI 協助企業創造更多價值的機會。

數據驅動的第一步:跟你的客戶建立關係

隨著大數據的出現,許多企業已經意識到數據的重要,然而如何善用數據,如何讓數據驅動業務,才是數據最大的價值所在。胡筱薇在課程一開始即提到,數據驅動就是要能夠在數據中找到動能,創造一個反饋閉環就是數據驅動很重要的一環。

以 Google Search 為例,使用者在搜尋框輸入想要找的內容,結果出來後使用者點了第幾個結果,這就直接地告訴 Google 是否滿意它的服務,如果在前三個就找到想要的網頁,就表示提供的資訊相當精準,如果到第二、第三頁,也就表示這個搜尋功能有待加強。

「這就是『活數據』,」胡筱薇說,有新的資料,就會有新的燃料,透過反饋閉環,就可以知道用戶是否滿意服務,企業就可以依此結果優化模型的方向,一旦掌握模型的優化方向,就會比競爭對手還要預先知道用戶的使用需求。「用戶持續使用,企業端就持續搜集、持續優化。」胡筱薇強調,第一波的數位轉型是 outside-in,偏向數位化;而目前是 inside-out 的數據驅動,關鍵就在於是否持續跟客戶建立關係、產生互動。

接著思考:企業的數據是資產?

當然,目前不少企業已經開始建立與用戶接觸的界面,然而透過界面搜集到的資料,會是怎麼被處理?「紙本、傳真,還是 email ?」胡筱薇說,每個企業,甚至每個部門搜集到的數據格式都不一樣,處理的成本也會相對變高,要花成本處理數據前,企業就會問,這些數據真的會變成有用的資產嗎?

胡筱薇觀察,許多企業希望打造數據中台,達到數據共享,支持多種業務的作用。但是對於企業經營者而言,考慮的是要花多少錢?是否真的能夠產生效益?而第一線的業務同仁在意的則是工作能否順利交付。「效益評估怎麼寫?」胡筱薇說,真的很難,數位轉型是做賺錢的事,還是值錢的事?賺錢的事是賺現在的錢,值錢的事則是賺未來的錢。老闆其實不是不願意投資,往往是因為資訊太少,無法做判斷,「如果有辦法讓數據成為真正的資產,就比較有論述的基礎。」胡筱薇強調。

如果數據是資產,當數據跟錢擺在一起,會選哪一個?現場觀察,多數人還是選擇錢。為什麼會有這個情況?胡筱薇認為,主要是因為數據的所有權不清晰;技術上,沒有辦法完美地防止這些數據沒有成本的被複製,也就是說,當數據垂手可得的時候,就會變得一文不值。「假設今天有 100 TB 的資料,只給特定某個人,有獨佔性,就有價值,而且所有權很明確。」

因此,數據的所有者、管理者與使用者的定義就需要明確,才能讓數據真正有價值。例如在美國,醫生為了研究需要花錢買病歷,病歷是屬於病人的資產,醫院是病歷的管理者,病人可以透過授權醫生使用病歷來變現,這就是有價值的數據。

數據治理是一個體系而非單一專案

數據治理最重要的本質,是希望用統一的數據管理規則,確保數據品質,數據處理的每個流程都有一致的標準,以建立企業數據管理的體系。這個體系可以針對業務數據自動採集,同時在此一規則與框架下,企業有一致的標準,就能做到自動化,並且打破相對獨立的數據庫。

但現實是,各部門的數據五花八門,連搜集的方式都不一樣,要提升到全企業層級的數據治理其實相當有難度。「難點在於資料治理需要投入很多資源,但是不會看到立即的成效,」胡筱薇比喻,這就如同挖馬路、舖水管,起初費時費力,但是打開水龍頭那一刻就會覺得很值得。

因此,數據治理並非單一部門的專案,也不是 IT 部門應該負責,而應該將其視為業務問題。胡筱薇提到,IT 沒有辦法理解第一線用戶的使用場景,所以需要各部門共同協作,才能打破數據孤島。而且每個數據都需要有對應的業務部門承擔責任,數據所有者要確保數據可以被定義、標準化,以及確認這些數據在企業內的定義是唯一、不會有第二種說法,數據所有者也有權利對於誰能使用這些資料進行裁決。「這是數據治理體系很重要的基石,」胡筱薇說。

她也發現,很多企業會把數據治理當做一個專案來看待。然而企業都想要打破數據孤島,有一個數據湖(Data Lake),可以隨時調用、共享。但是一旦數據被打通之後,會在各個業務中流動,就不會只是單一節點,它會是一個體系,不是一個專案,所以會需要一個針對數據治理的組織架構。