數據是企業推動 AI 最重要的基礎,隨著各企業組織擁有的資料越來越多,在保障資料安全和遵循法規的同時,還必須從中發掘寶貴的洞察,複雜度有增無減。「2024 台灣企業 AI 準備度」調查中所定義的數據力,不只是企業的資料搜集與管理能力,還包含應用能力,但三者在程度上有明顯落差,該如何提升整體能力呢?
中原大學智慧運算與大數據碩士學位學程副教授胡筱薇表示,企業無論要推動數據治理或導入 AI,都必須先建構起完整架構。從公司的治理架構來看,主要可分為業務、數據、應用及技術四個重要架構。四個治理架構是一個循環,且彼此協作。如果沒有協作,企業的策略只能停在某一個層級無法向下傳遞,也無法真正進入到營運端,而變成各做各的。
業務驅動的架構最重要的就是企業的策略與願景,資料應用與公司的銷售、行銷、人資、財會、營運等各個業務單位都有關係。如果公司在導入 AI 應用或服務時,只交由 IT 部門負責,那麼,在 AI 的應用上也就容易朝向與公司營收較直接相關的銷售與行銷面向,也容易因為技術人員不熟悉第一線業務內容,無法理解各部門的真實需求,主要透過想像開發出的應用,也容易與實際狀況有落差。
數據架構最重要的,除了建立企業級的數據管理策略,包括數據的收集、儲存、處理、安全和隱私保護等;更要定義數據標準和數據品質管理流程,確保數據的一致性、準確性和及時性。同時,還需建立數據治理委員會,負責制定數據治理政策和監督執行情況;以及建立 Data dictionary 和 meta data 管理,方便數據的檢索和理解。
在應用架構上,重要的部分包括識別企業的關鍵應用場景,並評估 AI 技術的適用性;設計「以用戶為中心」的應用架構,確保 AI 應用能夠無縫整合到業務流程中。除此之外,建立應用開發和部署的標準化流程,縮短應用上線時間;以及建立應用性能監控和反饋機制,持續優化應用體驗都是必須的。
技術架構除了選擇合適的 AI 平台和工具,以滿足企業的技術需求,另需要設計可擴展、高可用性的技術架構,確保系統的穩定性和性能。同時,企業也應該建立數據安全和隱私保護機制,確保數據在採集、傳輸、存儲和使用過程中的安全;以及建立技能培訓和知識管理體系,提升技術團隊的 AI 開發和應用能力。
胡筱薇強調,在規劃相關架構時,企業還需要注意與參考以下重點:
- 明確企業戰略和業務目標,識別 AI應用的關鍵領域。
- 評估現有的數據、應用和技術基礎,找出差距和改進點。
- 制定業務、數據、應用和技術的發展藍圖,明確關鍵里程碑和交付成果。
- 成立跨部門的項目團隊,確保各個架構的設計和實施能夠協同推進。
- 建立架構治理機制,持續監控和優化架構的執行情況。
- 加強與業務部門的溝通與協作,確保架構設計滿足業務需求。
- 看看別人怎做,學習先進企業的經驗教訓。
數據治理不夠完善,應用就會受到限制
「每間公司都應該有統一的數據管理規則,」胡筱薇指出,企業要有一個數據治理框架,在共同的規則下才能確保各部門的數據品質與數據處理流程。她舉例,當消費者進入公司網站時,就會產生許多面向的數據,包括購物流程、結帳、物流、金流、地區等,每個環節都必須要有一致的標準。無論企業是找開發商,或是有自己的電商、通路等,都必須遵守共同的規範。在管理數據時,另外得根據國家地區的不同,因地制宜遵守當地的規範。
數據治理像是打通資料孤島,也可稱作資料的民主性,就是讓公司內各個部門的員工、業務單位都能自主運用資料。例如人事部的同事可依照自己的需求,利用公司提供的資料資源拉出所需的介面,或產出需要的服務。而不是任何數據分析、報表產出,或任何資訊服務都必須仰賴 IT 部門的協助。如果企業四個層面的治理架構都足夠完善的話,無論是人事或是會計等部門,都能自己產生部門的數據應用;且部門會有自己的資料擁有者(owner),並肩負管理資料的責任,包括數據安全、品質、服務與應用;也能決定跨部門間資料交換的機制、管理內部資料交換的需求與爭議。「數據治理如果不夠完善,要產出更深更廣的數據應用就會受到一些限制。」胡筱薇說。
數據治理不是一個專案,是一個體系
胡筱薇建議,企業要提升數據治理能力的首要工作,就是建立一個完整、且經過設計的數據治理框架;在此框架之上還要定義數據策略。她解釋,策略包含明確的管理、原則、標準及流程,以確保數據的品質、可靠性及安全性。她提醒,數據治理並不是一個專案,而是一個綜合治理的體系,必須要有公司層級的數據治理政策,也就是要有組織的保障與流程,以及運作的品質。
「一個企業數據管理的體系很重要,」胡筱薇說,體系指的不是資訊系統,而是一個運作機制,包括規則、授權,以及每個層級的權限與責任義務。每個業務部門都必須肩負數據管理責任,管理包括數據安全、品質、服務與應用,以及內部資料交換的需求與爭議。她指出,業務、行銷、人資三個業務部門,各自所在意的數據一定不同,例如對人資而言,銷售絕對不是該部門重要的數據,因此,不同部門的 Master Data 也不同,而 Master Data 的內容也應該由各業務部門來擬定,且各部門需有一位數據的負責人(Owner),該職位最理想的人員應該是部門主管。但由於涉及主管對業務、數據與技術的能力,且因為過往企業可能沒有相關職位與組織架構需求,但企業如果要做全面導入,就必須將這些層面納入考量。
而資料倉儲與資料湖泊雖然都是重要的系統,但重點在於系統該如何安排與銜接,如同城市的治理,關乎規則與政策及負責任的人。這些事情做好才會有系統,也才能賦能企業或是簡化員工的行政程序。