
數據、模型與算力向來被視為 AI 落地的核心要素,其中,「數據」被視為能否實現 AI 落地的關鍵起點。然而,即便多數企業已意識到數據的潛在威力,實務上仍面臨「知道重要,卻難以善用」的困境。資料雖被收集與存儲,但未能有效轉化為組織決策的動能,遑論推動 AI 專案落地與擴展。
AI 時代的數據觀:數據也需要「與時俱進」
隨著 AI 的技術與應用逐漸成熟,企業對 AI 的期待已從「技術展示」與「具話題性」的應用,轉向更具價值導向與解決問題能力的垂直整合型應用。以醫療影像診斷為例,從大範圍的「癌症檢測」進一步細分為乳癌、肺癌等專科領域,不僅對模型的精準度要求更高,對應的資料也必須具備更強的代表性、完整性與決策支持能力。
那麼,企業該如何因應這樣的轉變,真正發揮數據的價值?
中原大學智慧運算與大數據碩士學位學程副教授胡筱薇指出,當企業思考「什麼樣的數據標準足以支撐 AI 應用落地」時,應跳脫僅以合規性或結構性為核心的傳統資料治理框架。取而代之的,是從組織策略層級出發,思考如何讓數據成為推動創新、創造價值並提升競爭力的核心資產。
換言之,AI 導入不只是技術升級,更牽涉到組織對數據能力的重新定位。胡筱薇強調,企業所需的「數據力」不再是單一維度的技術支援,而是涵蓋資料標準制定、決策支持、部門協同與持續優化等在內的多維整合能力。
在導入 AI 的歷程中,企業的焦點也從「是否有資料」轉向「資料是否能創造決策價值」。
「資料必須被視為動態進化的企業資產,才能真正支撐 AI 系統的長期學習與即時反饋,進而產生效益。」胡筱薇強調,合規的資料,若無法被業務靈活調用、隨需求演進,最終也只是一筆「死數據」。舉例來說,使用者過去可能透過 Google 搜尋,但如今資訊探索已轉向短影音或社群平台。這種行為模式的改變,也在提醒企業必須掌握「即時且有意義的數據」。能夠反映當下需求、持續更新、可被有效轉化為商業洞察的,才稱得上是「活資料」。
從數位化邁向數據價值創造:資料須直接連結使用場景
胡筱薇進一步指出,數據化的重點在於資料可被使用,因此需要討論並建立數據標準,例如主資料(Master Data)、中繼資料(Metadata)、欄位定義(Codebook)等。然而,即便具備資料標準,從資料應用走向價值創造仍有一段差距。這要求企業建立更進階的資料治理思維,讓資料標準也能如同 AI 模型一般,隨情境演進而持續優化。
胡筱薇說,當前企業在面對資料標準與治理議題時,不該再侷限於資料量多寡上,而應聚焦於「資料的價值密度」。所謂價值密度,指的是一筆資料是否能夠對應到具體應用場景,並有效驅動決策與業務行動。她指出:「如果資料無法與實際使用場景產生連結,那它的價值便難以真正被發揮。」
尤其台灣企業普遍存在的資料孤島(或稱資料穀倉, silo effects)現象,亦即多數企業僅針對單一部門進行局部優化,缺乏橫向整合與跨域協作的機制,導致資料無法有效流通,進而無法支撐 AI 系統所需的完整資料流程與應用鏈。
綜觀這幾年許多企業導入 AI 成效不彰,很多人以為是缺乏人才或資料不夠,但細究根本原因,往往在於資料治理與應用流程脫鉤。因為 AI 導入多半仍由 IT 部門主導,而實際業務部門多處於被動角色,導致治理與應用之間出現斷裂,各部門各自為政、難以整合。就算在IT部門裡面組成資料中心或AI團隊,只要無法掌握使用場景、流程與數據之間的連結,同樣無法突破這個限制。
胡筱薇強調,數據治理從來不可能只是「組幾個人湊成 Data Team」就能推動的任務。也不該僅交由技術部門負責。原因很簡單:只有真正了解業務運作邏輯與價值所在的人,才有能力定義何謂有價值的數據。
舉例來說,不論該主管負責的是產品、客戶、人力資源、物流或其他業務範疇,皆應由其明確界定其所需數據的價值及應用邊界。因為每位主管都承擔特定職能與目標,因此他們對數據實際用途及策略價值的掌握最為清楚。
對於多數企業而言,儘管傳統上會以部門劃分職責,但現今許多企業已採用矩陣式的組織架構,部門邊界日益模糊。因此,若要進行數據價值的判定,最直觀且務實的做法,是由各自的業務主管來主導。
進一步地,當企業進行數據治理規劃時,由於治理本身即涉及權責分配與制度規範的建立,這與城市治理的邏輯類似。在這個過程中,必須由幾個關鍵角色負責制定相關規則與執行標準,以確保治理落實並具一致性。
須建立完整框架推動數據治理
為了協助企業在面對資料斷層、治理難題時,能建立一套具有邏輯性與技術導向的標準路徑,因而提出以下一套具體且可操作的資料治理思維框架,從策略原則、具體原則到能力指標,提供企業參考。
數據治理第一原則:Revenue
胡筱薇指出,企業若要將數據視為資產,就必須同步建立可衡量價值的機制,即所謂的「資料資產估值模型」。然而,數據估值並不如傳統資產那樣能在財報中清楚列示,且每家企業的商業模式與資料應用場景皆不同,難以以單一指標評估。但企業可以從泛化角度,設計出一套適合自身的評估矩陣,用以分析數據如何直接或間接驅動營收(Revenue)。
數據治理第二原則:強化資料合規能力2C
Compliance|合規性
傳統的資料隱碼或遮蔽方式已難以因應現今 AI 模型強大的反推能力。胡筱薇指出,企業應導入「差分隱私(Differential Privacy) 」技術,在保障個資的同時,不影響模型訓練與統計分析的準確性。此技術透過資料擾動與雜訊注入,使單筆資料無法被辨識,有效防止個資洩漏風險。
Confidentiality|機敏保護
差分隱私技術在零售、金融等高度依賴用戶行為數據的產業中尤其關鍵。搭配制度性治理工具,如「PIA(Privacy Impact Assessment,隱私衝擊評估)」,企業可從制度與技術兩個層面交叉防護,系統性評估資料處理過程中可能對個資造成的風險,並採取對應的風控設計。
數據治理第三原則:建構資料治理的 3 V
Validity|有效性
企業須建立業務的因果關係,將資料依決策影響力分類、比重,以提升資料治理的策略性與效率。以客服場景為例,若能系統性地整理客戶來電記錄、問題類型、回覆時間與客戶滿意度之間的關聯,企業便可優化服務流程,進而降低退貨率或提高轉換率。
藉由建立「資料—決策影響力評估矩陣」,了解資料與決策間的連結,從治理的角度建立資料決策影響力。
Velocity|即時性
資料處理的即時性與時效性對金融產業尤其重要。但胡筱薇提醒,企業常以為資料處理越即時越好,於是在這方面投入大量資源,但事實上,並非所有資料都需即時處理,反而更應建立資料分級制度,根據資料類型、風險程度與應用需求,動態配置處理節奏。
同時,企業還應同時思考「審查週期」與「更新頻率」等合規性的問題,因為這涉及資料治理的能力。
Variety|多樣性
胡筱薇強調,當企業已具備處理非結構資料的能力,下一步更應思考如何讓資料標準化,進而與國際標準接軌。以醫療影像 AI 為例,若資料僅符合國內 TFDA 認證標準,仍難以進入國際市場,唯有同時符合美國 FDA 等規範,才能真正打開全球應用通路。這也突顯,資料治理應建立可對接國際的標準體系,涵蓋資料交換、資訊安全與語意對齊等關鍵維度。
同時,還需要考量隱私性問題。除了透過技術進行隱私保護之外,也要思考治理相關的評估制度。
落實資料治理的「4D 能力」
企業應從四個關鍵面向建立資料治理的基礎能力,即「4D 能力模型」——Discoverability(可發現)、Data Accessibility(可存取)、Debuggability(可除錯)、Deployability(可部署),為資料在 AI 系統中的全流程應用提供有力支撐。
Discoverability|可發現
胡筱薇解釋,「資料可發現」意指資料應具備清楚的來源、處理歷程與責任節點,能被查詢、識別與追蹤,這也就是業界常提到的「資料血脈(Data Lineage)」能力。舉例來說,早期福特汽車透過要求整體供應鏈導入標準化系統,使其能即時追溯零件來源、生產時間與責任廠商,有效控管品質風險與營運流程。
在現今企業中,許多金控業、製造業等資料密集型組織,已導入企業級 Data Catalog(資料資產目錄) 系統,用以建立完整的資料地圖與資產登記冊,這不僅提升管理效率,也強化了 AI 決策所需的資料透明性與信任基礎。
Data Accessibility|可存取
意指資料安全機制的設計與使用授權的控管機制。企業需確保資料在開放應用的同時,具備足夠的防護機制來防止未授權存取。這樣的能力在 AI 模型訓練過程中特別關鍵。因為模型所依賴的資料,通常需具備結構清晰、標註透明、具備分析價值的特性,方能支撐訓練品質與結果可信度
Debuggability|可除錯
AI 模型的效能高度依賴資料品質,而資料常因空值、格式錯誤、欄位覆蓋率不足等問題,導致預測偏差與決策錯誤。Debuggability 意指企業能否辨識並修正資料異常的能力。胡筱薇指出,這項能力相當於企業是否具備進行資料除錯(debug)與修正的能力,確保資料品質隨使用過程持續累積與維持。
Deployability|可部署
企業若無法將資料應用順利部署於實際業務流程中,即使建置完成資料管線或模型訓練,也難以真正創造價值。企業應具備將 AI 解決方案部署至 Beta 或 PoP(Proof of Product)階段的能力,並進一步實現自動化執行,減少人工作業流程。
更多精彩內容,請參考《2025 台灣產業 AI 化大調查暨 AI 落地指引》點此下載