數據多少才夠?兩大建議完善數據資產

在各種演講及諮詢場合,我常遇到這樣的問題:「(數位轉型)到底需要多少數據才算夠?」這個問題超級深奧,幾乎就等於人們總想知道「要存多少錢才能退休」一樣。很多人被問到這個問題,只能泛泛回答,「當然是越多越好」,或者奸笑著回答,「每家公司的需求都不一樣,你還是找我到你公司看看吧。」

這個問題之所以難以回答,是因為大家都問錯了方向。

最原始的誤解來自於人們習慣從硬體思維出發,以為多了一個神奇的工具就可以解決很多過去難以處理的問題。然而,數位轉型或導入 AI 從來不是敲下一個神奇密碼,或是董事長摸摸頭、打打雞血,就能夠完成的事情。大部分數位轉型計劃失敗的原因,在於一開始的問題就定義模糊不清,當然搞不清楚需要多少資源,更是難以把握方向與結果。

大家都聽過,要改革只能進行數位轉型,就要先準備大量數據。話說到此,想做的人就被嚇到,輾轉反側,始終拿不定主意到底要不要進行,畢竟看起來很貴;不想做的人心中暗笑,「正好,反正沒有數據不能怪我了。」不管真正的想法如何,人人都想知道到底需要多少數據,真實目的就是為自己的論點找證據。

答案說破,一點都不複雜。需要多少數據,完全取決於所設定的目的是什麼。

Gartner 對數位轉型的定義是「企業在企業活動中嵌入技術,以推動根本性變革的過程。」,而 AI 是其中最受關注但也是最需要資源投入的技術。無論如何,數位轉型從來不會是大張旗鼓、一次就能完成所有的任務;反倒是目的越明確,邊界越清晰,任務越可能實現,對數據的需求也會自然浮現。

以具體企業場景而言,企業建立數據資產所需數據量,要根據企業特定的業務目標來確定。不同的業務目標需要不同規模和類型的數據集。如果目標是建立商品推薦系統,需要收集大量顧客行為數據和商品數據;如果目標是優化倉庫管理,則需要收集倉庫存量、入庫出庫等數據。

「可是我就是沒有數據,怎麼辦?」長靴貓眨巴著明亮眼睛可憐兮兮說道。

「其實,數據已經在手上了,」大師低眉斂目說道。

對於初期數據量不足的企業,可以參考以下兩項建議逐步完善數據資產:

一是充分利用現有數據,通過數據清洗、組合等方式拓展現有數據集。例如將歷史數據與新數據進行組合,形成更大的訓練集。

二是根據業務目標定位,補充特定類型的新數據。這需要企業明確數據需求,並與業務目標緊密相連。

總體而言,企業建立數據資產的關鍵在於,根據企業業務定位和發展目標來構築清晰的數據戰略,確定所需數據類型、數據品質標準以及收集方式。具備明確數據戰略,才能高效建立企業數據資產。

隨著企業業務發展,數據資產也要持續擴充和優化。企業可以建立數據收集與處理流程,即時追蹤新的數據來源,並根據變化調整數據戰略。只有做到數據資產和業務同步發展,才能充分發揮數據資產價值,實現企業智能化。

再分享一個連許多顧問都不清楚的概念:「標籤」是 AI 技術中一個很重要的概念,活用標籤,也可以讓企業數據資產瞬間倍增。「標籤」為每筆數據添加元數據,標示其業務意義和屬性特徵。良好的數據標籤可以明確數據內在價值,提升數據可分析性。而企業在建立數據資產的同時,也可以同時考慮為數據賦予不同解析度的標籤,透過標籤與數據集的選擇,讓數據資產可以創造出更多價值。

這就像是 AI 技術中的一個關鍵,可以讓企業數據資產瞬間倍增。透過為每筆數據添加元數據,標示其業務意義和屬性特徵,可以提升數據可分析性,並創造更多價值。而在企業建立數據資產的同時,也可以考慮為數據賦予不同解析度的標籤,透過標籤與數據集的選擇,讓數據資產能夠創造出更多價值。

數位轉型及 AI 導入並非單純追求數據量的增加,而是在確定明確的目標和邊界後,有目的性地收集、處理和利用數據。企業在建立數據資產時,需明確業務目標,構建清晰的數據戰略,並持續調整以適應業務發展。透過 AI 技術中的 「標籤」,可以增強數據的價值和分析性,進而實現企業的智能化轉型。數位轉型和 AI 技術為企業帶來了無限可能,然而成功的關鍵在於深思熟慮的策略和有效的數據應用。唯有如此,企業才能在激烈的市場競爭中脫穎而出,實現長期穩健的發展。