資料越多越好?胡筱薇:企業需要的是能辨別資料價值的人

「每個產業都有自己的治理之道,」東吳大學巨量資料管理學院副教授胡筱薇說,治理是用較為宏觀的角度去檢視整體,掌握治理的核心就能應用在各個產業或領域,且由於各領域知識有不同的「眉角」,發展出屬於該領域或該群體的治理方法。

我們需要資料做什麼?

「數據的探索幫助我們理解用戶。」胡筱薇以常見的Google Search為例,透過收集各個網頁,建立模型,讓使用者透過平台找到想要的東西,這是一個從數據化、模型化,再到產品化的過程。而所謂的產品,指的就是能與使用者互動的介面,例如Instagram、Facebook、ERP這些都可稱為產品。

「明明還有其他的搜尋引擎,為什麼在場的多數人還是使用Google Search呢?」胡筱薇問。「因為它找出來的東西比較符合你的需求,」胡筱薇說,除了模型必須比較明顯好用,還必須能夠滿足你現在的需求。

「假使今天Google只是滿足你二十年前的需求,那麼它不會成為今天的google。」胡筱薇說,所以企業要透過每一次用戶的行為反饋,例如點擊的頁面與位置,IT人員得以藉由這些資訊調整模型,持續精進找出更符合用戶需求的搜尋結果,才能滿足客戶此刻的需求。換言之,對企業來說,最關鍵的第一步,就是有沒有跟客戶之間建立持續的互動關係,而這些都必須透過客戶與產品互動的反饋閉環,瞭解客戶的真實狀況。透過用戶的行為數據,才能在資料探索的階段了解模型優化的方向。

胡筱薇說,要藉由數據幫助我們理解用戶,光靠IT部門是不可能做到的,反而是擁有領域知識的第一線業務人員才能做得好,因為只有他們才能掌握客戶想法,但業務人員缺乏數據能力,所以才需要數據治理。治理是為了讓公司成員都成為數據公民,能依照工作需求尋求不同部門的協助,持續優化用戶體驗。

公司不缺資料,缺的是辨別資料價值的人

「數據這麼多,你需要的到底是什麼?」每家公司都有不同的數據源頭,包括與客戶互動的介面、經營的媒體、ERP等內外部數據,因此,有些公司會將這些資料彙集起來並建立數據中台,但並不是每一家公司都需要建立數據中台,企業要選擇做最重要的事情,並不是為做而做。

胡筱薇將數據分成大數據、小數據及活數據。大數據是用來制定戰略的,透過歷史數據掌握大致的輪廓及方向。同時定義跟用戶有關係的數據就是小數據,包括用戶的行為數據、消費數據、地理位置數據、金融數據、社交數據等,是用來擬定策略用。另外,活數據則是透過持續與客戶互動的關係,掌握客戶的反饋數據,最終的目的是:優化用戶體驗,以確保用戶的黏著度。

但是這些數據能成為資產嗎?有趣的是,即使許多人都認為數據是資產,但是問起現場聽眾:「給你2TB的會員資料或兩百萬美元,你會選哪一個?」在場多數人仍然選擇兩百萬美元。為什麼?胡筱薇笑說,數據無法產生價值最重要的原因就在於:所有權不明確、無法防止數據零成本的被複製。

「公司不缺資料,缺的是什麼是能夠辨別什麼資料有價值的人,」胡筱薇強調,「如何判斷資料的價值」才是真正的核心議題,也是資料治理的關鍵。

數據治理小心三大地雷:

胡筱薇說,治理除了技術還有管理,「數據治理就是一個系統、兩個經驗、三個要避開的陷阱。」她認為,數據治理必須要訂定一套適用於自己公司適用的管理規則,並且要有專職負責的人。

「數據治理不是一個專案,而是一個體系,」她說,數據治理需要全組織都動起來,除了要有管理的原則與辦法,也需要有級別夠高的管理組織,訂定讓內部及外部供應鏈企業都能遵循的規範。

而兩個經驗指的是業務的經驗以及對於跨部門溝通與管理的經驗。「數據治理不是IT問題,而是業務問題,」胡筱薇說,「每個數據都需要有對應的業務部門承擔管理責任,且必須有唯一的數據owner」。她建議,部門主管必須要自己擔任數據的owner,即使不懂技術也沒關係,只要找一個懂技術的擔任翻譯。因為只有業務主管才知道對實際業務而言,重要的資料是什麼?也必須借重他在對跨部門溝通的經驗。

另外,數據治理有三個必須要避免的陷阱:數據不分類、專注在苦工、搶快搶績效。胡筱薇分析,做數據治理的第一步就是先盤點,先將數據分類。並不是所有數據都是資產,而是要選擇適用的。千萬別用一招打全場的方式做數據治理,不同的數據,對數據精確度的要求不同,所以治理的成本與方法也就不同。

第二個陷阱是,不要專注在苦工,不需要從頭開始慢慢做,而是要選擇一個適合的專案做出成果,讓公司其他同仁可以看見數據治理的效益,才能建立良性循環。

最後,則是不要為了搶快搶績效,在需求沒有盤點好、規格沒有開好,為了能夠快速做出些什麼,就趕著衝上去開發,結果就是需要花好幾倍的精力去清理數據。希望能夠快速做出成績,所以搶快著做,但其實寧願慢一點,也要想好了再做。

閱讀更多「人工智慧發展關鍵趨勢」精彩文章:2022 AI EXPO:探索新時代人工智慧發展關鍵議題