各位朋友們好:
資料,一直都是企業導入人工智慧的第一個重大關卡,無論有沒有生成式AI,企業都必須先蒐集足夠的、正確的資料。但究竟要多少資料才算足夠?這個問題幾乎是在啟動AI專案時必經的「靈魂拷問」。
用「靈魂拷問」形容絕非誇飾法。例如,某家企業認為從成立開始所有資料都在網路上,絕對足夠,但最終卻只給出三個月的資料。原因是「所有資料都在外包商手上,對方只保留最近三個月的資料」;而在此之前,企業內部沒有人發現,原來這可能是個嚴重問題。
那麼,是不是資料橫跨時間愈長愈好,也不一定。例如在本期電子報中分享的企業個案就面臨這樣的抉擇:三十年、十年或五年的資料,究竟哪個才能達到準確預測的目標?
資料遺失、無法彙整、無法清楚定義,經常與人員流動、交接失誤等各種年久失修或不可考的問題相關,只要加以深究,往往直指企業營運的關鍵問題。應該如何找尋可能的解決方案,並在整理過後,從數據中發掘新價值?本週與你共同思考這個問題。
人工智慧科技基金會執行長 溫怡玲
|