想要導入AI,企業做好這些準備了嗎?
關鍵認知: AI 不等於 ChatGPT
人工智慧科技基金會技術長張嘉哲說,人工智慧的本質是一種資料科學,簡單來說就是希望機器能從大量資料中找出人腦無法整理出來的規則。於是,人類用了許多的資料當作範例,以教會電腦學習某件事情,也就是說,我們必須先有資料,才能用這些資料訓練出AI模型。
以熱門的ChatGPT為例,它便是使用網路上的公開資料,以及書籍等高達570GB的資料,大約是哈利波特小說全集8到9萬倍的文字量訓練而成。比起用於工作,ChatGPT最主要的功能仍是聊天,因此,除非你的工作是純粹的聊天,否則ChatGPT不一定能完全滿足工作上的實務需求。
以AI提供服務的公司不只ChatGPT,例如用來寫程式的Copilot(編按:GitHub Copilot)、做筆記的Notion、做簡報的Gamma等,這些AI工具已經逐漸成為我們的日常。當任務目的與這些AI工具原先訓練的目的相符時,就可以直接使用。
但在實務工作上,需要AI去解決的問題,通常跟公司本身的領域知識有關,例如製造業的生產流程調控、服務業的商品推薦等。當我們希望用AI取代或加強現有的部分工作流程,但流程涉及公司內部機密資訊,而較難直接套用現成AI工具時,就需要組織自行開發出適用自家企業的AI模型。
開發AI模型前 企業常見的兩大管理問題
一、沒有先界定需要的資料範圍
著手開發AI前要先辨認,哪些是解決目標問題需要蒐集的資料;以及由誰來決定哪些資料有用、哪些用不到?通常我們會認為主責單位可以決定,但現今多數業務已經無法由一個單位獨立完成,而是公司部門間通力合作的結果,因此資料來源是需要跨部門協助提供。
以老闆們最喜歡做的業績預測AI專案為例,與業績相關的資料從哪裡來?業績可能來自老闆的人脈,像老闆出去應酬後業績上升;也可能是成功的社群行銷造成購買熱潮;也可能是被外在環境影響,像是預期颱風登陸的心理讓超市擠滿人潮,業績瞬間暴增等。由於公司訂定的「業績成長」任務,資料提供的來源其實分散於各個部門,因此很難完全由一個業務單位來提供。
二、組織陷入穀倉效應,難以取得跨部門資料
這時,組織會面臨跨部門磨合的問題。例如工廠生產部門的「生產參數調控優化」AI專案,最終目標是要將需要人工手動調控機台參數的工作自動化。
為了達到目標,除了需要生產部門的機台設定參數之外,還需要生產時工廠現場狀況的記錄(如溫度、溼度等),這是由廠務部門人工記錄;以及品保部門的品管數據記錄。當時,這間工廠的生產部門,花了很多時間進行跨部門溝通,才取得關鍵資料。
企業必須建立資料共享生態系思維
多數企業由於資源有限,通常傾向以軟體外包方式進行 AI 模型開發,此時,資料生態系的思維就很重要,因為外包的開發團隊也需要理解資料與專案目標之間的關係,而公司內的需求團隊則要想辦法提供對應的資料。
因此,公司必須建立資料共享生態系,以連結企業內部能源、物流、產品、售後、供應鏈甚至金融系統等,讓公司所有資訊能夠準確地自動蒐集到公司的數據中台,方便資料科學家快速地在中台裡觀察、分析所有相關資料。不用再經過各部門與主管的層層關卡,只為了取得不確定是否有用的資料。
透過 AIF 了解更多企業導入 AI 詳情;或是透過我們與天下創新學院合作的課程「企業 AI 工具導入的5大基本功」幫助專業工作者更宏觀了解 AI 的應用。