從數據到大語言模型,生成式 AI 的未來該往哪走?

從數據到大語言模型,生成式 AI 的未來該往哪走?
知勢電子報 | 2024.08.11

各位朋友們好:

「我講的事情,很可能跟大家的認知不太一樣。」這句話幾乎是最近參與各種會議時,我最常說的話;其實,我也很不喜歡這麼說,畢竟逆風說實話,絕不是聰明人會輕易嘗試的事。

例如,很多企業來詢問人工智慧客製化課程,常常是這麼開頭:「我們只是來問問看,員工應該要上哪些 AI 課程?」

「請問希望員工上了課程之後,能夠有什麼能力呢?」

「呃,就是會用像 ChatGPT 來寫文案、配圖之類的。」

「其實,這些在網路上都已經有現成的免費課程,不需要特別花錢請老師教喔。」

「是啦,可是大家用來用去,好像都差不多,想說能不能學到一些比較厲害的方法?」

接著,只好回答:「我講的事情,很可能跟大家的認知不太一樣。」

在接下來的對話中,就會發現企業很容易踏入「只要上過生成式 AI 的課就懂得怎麼用 AI」的誤區,雖然企業本身可能過去根本沒有蒐集資料、整理資料的習慣,大部份檔案都還散落在不同部門同事的電腦裡;更常見的是,完全不知道有哪些資料跟想用 AI 解決的問題有關。

由於政府積極推動公務人員學習 AI,最近有機會參與幾場教材審編會議,教材都是由學界德高望重的學者主導,品質優異當然不在話下。不過,為了讓學習者快速上手,課程內容往往都從機器學習、視覺辨識、推薦系統……開始,沒有辦法提到處理資料這個最容易卡關、大部份企業不知道如何著手、也是員工們最想學習的環節。

所以,除了一再說「我講的事情,很可能跟大家的認知不太一樣」,我想《知勢》電子報應該能夠多做一些,讓大家對生成式 AI 的認知不再只有媒體上報導的無所不能,以及各大科技公司高超又快速的技術。因此特別邀請 AIF 技術顧問撰寫《從深度學習到大語言模型》一文,從原理、限制到目前正在進行的研究方向,深入淺出一次說清楚。同時搭配《生成式 AI 並非橫空出世,那些關鍵的技術突破與發展》一文,則適合技術人員補充複習。

在準備報名坊間各種 AI 課程之前,希望本週電子報能夠讓大家了解基礎概念,選擇對自己和企業最有用的學習路徑。

人工智慧科技基金會執行長 溫怡玲

本期目錄

大語言模型 技術

從深度學習到大語言模型

現在的深度學習是數據驅動(Data-Driven)的技術,訓練深度學習模型就像教小朋友學習新知識。最關鍵的步驟是準備教材(數據)來教導小朋友,這些教材通常放在圖書館中(記憶體或硬碟)。

閱讀更多
>Gemini 技術

生成式 AI 並非橫空出世,那些關鍵的技術突破與發展

自從 ChatGPT 在 2022 年底出現,並掀起一陣 AI 討論熱潮後,隨著各式生成式 AI 工具的出現,除了大眾開始感受到生活與工作方式將逐漸受到影響,各大科技巨頭相繼發表最新模型技術,紛紛投入這場大型語言模型競賽中,包括 Meta 推出 V-JEPA 模型、Google 的 Gemini ,以及 OpenAI 的影片模型 Sora。

閱讀更多
人才培育 觀點

走進真實場景,找到下一代永續新遊戲規則

AI 科技的發展與 ESG 新規範的出現,預期將帶來新的典範轉移,使得企業經營管理或人才定義,必將面臨創新的挑戰。成大未來智慧工場近兩年在日本飛驒完成負碳建築的模型;以及與泰國當地學生合作,共同研究糧食危機與有機農業平衡的可能性。當原來的計畫在落地時,可能會在現實中遇到哪些考驗與挑戰?

閱讀更多