各位朋友們好:
川普很忙,AI 圈也很忙,應該是許多人過去這週的感受。
川普重返白宮,一邊忙著退群,一紙行政命令就退出巴黎協定、WHO、聯合國人權理事會……;一邊開徵關稅、強化邊境管制與限制出生公民權、取消性別多元政策……多到甚至《紐約時報》以專題網頁方式隨時更新,還附上關鍵字點選搜尋,以便讀者從多如牛毛的行政命令中找到想了解的訊息。
AI 圈很忙,當然還是 DeepSeek-R1 的後坐力持續震盪。(宣稱)低廉的算力與訓練成本、媲美 OpenAI o1 的推理能力,使得各家科技巨擘也紛紛推出新 AI 工具。還有 Hugging Face 根據 DeepSeek 所公布的研究內容,復現 DeepSeek-R1,希望能掌握當中的關鍵架構、訓練步驟,以及在有限硬體資源下達到高效訓練的方法。
這兩件事情都有極大的影響力,甚至有媒體直接稱之為「黑天鵝」,不過這恐怕有點誤用及誤導。因為黑天鵝的定義比較偏向是「極為罕見,在一般的預期之外。發生前,沒有任何前例可以證明;一旦發生,就會產生極端的影響。」川普當選早在半年前就已隱約可知,至少,全球許多智庫、包括台灣的智庫都已經具體分析川普重返白宮的政策與可能影響,而川普目前的施政方向並沒有脫離先前的預測。
至於 DeepSeek 採開源方式、在低算力環境下維持模型強大推理能力,降低 AI 應用門檻,這樣的發展路徑或許與大家設想的 GenAI 方向不同,但一直都是許多軟體開發者致力的目標,也不算太大的意外。
或許比較值得思考的問題是,為什麼不算太意外的事件會讓許多人感到震驚(是的,這也是媒體慣用的詞彙之一)?而在震驚之後,台灣產業又學習到什麼?下一步應該做什麼?或者說,我們真正需要解決的問題到底是什麼?
例如大家都知道,因為繁體中文資料不足,是台灣訓練大型基礎模型面對的極大挑戰。那麼,多少的資料量才是足夠的?這些資料要從什麼地方取得?政府公開資料的品質堪用嗎?模型訓練出來之後,又有多少企業願意採用?退一萬步看,按照目前的產業結構與政策方向,在資本主義自由市場的運作邏輯中,台灣究竟需要什麼樣的AI發展策略?
川普與 DeepSeek 帶來的影響會有多大,沒有人敢斷言;可以確認的是,我們正處於新舊政經體系交替、融合的時刻。或許也可以再進一步想想:如果有一天台灣有了繁中版、表現不輸給 OpenAI o1 或 DeepSeek-R1(當然很快又會有更厲害的新模型出現,請自行代換)的大模型,之後呢?我們希望達成的真正目標是什麼?最近一直被提起的「主權 AI」真的就是答案?
這週的導讀又不小心寫長了。其實上面這些都是最近與企業經營者、AI 專家們曾經討論到的問題,如實呈現,希望的仍是可以開啟更多對話與思辨的可能。
在美國洛杉磯野火終於熄滅之後,本週電子報也特別分享 AI 在類似天災人禍中保護生命財產安全的一些應用。這是我們新的嘗試,希望和你共同思考。
人工智慧科技基金會執行長 溫怡玲
|