DeepSeek 熱潮下,台灣如何評估開源 AI 模型與創新機遇

近期在全球 AI 界掀起熱潮的 DeepSeek,以其 低開發成本、高效推理能力的開源模型迅速走紅,並成為美國下載量最高的 AI 應用,甚至一度引發 NVIDIA 股價波動。這個來自中國的創新不僅展示了開源模型的強大潛力,也意味著中國在生成式 AI 領域正快速追趕上美國,將對全球 AI 供應鏈產生深遠影響。

過往基礎模型開發成本極為高昂,僅有資源雄厚的企業得以負擔,然而,DeepSeek 這樣的開源模型出現,大幅降低 AI 應用開發的門檻,為開發者創造了全新機遇。此外,演算法創新也正在快速降低訓練成本,使得小型團隊也能參與這場 AI 競賽。

人工智慧科技基金會執行長溫怡玲表示,任何技術的單點突破都是值得肯定的,而DeepSeek 為台灣帶來的重要啟發,除了模型部署成本降低,並帶來開源模型的興起與應用創新機會。但她也提醒,雖然 DeepSeek 宣稱具備更低的訓練成本,但由於相關資訊有限,許多細節無法查證,再加上 DeepSeek 的母公司為量化對沖基金,此模型發布後迅速影響美國股市,可能 隱含其他策略性意圖,值得業界持續觀察與深入分析。

中美 AI 差距正在縮小,全面超越仍言之過早

至於中國 AI 與美國的差距正在縮小,但是否代表全面超越,仍有待商榷。溫怡玲指出:「若要說美國的晶片封鎖政策已失敗或此舉將對 NVIDIA 產生重大衝擊,恐怕還言之過早。」在 AI 軟體層面的領先,並不等於能全面改變 AI 生態系。中國要真正撼動全球既有 AI 產業版圖,仍有許多挑戰需要克服。

人工智慧科技基金會首席資料科學家蔡源鴻表示,許多大模型設計中的核心技術與細節並未完全公開。例如,OpenAI 雖分享部分成果,但完整的訓練架構和硬體優化設計仍屬保密範疇。

在高成本實驗的限制下,缺乏高效能硬體將會大幅提高中國的試錯成本,影響創新速度。

另一方面,在生成式 AI 競爭中,O3 模型(Optimal Open Operational Model)相較於其他大規模語言模型,更專注於演算法優化與高效運算成本,並在多個領域展現獨特優勢。蔡源鴻指出,O3 模型在高精準度研究領域展現出顯著優勢,特別適用於深度研究與專業分析。雖然在創意生成上較為受限,但其穩定性與可靠性使其成為實驗中的理想選擇。且O3 系列的技術演進速度同樣不容小覷,未來有望在更多專業應用場景中發揮關鍵作用。

至於大家熱烈討論的Mixture of Experts(MoE)架構早在 2020 年已被提出,並非全新突破,這類技術更多是已有概念的延伸與優化。

技術創新與開源挑戰

DeepSeek 讓全球更加確認開源技術的價值,不過美國有部分企業主張,對開源技術進行更嚴格監管,聲稱開源可能帶來極高風險。然而,人工智慧專家吳恩達則持相反立場,他認為開源權重模型是 AI 供應鏈的關鍵組成部分,許多企業會在資源、數據安全等多方面的考慮下選擇使用。如果美國繼續限制開源,中國可能在此領域佔據主導地位,屆時許多企業將使用更多反應中國價值觀的模型。此外,開源模型也加速了基礎模型的商品化,LLM 的價格迅速下降。OpenAI 的 o1 模型每百萬輸出字元成本約 60 美元,而 DeepSeek-R1 僅為 2.19 美元,價格差距近 30 倍。儘管訓練基礎模型並銷售 API 存取權並非易事,多數公司仍在尋找獲利模式,但他認為,基於基礎模型構建的應用仍充滿商機。開發者只需花費少量資金即可利用已投入數十億美元訓練出的模型,打造如客服機器人、郵件摘要工具、AI 醫生、法律文件助手等多樣化應用。

隨著 AI 技術與應用的發展日漸普及,數據集來源與可信度問題愈加重要,尤其在箝制言論自由的國家或地區,透明且可信任的 AI 模型是否可能存在?如果答案是否定的,又將對「可信任 AI」的定義產生什麼衝擊?這些都是 AI 治理至為關鍵的命題,也是 DeepSeeK 爆紅之後,全球 AI 產業、特別是台灣推動產業 AI 化不能再掉以輕心的議題。