《AI 趨勢-蔡博探路》從「最強的模型」到「最聰明的系統」:AI 競爭賽場正在轉變
隨著生成式 AI 大舉導入企業各項業務,企業的關注焦點已從「AI 能不能做」,轉向克服落地的現實瓶頸,包括能否低延遲、低成本、可治理地AI生成。
同時,AI 生產力的爆發促使生成速度遠超團隊的決策速度,也帶出工作流程的根本重塑,以及Token資源的極效運用兩大 AI時代的急迫命題。正因如此,「Token效率優化」已成為開發者與企業最熱議的核心議題之一;OpenRouter的Fusion、Sakana AI的Fugu等新技術的出現也預示著AI競爭的賽道正在悄悄轉換。
一、技術以驚人速度進化,更強、更快的模型出現
模型技術持續進化,不僅有更強的基準表現,還有將「生成速度」推向了新極限的模型。
1. Google 發布了 DiffusionGemma 開源模型
Google 發布了 DiffusionGemma 開源模型,能夠透過平行分塊技術,將文本產出速度一舉提升至原來的四倍。在單張 Nvidia H100 晶片運算下,它能達到每秒超過 1,000 個 Token 的驚人速度。在文本之外,Google 更將極速生成的戰場延伸至語音,釋出 Gemini 3.5 Live Translate 即時語音模型API,讓顧客試用,該模型能在保留說話者原生語調與語速的前提下,支援 70 多種語言轉換。
2. Anthropic 重磅推出的 Claude Fable 5
此外,模型的效能與安全機制也在不斷重塑市場標準。Anthropic 重磅推出的 Claude Fable 5(目前暫時被停用),首次向大眾開放其最頂級的 Mythos 層級模型。這款新模型不僅在幾乎所有的 AI 基準測試中展現出領先業界的效能,並針對實務應用配備了一套嚴格的安全護欄(Guardrails)機制。
二、不再追求最強模型,而是誰擁有最強的系統
面對價格高昂的 Token 成本與算力負擔,「Token 效率優化」已成為開發者與企業最熱議的核心議題。近期兩項引人注目的產品發布,完美詮釋了這股轉向「系統化」的新趨勢。
1. OpenRouter Fusion:打破成本與效能的零和博弈
OpenRouter 最新推出的 Fusion API 服務,透過將多個不同 AI 模型的回應,彙整輸出為單一答案的API 服務,改變了過去依賴單一模型的做法。基準測試顯示,這種模型組合策略在深度研究任務上的表現,幾乎能與 Anthropic 頂級的 Fable 5 媲美,但花費的成本卻大幅降低。在 Token 經濟學(Tokenomics)的考量下,這無疑為企業提供了一條更划算的解決方向。
2. Sakana Fugu:將複雜的多代理協作封裝為極簡 API
日本新創 Sakana AI 發表了一款新產品:Sakana Fugu,則是從另一個維度展現系統戰的威力。它將複雜的多代理協作(Multi-agent orchestration)完整封裝,對外僅提供單一 API 接口。當使用者像呼叫單一模型般發出指令時,Fugu 會在後台自動進行模型的挑選、任務分派、交叉驗證與答案彙整。官方不僅強調其綜合表現達到 Fable 5 / Mythos Preview 的同等水準,更關鍵的是,它不受美國出口管制影響,解決企業在政策與地緣政治上的硬傷。
三、領域知識將決定AI應用的成敗
當底層算力與系統架構逐漸成為基礎設施,企業間的競爭不再是「誰擁有更好的模型」,而是「誰能將 AI 與既有業務結合得最深」。近期的研究與頂級賽事應用,恰好展示了領域知識才是AI時代真正的競爭力。
1. Anthropic 實證報告:「人類專業」將決定 Agent 價值上限
Anthropic 最近針對 40 萬次的 Claude Code 對話進行深度分析,企圖探討人類與 AI Agent 之間的工作分工及成功要素。研究結果卻發現:使用者在特定領域的專業知識,比其整體程式設計水準更為關鍵。這意味著,AI Agent 的產出價值上限,並不完全取決於模型本身的智商,而是取決於使用者對該項業務「實際痛點與運作邏輯」的理解深度,才能給出最精準的指引與糾錯。
2. 2026 世界盃足球賽:精準結合領域場景的完美落地
在真實世界也看到了極致的應用典範。隨著 2026 年 FIFA 足球世界盃在墨西哥城揭開序幕,該體育盛事也是今年最成功的 AI 落地案例。Google 與聯想(Lenovo)等科技巨頭將 AI 技術深度融入足球賽事的特有領域中,包括輔助越位判罰、球隊戰術數據分析,到個人化的球迷互動體驗。這些應用之所以成功,正是因為技術團隊與體育專家深度協作,將 AI 完美嵌入了高度專業的賽事工作中。
四、學術新視野:賦予 AI 自主進化的能力
學術界與研究機構的最新研究顯示,未來的解方不再是無止境地擴大模型規模與耗費人力調校,而是轉向賦予 AI「自主進化」的能力。
1. 實體世界的自動研發閉環(ENPIRE):
由 NVIDIA、CMU 與 UC Berkeley 共同提出的架構,旨在讓機器人在現實世界中自主優化精密操作技能。透過讓 Coding Agents 自主編寫並修補強化學習(RL)演算法,系統能形成「環境建構、策略改進、物理實測、演化優化」的循環。不僅克服了繁瑣的人力負擔,更讓機器人在插拔插針、剪斷紮帶等高難度任務中達到 99% 的成功率;其支援的分散式計算,也大幅縮短了訓練時間。ENPIRE: Agentic Robot Policy Self-Improvement in the Real World"
2. 虛擬環境的自我重構(Self-Harness):
上海人工智慧實驗室則將自我優化的概念搬到了 LLM Agent 身上。過去銜接模型的系統提示詞、工具與編排邏輯等多由人工設計,難以跟上迭代速度。Self-Harness 架構讓模型能主動針對自身的失敗模式,進行「弱點挖掘、修改提案與回測」,實現運作環境的動態自我修復與優化。"Self-Harness: Harnesses That Improve Themselves"
五、地緣轉折:美國管制推動生態多元化
美國針對前沿模型的監管收緊,非但未能完全鎖死 AI 的擴張,反而意外推動了全球「主權 AI(Sovereign AI)」與開源生態的加速突圍。
1. Anthropic 的戲劇性暫停
Anthropic 執行長 Dario Amodei 近期發表了政策專文,強烈呼籲監管機構應加快步伐,甚至提議政府應具備「叫停前沿模型」的權力,並輔以全民基本收入(UBI)等社會緩衝機制來應對就業衝擊。諷刺的是,這項呼籲在不久之後便一語成讖。因為,Anthropic 自家最前沿的 Fable 5 模型,就真的被美國政府以「國家安全」為由下令暫停。這項極具指標意義的事件宣告了,在美國,頂尖 AI 的發展天花板不再是技術瓶頸,而是國安底線。
2. 開源與主權 AI 的反撲:Z AI 打破閉源壟斷
中國新創 Z AI 近期發表了全新的開源模型 GLM-5.2,在一系列基準測試中,展現出足以與 GPT-5.5 和 Claude Opus 4.8 等美國頂尖閉源模型抗衡的強悍實力。這項發布具備雙重意義:它不僅標誌著「開源模型」在效能上已實質逼近「頂尖閉源模型」,更是對美國國安封鎖政策的直接回應。透過將具備頂級競爭力的模型開源,Z AI 完美詮釋了「主權 AI」的戰略價值,讓其他國家與企業有了擺脫美國技術依賴的新選擇。
在一系列的產品與時事資訊中,皆透露出,技術的未來不再只是「誰能訓練出最強的單一模型」,而是「誰能設計出最聰明的自優化系統」。而這個轉變,正在悄悄改寫整個 AI 產業的競爭規則。