
大家都知道,Uber 是平台經濟中最具有代表性的公司之一。這家每天需要處理 3,300 萬筆行程、遍布全球 15,000 個城市的企業,其營運背後靠的是一套擁有數億行程式碼的龐大系統。對Uber來說,5,000 位內部工程師有效率地寫 code、不被瑣碎工作拖累,對公司的整體營收至關重要。隨著AI的進步,Uber同樣導入 AI 來優化自己內部的開發流程。
Uber 開發平台團隊的 Sourabh Shirhatti 與 Matas Rastenis 在今年5月由LangChain舉辦的Interrupt Conference上,公開分享他們如何利用 LangGraph 在公司內部打造了一套 AI 工具鏈,主動幫開發者找出程式碼問題、產出測試案例,加快 code review 的效率。經過一年的實踐,AI導入為Uber的工程師節省了超過 21,000 小時的開發時間。
Matas Rastenis 說:「我們不斷問自己,怎麼讓這些流程變得更好?怎麼讓它們更快?怎麼徹底消除工程師重複又乏味的工作?」
三大策略:讓 AI 工具成為開發流程的一部分
Uber 的 AI developer tool 策略建立在三個核心原則上:
- 專注解決開發者痛點(Bets)的產品設計:從開發者最常抱怨的工作出發,優先導入在測試撰寫、code review 、找 bug,挑選可以立即改善的流程進行 AI 自動化。
- 打造可跨產品重複使用的基礎元件(Crosscutting Primitives):打造一套 Uber 內部通用的 AI agent 框架,讓 Agent 能夠被不同任務重組與使用,加快新工具開發速度。
- 刻意設計的技術轉移(Intentional Tech Transfer):每開發一套工具,都思考哪些模組可以重用到下一個產品,打造可組合、可擴展的 AI agent 生態系。
這三個策略的交會點,就是他們打造的 「LangEffect」框架,它基於 LangGraph 與 LangChain 所建構,提供一套 Uber 專用的 Agentic 開發環境,可以讓多個 AI agent 串接運作、互相傳遞資訊,成為工程團隊「AI 工具即服務」的基礎設施。
Validator:AI 當程式碼守門人,預先擋掉壞習慣
第一個成果是「Validator」,一套整合在 IDE(整合式開發環境)中,能夠自動偵測程式碼品質與安全問題的 AI agent 工具。
簡單來說,它能自動偵測程式碼中的「壞習慣」與潛在安全漏洞。開發者打開程式時,Validator 會即時提醒問題,並提供修改建議。使用者可以選擇一鍵修復,或交給 AI agent 幫忙處理。
這套系統的背後是一個「主 agent + 子 agent」的架構:主 agent 負責統整,子 agent 包含調用 LLMs 的自然語言推論模組,也能串接靜態分析工具,讓部分檢查結果 deterministic(確定性)地生成,再進行自動修復。
根據 Uber 的統計,這項工具每天會促成數千次修復行為,許多錯誤在正式上線前就被解決,顯著提升了軟體品質。
AutoCover:AI 寫測試,不再是夢
Validator 解決的是「怎麼寫好 code」的問題,而 AutoCover 則幫助工程師「更快驗證 code 是否正確」。
這是一套 AI 自動生成測試案例的工具,會分析程式碼的結構與邏輯,產出覆蓋率高、品質優的測試碼。它不只產出單元測試,也能執行 coverage 檢查、mutation test、concurrency test 等進階驗證流程。
AutoCover 的運作也建立在 agent graph 的設計上,包括:
- Scaffolder:決定需要測試哪些商業邏輯
- Generator:構思與生成新測試案例
- Executor:實際跑測試、檢查通過與否、並進行 coverage 分析
- Validator:再次進行程式品質檢查
整個系統可同時平行運作數百個測試流程,顯著提升測試速度與準確性。根據 Uber 的內部統計,AutoCover 幫助開發平台的測試覆蓋率提升約 10%,等同於一年節省 21,000 小時開發工時。
一次開發、多次使用:AI agent 的橫向擴散
Uber 並未將這些工具視為單一專案,而是當成模組化的建設。Validator 與 AutoCover 的 agent 模組,也出現在其他內部工具中,例如 Validator 除了內嵌在 IDE 裡,也被嵌入到 Uber 內部的 GPT chatbot「Security ScoreBot」中,用於事前安全設計審查。甚至在 PR code review 階段,也能再次套用 Validator 的檢查邏輯,確保程式碼能在最終合併前再過一遍把關。
這種「一次開發、多次應用」的策略,讓 Uber 在構建新工具時有更快的迭代速度與更高的一致性。
給台灣企業的啟示:AI 導入不是單點,而是系統性重構
這次 Uber 分享的最大啟示,不在於他們選了哪一套框架或模型,而在於他們如何思考AI導入的邏輯。
他們不急著追逐最新模型,而是先定義內部流程中具有高度重複性的工作項目,以及工程師的痛點;接著用模組的方式打造 AI 工具。每開發一個 agent,就思考能否應用於其他場景。例如 Validator 的 linting 子 agent,不只能用於提高code品質,也能轉換為安全規則的監測引擎。
在台灣,許多企業導入 AI 的瓶頸,往往卡在「找不到切入點」與「系統無法整合」這兩件事。Uber 的例子顯示,成功的關鍵不是找單一 killer app,而是打造一套能跨場景擴散的 AI 工具組合框架。
如果 Uber 能從程式碼維護下手,讓 5,000 位開發者的工作流程全面升級,那麼台灣的軟體公司、製造企業甚至銀行金融業,又能否從流程最痛的地方,開始打造自己的 AI 工具鏈?這不只是 AI 的技術問題,更是企業策略、流程工程與組織文化的綜合考驗。