Uber 打造 AI 驅動開發平台，每年為開發團隊省下 21,000 小時

大家都知道，Uber 是平台經濟中最具有代表性的公司之一。這家每天需要處理 3,300 萬筆行程、遍布全球 15,000 個城市的企業，其營運背後靠的是一套擁有數億行程式碼的龐大系統。對Uber來說，5,000 位內部工程師有效率地寫 code、不被瑣碎工作拖累，對公司的整體營收至關重要。隨著AI的進步，Uber同樣導入 AI 來優化自己內部的開發流程。

Uber 開發平台團隊的 Sourabh Shirhatti 與 Matas Rastenis 在今年5月由LangChain舉辦的Interrupt Conference上，公開分享他們如何利用 LangGraph 在公司內部打造了一套 AI 工具鏈，主動幫開發者找出程式碼問題、產出測試案例，加快 code review 的效率。經過一年的實踐，AI導入為Uber的工程師節省了超過 21,000 小時的開發時間。

Matas Rastenis 說：「我們不斷問自己，怎麼讓這些流程變得更好？怎麼讓它們更快？怎麼徹底消除工程師重複又乏味的工作？」

三大策略：讓 AI 工具成為開發流程的一部分

Uber 的 AI developer tool 策略建立在三個核心原則上：

專注解決開發者痛點（Bets）的產品設計：從開發者最常抱怨的工作出發，優先導入在測試撰寫、code review 、找 bug，挑選可以立即改善的流程進行 AI 自動化。
打造可跨產品重複使用的基礎元件（Crosscutting Primitives）：打造一套 Uber 內部通用的 AI agent 框架，讓 Agent 能夠被不同任務重組與使用，加快新工具開發速度。
刻意設計的技術轉移（Intentional Tech Transfer）：每開發一套工具，都思考哪些模組可以重用到下一個產品，打造可組合、可擴展的 AI agent 生態系。

這三個策略的交會點，就是他們打造的「LangEffect」框架，它基於 LangGraph 與 LangChain 所建構，提供一套 Uber 專用的 Agentic 開發環境，可以讓多個 AI agent 串接運作、互相傳遞資訊，成為工程團隊「AI 工具即服務」的基礎設施。

Validator：AI 當程式碼守門人，預先擋掉壞習慣

第一個成果是「Validator」，一套整合在 IDE（整合式開發環境）中，能夠自動偵測程式碼品質與安全問題的 AI agent 工具。

簡單來說，它能自動偵測程式碼中的「壞習慣」與潛在安全漏洞。開發者打開程式時，Validator 會即時提醒問題，並提供修改建議。使用者可以選擇一鍵修復，或交給 AI agent 幫忙處理。

這套系統的背後是一個「主 agent + 子 agent」的架構：主 agent 負責統整，子 agent 包含調用 LLMs 的自然語言推論模組，也能串接靜態分析工具，讓部分檢查結果 deterministic（確定性）地生成，再進行自動修復。

根據 Uber 的統計，這項工具每天會促成數千次修復行為，許多錯誤在正式上線前就被解決，顯著提升了軟體品質。

AutoCover：AI 寫測試，不再是夢

Validator 解決的是「怎麼寫好 code」的問題，而 AutoCover 則幫助工程師「更快驗證 code 是否正確」。

這是一套 AI 自動生成測試案例的工具，會分析程式碼的結構與邏輯，產出覆蓋率高、品質優的測試碼。它不只產出單元測試，也能執行 coverage 檢查、mutation test、concurrency test 等進階驗證流程。

AutoCover 的運作也建立在 agent graph 的設計上，包括：

Scaffolder：決定需要測試哪些商業邏輯
Generator：構思與生成新測試案例
Executor：實際跑測試、檢查通過與否、並進行 coverage 分析
Validator：再次進行程式品質檢查

整個系統可同時平行運作數百個測試流程，顯著提升測試速度與準確性。根據 Uber 的內部統計，AutoCover 幫助開發平台的測試覆蓋率提升約 10%，等同於一年節省 21,000 小時開發工時。

一次開發、多次使用：AI agent 的橫向擴散

Uber 並未將這些工具視為單一專案，而是當成模組化的建設。Validator 與 AutoCover 的 agent 模組，也出現在其他內部工具中，例如 Validator 除了內嵌在 IDE 裡，也被嵌入到 Uber 內部的 GPT chatbot「Security ScoreBot」中，用於事前安全設計審查。甚至在 PR code review 階段，也能再次套用 Validator 的檢查邏輯，確保程式碼能在最終合併前再過一遍把關。

這種「一次開發、多次應用」的策略，讓 Uber 在構建新工具時有更快的迭代速度與更高的一致性。