人形機器人又稱為「具身人工智慧」(Embodied AI, EAI),也就是擁有實體身體的人工智慧。從此AI不再只是存在於雲端或螢幕中的軟體程式,而是能透過存在於物理世界的身軀,感知、互動、並在真實世界中採取行動的智慧系統。
數十年來,人形機器人一直是電影裡的常客。無論是拯救世界、統治世界,是善是惡,人類一直對於人形機器人充滿各種想像。在AI技術應用快速進展的此刻,它們已經進入倉庫、工廠,甚至進入家庭中。
NVIDIA執行長黃仁勳在GTC 2025主題演講中,預測人形機器人將在未來五年內廣泛應用於製造業。而根據《Fortune Business Insights》報導, 2032年人形機器人全球市場規模可達660億美元,每年成長率為45.5%,且將普及到醫療保健、零售和製造業領域。
鴻海集團也在10月21日的鴻海科技日首度公開,2026年初將於美國德州廠上線的AI人形機器人,背後的供應鏈廠商也同步曝光,令人對機器人產業的下一步充滿想像。
具身AI與傳統機器人、虛擬AI
就技術學理而言,人形機器人又稱為「具身人工智慧」(Embodied AI, EAI),也就是擁有物理身體的人工智慧。從此AI不再只是存在於雲端或螢幕中的軟體程式,而是能透過存在於物理世界的身軀,感知、互動、並在真實世界中採取行動的智慧系統。
在Jared Perlo等五位作者所撰寫的《Embodied AI: Emerging Risks and Opportunities for Policy Action》一文中,比較了過去的傳統機器人、虛擬世界AI,以及具身AI的差異:
傳統機器人:有實體,智慧有限。擁有實體身軀,但缺乏高度自主性與推理能力,通常被設計來在特定、受控的環境中執行高重複性的單一任務。
虛擬世界AI:有智慧,無實體。具備自主性與推理能力,但沒有實體身體直接跟現實世界互動。
具身AI:智慧與實體兼備。結合AI 的自主思考能力與機器人的實體身軀,因此能夠在多樣化、非結構化的真實環境中運作。
尚在起步階段 仍待技術突破
當然,具身機器人要能夠達成這樣的境界,仍有許多技術與學理上需要突破的限制。例如,史丹佛大學AI教授李飛飛為解決機器人在多階段、空間和時間依賴任務中的挑戰,提出「關係關鍵點約束」(ReKep)技術。首先透過ReKep拆解AI機器人需要操作的動作,這些就是與場景中物體互動的步驟,接著再為機器人生成一套操作規則,這些規則包括如何抓取、如何移動、傾斜、施力等。
同時還必須加入即時優化與回溯的機制,例如當機器人在倒茶時,如果茶杯意外移動,系統可以重新計算新的抓取或倒茶的方式,以確保任務成功達成。
被稱為「日本人形機器人之父」的石黑浩認為,人形機器人目前在技術的精細度上仍有落差,尤其,雖然電腦視覺和聽覺感測器已有大幅進步,但人類手部的靈活性與感官的細膩度,仍是AI無法達到的。特別是皮膚感測,他評估AI要具備與人類相同的能力,可能還需要50年的時間。
四大風險必須提前預防
雖然,具身機器人目前仍在起步階段,但在Jared Perlo等人的文章中,已經提出四個必須關注的風險:物理風險、資訊風險、經濟風險,以及社會風險,幾乎涵蓋人類生活的每個層面。
因為EAI和虛擬AI的核心區別在於「實體性」,和現今機器人的差異在於「學習能力」,使它能夠在物理世界中學習、感知和行動。但這使得EAI帶來虛擬 AI所沒有的即時物理風險,一旦失誤,很可能立刻造成極大傷害。因此,如何避免可能的傷害,必須在研發技術與應用之初,就必須經過慎重的規劃並且有效預防。而這將是人類社會此刻就必須思考對策的重要挑戰。(下篇待續)