簡立峰:從領導力、人才、硬體與投資看未來AI

Google台灣前董事總經理、Appier獨立董事簡立峰長期關注全球AI科技發展趨勢,並且是協助台灣新創出海的重要推手,當全球面臨新冠病毒的威脅、中美貿易白熱化,AI未來發展的趨勢如何?台灣新創團隊該何去何從,將面臨什麼挑戰?

2021年,在 AI 領域有一份重要的報告,是由 Google 前董事長 Eric Schmidt 代表美國人工智慧國家安全委員會(NSCAI),對美國政府的提出的建言——The 2021 Final Report。報告中提到美國目前正面臨中國 AI 研究的重大挑戰,包含領導力、人才、硬體與投資:

  1. 領導力:美國目前雖然在科研依然領先中國,特別是在AI的領域,但是在不久的將來,如果美國不再繼續投資,將會面臨重大挑戰。
  2. 人才:美國的科研機構是全球主要人才培養基地,最具競爭力。但是有一個很重要的警訊,許多優秀的科研人才都是來自中國。
  3. 硬體:這點與台灣息息相關,AI時代強調GPU與TPU的發展,對半導體的需求強大,尤其台積電扮演相當重要的角色。但是這份報告也建議美國政府,應該加大半導體的投資,能夠讓美國生產半導體產量回到全球佔比三分之一的水準,這與近期英特爾(Intel)將其重心轉換為晶圓生產製造的策略不謀而合。
  4. 投資:強調美國政府應在AI研究與發展加大投資力度。

人工智慧發展現況與趨勢

目前人工智慧發展的現況與趨勢可歸納為以下三點:

  1. 研究趨勢:AI發展迅速,這根Transformer的推出有很大的關係,同時也帶動自然語言處理(NLP)大幅進步。
  2. 龐大模型:Transformer在學術研究上極為重要,然而在短短三、四年的時間裡,深度學習或神經網路學習用在NLP的模型愈來愈龐大,這樣的規模已經不是一般科研單位或學校有餘力可以訓練的,這也造成某種程度的軍備競賽。
  3. 生物科學:生物科技、健康關懷等領域學期物研究開始大量採用AI,已形成「AI Moment」,也成為最快速應用AI的領域之一。

2018到2020年 GPT-3參數量達500倍成長

機器學習用在自然語言處理所產生的模型大幅成長,從下圖中,由左而右觀察,從2018年到2020年,Open AI在GPT-3的各種成效是非常好的。此外,整個機器學習用在自然語言處理有很重要一個部分是來自 BERT 的發展,BERT 在早期所需要的參數大約不到 4,000萬而已,但是到最右邊GPT-3已經到了1,750 億,簡單算一下大概有 500 倍的參數量成長。

試想這麼大量的參數,需要多龐大的訓練資料、花多少的機器資源去訓練它?研究報告發現,一個 GPT-3 需要 1,000 萬美金才能訓練出一個模型。 1,000 萬美金是什麼概念?大概是一個十奈米製程,下線(tape out)製造一個晶片,所需要的費用。很有趣的是,一個語言模型訓練成本,跟一個高階半導體的製程花費是越來越靠近,因此不僅在半導體有軍備競賽,語言模型、機器翻譯也成了軍備競賽的籌碼。

小數據訓練成效顯著  韓日語可用中文模型訓練

Google 機器翻譯數據越少,成效越顯著?下圖談到的是 Low Resource 的語言的概念,橫軸代表各種語言,從軸則代表機器翻譯的成效。從最左邊來看,訓練資源越少的語言,透過Transformer 它的效果是愈明顯的好;而訓練資料越多的語言,一開始成果不錯,但成效就沒有那麼顯著。

這個想要解釋的概念是,Transformer 讓我們在一些低資源的語言裡,可以透過其他語言的資源加以訓練,以中文翻譯為例,Google的機器翻譯,韓文跟日文的其實是可以透過中文的資料來訓練。這個非常有趣,雖然這幾種語言的的語法跟形式不一樣,但是語言翻譯在深層結構裡,其實是可能有共通性,所以可以用中文的資料來訓練韓文跟日文,這是一個 Transformer的特性,也因此讓全世界學術機構、各行各業可以利用已經公開訓練出來的資料加以運用。

醫療導入AI 對抗Covid-19

從生物科學領域角度來看,在2020年的論文數量,相當於過去很多年的總和,這是生物科學大量應用AI,我們稱之為 AI Moment 的時代。這是一個時代的典範轉移發展,這個領域有很多的應用,尤其在疫情期間不少藥物的開發都有 AI 科技在裡面。

台灣很遺憾的,並沒有逃過疫情的衝擊。在過去一年多以來,全球很多國家封城的情形下,AI 在協助對抗病毒有許多成果,舉例來說,當大量病人在感染的時候,醫生資源是非常有限的,可以用 AI 協助 X 光片判讀,可以大量減少醫生人力。比如 當1922 電話打不進去,聊天機器人可以緊急狀態下協助處理大量的疑難雜症。

AI 的人才發展趨勢

AI 人才依舊非常吃緊,而 AI 這個領域還是非常值得投資,尤其在學術研究領域裡,美國還是很具代表性。下圖提到在美國有很多學者,尤其博士班的學生來自世界各國從事AI研究,但在美國完成學業之後,回到的國家有哪些?最多的是英國18%,接下來就是中國,而且中國學者的研究也都相當優秀,這大概是在中美關係緊張的狀況下,美國非常在意的一個部分。

而某種程度也帶給台灣一些機會,因為中美的競爭下,全世界就會分成兩個陣營,台灣在某種狀況下可能受到美國比以前更高的重視,AI 的研究在未來說不定也有這樣的特質。還有一個值得注意的趨勢,企業其實某種程度因為重視AI的發展,挖角了很多學者,學術單位的人才現在開始有往產業發展的趨勢。

AI 還有什麼趨勢?

AI 使用雲端服務的需求增加,因為 AI 需要非常大量的訓練資料以及資料管理,當然需要用雲端,在 Google 的經驗裡,大量雲端伺服器都用到機器學習做訓練,因此 AI 也造就雲端服務更多的需求。

AIOps(Artificial Intelligence for IT Operations,智慧營運)重要性增加,當各行各業大量使用機器學習模型,AIOps就顯得重要,在一家公司裡,如果有很多機器學習模型在執行,這時候就需要觀察它的表現,資料需要更新、需要重新訓練,或是模型有什麼樣的變化,AIOps就會派上用場。

重視AI應用跟資訊安全、倫理的關係, AI 倫理也是大家所重視的,有沒有善用保護個人資料,或是被誤用,或者造成貧富更大的懸殊、種族的差異跟人權的危害,都是大家關心的議題。例如舊金山禁止使用人臉辨識,因為這對種族,特別是非洲裔的辨識上,容易產生歧視的現象。

數位經濟正在驅動全球GDP

如果大家留意這 20 年來的科技發展,我們先是有雲端運算,之後有了大數據,有了數據之後就產生大量的 AI 科技的需求。根據 IDC 統計,2023 年將會有 50% 全球 GDP 是數位科技帶動。

台灣現有的 GDP 大約 19.2% 跟數位科技有關,或許會問,世界上這麼多的 App 跟網路服務都不是台灣開發,為什麼還有 19.2% ?事實上這個數據也把硬體都算進去,台灣大廠如台積電、鴻海的產值都在裡面,由此可見,台灣在數位經濟的主力是在硬體,軟體佔比很少,台灣的軟體佔台灣的數位 GDP 大概只有16.6%,跟美國的 91.5% 是有很大的差距,這也是政府某種原因希望可以推動成立數位發展部推動數位經濟,而 AI 當然是數位經濟裡頭的重中之重。

台灣新創要出海 才有能力與國際獨角獸競爭

台灣加速器 AppWorks 每年都會針對新創圈做調查,可以留意幾家新創,包括 AI 晶片的耐能,行銷科技的Appier、ikala,以及其他醫療相關的新創團隊。

台灣新創近年有大幅的進步,以行銷科技新創Appier為例,在全球15個市場營運,成功在日本上市後,市值已經高過10億美金,已經是一個台灣具代表的獨角獸。而這樣的獨角獸公司在全世界大概五百多家,集中在美國和中國,日本是我們傳統認為的高科技大國,亞洲的領導國家,事實上日本獨角獸只有三家,所以獨角獸真的是得來不易,南韓跟以色列各有10到12家。

值得關注的是,獨角獸的發展不止在中美兩國,在東北亞、東南亞都有新創蓄勢待發,例如東北亞的 Yahoo Japan,跟南韓 Naver 的Line在做整合;印尼的 Gojek+Grab+tokopedia,新加坡的 Shopee,逐漸形成龐大的新創勢力。然而,台灣若是只專注單一市場,這在東北亞、東南亞與中國的邊境上是非常挑戰的,台灣的新創必須要有能力出海去參與這些國際競爭。

*更多精彩報導詳見:人工智慧與新世代通訊論壇 精彩分享 (整理:AIF 陳梓元)