洪士灝:要追上先進國家,勢必要有算力或技術

許多人出門前習慣使用氣象預測軟體掌握天氣,尤其夏日常見的颱風預測,更是攸關放假與否的重要參考標準。但要做到精準的天氣模擬,高效能運算是不可或缺的工具,台灣第一台能執行高效能運算的超級電腦,就是用於氣象預測上。不過,這台電腦從硬體到軟體都是跟國外購買的,換句話說,台灣並沒有自己的技術。但是,台灣能發展高效能運算嗎?對於台灣產業及人才培育上又有什麼影響呢?

高效能運算能力對台灣重要嗎?

台灣大學資訊工程學系系主任、國家高速網路與計算中心副主任洪士灝,長期投入平行處理、高效能運算和計算架構等領域研究。曾經任職於矽谷昇陽電腦工程師,是國內知名的超級電腦專家。從他的個人臉書,更是可以看到他對人才培育、產業轉型、產學合作等面向的關注,每篇貼文都是鏗鏘有力、擲地有聲。

「要開發自已的技術的話,需要兩個東西,一是高效能運算,另一個則是要懂機器上的軟體。」洪士灝說,國外已經累積數十年的經驗,國內如果要追上先進國家,勢必要有算力或技術。全世界先進的國家幾乎都有超級電腦,即使是國土較小的瑞士,也有全世界前十名的超級電腦用做各種科學工程的研發。韓國更是在十年前就訂定了超級電腦法案,明文規定國家要提供高效能運算資源以支持產學研發,甚至編列預算鼓勵業界開發超級電腦相關的技術跟設備等。

洪士灝指出,這些國家都知道高效能運算的重要,例如模擬軟體就是超級電腦的經典應用,包括飛彈的模擬、核彈的設計模擬,不用特別引爆一顆核彈,透過模擬軟體就能知道核爆後的狀況。尤其是邁入AI年代,高效能運算能力也就越來越重要,原因很簡單,「誰的算力強,就比較有可能勝出。」

有些人可能認為,如果不要做世界最先進產品,只做普通的消費型產品,是否就不需要發展很厲害的AI技術了呢?洪士灝認為,人工智慧是經過大量的訓練與資料所做出來的智慧結晶,這些訓練後的成果可以放在電子裝置中,包括手機、手錶,或是許多路燈周邊的插座,之後應用在許多地方,智慧物聯網就是其中之一。

不過,看似熱門的智慧物聯網,實際上很難做出一個讓人有感的產品。「關鍵不在硬體,而是上面的智慧是不是真的非它不可?」洪士灝解釋,物聯網裝置很多公司都會做,當今業界幾乎可以快速生產出許多智慧裝置,但卻沒有想過要怎麼應用這些裝置及合作模式。當中除了需要有整體的規劃,還有許多軟體的議題,僅有單一的連網裝置,並不能稱為智慧物聯網。

洪士灝以智慧城市為例,指出當中最重要的事情就是「資料」,包括資料的處理與管理,資料如果只是放在資料中心就失去意義了,但這些資料被運用時會需要大量的計算能力,也就是一個很強的中樞,「一個整體的計算資源規劃」。

企業不能空等人才培育

洪士灝提到,從人才培育的角度出發,目前遇到比較大的問題就是計算資源不足。如果要使用資料訓練模型,作業時間從好幾個小時到好幾天都有可能。一樣的模型,使用超級電腦和自己的小電腦運算,光是時間就有明顯落差,當然也會影響生產力。因為注意到這件事情,國網中心近年來也積極與國內一些學校合作,協助老師申請計算資源。洪士灝說,經過一陣子的觀察,發現將計算資源集中在國網中心的做法極有效率,因為這樣一來,不僅可以減少學校設備添購的費用,也不用負擔設備維護的高額成本。

提到目前業界需求與學校教育的人才落差,洪士灝認為,業界需要的是最新且能及時應用的技能,但是學校教的是長時間不變且適用多數地方的理論,由於目標不同,產學落差的出現也就無可避免。但是,近來已經有些折衷的做法,例如學校會教一些較為務實的基礎,讓學生到業界後可以不用再從頭學起。學校也不會只是教導教科書上的東西,考完試就結束,而是會再加入很多作業,甚至是期末的專題,讓學生能更深刻的動手實作。

不過,洪士灝坦言,以人工智慧領域來說,如果要動手做,除了計算資源不足,最大的問題就是資料,沒有資料就無法訓練機器學習;資料太少的話,做出來的東西也稱不上「智慧」,所以資料是一個重要的議題。

但有些企業對於提供資料一事較為介意,在產學合作上就會較費心思。假使企業無法或是不願意讓提供真實資料,洪士灝建議,可以透過幾個做法,例如提供虛構卻能反映真實情況的資料,這些資料不會洩漏機密,但是需要經過包裝,讓人可以輕易幫忙解決問題的程度。也就是說,企業不能只是坐在一旁等人家幫忙,而是要跳出來盡一份心力,最重要的就是提出真實問題,並將之變成大家有興趣且想幫忙解決的問題,過程不會是免費的,但是為了要發展,就一定要做這件事情。

也可以學習國外許多單位,釋出一些公開資料或是辦比賽。例如公家單位也可以思考,如何將資料釋出成公開資料,提供一些實戰的舞台。不過,洪士灝也提醒,資料公開時需要注意洩密或隱私問題。國網中心也發現了這個讓人頭痛的問題,因此,十分積極發展隱私保護的機制。他認為,國網中心在這方面可以扮演一個重要的角色,協助這些資料。洪士灝說,因為國網屬於非營利單位,無法將這些資料拿去賣錢,是一個比較中性的單位,若再搭配計算資源,相信可以幫助研究者快速做出很好的研究。