如何發想一個 Green AI 專案?別忘記最核心的問題

淨零碳排大限逼近,AI如何賦能產業、企業以及環境邁向永續,是近來科技人極為關注且迫在眉睫的重要議題。該如何利用所學發想出一個好的AI綠色專案?臺北醫學大學大數據科技及管理研究所副教授具有豐富的產學合作經驗,去年指導的團隊更是拿下「2022 AI Junior Award」的金獎,從他分享的經驗中,讀者可以思考要從哪些角度出發發想題目,跳脫框架,讓創意可以被實現。

你的題目是真問題還是假議題?

該如何發想出一個好的題目呢?張詠淳說,追劇、讀論文,以及日常生活中都有許多靈感來源,只是有了雛形的問題之後,別忘記一定要「反思」確認這是一個真問題,還是只是一個假議題。

他列舉了幾種構想題目時常見的狀況,包括看起來有趣卻缺乏問題意識;又或者缺少經濟價值;更常見的是以為自己想到一個從來都沒人做過的題目,但探查相關資料後,才發現別人早就做過。又或者,可能想到了三、四個題目,但要挑選哪一個題目先做?這裡面要思考非常多面向,包括經濟價值、技術門檻是否可以達到,或者如何從別人已經有成果的研究,再往下探索,「一定要站在巨人的肩膀上,才會看得比較遠、比較快。」張詠淳說,透過不同角度的檢視,就能快速鎖定出自己的題目。

要會找資料,也要有能力處理資料

「解題有訣竅,最重要的是資料在哪?」張詠淳提到,許多學生有好的題目,也有很好的願景,但就是缺少資料,或是搜集資料要耗費的成本太高,在時間有限的情況下只能放棄。另外,資料的完整度及正確性也會影響使用的方法與解題方式。

除了透過爬蟲技術搜集想要的資料外,張詠淳也列舉了幾個常用的資料來源,如知名的競賽平台Kaggle, 國內有不少智慧醫材公司的雛形( Prototype )系統就是從是利用平台的資料做出來的,才能和醫院談合作,再用台灣的在地化資料去微調模型。除了醫療資料外,這裡也有許多讓人想像不到的資料,十分值得探索,但要找到完全符合解題所需的資料幾乎不可能。因此,必須將問題再仔細拆解,更著重在部分環節上,才能進一步思考更好的解法。再者,可以透過參加學術競賽,策略性的取得已經處理好的資料,且還能再延伸應用到其他專案上。此外,有些公部門的公開資料(Open Data)也是一個能利用的管道 。

當你收集到資料後,會發現資料其實又多又雜,或者是需要特別處理的「非結構化資料」,包括文字、影像,或是波形資料。這些不同屬性的資料需要不同處理方式。他笑說,許多人以為做人工智慧專案是件優雅的的事情;但其實「大概有80%可能是在做垃圾分類,」資料的收集、整理,及彙整其實真的很費工。他在企業演講時,一定會要高階主管要重視這些處理資料的人,因為沒有他們,後續人工智慧的進行就會很難推動。

比起單打獨鬥,懂得打群架更容易成功

張詠淳提醒,一個專案並不是所有事情都是自己擅長的,這時候別忘了尋找志同道合的夥伴一起參與,例如有些人擅長上台簡報,有些人喜歡鑽研程式,也有些人適合宣傳,讓每個人可以各司其職,團隊才會壯大起來,並且要一起找出方法解決「核心的問題」。

他特別強調,必須要把問題縮小範圍到最根本的核心,才能去想一個好方法。無論是競賽或是簡報的過程中,不僅要凸顯出自己與別人的差異,更要讓大家了解「為什麼你的問題這麼重要?」同時,你提出的方法也要能證明可以解決或是改善這個核心的問題。

至於方法要如何想?可能是翻閱文獻,參考主流的解法大概都是用哪些模型,團隊中是不是有人會這些方法?但是,如果跟著別人的方法解一樣的問題,還需要考量到創意性的部分,這時候就需要徵詢前輩、專家、學者的意見,幫助成員可以勾勒出新方法。更需要有一個善於簡報的夥伴,清晰地向大家說明團隊在數據、方法層面上的優勢。

AI變化日新月異,不藏私的交流才會成長

由於人工智慧的技術進步十分快速,甚至有些學者會透過許多混合的方式去產生更好的結果。張詠淳說,許多事情走得太快,很多答案跟要學習的東西,都能在網路上得到很好的結果,因此,具備自我學習的能力是很重要的事情,不要期待老師會告訴你所有事情。更重要的是,多討論、多溝通、不要藏私,多與他人交流才會成長。

閱讀更多『AI For ESG專案』精彩文章:想用AI解決ESG難題?提出一個專案前的必備知識