如何發想一個 Green AI 專案?別忘記最核心的問題

你的題目是真問題還是假議題?

該如何發想出一個好的題目呢?張詠淳說,追劇、讀論文,以及日常生活中都有許多靈感來源,只是有了雛形的問題之後,別忘記一定要「反思」確認這是一個真問題,還是只是一個假議題。

他列舉了幾種構想題目時常見的狀況,包括看起來有趣卻缺乏問題意識;又或者缺少經濟價值;更常見的是以為自己想到一個從來都沒人做過的題目,但探查相關資料後,才發現別人早就做過。又或者,可能想到了三、四個題目,但要挑選哪一個題目先做?這裡面要思考非常多面向,包括經濟價值、技術門檻是否可以達到,或者如何從別人已經有成果的研究,再往下探索,「一定要站在巨人的肩膀上,才會看得比較遠、比較快。」張詠淳說,透過不同角度的檢視,就能快速鎖定出自己的題目。

要會找資料,也要有能力處理資料

「解題有訣竅,最重要的是資料在哪?」張詠淳提到,許多學生有好的題目,也有很好的願景,但就是缺少資料,或是搜集資料要耗費的成本太高,在時間有限的情況下只能放棄。另外,資料的完整度及正確性也會影響使用的方法與解題方式。

除了透過爬蟲技術搜集想要的資料外,張詠淳也列舉了幾個常用的資料來源,如知名的競賽平台Kaggle, 國內有不少智慧醫材公司的雛形( Prototype )系統就是從是利用平台的資料做出來的,才能和醫院談合作,再用台灣的在地化資料去微調模型。除了醫療資料外,這裡也有許多讓人想像不到的資料,十分值得探索,但要找到完全符合解題所需的資料幾乎不可能。因此,必須將問題再仔細拆解,更著重在部分環節上,才能進一步思考更好的解法。再者,可以透過參加學術競賽,策略性的取得已經處理好的資料,且還能再延伸應用到其他專案上。此外,有些公部門的公開資料(Open Data)也是一個能利用的管道 。

當你收集到資料後,會發現資料其實又多又雜,或者是需要特別處理的「非結構化資料」,包括文字、影像,或是波形資料。這些不同屬性的資料需要不同處理方式。他笑說,許多人以為做人工智慧專案是件優雅的的事情;但其實「大概有80%可能是在做垃圾分類,」資料的收集、整理,及彙整其實真的很費工。他在企業演講時,一定會要高階主管要重視這些處理資料的人,因為沒有他們,後續人工智慧的進行就會很難推動。

比起單打獨鬥,懂得打群架更容易成功

張詠淳提醒,一個專案並不是所有事情都是自己擅長的,這時候別忘了尋找志同道合的夥伴一起參與,例如有些人擅長上台簡報,有些人喜歡鑽研程式,也有些人適合宣傳,讓每個人可以各司其職,團隊才會壯大起來,並且要一起找出方法解決「核心的問題」。

他特別強調,必須要把問題縮小範圍到最根本的核心,才能去想一個好方法。無論是競賽或是簡報的過程中,不僅要凸顯出自己與別人的差異,更要讓大家了解「為什麼你的問題這麼重要?」同時,你提出的方法也要能證明可以解決或是改善這個核心的問題。

至於方法要如何想?可能是翻閱文獻,參考主流的解法大概都是用哪些模型,團隊中是不是有人會這些方法?但是,如果跟著別人的方法解一樣的問題,還需要考量到創意性的部分,這時候就需要徵詢前輩、專家、學者的意見,幫助成員可以勾勒出新方法。更需要有一個善於簡報的夥伴,清晰地向大家說明團隊在數據、方法層面上的優勢。

AI變化日新月異,不藏私的交流才會成長

由於人工智慧的技術進步十分快速,甚至有些學者會透過許多混合的方式去產生更好的結果。張詠淳說,許多事情走得太快,很多答案跟要學習的東西,都能在網路上得到很好的結果,因此,具備自我學習的能力是很重要的事情,不要期待老師會告訴你所有事情。更重要的是,多討論、多溝通、不要藏私,多與他人交流才會成長。

閱讀更多『AI For ESG專案』精彩文章:想用AI解決ESG難題?提出一個專案前的必備知識