資料科學的應用-當現實比想像更棘手

資料科學的應用-當現實比想像更棘手
知勢電子報 | 2022.02.20

各位朋友們好:

首先要坦承,本期電子報內容比較偏向資料科學的原理和技術應用,對於某些初入門者或非數據部門的企業經理人來說,可能會有些不容易著手的感覺。

不過這也是我們這個世代工作者經常面對的實際情況:各種新技術或系統出現的速度快到超乎想像,必須快速掌握許多過去不曾接觸的新知,與此同時,還要能和具有新技能的同事們有效溝通,以達成企業的目標。

尤其是這幾年不停被討論的數位轉型或人工智慧,背後本質其實都是資料驅動(data-driven);談論導入人工智慧的各種困難時,也常常聽到資料處理才是關鍵。究竟當中有哪些細節需要思考?在本期電子報有詳細分享。

人工智慧科技基金會執行長 溫怡玲

如何從數據中找到使用者需求?

資料處理是一種利用數據幫助人進行決策的方法,探討用模型去解讀不同的資料與意涵,採用新的知識和經驗的戰略,從資料中發現價值。如何透過這些資料科學,幫助察覺地方的交通需求,打造更順暢、便利的大眾運輸服務?

閱讀更多

資料不平衡時,如何提高影像辨識準確度?

針對類別數極大、資料不平衡狀況明顯、且同時需要全局與細部資訊的分類問題,透過Google Landmark Recognition 2021的競賽經驗,提出可行的做法。未來,假使讀者遇到具有相似任務性質的問題時,或許可參考本文所使用的架構與處理方式

閱讀更多

不必接觸高深數學,也能輕鬆打造高效能AI模型

AutoML是近來極為熱門的話題,使用者不用寫出繁雜的演算法,也能快速打造出AI模型,降低「AI落地」的門檻,大幅減少試驗機器學習模型的時間與痛苦。AutoKeras是一套完全開源的Python AutoML套件,對影像、文字、時間序列或一般結構化資料的預測提供內建類別,甚至會加上資料預處理功能。使用者不必接觸高深的數學,就能用短短幾行程式碼便能打造出成效優異的DL模型。

閱讀更多