資料英雄用資料擴大社會影響力

大數據浪潮席捲,資料驅動組織轉型、結合創新科技與資料解決社會議題的成功案例逐漸增多,也讓政府、企業及民眾意識到數據的重要性,並將跨領域的資料科學應用視為最佳解方。然而,台灣多數的非營利組織與政府機關礙於有限的人力與物力,對於如何有效將資料科學應用於組織上,仍有許多困難需要克服。

近期熱門的大數據或人工智慧,都是近五至十年基於雲端技術、運算或系統而生的模式,「當成果經過媒體報導美化,的確吸引許多單位想嘗試。」智庫驅動D4SG 專案經理陳潔寧提到,資料治理的概念已經被提出許久,只是隨著不同世代的資通訊能力,而有不同的樣貌或成果。但是,如果組織的管理思維還是停留在紙本時代,想要透過資料進行下一步的應用或是組織能力驅動,還有許多挑戰要面對,甚至兩者的基本思維也不同。

D4SG資料英雄 (D4SG Fellowship)是由智庫驅動所推動的公益計畫,D4SG是Data for Social Good的縮寫,七年來已協助超過40個非營利組織、40個政府機關親身體驗資料價值。專案類型包括家暴預警系統、火災風險地圖、農地土壤污染調查、空氣污染調查,到視障按摩站排班管理、提升公部門採購品質與效能...,希望協助非政府組織與政府單位,透過與資料科學團隊的合作,促成跨域對話,挖掘資料價值進而解決社會問題。

透過專案合作 帶進資料管理思維

「台灣的非營利組織在資料治理上,最大的挑戰就是『沒有資料』,」陳潔寧指出,例如有單位習慣以紙本記錄、簽核及人腦記憶進行人力管理,可以想像,在資料檢索及人事安排上很難快速利用系統掌握。大部分非營利組織對於資料治理或是相關資料工具的使用是不夠熟悉或不了解的,在接觸的過程中,也會提醒對方部分工作是可以使用相關資料工具或系統,有效提升效益。「當你沒有系統時,實際上能儲存的資料十分有限。Excel資料可能因為各種時間或人力的因素,導致資料被覆蓋或出現缺漏,」檔案編寫過程中的更動沒有辦法被記錄下來,也無法掌握一段時間內的變化。在資料沒辦法被累積,數據的量及品質都不夠的情況下,組織很難進入資料治理。

但組織要從紙本管理往資料治理前進時,並不是直接導入一個系統要求大家直接使用就可以順利進行了。陳潔寧說:「系統如果沒有真的幫助到使用者,使用者是會抗拒使用的。」

以臺北市家庭暴力暨性侵害防治中心為例,由於家防中心社工在執行訪視、庇護、安置等外勤時,存在被打、被威脅、被言語騷擾等各種人身安全風險,而家防中心為了幫助社工降低相關風險,於是規劃了「外勤風險檢測指標」要求社工在出勤前必須填寫,並定期滾動修正。而單位在累積數年的資料後,也希望透過資料進行填寫行為分析、結果比對及表單優化,並發展出風險因應策略,建立循證治理的工作流程。(延伸閱讀:了解資料英雄計畫-「讓社工外勤不再危險」)

陳潔寧說,這是與家防中心第二次合作,單位成員在多年前首次參與資料英雄計畫之後,開始意識到必須有組織地搜集與清楚定義資料,也開始使用excel及google表單搜集資料。這是一個很好的開端,但是,資料填寫電子化後遇到的問題是,社工雖然紀錄了出發前的狀況,但訪視過程中,除非遇到極有可能危及人生安全的重大危機,才會特別紀錄。

這次的合作也透過工作坊,盤點相關問題並建構社工從接案到受暴通報的程序。最後,釐清步驟中的數據細項及來源,並思考如何透過數據優化現有的任務流程,以降低社工出訪時的風險。

透過快速試做,打通不同背景成員的溝通方式

由於參與資料英雄計畫的志工背景十分多元,如何善用夥伴的專長激盪出不同的合作火花?以不當黨產處理委員會所提出的「專案文本分析系統」為例,單位原本的提案是希望協助辨識歷史文件中的資訊,但因為現行的文字辨識功能限制,加上多數為手寫歷史文件,辨識不易。因此,陳潔寧在與單位溝通時,便提出進行小範疇實驗內容的建議,協助委員會建立自定義字典,協助研究員能更快從史料文章中,分析出人或組織之間的關係;並協助提升研究成果的可閱讀性。

陳潔寧說明,從原始提案到專案題目一定會有落差,在與提案單位進行溝通時,可以從以下兩個角度進行收斂:一是從問題出發,向提案單位說明,要完成提案題目至少要具備哪些資料,但實際資料僅有哪些?並從對答過程中進行題目修正;其次則是從現有資料提供對方有哪些可行的問題可做。「這是一個來回的溝通,最後再去收斂現行資料可以做到的題目。」

陳潔寧說,不當黨產處理委員會這個專案最大的挑戰來自,目前委員會的成員多半是法律背景,在闡述事件的口吻上,專業性較高也不容易理解,而讀者需要的是更互動、視覺化的東西。數位敘事在大數據的範疇下是個相較小的領域,但十分具有價值性,希望透過這個專案的呈現,作為後續其他單位的提案參考,也能了解到如何將繁雜的資訊轉化成易讀性高的內容。(延伸閱讀:了解資料英雄計畫-黨產會專案文本分析系統

另一方面,不同背景領域成員的溝通也不太容易,更需要彼此配合。陳潔寧以斷詞訓練為例,對於委員會的研究員來說,會十分困惑於到底哪些東西需要特別訓練?「有些是他覺得大家都知道,但其實大家都不知道的東西。」這些東西除非大家開始做,否則非常難定義。因此,會需要進行一個快速的試做。直接請委員會整理出要做斷詞的資料,並快速做出成果,讓雙方可以快速確認使用上是否符合需求。

陳潔寧指出,不同於非營利組織的挑戰,政府單位各部門的數位落差極大,礙於舊有組織系統的設計,橫向的溝通也不易。以住宅風險評估為例,目前有許多屋齡超過三十年的住宅,由於舊有用電的配置並不符合現行生活的用電需求,現在的住家使用許多高用電的電器,若還使用舊有的配電,火災風險極高。因為資料散落在不同政府單位中,在資料使用上也有許多問題要克服。例如資料如何串聯?誰要發起這件事?資料的使用範疇及目的該如何界定?現行消防單位也沒有資源進行資料的統合,只能透過發放警報器提醒民眾小心。

她認為,目前雖然有些資料交換的機制,但是公部門最大的挑戰,在於各單位對於這些機制的熟悉及信任度不高,需要有一個縣市當作範本,才有機會吸引其他單位或縣市跟進。

「當我們將時間軸拉長,可以看到公部門或非營利組織的改變,透過一個案子一個案子的累積與醞釀,才有可能在成熟的時機改變。」陳潔寧認為D4SG資料英雄七年來累積的成果斐然,甚至催生出總統盃黑客松,更有機會推動跨部門的改變。這個計畫的目的是,透過有熱情的資料科學家,持續不斷做不同的事情。她相信,越來越多不同世代的人進入公部門,將會帶來新的工作思維,隨著不同世代對服務的理解和想像不同,將會帶來新的改變。