數據正在改變生活,結合不同領域專業為資料科學工作者找到新的解決方案

資料科學家曾被譽為21世紀最為性感的工作,並吸引各種不同背景的人才投入資料科學領域中。當許多企業或組織藉由數據應用創造價值的同時,也大幅度重新建構我們的生活體驗。然而,現實中的資料科學工作者實際要處理的問題,往往更為複雜,除了紊亂的資料來源與各式情境,甚至還得面對各種工作角色轉換與內部溝通等大小問題。

即將舉行的國際知名科技論壇「Women in Data Science Taipei Conference 2023」,便是希望召集各個產業的資料工作者,藉由活動場域彼此交流,分享自己的專案經驗與職涯發展。活動總籌備大使之一的施佳綸解釋,過往三年,礙於疫情,都是以線上活動為主;今年是睽違已久的實體交流活動,並同時開放線上參與的混和模式,除了讓與會者與講者有深入對話的機會,也希望能消弭距離的限制,讓各地對資料科學有興趣的人都有機會參與。本篇文章邀請負責籌劃2023年「數據應用重構生活體驗」活動的三位成員施佳綸、邱佳宜、孫韻如與我們分享生活中的數據體驗,以及資料科學工作者在工作上會遇到的挑戰。

關於未來,數據正在改變我們生活型態

施佳綸說,以交友平台的數據應用為例,許多人都有使用交友軟體的經驗,並且為了可以快速找到「理想型」,在自己介紹的部分更會特別用心琢磨,先行為自己定義標籤,而平台服務者再利用這些資料,優化使用者體驗,讓使用者可以持續使用,而這個交友模式是十幾年前難以想像的。

邱佳宜也提到,自己的手機App中就有許多數據應用的案例,例如為了更快找到自己喜歡的商品,而利用電商或旅遊數據的推薦;或是計程車、共享機車透過數據蒐集熱門時段、熱點,提供更便利的交通服務;以及紀錄自己單字學習狀況,加強單字記憶的語言學習服務,都是應用數據改變生活體驗的例子。

「數據就像是另一個思考判斷的工具,可以幫助自己在接收各項訊息時,擁有多一個維度與架構進行判斷。」她說,在閱讀文章、影片、新聞等結論時,也可以思考內容中的前提假設是否符合現況,以及所用的數據是否有局限於特定範圍等。

「數據就是生活的累積。」孫韻如也提醒,過往的使用者多半不會將個人的數據視為資產,甚至容易為了得到便利的服務,而輕易提供自己的資料。但是隨著相關意識的高漲,不僅企業與政府都應該提供足夠的資訊揭露,使用者也要有數據素養,讓服務使用者可以知道自己所提供的資訊會被應用到哪些地方。

結合專業,跨域說出一個資料的好故事

孫韻如觀察到,近年來,由於No-Code平台興起,即使是非技術背景的人也能輕易上手,也讓許多人可以接觸資料科學相關領域。再加上,數據應用已經逐漸滲透於日常生活中,因此,選擇從生活面向的資料應用切入,讓大家可以對資料「更有感覺」。

隨著越來越多跨域人才的投入,也為資料科學領域帶來越來越多的面貌。例如,近年語言模型的快速發展,文學院的專業在此便有十足的發揮空間。而施佳綸本身就是從歷史跨足資料科學領域的代表,他提到,歷史本身也是一個需要處理許多資料的學科,無論質化或量化都要能同時應用,在投入資料科學領域的過程中當然有些技術債需要付出許多努力才能補齊,但更重要的是要對資料抱有熱忱,才是持續推動自己前進的動力。他認為,歷史專業帶給他最大的優勢是能「把資料說成一個好故事」。

從學校到職場,真實的資料比想像中來得亂怎麼辦?

施佳綸說,對於社會新鮮人來說,最大的落差在於「當學生的時候只要回答Why就好;但在職場上,還必須能回答要做什麼,以及需要付出多大的成本。」

孫韻如說,真實的資料往往比想像中來得複雜,不同於學校實驗室中的資料,已經被處理得很乾淨,只需要開發出一個好的模型即可;但職場上,模型只是一小部分,中間還有如硬體上使用不順暢、環境部署等許多關卡需要跨越,而這些落差也是許多剛出社會的新人需要適應的部分。加上每個產業會面對的資料型態不同,公司的規模能擁有的資源也有差異,因此,所採取的解決方案也會不同,但這些都需要經驗的累積,因此,透過與不同知識背景的與會者、講者間彼此交流,也能拓展更多觀點,發現不同的解法。

另一方面,若是對於講者的職涯發展有興趣的人,也可以透過這個論壇,更近一步與講者交流。

施佳綸提到,即使都是零售業的銷售資料,也會有線上與線下的巨大差異,不同於線上使用者有著較為清晰的購買流程、興趣等資料;線下使用者的購買動機、是否完成購買等都不容易掌握,影響的因素還可能包括了展場空間的變化,以及單月的促銷活動等。但他提到,例如電信業者中也有會員終身價值、消費者紀錄等資料的應用,也十分好奇零售業的問題是否可能借鏡其他產業的解法。

作為資料科學家,邱佳宜常見的困境在於為了確保資料背後所代表的意義與邏輯,科學家必須同時具備產業知識與技術能力,但在處理資料的同時,更是需要與第一線人員緊密合作,以確認所發現的機會點邏輯與故事脈絡吻合。藉由與不同產業工作者的交流,無論是不是業內人士,都能為工作帶進新的觀點。面對理想與現實不符的情況時,她建議,能先透過事前定義指標,並進一步實驗反饋,去抽絲薄繭釐清脈絡。

邱佳宜觀察,近幾年資料科學社群關注的重點從原本的特定研究,慢慢拓展到各個產業的工具應用與概念普及。因此,在論壇的主題規劃上也從專注於技術探討,逐漸往外擴展到產業以及生活中的應用,讓想要接觸該領域的學生或初級工作者,可以從生活面向的資料更好地理解可能的發展;而本身在就是資料領域的工作者,也能不同產業講者的角度,找到更多元面向的解決方案。

活動資訊

  • 論壇主題 丨 數據應用重構生活體驗( 點此購票
  • 論壇時間 丨 2023.05.21(日)9:00-17:15
  • 活動方式 丨 台大集思會議中心 / Zoom Webinar 線上串流直播
  • 主辦單位 丨 Taiwanese in Data Science
  • 合作單位 丨 資料科學協會 Data Science Association、東吳大學巨資學院/STEM領域及女性研發人才培育計畫辦公室、ALPHA Camp、iPASS 一卡通、人工智慧科技基金會、檜山坊Kuai Shan Fang