資料分析可以應用在哪些業務問題上呢?

加劇的氣候危機、後新冠時期步履蹣跚的經濟復原腳步,以及蓬勃發展的數位工具。面對混亂的世局,潛藏在生活中的數據能為我們帶來哪些指引嗎?無論是氣候如何影響原物料價格、尋找新的行銷方式,或是找到房價的關鍵因素,我們試著將資訊分析應用於這些問題上。

在數位時代中,許多數據資料被大量累積,企業也期待能透過資料分析解決業務問題。人工智慧科技基金會長期藉由內部讀書會,提升同仁認知並建立共識。近半年來,同仁在學習統計學、總體經濟、產業分析等知識與方法之後,嘗試就生活中的問題,透過不同資料的解讀與意涵,採用新的知識和經驗的戰略,尋找新的洞察。以下是幾個有趣的洞察分享:

1.如何從總體經濟發現氣候可能對知名咖啡品牌股價帶來影響?  

近來,巴西在長期乾旱之後終於迎來下雨,由於巴西是生產咖啡豆的大國,對投資者而言,如果想投資知名咖啡品牌例如星巴克的股票,有哪些需要注意的地方?

首要針對現況,也就是降雨對於咖啡產量帶來的影響,包含乾旱持續時間、降雨量和模式,包括降雨高峰日和咖啡種植區的分佈,以及降雨時咖啡作物的生長階段和任何潛在疾病或害蟲。同時也要考量全球咖啡市場分佈,除了找出咖啡生產商和買家間的供需動態,還要知道全球各地的咖啡價格,以及消費模式和趨勢」變化。

不可忽視總體經濟因素,包括匯率波動,以及貿易政策和國際關係對咖啡供應鏈和該咖啡品牌全球營運的影響。

透過歷史資料與統計分析可以發現,咖啡價格波動將會直接影響該咖啡品牌的營運成本和獲利能力,以及向消費者收取的價格。最後,藉由統計方法確定咖啡價格變化與該品牌股票表現之間的相關性。最後根據以上資料,給予長短期的投資建議。

2.影響房價的因素中,哪個最重要?

從售屋廣告中,可以看到好幾個吸引人的賣點,包括位置、周邊設施、屋齡,以及賣家等個人因素,而這些因素可以如何被量化,進一步協助銀行進行估價的基準?

首先,要搜集的就是資料,這裡以2021~2022年度的類實價登錄資料(不包含預售屋買賣 建物型態限於公寓、華廈、住宅大樓),透過統計檢定方式確定資料中的標的物所在位置、各類坪數、車位個數 、樓層、 屋齡、建材等特徵是否為重要因素。在確認每個特徵都很重要之後,我們近一步想知道,以台中市為例,哪個因素對房價的影響程度最大呢?

透過機器學習模型,使用Shavely values,除了找出屋齡、鄉鎮市區、車位面積等因素對房價的影響外,還發現一些有趣的結果。如921前後的房價出現明顯的斷層,或是一般認為學區對於房價有明顯影響,但從資料中可以看到「標的房屋與小學的位置必須在方圓300公尺以內,才會對房價產生顯著影響」。

另一個有趣的觀察是,與親友買房子從數據看來的確是較便宜,但價格差異多少呢?從資料中可以找到範圍約落在平均每坪差異為5萬7,不過從直方圖做觀察,取波峰的估計的話,差距約在4萬5左右。特別提醒的是,部分資訊並沒有紀錄在資料中,也就無法進行更多觀察;而該研究提出的論點,雖有關聯性,但並不代表因果。

3.透過網路數據,可以打造出成功的行銷方程式嗎?

網路數據是許多行銷人關注的資料,如何應用數據並從中找到行銷的方向,各有不同的方式與做法。我們試圖為一部2023年上映的青春愛情國片,透過導演與演員聲量,以及社群平台數據等觀察,提出行銷操作方法。

根據電影上映一週後的票房分析,得出「上映一週決定票房高點,上映一個月決定跌勢」,並且透過媒體聲量分析,觀察到「社群媒體的聲量上升或穩定者,電影票房表現比較好」。因此,若想操作社群聲量,必須在電影上映前三個月就得開始逐步累積聲量,維持產品熱度。

但從導演聲量、演員聲量,以及電影聲量來看,可以發現主演群的 Google 搜尋聲量與票房走勢有相同趨勢。但如何操縱聲量,得仰賴各家的行銷能力。同樣也得提醒的是,該調查樣本主要以2022 年~ 2023年上映電影為主,不同的社會環境或是疫情復甦,仍有不同的干擾。