我們生活的世界中,充滿著許多數字與統計結論。面對統計數字,許多人會急著討論技術性問題,例如樣本誤差、誤差範圍、數字升降、結論分析或是質疑真偽,卻很少懷疑最根本的事實:這些數字所計算的對象是什麼?用的是什麼定義?
由於當今許多統計數據被用於凸顯部分問題,加上多數人對於統計學科的不熟悉,因此,許多人會認為統計數據是用於操弄話題的工具。但是,好的統計數據不是用來扭曲真相或掩蓋事實,而是幫助我們看得更清楚的有效工具。
作者提姆.哈福特(Tim Harford)是《金融時報》資深專欄作家,也是BBC第四電臺節目《數字知多少》(More or Less)的主持人。他是皇家統計學會榮譽會員、牛津大學納菲爾德學院訪問學者,曾多次榮獲經濟與統計新聞報導獎,2019年獲頒大英帝國勳章(OBE),以「表揚他促進民眾對經濟的了解」。他善用大量生動、活潑、知名的例子,並輔以大量資料佐證,讓讀者像是閱讀故事般慢慢了解數據背後隱含的陷阱,同時列舉十個準則幫助讀者有效理解統計數字,從中挖掘可貴的數據。
如果我們隨時保持警覺、仔細思考數據的來源和呈現方式,我們就可以以明晰透徹的雙眼看世界。尤其在COVID-19疫情尚未明朗的現在,正確運用統計數字可以幫助我們個人、組織甚至是社會,做出最佳的決策。以下為《臥底經濟學家的10堂數據偵探課》精彩節錄:
從新冠疫情看統計花招
2020年春季,以嚴格、即時且正當的手法進行統計學研究可能涉及的高風險,突然變得再明顯不過了。一種新型態的冠狀病毒正席捲全世界。各國的政治領袖必須面臨數十年來最重要的難題,而且必須很快就做出決定。
這些重要的決定需要仰賴流行病學家、醫學統計專家與經濟學家分析數據所得到的結果。數千萬人的性命危在旦夕,數十億人的生計岌岌可危。數據偵探努力想利用數據拼湊出這個世界所面臨的狀況,但來自四面八方的證據總是不夠即時。流行病學家伊安尼迪斯(John Ioannidis)在2020年3月中撰文寫道,新冠肺炎有可能是人類百年一遇的大慘敗。我們必須在一無所知的情況下,做出攸關生死的決定。
不過就在幾週之內,數據偵探開始描繪出新冠病毒的一些重要特點,以及它所導致的疾病。我們逐漸發現,許多人在感染一段時間之後才出現症狀,且有些人是無症狀感染,而這種人到底有多少,是個非常重要的問題。(現在認為這種人大約占四分之一。但稍微深思後你會發現,若不是有人嚴謹的追查與分析數據,將難以回答這個問題。)我們很快就了解,年長者比年輕人的風險高很多,甚至能推估出合理的致死率:在擁有大量老年人口的富裕國家,死亡率約為1%。這個數值是經過一番激烈討論才得到的,而且會隨著醫學的進展與病毒的變異而改變。不過,早期的估計值其實出奇的可靠。
雖然還有一些謎團尚未解開,但隨著時間推移,由於可以擴大檢驗規模、檢視個案研究的結果,甚至追蹤病毒遺傳密碼的變異,我們對病毒的了解愈來愈清晰。強調檢驗的重要性是有原因的:我們可以透過蒐集資料來看見無形的威脅,尤其當檢驗是在適當的規劃下進行與分析,像是英國國家統計局進行的分析。統計數據相當於疫情的雷達。
本書大綱是在還沒有人感染新冠病毒的時候寫的。我發現,這個致死率極高的疫情凸顯出我多年來主張的三個論點。首先,我們的情緒、成見與政治立場會嚴重影響我們如何解讀證據。這個問題是本書的核心主張,也是第一章的重點。
你可以從美國對疫情的反應看見這個問題造成的影響。川普總統在2020年2月底宣布:「疫情將會消失。有一天它會奇蹟般消失。」一廂情願是個威力強大的想法。四週之後,川普總統還在說,美國人可望在復活節上教堂。他卸任的時候,美國已經有40萬人死亡。
川普總是能激起兩極化的意見:假如他說大熱天吃冰淇淋是一大享受,就會有一群人從此什麼都不吃,只吃冰淇淋,同時還會有另一群人到冰淇淋店外面大聲抗議。新冠肺炎疫情也造成了類似情況。許多川普的支持者將拒絕戴口罩視為榮譽勛章,而他的反對者則反其道而行。我注意到,有一位美國記者在推特發文指出,英國的民眾到公園散步時不戴口罩,結果導致疫情「失控」。在英國人看來,那則推文很匪夷所思:證據顯示,不論外出時有沒有戴口罩,散播病毒的風險都很低。那則推文在2021年1月底發布,當時英國的確診人數並沒有失控,反而是快速下降。
那則推文可以被視為立場對立的兩個陣營,以戴不戴口罩來進行政治攻防的一種手段,事實上,這兩個陣營的人一點也不想知道事實是什麼。矛盾的是,當你與任何一方保持距離時,比較容易看見部落主義(tribalism)。如果你屬於共和黨或民主黨的陣營,你會因為太過投入某個立場,以致於很難用清晰的頭腦想事情。當你屬於霧裡看花的局外人,反而更容易把事情想清楚。
其次,政治決策會影響我們蒐集與分享哪些統計數據,以及忽略或隱瞞哪些數據。例如:疫情剛暴發時,地緣政治因素似乎阻礙了真實統計數字的自由流通,我們將在第八章詳細討論這個問題。臺灣政府表示,他們在2019年12月底已經向世界衛生組織(World Health Organization)提出了新冠病毒會人傳人的重要線索。然而到了2020年1月中,世衛還信誓旦旦的發推文表示,中國並沒有發現人傳人的證據。(臺灣並非世衛成員,因為中國堅稱臺灣是中國的一部分,不能被視為獨立的國家。這種障礙導致訊息延遲傳播。)
這件事很重要嗎?極為重要;從確診案例每隔幾天就翻倍的速度來看,假如我們提早幾個星期得到警告,情況必然會大不相同。
最後,統計數據可以告訴我們一些我們無法從其他方式得知的事。統計數據不是報紙上可有可無的東西,或是政治辯論的武器。究竟是有憑有據的統計數據,還是不實或有所遺漏的資料,攸關人民的生與死。
我在2020年春季撰寫本書的初稿時,我們不知道的事情還太多,太多的資料付之闕如。死亡人數每隔幾天就翻一倍,我們實在沒有本錢再等等看了。各國領袖暫時中止國家的經濟活動。3月底時,美國在一週之內就有超過300萬人申請失業救濟,是先前數據的5倍。次週的情況更糟:新增650萬人申請失業救濟。疫情真的糟到足以造成這麼多人失業嗎?似乎如此,不過流行病學家只能倚賴非常有限的資訊,來猜測最可能的情況是什麼。
新冠肺炎疫情使我們深刻意識到,原來我們平時往往將以精確、有系統的方法蒐集到的數據,視為理所當然。在疫情暴發之前,勤奮的統計學家多年來一直煞費苦心的蒐集各式各樣重要議題的統計數據,而且通常免費公布在網路上,供世界各地的人下載。然而,我們顯然被這種奢侈的待遇寵壞了,於是漫不經心的將那些統計數據貶為「謊言、可惡的謊言與統計數據」。新冠肺炎疫情提醒了我們,當我們得不到統計數據,會落入多麼絕望的境地。
統計數據是我們找到方法度過新冠肺炎疫情的僅存機會,也是理解這個複雜世界的唯一機會。然而,假如我們一遇到不喜歡的統計數據,就陷入反射性的否認,這項工具便成了無用之物。我們不該太天真,什麼都相信,不過,要避免受騙上當,並不是什麼都不相信,而是帶著好奇心與健康的懷疑心態,充滿自信的評估手上的資訊。
拿起統計學的望遠鏡
可靠的統計數據並不是騙人的花招,雖然它相當神奇。可靠的統計數據也絕非詐騙工具,事實上,它可以幫助我們看清事實。可靠的統計數據就像是天文學家的望遠鏡、細菌學家的顯微鏡,或是放射科醫師的X光片。如果我們有意願,可靠的統計數據能夠幫助我們看清周遭的世界與自己,包括各種大大小小無法用其他方法看清的事。
我寫本書的主要目的,是希望說服你相信,統計數據可以用來清楚而坦白的闡明現實情況。因此,我需要讓你知道,你可以運用統計數據進行推論,自行評估你從新聞媒體、社交媒體與日常對話聽到的說法是否可信。我希望幫助你從零開始,對這些說法進行評估,以及幫助你知道,去哪裡可以找到你能信賴的資源(這一點同樣重要)。
告訴你一個好消息:這個過程會很有趣。了解統計學的真相,會讓你得到一種很實在的滿足感:你的自信心會提升,好奇心得到滿足,而且你會覺得自己掌握了某個本領。你開始明白個中道理,不再以旁觀者的姿態訕笑。
以信心與智慧運用統計數據,我們就能看見平時難以辨識的細微趨勢。這個世界很大、很複雜,而且非常、非常有趣,有近80億人居住其中,每天有數兆美元的經濟活動在進行。人類大腦大約有860億個神經元。全球的網路世界大約有20億個網站。而一種新的病毒可以從一個人散播到數千、數百萬、甚至數十億人。不論我們想要了解的是關於這個世界、其他人還是我們自己的事,若少了統計數據,所知將非常有限,如同少了X光片就無法看清骨骼的狀況,少了顯微鏡就看不見細菌,少了望遠鏡就無法觀測星星。
我希望我能給你信心,使你願意拿起統計學的望遠鏡,用它仔細檢視這個世界。我希望能幫助你了解統計學真相背後的邏輯,而且不被錯誤的邏輯、情緒,以及導致謬誤的認知偏誤影響。
請你透過統計學的望遠鏡看看周遭世界吧。你會驚奇的發現,你能看清楚所有的事。
本文節錄自《臥底經濟學家的10堂數據偵探課》,由天下文化授權。