讀後感: The Signal and The Noise: Why So Many Predictions Fail, but Some Don't (by Nate Silver) @ A Follower of Heart and Intuition

這是一本值得六顆星的好書!!
能把複雜又困難機率和統計寫成科普書, 又不失其意義, 作者實在有一套
機率和統計和我們的生活和工作息息相關, 卻也常被誤用 (有意或無意地把noise當作signal)
書中解答了許多我平常就有的懷疑, 也提供了不錯的見解
想知道天氣預報的50%下雨機率是什麼意思? 或是為什麼名嘴喜歡亂講話嗎?
又或是嚴肅一點的2008年金融危機怎麼來的? 或是地震預測的準確度?
自認為了解機率了嗎? 有沒有聽過Frequentism v.s. Bayesianism兩種不同的流派呢?
這本書都可以幫我們解惑

想對這世界有多一份認識的人, 有空的話可以看一下
雖然目前沒有中譯本, (已有中譯本<精準預測: 如何從巨量雜訊中, 看出重要的訊息?>)
但作者用的都是很容易懂的方法和例子
我相信花在它上面的時間絕對會是值得的
看待這個世界的方式也會更隨機一點, 更準確一點
我自己對於研究用的統計手法也因此有所改變

(之前差點用老婆的手機玩起Candy Crash, 趕快找了這本書來當剎車
比爾蓋茲這麼忙, 他看過後推薦的書, 不太會錯吧?
實在是好家在, 要我現在把看這書獲得的知識和虛擬的關卡分數做交換是不可能的事情
但我卻差點就這麼做了, 世界真是處處充滿危險啊)

================================================================

這本書的宗旨就是要我們時時用機率去思考
作者想傳達的是, 或許這世界確實存在著真理, 但人類永遠是會被主觀意識所限制
所以我們要用貝氏定理的思路, 把原始主觀當作事前機率
根據發生的事實一步一步的更新事後機率, 這樣我們就有機會了解這世界更多一些

這是一個"Big data"的時代, 但如同資訊爆炸時代一樣
沒意義的noise其實增加的比有意義的signal快非常很多
如何有能力在一堆noise中找出signal, 將會是接下來每個人決勝的關鍵
(ex. 電視新聞有90%是noise, Facebook我猜大約60%以上也都是noise)

誤把noise當signal後, 產生的預測就會非常失準, 所以必需極力避免
書裡透過一章一個例子來一步一步讓我們理解統計的陷阱和威力
裡面的例子五花八門, 包含了金融危機, 政治名嘴, MLB球員分析, 天氣預測, 地震預測,
經濟預測, 傳染病, NBA賭徒, IBM Deep Blue, 樸克牌, efficient-market hypothesis,
氣候變遷, 一直到恐佈攻擊(珍珠港, 9/11)
每一個都是有趣(或嚴肅)的例子, 既實用又發人深省

總結作者提及壞預測的通病有: 過度自信, 系統太過複雜(complexity), 不確定性太高 (uncertainty), 缺乏共識, 過度擬合(over-fitting)
(note: 已知發生機率的事件, 可以算出風險(risk); 但uncertainty指的是連機率都不知道)
而要產生好的預測的原則則是: 避免過度自信, 有洞見的模型(modeling for insight), 尋求共識, 和貝氏定理

簡言之, 對於複雜又不確定性高的系統, 人類的通病就是容易過度自信
誤把比較有信心的預測認做比較準確的預測
反之應該要時時懷疑自己的預測能力以及誤差值
而且長久來看, 平均一堆人的預測往往會比個體的準確
所以最好要尋求共識, 以及不放過任何蛛絲馬跡, 切勿獨斷
最後一個, 也是最不容易察覺的就是, 把相關性強的東西逕自解釋成有因果關係 (correlation for causation)
例如章魚保羅預測世界盃結果七次, 全部命中, 就去相信一隻章魚能影響世界盃的比賽結果
世界上不同的數據曲線之多, 一定能找到某個數據和股市到目前為止有99%的相關性
或是一定能找到某種關係式, 是可以百分百用前年的經濟數字來預測去年的股市
這種就是所謂的over-fitting, 倒果為因的致命陷阱
要避免它, 就是要提出有洞見的統計模型來做預測, 必需具備基本的因果關係概念
概念上可以很複雜, 但數學上和操作上一定要簡單, 否則很容易又會變成over-fitting

其實很多學術論文都是over-fitting到了極點
例如提出一個演算法, 對於某幾張圖能得到非常好的結果, 但住往只是over-fitting的結果而已
更有趣的是, 接著又會有一系列的論文, 對於同幾張圖一直做最佳化, 持續的over-fitting
若是希望產出一個真正實用的演算法, 這真是不可不慎

書中有兩句話滿受用的:
"All models are wrong, but some models are useful." - George E. P. Box
人類看待這世界如同盲人摸象, 無法了解真正的真理, 所以所有理論都是錯的
但有一些的確能帶來有用的預測, 像是牛頓力學和電磁學
這是實證科學的理念, 也的確是目前為此改變人類生活的主要推力

"What you don't know can hurt you."
我們最大的盲點在於不知道自己不知道的事(unknown unknowns)
所以一旦真的發生了, 往往措手不及
但也讓我想到另一句話"What can't kill you makes you stronger."
經過災難後, 若能東山再起就得記往教訓
像是9/11之後美國就幾乎完全地阻止了中東來的恐佈攻擊

由新事件學到東西, 慢慢改進自己的偏見, 這不就是貝氏定理的事後更新機率嗎!?
這本好書的確值得一看!

============================================================

下面是我對這本書每個章節的小筆記
為了之後不用再重翻一次這本書, 就寫了下來
書上寫的差不多有趣100倍吧

Introduction

人類史上第一次資訊爆炸, 在古騰堡於1440年發明印刷術之後發生
當時印出最多的書不是宗教相關, 就是偽科學
這種現象和1990年代WWW爆發時期如出一撇
就算到目前為止, 都還是無意義的資訊(noise)成長遠快於知識(signal)的產生
在這個時代, 若缺乏篩選signal的能力, Google將會只是幫倒忙而已

prediction和forecast的意義很像, 而且在不同地方會有不同的解釋
一種是差在主觀和客觀性上
prediction(預測)大多指的是客觀地數字分析結果, 而forecast(預言)則為主觀式的猜測
但人類永遠是無法擺脫主觀的, 所以嚴格來說我們只能做到forecast
必須靠貝氏定理來一直更新我們的預測

另一種常見的差別則是, prediction為準確地預測, 例如2013年10月31日8點會發生地震
而forecast則為宏觀上的預言, 像是台灣十年內很有可能發生七級以上的地震 (但何時何地不知)

Chap 1 - A catastropic failure of prediction (Financial crisis)

第一章講的就是為何2008年的金融危機發生前, 都沒有主流的金融機構事先預測到呢?
畢竟冰凍三尺非一日之寒
為了了解這議題, 必須先知道兩個引發這事件的炸彈: CDO和CDS

CDO (Collateralized Debt Obligation)是在2000年左右才被發明的玩意兒
它是一種有資產作扺押的證券(asset-backed security)
是把債務重新包裝而成的證券 (ex. 等於是賭那些債務的違約比例)
例如次級房貸的違約率本身很高, 但連續10個人都違約的機率就很低了吧?
所以把這10個人的債務包一包, 就可以變成一個違約率極低的證券
再加上被信評機構都打上AAA的評等, 在2008年前成為一堆銀行吸金的工具

CDS (Credit Default Swap)則是一種信用違約風險轉嫁的衍生性金融商品
有點像是保險, 債權持用人可以用這種方式把風險分擔出去

這兩樣東西如何結合起來引爆近代最大的金融危機和經濟衰退呢?
首先, CDO的違約率低是站在不同人違約的機率是"獨立"的情況下
ex. 每個人違約機率為0.2的話, 10個完全獨立的人都違約的機率只剩0.2的10次方!
但是, 若人的違約機率不是獨立的話呢?
尤其次貸的債務人都是經濟不穩定的一群, 一旦經濟局勢不好, 同時違約是很有可能的
此時被評為AAA的CDO, 在經濟一冷卻下來的時候, 違約率立刻上升到幾乎約0.2 (同時違約)
貴鬆鬆的證券馬上變成壁紙

如果有人試圖賣你不懂的東西, 你要把它當作是顆檸檬, 不要用黃金去買檸檬
這點道理大部份的人都懂
但若是同時有個有頭有臉的人, 像是S&P(標普)和Moody's(穆迪), 出來說有批牛肉真的很便宜
不少人就真的會跳下去買了
於是一個超大的泡泡就這樣產生了, 投資者花大錢買了一堆沒價值的次貸債務

同時間, 各個金融公司為了分擔次貸的風險, 大量的交叉持有互相的CDS
這種交易是不需要告訴政府機構的
造成大部份的銀行都被綁上一堆炸彈的線, 緊緊綁在一起
爆炸的時候誰都跑不掉

這就是2008年發生的事情
作者想知道是, 為何沒有人事先發生呢? 還是, 其實是沒有人想先從這場夢醒過來呢?

整場風暴由三個因子組成: 房價泡沫, 高財務槓桿, 錯誤的預測

前兩項由信評機構和銀行聯手推動
信評機構是靠什麼賺錢的呢? 是靠評等的件數賺錢的, 而非評等的準確度
在CDO一出現之後, 他們就一直鼓勵各銀行發行這種證券, 這樣他們能評等的件數就可以暴增
S&P甚至事後還被發現, 提供銀行一個他們怎麼算評等的軟體
讓每個銀行可以把CDO裡的債務調的剛剛好, 正好跨過AAA的門檻, 真是貼心!

在CDO因為AAA評等狂賣之下, 也促使銀行對這種高槓桿的集資方法上癮了
只要亂借錢給人, 再把債務包成CDO, 又可以再用高價賣出
聚寶盆也差不多就是這樣了!
這也是他們後來放貸給根本買不起房子的人也無所謂的主因

房貸狂增的結果就是房價飆漲, 許多人都認為不買就輸了
市場機制是有個迴授系統(feedback loop)的, 由供給與需求, 或是恐懼與貪婪所控制
負迴授(ex. 太多供給, 需求就會下降)會產生好的, 穩定的市場
但是正迴授就會產生泡沫, 像是夢幻的永動機一樣, 美麗但不真實
就這樣房價泡沫形成了
更可怕的是, 由這堆不可靠的房貸產生出來的資金, 其槓桿度竟然高達50~80倍!
CDO的發明讓資金槓桿度達到前不見古人的地步 (一塊錢變50~80塊)
所有的投資者和銀行都一起參加了這場魔鬼邀約的派對

最後一個因子就是錯誤的預測
主要來自過度自信, 像是酒醉的人硬是要開車一樣
人對於開車會覺得很簡單, 是因為平常是清醒的, 但腦子裡其實是沒有自己喝醉後開車的印象
沒有過的經驗(出車禍)就認為不會發生, 這種過度自信的幻覺就發生在當時所有人身上
因為大部份的人都沒經歷過經濟衰退, 但是都深刻體會到房價飛漲
美國也從未有過如此高的資金槓桿率
信評機構在之前也沒有評等過CDO
於是這些不真實的自信, 產生了錯誤的預測, 也產生了可怕的泡沫

所以對於自己不知道的事, 要保持警醒, 這是這本書一再想強調的事
我們也可以用數學的角度來解釋這現象
人類很自然地採用貝氏定理來理解和預測這世界
也就是基於目前的知識(prior), 再參考觀察到的現象(observation)
來更新出新的知識(posterior)
但這種數學系統最大致命傷在於, 若一開始就被prior認為是機率為零的事件
不管出現了怎麼樣的現象, 該事件機率永遠會是零!
這種致命的偏見, prior的盲點, 就是人類思考方式最大的陷阱

Chap 2 - Are you smarter than a TV pundit? (政治預測)

根據作者的統計, 美國政治名嘴預測選舉的效力和丟銅板沒兩樣
(我一直想對台灣的名嘴做一樣的事, 但只是想想, 這個作者卻真的能去實行!)
主要是因為他們都有嚴重的偏見, 不是民主黨, 就是共和黨
另外他們在節目中的預測, 往往打廣告和宣傳的成分是最重要的, 所以他們沒有任何的誘因去給出正確的預測
甚至有些人喜歡做出違反主流意見的預測 (例如民進黨必定拿下台北市市長)
因為這樣所有的節目都會找他, 報紙也會幫他大肆宣傳

作者也提到了一個有名的比喻"狐狸知道很多事情, 但刺蝟只知道一件大事"
人基本上分成兩群, 一群像狐狸一樣知道很多小事, 注重細節
而另一群就像刺蝟只重視幾件大事而已
在柯林斯的"從優秀到卓越"一書裡, 刺蝟被認為才是做大事的人
但在本書中, 作者認為只有狐狸才能給出較正確的預測, 因為魔鬼就藏在細節中

刺蝟型的人比較會堅持自己的偏見, 所有的資料都會被他拿來"證明"自己的預測是對的, 不能用的就裝作沒看到
狐狸型的人會收集足夠多足夠細的資料, 再下判定, 而且也會從資料的更新來改變自己的預測
若是用我的話來說的話, 就是明君要是隻刺蝟, 但智臣必須是隻老狐狸

本章中也提到, 若把不同的政治預測做平均的話, 是可以給出更準確的預測的
因為許多不同的偏見會被相互扺消
也佐證了在統計預測上, 共識會比獨斷的好
感覺是不是也可以來做個網站, 自動地把不同媒體做的選舉預測平均一下呢?

Chap 3 - All I care about is W's and L's (MLB預測)

這章講的是大聯盟球員的能力預測, 作者曾鑽研過這個領域
最後還成功地把技術賣給著名的棒球雜誌
也訪談了像是Moneyball裡面的主角Billy Beane等等
如果有對MLB狂熱的人, 應該會滿愛這章的

作者結論是, 棒球的預測在本書算是少數成功的例子
因為MLB的數字紀錄都被完整的保留下來, 而且球隊的目的一致, 就是奪冠
做對事情就贏, 做錯就輸, 競爭又非常激烈
總總造就了Moneyball風格的統計預測有其可信度

然而卻也不能完全去除掉球探的必要
因為有些因素是無法量化的, 但卻對球員素質十分重要
像是工作倫理 (Ichiro永遠認真練習), 專注, 自信 (揮大棒被三振還會微笑), 壓力管理和適應力
這些都必須靠親自觀察, 而不是簡單就能數量化的東西
現在的MLB基本上就是統計+球探才是王道

Chap 4 - For years you've been telling us than rain is green (天氣預報)

天氣預報基本上是一件很困難的事情
當John von Neumann在1950年代打造人類第一台處理器的時候, 想的就是希望能預測天氣
但直到1960年代中期, 處理器的速度開始有了重大的突破, 天氣預測才開始有了顯著進步
在這之前, 最好的天氣預測, 就是去看往年的平均溫度和降雨量當作預測

對於短期天氣的物理現象, 人類大致上掌握度很高, 卻會遇到Chaos(混沌)系統的挑戰
在理想化的世界裡, 若我們能得知某一時間上所有分子的位置和速度, 就能得出完美的預測
但是氣候系統是一個動態且非線性的現象
兩個只差一點點的起始值, 會演變成兩個完全不同的結果(下雨或天晴)
這就是著名的蝴蝶效應: 一隻蝴蝶在巴西搧動翅膀, 會在德克薩斯引起龍捲風
數學上來看, 就是氣候的方程式裡, 充滿了許多指數函數這種非線性函數 (ex. y=e^x)
於是小小的誤差會經過一堆指數函數的放大再放大, 造成了截然不同的結果

天氣預測是如何解決這個問題的呢?
現在的做法就是Monte-Carlo(蒙地卡羅)方法
既然知道測量值有誤差, 那就乾脆撒一堆小誤差上去, 看看結果會怎樣
例如對於一百萬種不同小誤差的組合, 可以跑出一百萬種結果
天氣預報中, 所謂60%的降雨機率, 就是模擬後得到有六十萬筆結果說會下雨!

但這種方法會隨著時間拉大, 不準度會越大
這也是為什麼颱風預測路徑都會呈現一個錐型, 離現在越遠, 就越預測不準
現在的技術水平差不多是, 一個禮拜內的天氣預報都很準
但超過一個禮拜的, 你直接去看長期的平均值還會比較好

另外, 既然只是猜測, 不同的人做的預測就會有所不同
主要差別來自於對三個因素不同的重視度: 準確度, 誠實度, 和經濟效益
例如作者發現地方媒體的預報都會比較偏"濕"
也就是降雨機率都比官方機構高
因為當你說有20%會下雨時, 很多人就不會帶傘
當那20%的機會發生時, 就會接到很多客訴說預報不準XD
於是地方媒體為了減少被抱怨的次數, 反而故意拉高降雨機率
(對於台灣媒體習慣式誇飾颱風的可能影響, 有沒有似曾相識的感覺?)

Chap 5 - Desperately seeking signal (地震預測)

相對於天氣預測, 地震預測就是屬於不成功的一類
目前要做時間和地點都很精確的prediction是做不到的
但對於長時間的forecast, Gutenberg-Richter法則目前都可以提供不錯的估計
也就是地震的規模和發生的頻率遵守著power law ditribution
又或是在log-log scale下會呈現線性的關係

這法則說的是, 越小的地震發生次數越頻繁
若你對於規模和發生頻率做外插的話
就可以得到超大地震可能發生的機率 (ex.每一百年內的次數)
於是若苪氏規模六地震突然變多的話, 這法則告訴我們的是, 規模七地震的機率是會變高的!
(note: 規模差一, 代表能量釋放差了32倍!)

長時間的預言大家當然不滿意
住在台灣的人經過921後也知道, 再來一次大地震是很有可能的
或是在一百年內幾乎必然會再發生一次
但問題是何時和何地呢?

和天氣預測完全不同的是, 人類對於地震原因的理論還是沒有很完備
也不像氣候可以隨時得到測量值, 很多在地殼下的數值都測不到
而且天氣預報天天都可以比對一下準確度, 以改進預測模型
但地震的數字是少之又少

由於理論和觀察值的不足, 但對於精確預測又十分渴望
這造成了這方面的研究, 幾乎都落入了over-fitting的圈套裡
也就是飢渴, 不擇手段地從一堆數字裡, 純綷用統計方法想得到準確的預測
結果就是常常有人宣布找到了準確的預測模型, 可以完美的預測"之前"發生的地震
(p.s. 對於一百個點, 誰都可以找到100次多項式, "完美"地預測其走向)
但事後對於下一個地震的預測, 都是灰頭土臉的收場

所以一定要很小心避免純統計的over-fitting

Chap 6 - How to drown in three feet of water (總體經濟預測)

怎樣會造成一般成人在三英尺(90公分)深的水裡溺斃呢?

答案就是那三英尺是平均值, 但水裡的深度變化度其實極高 (ex. 正負90公分的差距)
所以當給出預測值時, 其誤差值是很重要的, 應該也要給出
作者給了一個有趣的例子
1997年, 美國有個城市的洪水警報是, 水深會高達49英尺
因為攔水壩的高度是51英尺, 所以大家就都覺得很安心地沒有任何預防措施
結果卻是洪水跨過水壩, 淹沒了當地75%的房子
是預測了錯嗎? 不是, 平均值的預測很準
但問題是該預測的誤差幅度高達正負9英尺, 所以水淹超過51英尺是很有可能的!

雖然誤差幅度很重要, 但你會發現對於總體經濟的預測, 例如最常見的GDP成長率
那些經濟統計專家們都沒有給出誤差值, 這是為什麼呢?
不是因為算不出來, 而是不好意思給
根據作者的計算, 美國政府給的GDP成長率的誤差值高達正負4.3%
所以當預測說下季成長率為1.7%的時候, 其實有很高的機會是負成長的!

但這其實也不能怪那些專家們
因為總體經濟本身太過複雜, 因和果無法分得很清楚
而且常常GDP成長率反映的較多是政府的"期望"
最大的問題則是在於, 我們無法客觀地遠離這個被預測的系統
這裡有一個經濟上的測不準原理
也就是經濟預測和經濟政策的迴授系統
當預測成長率下降時, 經濟政策就會偏向刺激經濟, 導致成長率不只沒下降還成長

作者亦舉了一些例子, 來說明純統計over-fitting的問題
直到1997年, Super Bowl的冠軍所處的聯盟可以很成功地預測接下來一年股市的指數
只要是National Football League贏, 隔年股市就會漲
若是American Footbal League贏, 就會跌
這個預測指標在31年內, 成功地達到28次的預測成功
這樣高相關性就能結論說Super Bowl對於股市有困果關係嗎?

這就是典型的correlation for causation, 將相關性解釋為因果關係
自1998年起, 這個指標反而變成反指標了, 若直接套用這預測做投資的人
1998年起會年年虧錢到瘋掉

所以對於因果關係, 我們應該是要去找到一個故事自圓其說, 也就是story for causation
接下來再用統計方法測試該故事對不對
這樣的做法通常都比較不會出錯

Chap 7 - Role models (傳染病預測)

傳染病的預測也是一件很困難的事情
作者首先舉出一個預測錯誤的例子
在1976年, H1N1流感病毒被預測有機會大量流行
若這個病毒像1918年的版本那麼強大的話, 有人預測有一百萬美國人民會因此而死亡
在雖然事證不足之下, 當時美國的福特總統力推施打疫苗
政府廣告都是在恐嚇你, 你要非常害怕這個病毒, 快去打疫苗吧
但結果卻顯示, 這病毒沒有大量流行, 還反而有500多人因施打疫苗出現可能造成癱瘓的副作用
於是福特的計劃就失敗地收場了

作者指出, 傳染病的預測模型有時候都簡單過頭了
例如一個有名的Reproduction number R0, 代表的是一個染病的人會造成其它多少人得病
像瘧疾, 有史以來最致命疾病之一, R0就高達150!
但R0在染病人數上昇後的預測力就會下降
因為傳染並不完全是獨立事件, 通常都有其區域性
所以沒有節制地使用R0外插可能染病的人數, 通常的結論都是人類滅亡

有些人, 書中提到的Chicago和Pittsburgh團隊, 試著用更有洞察力的模型來預測
不像傳統把傳染途逕當作完全獨立事件
他們考慮了種族和居住地點等更有意義的分類
結果的確也能得到較佳的預測

當我們建立數學模型時, 是要有洞察力的模型
模型本身的理論應該要力求簡單直接 (數學結果可以很複雜)
書中引述George E. P. Box說的話
"All models are wrong, but some models are useful."
人類的理論都只是一種簡化後的預測
但有些理論確實有其預測力, 這些應該才是我們要力求的目標

到這章為止, 作者用了許多例子, 來說為何統計預測會失敗
接下來章節的例子, 則是用來說明如何能改進這些造成失敗的原因

Chap 8 - Less and less and less wrong (NBA賭盤預測, 貝氏定理)

這章一開始講的是一個專靠下注NBA比賽結果維生賭徒的故事
他之所以成功, 就是因為他採用了貝氏定理風格的統計推論
更重要的是, 他真的會為自己的預測做下注, 試看看究竟準不準
如果只是口頭上的預測, 那誰都會做, 只有需要真的下注的時候, 才能知道誰是認真的
他的平均預測能力約53%準確, 和亂數選的50%只有個小小微妙的3%的差距
但這差距就能讓他成為百萬富翁了
在這麼競爭的世界, 往往勝負就只差這幾個百分點
但小小的百分點卻需要百分百的專注和努力才能得到

我比較感興趣的是, 作者提及統計界裡兩大不同流派的紛爭
仔細去查了一下, 的確在近幾年貝氏流派的聲音越來越大
但唸了一堆機率和統計後, 為何大部份的人沒有意識流派之分呢?
其實我猜大家應該都和我一樣, 只是隱約有感到怪怪的, 但不敢下定論
這兩大流派就是 Frequentism v.s. Bayesianism

前者Frequentism是大家所學過的主流, 機率的定義為事件發生的平均"頻率"
若母體樣本無限大時, 就是其趨近值
在這個派別下, 只有Random variable是亂數, 相關參數(如平均值)是固定的
通常的實際應用下, 我們都只能觀察到亂數的realization, 然後用這些資料去推論其參數
其估計誤差通常是用p-value或信賴區間(confidence interval)來描述
但信賴區間的定義其實是很吊詭又繞口的, 常常統計系的學生也搞不清楚那個意義是什麼
假設一個對於某M先生支持率的統計結果是, 在抽樣1000人的結果下
M先生的支持率是7%, 其95%信賴區間為誤差值在正負0.5%以內
這代表的是, 若你用一樣的樣本數(1000人)去取樣該母體(全台灣人口)
會有95%的機率, 該取樣的平均值會落在6.5~7.5%之間
乍看之下就會認為全台灣人的支持率應該就是7%左右
但, 仔細想想你會發現邏輯上的吊詭處
這裡講的都是取樣1000人支持率, 整個母體的支持率還是一樣是個未知數
是否你取樣的那次就恰好落在信賴區間外, 你也不知道!
總結來說, 這流派的統計方法雖已成為科學界的主流
同樣的方法卻可以得出吸菸會致癌, 和不會致癌兩種結果, 而且p-value都高達95%呢!
許多科學實驗已經是反過來, 想盡辦法讓實驗結果產生高p-value的結果
而且因為p=95%莫名其妙變成主流, 一堆科學實驗的p-value都會剛剛好是95%, 不多也不少
先前有篇著名的論文, 就揭露了大部份的研究結果都是假的, 都是無法重製的
("Why Most Published Research Findings Are False" by John P. A. Ioannidis)
裡面談的就是p-value造假的問題
大部份研究只是為了發表論文, 所以正確與否根本不管
你只需要選擇性的挑選實驗內容, 讓p-value為95%就好了
這個就是Frequentism目前遇到的困境, 高p-value究竟有沒有意義, 吵都吵不完

另一流派就是Bayesianism
貝氏定理的數學式, 是沒有人會有意見的 (該式子其實是Laplace提的)
爭論點都是在於式子變數的定義上
相對於Frequentism是建構在資料是亂數, 參數是固定的前提下
Bayesianism則是建構在觀察的資料已固定, 但參數是亂數的前提下!
舉例來說, 我們想知道一個骰子擲出六點的機率, 所以我們做實驗擲了1000次
Frequentism會假設該機率為常數, 然後用1000次的平均值當估計, 再算出信賴區間
Bayesianism則看待該機率值為一個亂數
先給定一個prior (ex. 1/6), 然後用這1000次的實驗算出事後機率密度分布
接下來你可以取平均值或機率最大值當你的估計
這裡的重點在於Bayesianism給出的是一個機率分布
有機率分布你就能算期望值, 進而做出決定, ex. 壓或不壓六點出現的機率比1/6高

其實Bayes和Laplace都是傾向這是個機械性的世界
只要知道所有的起始值, 未來都可以被計算出來
他們引進貝氏定理的原因是, 人類的測量有其誤差
所以可以給定測量值一個機率分布以代表你的信心度
有時Bayesianism給的"機率"已無法用頻率來定義
這時候就會用信心(belief)這個字來取代

兩種流派的簡單結論就是
Frequentism用的是大家都容易接受的假設, 但其結果沒有什麼參考性 (信賴區間能吃嗎?)
Bayesianism用的是不容易接受的假設 (ex. 參數為亂數), 但可以給出具參考性的機率分布
或許就真的像量子力學一樣, 雖然基本假設大家都覺得無法了解為什麼
但其展現的預測力, 卻是無庸置疑, Bayesianism極有可能在未來成為主流
(至少在信號處理的領域裡, Bayesianism早已成了王道)

Chap 9 - Rage against the machines (世界棋王Karparov v.s. IBM超級電腦 Deep Blue)

其實我不太懂這章跟統計的關係
不過故事是挺有趣的
講的是1997年, IBM Deep Blue如何擊敗世界棋王的故事

所謂人工智慧, 還是人工的, 並非真的有智慧
所以電腦在想棋路時, 只能依靠以前的棋譜資料庫去選擇較好的方法
儘管電腦再快, 也是無法把20步內的所有棋路都算過
或許可以看得比人類遠一點, 但它不會思考, 無法像人類下棋會存在策略和戰略

這場大賽的第一局由棋王獲勝, 因為他成功地在一開始下了不存在棋譜的路數
這導致電腦根本無法應付, 最後以棄子投降結束
但, 在電腦投降前, 走了一步看似沒有意義的棋路
這讓棋王覺得怪怪的, 回到飯店後和助手仔細推敲, 竟然發現那步會開啟新的戰局
而且走完的話, 棋王將會落敗
這讓棋王非常的驚訝, 發現這電腦已經可以看得比他遠, 甚至產生策略性的走法!
從那一刻開始, 棋王的信心全失, 中間還開記者會抗議電腦背後一定有高手在指點

最後就是著名的"電腦擊敗世界棋王"的結果
似乎宣揚著人工智慧的勝利
但, 最有趣的小插曲就是, 作者去拜訪IBM時才知道
當時讓棋王信心全失的那一步, 其實是個bug XD
Deep Blue先前有個bug是, 在投降前會亂數選一個棋子下
他們以為都修好了, 想不到那天比賽又出現了 (可能就是因為棋王一開始就不按牌理出牌)

所以與其說人類被電腦擊敗了
還不如說是被自己的疑慮和恐懼擊敗了
因為電腦是沒有感情的, 但人類有

Chap 10 - The poker bubble (樸克牌猜牌)

作者很神奇地也精通樸克牌
當初還因為線上樸克牌越玩越厲害, 最後乾脆辭掉正職

不同的賭博在所需技巧和運氣上, 共可分為四類
而樸克牌是屬於既需要技巧又需要運氣的那一類
一個好的樸克牌玩家, 需要足夠長的時間, 才能證明自己的牌技
因為樸克牌的noise太高, 有時運氣會決定一切
再加上莊家在牌桌上會一直抽錢走
讓樸克牌成為80-20原則很好的代表
你只要花20%的力氣就能使自己不至於虧錢, 但要花80%的力氣才能贏錢

做預測和玩樸克牌一樣, 你自己牌技當然重要
但能不能在牌桌上勝出, 就要看同牌桌上比你弱的人有多少
我想這幾乎可以用在所有競爭上
重點在於你的競爭者有多強, 多認真, 事情並非能如你所掌握的, 但你可以去做評估

最近的一個感想就是, 現在學生很喜歡問工作時數的問題
他們最應該要先問問自己, 你的敵人工作時數有多長
就算你去賣雞排, 也不是你想賣多少錢, 想什麼時候開店就可以的
要看你的競爭者賣多少錢, 幾點就開店
玩個樸克牌能體驗人生道理, 也是不容易

Chap 11 - If you can't beet them (Efficient-market hypothesis)

這章談的是, 共識所做出的預測是很難擊敗的

Efficient-market hypothesis(效率市場假說)指的是
長期平均來說, 市場是無法被預測的, 沒有人可以長期且一致性地擊敗市場
或許股市在短期內是可預測的, 但考慮交易會被扣掉的稅和手續費
一直買進賣出將會吃掉你所有的本金

當任何人認為自己可以靠投資賺錢的時候
代表的是他們認為在面對華爾街的無數菁英, 個個都高IQ, 高攻擊性
且手上有幾萬台電腦可以跑模擬的情形下, 還能勝出
這可能有點太理想化了

如同凱因斯的名言: 長期來看, 我們都已經死了
許多投資人的眼界只集中在短期
作者在這裡把長期的趨勢認定為signal (經濟趨勢), 短期的趨勢則為noise
雖然長期來說沒人能擊敗signal track
但像是高盛這種頂尖機構是可以在短期的noise中擊倒別人以獲利的

短期的noise也不全然是不好的東西, 它能幫助維持市場資金的流動性
但它卻是助長長期泡沫的元兇
作者的分析是近十年來, 股票市場的投資者已從個體戶轉為機構(像是退休基金)
這些機構的代操手, 都是拿別人的錢來投資
他們是靠短期的利潤以及避免被炒魷魚的前提下操盤的
注意他們的前提沒有幫客戶賺錢這件事的
(像是房仲的前提並非屋主賺錢為主, 而是交易量帶來的佣金, 當房市往下時屋主越虧錢賣他們更開心)

這種機構代操手有一種成群結隊(herding)的傾向
別人做什麼我就做什麼, 做對拿績效獎金, 做錯反正大家一起錯也不會被炒
分析一下他們的賽局, 會發現無論他們認為市場會上還是下, 都會做出買進的動作
因為大家都買進, 所以買進後市場向下也不會被責怪
但最慘的狀況是, 你賣掉但市場向上, 只有你一個人這樣做, 你就會被炒掉了
就算他們感到市場沒有向上的理由, 還是會繼續地同步地買進
於是看似不理性的動作(明明市場不好還是買進)是來自於他們考量短期利益的理性結果
而這來自於短期理性的反應, 便造就了長期不理性的泡沫

這裡和我自身的觀察幾乎一樣
看一個人的行為, 必須去分析他的動機
若你單純用道德或自己的立場去設想, 你將會得到錯誤的結論
例如保險公司本身是需要賺錢的, 所以平均來說你買保險一定是吃虧
若他們對每個人都很好, 給你的錢比你給他們的多, 那這間公司很快就會破產, 你也拿不回來錢了
這套用在房仲和基金經理人也一樣

Chap 12 - A climate of healthy skepticism (氣候變遷預測)

氣候變遷是個大哉問
究竟這六十年來的氣溫上昇, 是真的人為的, 還是地球本身的週期?
在科學上, 二氧化碳會造成溫室效應是很少人懷疑的
人類的活動一直在增加二氧化碳也是事實
但問題是, 人類所製造的二氧化碳真的有足夠到引發溫室效應了嗎?
最近更諷刺的發現是, 人類排放的廢氣中的二氧化硫, 如同火山爆發的火山灰
可以減少陽光照到地面, 於是反而有降溫的效果
這個但書之前很少在疾呼減少二氧化碳排放的團體所做的報告中出現
是否那些團體所做的預測, 放入了太多的偏見呢?

像高爾的"不願面對的真相"裡提到, 地球溫度將會以一年0.2度的姿勢上昇
但事實是2001到2011年, 溫度幾乎是沒有上昇的
這應該也是像美國這種減碳就會造成龐大經濟損失的國家, 拒簽京都議定書的原因

地球若一旦產生溫室效應, 結果是毀滅性的, 所以這是一件相當嚴肅的課題
但氣候變遷結合了預測的三大難題
時間上和空間上的複雜度, 極高的不確定性, 不同團體間缺乏共識
並且有理論指出, 30年的氣候預測或許還有機會, 但一百年後的幾乎是想都別想
在這樣的情勢下, 人類有辦法一起理性地, 適時地挽救地球嗎?

我想, 不信教的我, 也只能祈禱了

Chap 13 - What you don't know can hurt you (恐佈攻擊)

這章以珍珠港偷襲為開頭
講述著為何當時美國人沒預料到日本會偷襲
還像曹操的水兵一樣把戰艦都集中在同一處, 造成大量的傷亡

原因就在於這不存在於美國人的prior裡
美國的地理位置天高獨厚, 東靠大西洋, 西靠太平洋
和上下的鄰國, 除了建國時和墨西哥的戰爭, 以及古巴以外, 都相安無事
於是, 美國人沒有自己國土被攻擊的印象

再加上當時珍珠港上有許多日本的僑民
美軍害怕的反而是這些僑民的恐佈攻擊, 所以把人員和戰艦集中以便管理
最後就在1941年12月7日, 發生了改變第二次世界大戰戰局的珍珠港事件

另一個例子則是9/11恐佈攻擊
在事件發生後, 檢討時似乎都會發現很多證據都早已存在
最明顯的是有個恐佈份子, 在練習開飛機的地方被舉報行跡可疑而被逮捕
他練習的是小型飛機, 卻在休息時間跑去大型客機的練習區

這只是事後諸葛
事前的可疑情報實在太多, 無法一一仔細調察
但這代表著, 因為這種攻擊的規模一開始就不在美國情報單位的prior裡
於是就算再多的觀察事件發生
還是不會更新到正確的機率上

這就是作者想強調的"What you don't know can hurt you"
我們很容易把不熟悉的事件視為不可能
這就是unknown unknowns, 不知道自己不知道的事情
要改正這態度, 就必須抱著懷疑的心態審視自己的prior

====================================================

總結本書的內容, 就是要我們面對人類的缺點: 過度自信
改正的方式就是仔細地檢查細節, 以找出自己prior裡的盲點
提出的模型要有故事, 要合理的提供因果關係
再來就是利用貝氏定理, 不斷的更正自己的模型
這樣我們就能越來越接近真相, 機率上來說!

蘑菇

A Follower of Heart and Intuition

蘑菇發表在痞客邦留言(0) 人氣()

E-mail轉寄

A Follower of Heart and Intuition

這裡是我大腦的External Memory....

讀後感: The Signal and The Noise: Why So Many Predictions Fail, but Some Don't (by Nate Silver)

留言列表

文章分類