2011年1月15日星期六

氣象預報

另一半常常報怨氣象預報不準。我跟她解釋,氣象預報和節目預報不同,前者本來就會不準,後者除非遭遇不可抗力的因素,幾乎是可以百分之一百確定的。你不能將氣象預報當節目預報看,期望老天爺照中央氣象局預報的劇本演出。

其實這裡面還牽涉到何謂「預報準確」的問題,我沒和另一半提,免得她傷腦筋。以我們最關注的氣溫為例,中央氣象局預測今天新竹地區的氣溫是9到11度,如果真實溫度真的落在這個範圍內,那當然是準的,否則就是不準。準的話大家認為是應該的。如果不準的話,氣象局會被民眾抱怨。

可是且慢,在此前提下,我可以大膽預測未來一年台北的每日氣溫,而且保證100%準確。為什麼?因為我預測每一天的氣溫都在攝氏0度到40度之間。除非全球暖化的效應提早出現,我有信心此預測一定準確。但這種預報毫無參考價值可言。

所以對溫度預報而言,公佈出來的數值是在準確度與資訊價值間做個取捨。為了讓預報資訊有價值,預測的溫度區間不能太含混,如此自然會有大於0的機率預報結果會不準。

再以降雨預報為例,依據氣象局的定義,當天就算只下了一滴雨,也符合「下雨」的定義。因此會不會下雨是一個可以判定真偽的邏輯敘述,沒有模糊空間可言。不過氣象局的降雨預報並非明確敘述明天一定會或一定不會下雨,而是公佈一個降雨機率。如果氣象局預測降雨機率為70%,而真的下了雨,大家一定會認為這個預報是準的。反之若預測降雨機率70%但沒降雨,那顯然又是一次預測失準。

如果仔細思考此種認定方式,可以得到許多有趣的心得。首先氣象局公佈的是機率值,當它預測70%降雨機率的同時,它其實也同時預測了30%的不降雨機率(因為預測結果只有降雨與不降雨兩種可能,沒有模糊空間),為何我們就認定了氣象局是預言「會降雨」呢?顯然在我們的心目中已經對機率設定了一個門檻值,如果預言某個事件發生的機率值超過此門檻值,我們就認為此預言認定事件是會發生的,否則就是認定不會發生的。

大部分人心中的這個門檻值顯然是50%。所以氣象局公佈降雨機率是51%或是100%,我們都認定氣象局是預測「會降雨」。如果是這樣的話,氣象局何必再去區分51%, 70%或100%降雨機率的不同?反正民眾就是認定象局預測了「會降雨」。

進一步思考,預測51%的降雨機率,而且也真的降雨了,與預測100%的降雨機率且真的下雨,直覺上似乎後者的「準確度」又更高些。但是,如何量化這種「準確度」呢?

這個問題我沒有標準答案。但是我認為可以用下列方式量化。假設某預報預測次日降雨機率為p%。如果次日真的降雨了,此預測得分為p-(1-p);如果沒降雨,則得分為(1-p)-p。如此任何預測的得分皆在-1與1的範圍內,愈接近1表示預測愈準,愈接近-1則表示預測愈不準。例如,預測降雨機率100%且真的下雨了,則可以得100%-(1-100%)=1分。預測降雨機率70%且真的下雨了,則可以得70%-(1-70%)=0.4分。

另外,預測明天會不會下雨和預測擲骰子或擲硬幣的結果不同,後者一般認定是獨立隨機試驗,意思是說無論前一次試驗的結果為何,皆不影響我們對下一次出現結果的機率估計。但是天氣狀況不一樣,以台灣北部冬季氣候為例,當冷鋒或強烈大陸冷氣團過境時,往往會連下好幾天的雨。此時如果今天已經下了雨,明天下雨的機率應該要比今天不下雨時明天下雨的機率高些,也就是說今天的試驗結果(降雨或不降雨)會影響明天試驗結果的機率分佈。這就不是獨立隨機試驗了。

對於非獨立試驗,我們可以建立機率模型,以歷史資料預測未來的試驗結果。其中最簡單的馬可夫模型(Markov Model),只參考最近一次的系統狀態來決定下一次的試驗結果。有了這些工具,其實氣象學家要比隨意亂猜的表現要好得多才說得過去。

比如說,如果純粹依照歷史的機率模型(不參考今日實測的其他數據)預測今日下過雨後明日也下雨的機率是80%,而氣象局發佈了明日70%的下雨機率,實際上氣象局是認為明日下雨的機率低於一般機率模型的預測值。如果隔日果真下雨,我們還會認為氣象預報很準嗎?

事實上上述觀念也用不到多麼高深的機率模型。以南台灣的高雄來說,某個季節中下雨的日子非常少,甚至低於10%。如果氣象預報高雄明日的降雨機率為30%,從某種角度來說,此預報其實是講「明日下雨的機率遠高於該季節一般的平均值」。如果隔日果真下雨了,我們能說氣象局降雨預報不準嗎?或者隔日竟然沒有下雨,我們能說降雨預報很準嗎?

重點在於我們一般民眾不知道評估預測準與不準的參考基準點在哪裡。我們會以50%的機率當成門檻值,是因為沒有或不知道氣象預報的事前資訊(Prior Knowledge)。氣象單位有這些資訊,照理應該會比一般人的猜測準確許多。一般人會認為氣象預報不準,是我們心理上會將正確預報視為理所當然,而將注意力放在預報失準的少數例子。


沒有留言:

張貼留言