12 min read

假如美國大選民調像2016年再錯一次,特朗普能勝出嗎?

本文僅供參考,並非任何預測。

2020年美國總統大選,目前民調顯示特朗普(Donald Trump)落後對手拜登(Joe Biden),連任機會較小。不少人認為(甚至堅信),既然2016年民調指希拉里(Hillary Clinton)當選時已經錯了一次,今年同樣也會再錯。這種想法的最大問題在於,即使美國大選民調像2016年再錯一次,不代表特朗普會再次當選。

解答標題的問題之前,容我先介紹一點關於民調的基礎知識(我不是專家,所以內容非常基本),以及簡單回顧2016年的大選民調。如果想看關於今年大選的內容,可以跳過中間的部分,直接前往「2020年又如何?」一節。

對與錯的程度

如果你認為「民調錯特朗普就會勝出」的話,不妨先考慮這個問題︰以下兩個州份的民調,哪一個更準確?

  • A州民調顯示特朗普領先,結果特朗普勝;
  • B州民調顯示希拉里領先,結果特朗普勝。

答案是…B州,不過從上述兩行資料其實無從判斷。且看以下實際數字(民調數字取自FiveThirtyEight經調整的民調平均數字,注意該文發表時未有最終結果,結果數字來自《維基百科》

  • 猶他州(Utah)——民調顯示特朗普領先9.9個百分點,結果特朗普勝18.1個百分點;
  • 佛羅里達州(Florida)——民調顯示希拉里領先0.6個百分點,結果特朗普勝1.2個百分點。

猶他州民調誤差為8.5個百分點,佛羅里達州民調誤差則為1.9個百分點,後者較為準確,但只看勝負的話,就會有猶他州民調較準確的印象。

2016年的民調固然有其問題,但假如我們只看勝負判斷民調是否準確,便無法理解當年民調「錯」在何處。就像科幻小說作家阿西莫夫(Issac Asimov)說過

[W]hen people thought the earth was flat, they were wrong. When people thought the earth was spherical, they were wrong. But if you think that thinking the earth is spherical is just as wrong as thinking the earth is flat, then your view is wronger than both of them put together.

The basic trouble, you see, is that people think that “right” and “wrong” are absolute; that everything that isn’t perfectly and completely right is totally and equally wrong.

錯誤有程度之別,我們應該要看民調有多準確(或多不準確)。

兩種誤差

要評論民調,首先需要對民調的方法有基本認識,否則就會像余杰般鬧笑話︰

民調準確與否不只看人數,還需要看取樣方法。最簡單的要求包括︰

  1. 抽取的過程隨機,以減少樣本本身的偏差(所以網絡投票不能跟民調比較);
  2. 取樣後還需要加權(例如參考人口普查數據),以確保樣本能代表整體民眾。

假如你訪問了十萬人,但這十萬人本身不能代表整體美國人的話,反而可能不及一個只有千多人的隨機抽樣民調準確。

畢竟樣本只佔整體的一小部分,即使在最理想的情況,民調本身仍會有統計上的誤差。增加受訪人數可以降低這種誤差,然而同時會增加成本(訪問時間太長的話難以反映民意變化,須增加人手處理),民調機構在現實限制(錢和時間有限)下需要平衡兩者。簡言之,如果選情緊湊,最完美的民調也有可能「猜錯」,而且如果有大量高質民調,結果應為互有勝負(也因此看整體走勢比看個別民調可靠)。

除此以外,民調亦可能其他偏差,例如在取樣、加權時忽略了某一群人,又或者有受訪者回答問題時說謊。這類誤差難以在事前得悉,但可以對比過往民調和選舉結果以作參考。

2016年民調與大選結果的落差

關於2016年民調及媒體預測的問題,建議先參考梁啟智黎班的文章,以下簡單列出一些重點︰

  • 全國民調的誤差不大(FiveThirtyEight預測希拉里普選票多3.6%,最終多約2.1%),而且比較1972年起的12屆大選,選前21天的民調平均誤差為4.6個百分點,2016年為4.8個百分點,其實並非相差太遠;
  • 州民調的誤差較大(因為成本較全國民調高,整體而言較少高質素民調),而且傾向低估特朗普選票,包括其中四個關鍵州——威斯康星(Wisconsin)、賓夕凡尼亞(Pennsylvania)、密芝根(Michigan)和佛羅里達——最終特朗普在這四州以0.23至1.2個百分點險勝,全取共75張選舉人票;
  • 不少民調均沒有就「接受過大學教育」一項加權,以致樣本中未讀過大學的民眾數字被低估,而未讀過大學的白人為特朗普重要票源,在選情激烈的威斯康星、賓夕凡尼亞及密芝根(特朗普均以不足1個百分點勝出)佔整體選民超過5成

預測方面,FiveThirtyEight當年最後預測特朗普當選機會為28.6%,比其他媒體預測的機率高,其實這數字代表超過四分之一的機會,考慮到當時的民調偏差這個預測已算不差。不過我並非專家,這些預測模型有甚麼問題,我認為需要更細緻的討論,而非一句「預測錯誤」就打發掉。

沒有人能夠預知未來,預測模型只能夠按照已知資料去分析和推算,如果單以最終結果來判斷模型是否準確,然後堅稱FiveThirtyEight低估了特朗普當選機會(甚至指Nate Silver是江湖術士),其實根本沒辦法討論,就像下圖︰

Image Credit: xkcd

2020年又如何?

同上,梁啟智和黎班的文章已討論了不少,建議讀者先參考。以下列出一些重點(同樣參考FiveThirtyEight數字)︰

  • 今屆不少民調機構已按照教育程度加權,以免重蹈覆轍,並以不同方式接觸受訪者,務求接觸到更多選民;
  • 不過今年民調的一大難題在於疫情令投票率變得難以估計,郵寄票大幅增加、可能有個別地方爆發疫情令選民決定不去投票等,都會增加變數;
  • 全國民調中,拜登領先幅度由今年3月左右約4個百分點拉開至現在大約9個百分點(10月中最高達到10.7,最新數字為8.8),支持度長期超過50%界線;
  • 對比2016年選前5個月的數據,希拉里支持度未曾超過50%,選前三日僅領先2.9個百分點;
  • 在上屆得票率相差2個百分點的6個州份——上述4個關鍵州加上新罕布什爾(New Hampshire)及明尼蘇達(Minnesota)——拜登悉數領先,領先的差距不一︰在佛羅里達只領先2個百分點,在密芝根州則領先8.8個百分點。

當然大眾對「民調顯示特朗普落後」可以有兩種解讀︰一是「特朗普落敗機會較高」,二是「民調錯誤」(正所謂 “One’s modus ponens is another’s modus tollens”)。既然重點在於準確度,我們可以問︰如果特朗普勝出,民調的誤差要有多大?

按照FiveThirtyEight的數字,以及他們製作的 “The winding path to victory” 圖表(見下圖,圖片從FiveThirtyEight網站截取,建議按連結看該互動圖表)——圖表把各州按兩位候選人的領先幅度排列,中間較為淺色的州份代表兩人支持度較為接近——從最下方的哥倫比亞特區(DC,即首都華盛頓)到內華達州(Nevada)合共有258票,拜登只需要再多12票便達到當選門檻(270票),餘下淺藍色的州份選舉人票如下︰

  • Pennsylvania: 20
  • NE2: 1
  • Arizona: 11
  • North Carolina: 15
  • Florida: 29
  • ME2: 1
  • Georgia: 16

拜登暫時在處於「臨界點」的賓夕凡尼亞領先5.1個百分點,而最淺藍的佐治亞州(Georgia)則領先1個百分點。換言之,各個州份(至少圖中的淺藍州份)的民調要整體低估特朗普得票1至5.1個百分點以上,特朗普才可能連任。我們可以參考2016年的數字,以判斷這個落差的範圍是否合理。

每個州的民調與實際結果落差都不一樣,以下我用另一個非常粗疏的計算方法讓大家有個概念。時間有限,我只考慮目前選情較為激烈的州份和上屆的關鍵州份,即上圖從Texas到NH所有州份,但排除了NE2和ME2兩票(主要是因為我懶得找2016年這兩票的民調數字)。

我用到的數字包括︰目前各州的民調差距(特朗普領先為正數,落後則為負數,下同)、2016年最終民調數字差距、2016年實際得票率,並從最後兩項數字計算出有關州份2016年民調與最終得票率的差距,再把這個差距加到現時民調數字當中。

必須再三強調,這種計算方式非常粗疏,並非用作預測,僅為回答「假如今屆民調像上屆一樣犯錯,特朗普有沒有機會勝出」這個問題,完全沒有考慮各州形勢變化(例如人口組成、其他選舉選情)和民調方法的改變。

計算結果如下︰

這表示特朗普在目前民調中落後的州份當中,若加上2016年的落差,只能奪回北卡羅萊納州(North Carolina),共得202選舉人票,未能連任。不過在此情況下,特朗普於佐治亞、佛羅里達及賓夕凡尼亞落後不足1個百分點,假如這三州民調比上屆更為低估特朗普得票,他仍然有機會取得三州的選舉人票,總票數增至267。

然而如果拜登仍然在亞利桑那州(Arizona)勝出,他只要在内布拉斯加(Nebraska)及緬因(Maine)兩州之中多取一張選舉人票(這兩州的選舉人票並非勝者全取,所以上圖中會有NE2和ME2兩區)即告當選。反過來說,假如特朗普多取這兩張選舉人票(等同上屆勝出州份減去亞利桑那、威斯康星和密芝根三州),便能跟拜登打成平手(假設沒有失信選舉人),再交由眾議院決定總統人選(但以州為單位,目前在眾議院佔少數的共和黨佔優)。

至於民調到底有多大落差(甚至是否只低估特朗普的得票),個人認為在沒有更多資料的情況下純屬主觀判斷(雖然還是有合理範圍,例如特朗普獲得過半普選票的機會應該甚微),只想提醒各位不要太過相信自己的臆測,在選舉後要接受現實,按結果修正自己的看法。

後記

今早FiveThirtyEight刊出這篇 Trump Can Still Win, But The Polls Would Have To Be Off By Way More Than In 2016,內容當然詳盡得多,亦有另一組數據的推算(數據來自《紐約時報》),列表如下︰

這個圖表同樣顯示,假如今年民調出現跟2016年相同的落差,特朗普可以在落後的北卡羅萊納勝出,而佛羅里達、佐治亞及賓夕凡尼亞三個關鍵州份差距收窄至1個百分點之內(但差距較我用的數據大)。

另外,以上數據顯示拜登能贏得内布拉斯加一票,即使失去上述三個州的選舉人票,只要守得住亞利桑那(以及其他領先幅度更大的州份),仍然可以270票險勝。

(原刊於Medium