23 min read

《華爾街日報》的事實查核爭議

「書生」彭捷引用的《華爾街日報》文章曲解事實查核。
《華爾街日報》的事實查核爭議
《Miss Sloane》截圖

早前事實查核實驗室(Factcheck Lab)有幸成為「書生百用」的「反思對象」,「書生」以〈為什麼書生質疑「FactCheck 媒體」的存在?〉為題撰文(更新︰現已刪文,截圖見文末),配圖放上Factcheck Lab的標誌,也有Facebook專頁「真聞」、「Truth HK」以及香港最早出現也是最多人看的「求驗傳媒」。

身為Factcheck Lab執行編輯,本人可以確認Factcheck Lab的存在,但如果他質疑我的存在,那我就無能為力了。

當然,我們不應該只看標題。從內文判斷,我猜他的意思是事實查核機構(文中稱為「FC媒體」)實際操作上產生很多問題,以致不應該或不需要存在。由於我沒有訂閱他的Patreon未能讀到全文,無法拜讀他提出的「六大理由及兩宗香港真實案例」(Facebook帖文僅公開了第一點「『事實(查核)』沒有權威」),本人也無法評論太多。

以僅有的公開內容看來,有些論點我也同意,例如一些複雜的訊息難以查核、事實陳述與觀點/意見中間有難以區分的情況等,這些都是事實查核的限制。我不認為單靠事實查核可以解決失實訊息流傳的問題(當然問題是否需要/如何才算「解決」本身也值得討論),一大原因在於事實查核本身有大量限制,然而這並不代表事實查核機構需要消失,相反整個資訊生態需要更多配套及不同類型的角色對應此問題。最近在讀一些相關書籍,有機會我再分享這方面的看法。

另外,他這篇文章似乎也被引用作否定事實查核,例如我在《傳真社》的事實查核專頁FactWire Fact Check一則關於復必泰疫苗的帖文見到這個留言︰

FactWire Fact Check帖文留言截圖

「書生」似乎沒有叫大家不作任何事實查核,他自己也在留言表示「其實書生認同 FACTCHECK的價值」,所以應不算雙重標準。(順帶一提,我建議大家認真去看那則帖文和大量指控《傳真社》的留言,相信會明白事實查核的重要和限制。)

以下我主要想討論「書生」在該帖文的兩個留言,以及他引用那篇《華爾街日報》反駁事實查核的文章。

自稱事實查核有問題?

「書生百用」的帖文下有讀者表示「Truth HK」和「真聞」是「藍媒」(在香港指親建制派的媒體)而非真正的事實查核機構,「書生」同意,又指「但這正是(自稱)fc媒體可能具有問題之一,它會引起fc話語權的爭奪戰」。

「書生百用」帖文留言截圖

問題是,有甚麼用字不會引起這類「話語權的爭奪戰」?就連「新聞」也會帶來變成武器的「假新聞」一詞,假新聞網站也會自稱新聞網站,那就不要叫自己做新聞媒體嗎?「書生」也自稱「新聞工作者」(沒記錯的話以往叫「傳媒人」),為甚麼就不引起「新聞話語權的爭奪戰」?

「書生百用」自我定位為「作家」及「新聞工作者」

這也涉及該篇文章一個重點——事實以及事實查核的權威問題。事實查核機構固然沒有法定權力(也不應該有),所謂「權威」其實都是來自公信力,我甚至認為事實查核機構不太需要權威,重點在於查核方法。在香港,一項常見對事實查核的質疑就是「邊個fact-check你哋個fact-check/誰去查核你們的事實查核」,答案很簡單,就是讀者。沒人可斷言自己不會犯錯,甚至不同的事實查核機構也可能對同一個宣稱有不同判斷,但清楚列出資料來源、詳細解釋有關宣稱的背景脈絡,比起直接下一個「正確/錯誤」的「裁決」重要。

況且我認為不應把讀者想得太過愚蠢,事實查核機構的水平如何,我相信整體而言讀者會懂得判斷,不會見到「事實查核」就全盤相信。

大家會自行判斷,就不用事實查核?

「書生百用」的帖文下有留言問其想法會否過於犬儒,「書生」的回應卻是「正如大家自行判斷內容是否合理,但係就唔駛FC機構為我地各自判斷做裁定,岩唔岩先?」

「書生百用」帖文留言截圖

如果套用相同思路,其實這個社會也不需要KOL和評論人,反正大家會自行判斷,何須評論分析?而且這種「大家會自行判斷內容是否合理」的想法,似乎忽略了有人會利用失實資訊、陰謀論等各種策略操縱人們如何接收訊息,背後往往有不少資源推動。當然我不是要提倡家長主義式的回應,叫大家相信事實查核機構就好,但事實查核的用途並非代人判斷,而是提供更多資訊,也為大家省點時間。

舉個例子,最近有影片宣稱烏克蘭總統澤連斯基(Volodymyr Zelenskyy)探訪醫院的片段造假,如果單看影片就「自行判斷內容是否合理」,結果很可能只是判斷「影片與我的立場是否相符」。要真正判斷內容是否真實,需要進一步查核影片宣稱背後有何根據,得花費不少工夫和時間,而我不認為所有人看所有網絡資訊時都要把時間花在查核上,所以希望本人的工作能為大家省點時間。與此同時,我也不會自大得認為事實查核就是不容質疑的真理,要是不同意,讀者仍然可檢視完整的查核過程和資料來源。

《華爾街日報》查核了甚麼?

「書生」在文中指《華爾街日報》「 factcheck 了 facebook 的 factcheck 有問題」,內文他稱為「編輯評論」,在留言則指是「報導」︰

「書生百用」帖文留言截圖

《華爾街日報》會嚴格區分新聞及評論,甚至有一個網頁解釋其分別,其網站上就標明了這篇〈Fact-Checking Facebook’s Fact Checkers〉屬於編委會(Editorial board)的意見。

當然,嚴謹的評論須建基於事實,所以我也探討一下有關爭議。

群體免疫的預測

事緣《華爾街日報》2021年2月18日刊登了Johns Hopkins大學醫學院及公共衛生學院教授Marty Makary的文章,宣稱同年4月美國會達至群體免疫(標題為〈We’ll Have Herd Immunity by April〉),而這篇文章被事實查核機構Health Feedback判定為誤導。由於Health Feedback參與了Facebook第三方事實查核計畫,所以有關的Facebook帖文會顯示「缺少背景資料」(missing context)的訊息,點選「查看原因」可以見到Health Feedback(屬於Science Feedback,所以下圖顯示為Science Feedback)的文章連結︰

《華爾街日報》Facebook帖文截圖

《華爾街日報》的編委會對此非常不滿,所以寫了上面那篇評論。《華爾街日報》認為Makary在文中並未提出事實陳述,而是基於研究及其他證據預測美國在當年4月會達至群體免疫,並質疑進步派不喜歡這個預測而否定其說法,又認為該篇事實查核選擇性使用證據(cherry pick),因此提出反駁。

因為下文有點長,先在此寫個tl;dr︰

  • 《華爾街日報》的回應文章曲解了Health Feedback的質疑,混淆「沒有數據支持」和「錯誤」;
  • 當Makary推算所用的比率被批評沒有根據時,《華爾街日報》編輯只能拿出一個不太相干的研究回應,然後重複一次Makary的說法,未有補充任何證據;
  • 本人義務幫他們找回有關比率的來源,發現他們仍然錯誤;
  • 《華爾街日報》編輯選了符合他們的感染死亡率推算數字,但一個僅為多個地區的中位數,另一個是巴西城市的數字,卻未有考慮年齡分佈;同時隻字不提Health Feedback訪問專家引用的研究(該模型有考慮年齡分佈);
  • Makary引用一篇文章宣稱巴西城市感染率高達76%後傳播速度減慢,但該篇文章實際上探討其後出現大量住院個案的可能原因;《華爾街日報》編輯以此為由認為未有定論,迴避個案大幅回升已顯示Makary錯誤的事實。

《華爾街日報》文章宣稱美國20年4月有群體免疫

誠然,意見和預測不是事實陳述,無法查核。不過我們可以檢視提出意見或預測所根據的證據,再判斷是否合理(除非預測者是「印度神童」之類)。Makary當時會達至群體免疫的理由為︰

  • 確診個案在(文章發表前)過去6星期下降了77%;
  • 美國已有大量人口感染,估算實際上有高達三分之二人感染;
  • 前FDA局長Scott Gottlieb預測當年3月底時會有1.5億人已接種(約45%人口);
  • 關於巴西城市Manaus的記錄顯示,當感染率高達76%時,病毒傳播速度顯著減慢。

而Makary在文中用了兩個方法去估算美國整體的感染比率︰

  • 他認為檢測只能找出10%至25%感染個案,假設數字為1/6.5(約15.4%),以當時累積2,800萬宗確診個案推算,美國已有55%人感染;
  • 以死亡數字推算,美國約有600分之一的人死於COVID-19,佔全體人口約0.15%,而COVID-19的感染死亡率為0.23%,由此推算美國當時約有三分之二人感染(文中沒有解釋如何計算,補充如下︰全國人口×0.15%=COVID-19死亡個案數字=全國感染人口×0.23%,由此可推算全國感染比率=全國感染人口÷全國人口=0.15%÷0.23%=65.2%)。

他亦在文中提倡曾感染COVID-19者先不要接種疫苗,留待所有長者接種完疫苗復才開始接種,其原因是康復者會帶有抗體,再感染機會輕微,但他亦提到其醫學界朋友對此想法也是一半支持一半有保留。

Makary認為自當年1月8日起每日確診數字迅速穩定下跌,唯一合理解釋是感染者獲得自然免疫力。他表示基於數據、研究、與專家對話以及觀察到窮人難以獲得檢測(因此確診個案遠低於真實感染個案),預測COVID-19在2021年4月大致消失(mostly gone by April)。

查核指出的問題

Health Feedback的事實查核報告引述加州大學Santa Cruz分校專研疾病生態學的Marm Kilpatrick教授,指出Makary可能高估了美國當時的感染比率︰

  • Kilpatrick表示,由於缺乏具代表性的調查,「檢測只能找出10%至25%感染個案」的說法並無數據支持
  • Makary採用1/6.5這個比率估算美國已有55%人感染,但若以他提到的上限1/4(即25%)去估算,感染比率會降至34%,而如果檢測找出感染個案比率更高,估算的數字會再降低;
  • Makary宣稱COVID-19的感染死亡率為0.23%(未有提及數字來源),Kilpatrick引用在《Nature》刊登的一項研究表示,當時最可靠的數據顯示美國的感染死亡率為0.6%,套用Makary的推算方法,美國當時應有25%人已感染COVID-19,遠低於他估計的65%

除此而外,Health Feedback亦指出Makary文章的其他問題,但我就不逐一複述了,僅多提另一個錯誤。該篇查核報告引述哈佛大學流行病學副教授William Hanage指出,Makary以巴西城市Manaus作為群體免疫的例子不準確而且誤導

雖然有報告推算Manaus的感染率曾高達76%,但並未如Makary文章所言般感染速度顯著減慢。Hanage的回覆附上《Science》介紹該期刊一篇研究論文評論,指出雖然估計2020年10月時Manaus的感染率高達76%,仍然無法達至群體免疫;而《BMJ》的報導亦提到,2021年初當地出現第二波疫情,超出醫院負荷(兩篇文章均在Makary發表前刊登)。

有趣的是Makary在《華爾街日報》的文章提及Manaus時連結了《The Lacent》一篇文章,然而該文正是分析為何Manaus出現新一波疫情,而非宣稱當地已達至群體免疫

我們也不妨事後孔明去檢視Makary的預測︰美國到了2021年4月時還未有群體免疫,雖然確診數字從當年1月的高位回落,但直到4月30日每10萬人7天確診個案數字仍為105,傳播率仍屬於CDC標準四個等級之中的最高級別。當然,預測錯誤不代表文章有問題,但Makary的文章確實有誤導和證據不足等情況。

《華爾街日報》的回應是否成立?

「書生」所引用的《華爾街日報》文章,正是《華爾街日報》就此事實查核的回應。接下來我只簡述《華爾街日報》針對上述幾個問題的回應。為方便起見,容我直接引用《華爾街日報》原文︰

Another fact checker says Dr. Makary incorrectly extrapolated the share of Americans who have probably been infected. We will never know this number with certainty because most people with no or mild enough symptoms don’t get tested. Antibody surveys can help extrapolate infections, but antibodies wane over time and more quickly in mild and asymptomatic cases. So they may underestimate infections.

A study in the journal Clinical Infectious Diseases found that 2% of American blood donors had antibodies in mid-December 2019. Early in the spring, testing was only picking up one in 11 cases. The ratio fell by the fall to around 1 in 4 as testing expanded. Dr. Makary applied what he called a “time-weighted case capture average of 1 in 6.5.”

此處第一句已曲解了Health Feedback的文章,Kilpatrick(注意他是受訪的專家,不算事實查核員)回應的用字是 “is not supported by available data” 而非 “incorrectly extrapolated”,他僅質疑這個說法沒有數據支持(Makary的確沒有提供任何資料來源)。

第二段首句提到的研究,應該來自一篇顯示美國在2020年1月19日出現首宗確診個案前已有感染個案的論文。該研究分析2019年12月13至16日收集的血液樣本中,確實有2%呈陽性反應。不過,接下來兩句——宣稱2020年春天檢測只找到1/11感染個案、比率在該年秋天降至1/4——根本與該研究無關

換言之,這段反駁根本未能回應對「檢測只找到10%至25%個案」此說法無數據支持的質疑,只是引了另一個研究然後把Makary的說法重複一次(而且數字更由1/10變成1/11),沒有補充任何資料來源。如果我負責編輯Makary的文章,相信在登刊之前會問清楚這個數字的來源,即使最後沒有刊出,回應別人的事實查核時為何不拿證據出來?可《華爾街日報》的編輯就是沒有,不知是太厚道抑或根本沒問清楚。

我唯有做點義工,最終在Google輸入 “estimate infection per confirmed case united states” 發現答案,找到《NPR》一篇報導,內文介紹哥倫比亞大學教授Jeffrey Shaman關於美國實際感染數字的數學模型。報導提到Shaman的模型顯示疫情最早期檢測只能找到1/10的個案,比率逐步升至2021年1月的1/4,數字正好與Makary的說法吻合。

不過,Makary「按時間加權」推算感染數字為確診數字的6.5倍仍然沒有根據,因為按照Shaman同一個模型推算,截至2021年1月31日美國共有1.2億人已感染COVID-19,即佔全國人口約36%。換言之,如果Makary的數據來自Shaman的模型,他就不能自行「按時間加權」計算另一個比例出來,再推算感染比率高達55%。

按下來《華爾街日報》的編輯質疑︰

A disease ecologist at the University of California Santa Cruz says he should have used 1 in 4, which would have extrapolated a lower estimate of infections. This is an arbitrary number and would underestimate the number of infections during the spring.

Kilpatrick的回應之所以用1/4去推算,純粹因為Makary提到10%至25%(後者即1/4)這組數字,所以用其數字推算顯示誤差可以很大,感染比率不一定高達55%,而Makary根本沒有為其計算方式和所用的數字提供證據支持。

然後《華爾街日報》編輯反駁Kilpatrick指感染死亡率為0.6%的說法︰

She also claims the 0.23% “infection fatality rate” that Dr. Makary cites is wrong and says it is around 0.6%.

Infection fatality rates (IFR) are based on models and vary by population demographics and the degree to which societies protect the elderly. Stanford epidemiologist John Ioannidis found the median IFR estimate across 51 locations worldwide was 0.27%, but many estimates were from the spring when there were few treatments. The infection fatality rate has since likely fallen.

A recent study in the journal Science estimated an infection fatality rate of roughly 0.23% in Manaus, Brazil.

Makary宣稱死亡率為0.23%時並無提供任何資料來源,但Kilpatrick有明確引用研究,在《華爾街日報》的文章中該研究完全消失。《華爾街日報》編輯指一項就全球51個地方的感染死亡率的推算的中位數為0.27%,再引用一項《Science》關於Manaus的研究指感染死亡率約為0.23%。

上文提及來自《Science》關於Manaus的研究提到聖保羅的感染死亡率要高得多,主要跟年齡分佈有關。《華爾街日報》的編輯似乎沒考慮這一點,直接把巴西一個城市的數字套用在美國去為Makary辯護,而Kilpatrick引用的研究有按照年齡分佈去推算感染死亡率,《華爾街日報》卻隻字不提。

我有點懷疑《華爾街日報》編輯是不是看到有研究的數字符合他們需要,便引用來宣稱「科學家有不同看法」,忽略研究限制。《華爾街日報》編輯還好意思反過來批評Health Feedback選擇性引用證據,明明是Makary本身沒有提供證據,Health Feedback訪問的專家進一步引用可靠的研究,說明他高估數字——至少有其他合理估算明顯較低——但他們沒有指那是唯一真理。

最後容我多引幾段《華爾街日報》關於Manaus的回應,令人大開眼界︰

Speaking of which, a Harvard epidemiologist takes issue with Dr. Makary’s citing Manaus as an example of “herd immunity.” Epidemiologists estimated 52.5% of Manaus had been infected by June at the same time hospitalizations plunged and stayed low for seven months despite relaxed government restrictions.

The Washington Post in August pointed to Manaus as a possible real-world example of herd immunity. Yet hospitalizations inexplicably shot up in December. A recent Lancet paper offers several hypothesis for this surge, including new virus variants that evade antibodies and flawed models. These hypotheses deserve to be investigated.

Yet Facebook’s Harvard epidemiologist concludes Manaus should “be more than enough to demonstrate the dangers of trusting to ‘herd immunity’ from infection for protection.” It’s always a red flag when a scientist proclaims that a single piece of ambiguous evidence is enough to demonstrate anything. These Facebook fact checkers aren’t acting like scientists.

Manaus在高感染率的情況下出現大量住院個案一事,本來是用來反駁Makary以Manaus作例子宣稱「群體免疫」有效,但《華爾街日報》編輯卻反過來以《The Lancet》文章提出數個假說解釋這現象,認為Hanage過份肯定,批評他不是科學家。而且Hanage是Health Feedback訪問的專家,《華爾街日報》故意以 “Facebook’s Harvard epidemiologist” 稱之,既不準確亦有引導讀者之嫌

明明是Makary宣稱Manaus有高感染率後病毒傳播減慢,但他自己引用的文章已經與其說法矛盾,《華爾街日報》完全無視這一點,認為有待解釋 — — 任何解釋都與Makary的說法錯誤無關 — — 就代表未有定論,以「科學家可以就如何詮釋證據有不同意見」為由,避開回應Makary的錯誤,根本就是詭辯

小結

《華爾街日報》那篇文章還有其他問題,我就不在此悉數指出了。如此詳細解說主要是示範事實查核往往須花費大量時間搜尋來源、釐清細節,而非只看「正確/錯誤」、「事實/虛假」的裁決。

老實說,《華爾街日報》編輯這次爭議中處理科學議題的態度不太專業,像我這種非科班出身的人也能看到其問題。「書生」引用這篇水平不高的文章而不說明來龍去脈實乃「劣質的開始」(已刪文,截圖見文末),要麼沒仔細看,要麼不負責任。

也許以上說話不中聽,但既然自稱「書生」向來以「深度」作賣點,期許自然高一點。

後記

近日發現「書生百用」兩篇「反思媒體」的帖文已經刪除,下面補回截圖。本文刊出後一日,「書生百用」貼了一篇《風傳媒》的文章,內文引用Glenn Greenwald對事實查核的質疑,亦加插一些評論︰

「書生百用」帖文截圖

首先,我自己就未能從那些事實查核報告(及文章)看到有任何嘲笑意味,當然可以質疑宣稱錯誤是否過於武斷,但跟否定所有事實查核機構是兩回事。若只查核有關帖文和宣稱,忽略俄國早就有類似質疑卻未能提供證據(注意舉證責任),其實也不夠全面。我絕對同意事實查核重點不應在於只貼標籤(否則的話本人工作會簡單得多),更需要提供更全面的資訊和脈絡。

不過「書生」那些文章還是未能解決最大的問題︰為何只針對事實查核?任何新聞報導、文章標題都無可避免有簡化的情況,也會有權威與否之分(不等於要人無條件信任權威),要不要全盤禁止?早有立場的讀者看了新聞報導、KOL的評論文章,同樣會鞏固既有信念,可這要怪誰?

而且在引用Glenn Greenwald之前,不如檢查一下他自己對待事實查核機構/媒體的立場?這就像引用《華爾街日報》的評論而忽略他們對待科學的態度一樣,專業的事實查核員不會犯這種錯誤。(當然還是可以引用他們,但需要小心處理。)不然的話,就會像葉劉淑儀引用Tucker Carlson宣稱「霍士新聞踢爆美謊言」一樣了。

最後,留意AFP的查核報告使用「未經證實」,不過事實查核機構有時使用的「沒有證據」又會被「書生」拿來諷刺,真難服侍。

附錄︰文章截圖

(原刊於Medium,原文的「後後記」見