我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

邁阿密班機對空服員伸鹹豬手 他遭膠帶五花大綁

東奧/美國棒球2轟擺平多明尼加 再1勝就有金牌戰

對抗新冠華人英雄/顧悠揚 設計預測疫情最準模型

顧悠揚說,中國傳統文化幫助他取得了今天的成就。(顧悠揚提供)
顧悠揚說,中國傳統文化幫助他取得了今天的成就。(顧悠揚提供)

2021年2月19日,彭博新聞社(Bloomberg)發表一篇長篇報導,題為《成為新冠數據超級巨星的27歲年輕人》。報導稱,在關於誰能做出最準確的冠狀病毒預測的競賽中,全球預測機構對陣一個與父母住在加州聖他克拉拉(Santa Clara)的人。這個人就是顧悠揚,一位七歲隨著父母從上海移民美國華裔青年。

顧悠揚在在紀念美國亞裔月(AAPI)的推特群裡發帖說,「我很自豪在過去一年中代表華裔美國人」。他說,儘管許多華裔做了很多了不起的工作,但在有關新冠疫情的主流新聞中,出現的傑出華裔並不多。「我希望我的工作可以幫助彌合這一差距。」

顧悠揚使用新冠死亡人數作為預測模型中的一個變量。(美聯社)
顧悠揚使用新冠死亡人數作為預測模型中的一個變量。(美聯社)

看到預測離譜 決定出手

顧悠揚接受本報記者採訪時說,2020年4月,新冠疫情在美國爆發,當時美國處於封鎖狀態,存在很多不確定性。許多著名學術機構的模型有不同的預測:總部設在西雅圖的健康指標與評估研究所(IHME)預測到2020年8月將有8萬人死亡,而倫敦的帝國學院(Imperial College)預測將有超過200萬人死亡。

擁有麻省理工學院(MIT)電氣工程和電腦科學碩士學位的顧悠揚說,他和其人一樣感到焦慮。剛好當時有一些空閒時間,所以決定利用在統計建模、機器學習方面的背景來構建「更好」的模型。他認為,他處理數據模型的背景在疫情期間可能會有用。

4月中旬,他花了一周時間構建了自己的新冠死亡預測器和一個網站,來顯示疫情資訊。他首先檢查新冠病毒檢測、住院和其他因素之間的關係,但發現各州和聯邦政府報告的數據不一致;最可靠的數字似乎是每日死亡人數。他說,其他模型使用了更多的數據源,但他依靠過去的死亡人數來預測未來的死亡人數。「這樣有助於從噪聲中過濾信號。」

他的預測模型在某些方面很簡單。他將他的預測與最終報告的死亡總數進行比較,並不斷調整他的機器學習軟件,以便進行更精確的預測。這項工作需要全心投入,因此無法做其他的事,他僅靠積蓄過活。「我的數據沒有任何利益衝突或政治偏見。」

預測開始後,他給很多記者發了電子郵件,告知他的預測結果,但沒有人理他。他說,當時一個主要困難是,「因為我沒有傳染病方面的背景,讓人們關注我的模型很難」。他說,他不會責怪人們在早期質疑他的模型。「畢竟,我是一名傳染病經驗為零的數據科學家。」

預測模型可以幫助政府作出正確決策。(美聯社)
預測模型可以幫助政府作出正確決策。(美聯社)

準確結果 震驚預測學界

但他的預測準確結果,震驚學界。顧悠揚說,不久,他的模型開始產生比擁有數億資金和數十年經驗的機構製作的模型「預測得更準確」。4月底,華盛頓大學生物學者伯格斯特羅(Carl Bergstrom)在推特上介紹了他的模型,接著美國疾病防治中心(CDC)在其新冠預測網站上引入了他的數據。

從那時起,他的模型獲得了人們的關注。他的網站的訪問量激增,每天有數百萬人查看他們所在州和整個美國的情況。經常是,他的預測數字在幾周後最終與實際死亡數字相近。雖然總是會有懷疑者、批評者,但他的模型的持續準確性很難被駁倒。

例如,他4月下旬預測到5月9日美國將有8萬人死亡,而實際死亡人數為7萬9926,預測數字和實際數字幾乎一樣;而IHME於4月下旬預測,美國到2020年全年的死亡人數不會超過8萬人。他還預測到,美國5月18日死亡人數為9萬人,5月27日死亡人數為10萬人,並再次證實他的預測正確。

2020年春季和夏季,更多模型出現。麻州大學(University of Massachusetts, Amherst)生物統計和流行病學系副教授瑞奇(Nicholas Reich)收集了50個左右的模型,並測量了它們對新冠疫情預測的準確性,他得出結論:「顧悠揚的模型一直名列前茅。」

當年11月,顧悠揚決定停止他的死亡預測。在停止該項目的一個月前,他又預測到,美國將在11月1日有23萬1000人死亡。實際上,11月1日美國報告死亡人數為23萬995人。「預測數字和實際數字只相差五人。」

顧悠揚被主流媒體稱為新冠數據超級巨星。(顧悠揚提供)
顧悠揚被主流媒體稱為新冠數據超級巨星。(顧悠揚提供)

他還準確預測美國將有第二波的新冠疫情,「與許多專家的預測相反」。他說,由於他沒有流行病學的背景,因此只有多聽取專家的意見並向他們學習。「我花了很多時間閱讀研究論文。」在2020年4月,所有專家都警告說,如果各州過早重新開放,將會出現另一波浪潮。「直覺上,這也是有道理的。」

精準預測 實用意義重大

預測準確究竟對控制疫情有無幫助?世界上最大的電氣和電子工程師協會(IEEE)網站2020年9月22日發文說明了這個問題。文章的題目是《為何對新冠病毒傳播的建模如此困難》。文章指出,太多的新冠疫情模型使政策制定者「誤入歧途」。

從2020年初開始,預測圖表描繪了通過社交網路傳播的預期感染數量。現在,大家都已成為流行病學模型的消費者。模型已經存在了幾十年,但從未像今天受到如此關注。「他們為公共政策、財務規畫、醫療保健分配和推特熱門話題提供資訊。」

文章說,模型要解決許多重要問題。例如,未經控制的爆發是否會殺死數百萬人?哪些干預措施最有幫助?我們對預測有多大把握?2020年第一季度,政府領導人分析這些計算推測,就是否關閉學校、企業和旅行做出重大決定。

健康指標和評估研究所(IHME)在流行初期就採用了一種曲線擬合模型(curve-fitting model)。它通過中國、義大利和西班牙的預測醫院使用高峰曲線,假設美國的曲線與這些國家的曲線相似。3月下旬,美國累計死亡人數只有幾千人,但預測未來4周內死亡人數將上升至約5萬人。當年4月,政策制定者和媒體都非常關注IHME模型。白宮冠狀病毒應對協調員博克斯(Deborah Birx)博士及其團隊幾乎每天都與IHME小組交談;但美國曲線並沒有像IHME模型預期的那樣「迅速變平」。

例如,在4月中旬,它預測5月中旬死亡人數將達到6萬人,而實際數字卻在8萬人左右。顧悠揚說,在3月底、4月初,媒體中最常引用的IHME模型顯示「到6月,死亡人數將為零」。他查看數據看不出有這個可能,所以想自己動手。到5月9日,當美國的死亡人數幾乎完全符合他預測的8萬人時,醫生和公共衛生領導人托波爾(Eric Topol)稱讚他的模型是「最準確的新冠預測模型」。

他說,他的成功與中華文化有關。「中國關於教育、努力工作的文化幫助我取得了今天的成就。」目前,他已經從加州搬至紐約。他說,他來自上海,因此比較喜歡大城市。「在美國,沒有比紐約更好的大城市了。」他說,亞洲文化也偏愛從眾而不是個人主義,在這個特殊情況下這對他不利。例如,由於沒有證書,也沒有博士學位,這在亞洲文化來說是不理想的。「我必須克服很多障礙,才能證明沒有經驗也能有所作為。」

美國 疫情 華裔

上一則

對抗新冠華人英雄/王年爽 創S-2P技術為疫苗鋪路

下一則

對抗新冠華人英雄/蔡秉燚 發明N95口罩過濾材料

超人氣

更多 >