Northeastern University 的研究人員使用 Google Cloud 建立茲卡病毒傳播模型

Northeastern University 的「Modeling of Biological and Socio-technical Systems」(生物與社會技術系統模型,MoBS) 實驗室需要快速建立茲卡病毒模型。透過 GCE 和先占虛擬機器,MoBS 已執行超過 1,000 萬次模擬作業,並大幅縮短了分析資料所需的時間。

2015 年,經由蚊子傳播的茲卡病毒在美洲迅速擴散,致使相關單位頒布旅遊禁令和採取隔離措施,甚至有人呼籲取消 2016 年巴西奧運。隨著世界衛生組織宣布此為國際公共衛生緊急事件,受影響國家/地區的政府也必須設法準確預測新病例的發生率和發生地點。由於只有 20% 的茲卡病毒病例出現症狀,因此是相當難以預測的病毒。

2016 年 1 月,Northeastern University MoBS 實驗室的團隊在傳染病推論與動力學中心的輔助下,開始進行茲卡病毒模型專案,目的是要協助政府當局與研究人員進一步瞭解這種病毒的演化及傳播過程。

「我們希望大數據和強大運算能力,能夠幫上研究人員與公共衛生官員的忙。」

Matteo Chinazzi, 副研究員, Northeastern University

Google Cloud:提供必要的預測工具、分析工具和其他功能

這支團隊使用 Google Cloud (Google Cloud) 的技術,透過數學和運算方法研究可能會讓茲卡病毒傳播的各種情況,並預測茲卡病毒對受感染群體的影響。這個模型是根據茲卡病毒最初在巴西的傳播情形製作而成,而巴西正是 2015 年疫情爆發之處。藉由導入溫度、蚊子數量、群體大小和人們的移動模式等額外資料層,研究人員現在能夠預測其他地點中新感染案例的影響。

Google Cloud 讓團隊能夠同時執行多項模擬作業,以及分析由模擬情境產生的數 TB 資料。Northeastern University (東北大學) 副研究員 Matteo Chinazzi 表示:「我們使用多項 Google Cloud 產品。Google Cloud Storage 是用於儲存我們所有模型資料及代管我們的網站。Google Compute Engine (GCE) 和先占虛擬機器則用於模擬疾病的傳播情形。另外還有 Google BigQuery 是用來檢視模擬情境,每個情境都牽涉到日期和感染人數等變數。目前為止,我們已處理共數百 TB 的大量資料。這些資料全都儲存在 Google Cloud Storage 中。」

取得相關結果,以便大規模地快速採取行動

透過 GCE 和先占虛擬機器,MoBS 已執行超過 1,000 萬次模擬作業。GCE 和 BigQuery 大幅縮短了執行模擬作業和分析資料所需的時間。這兩項程序現在只需幾小時便可完成,而不必耗費數週的時間。Matteo Chinazzi 表示:「我們可以靈活調度資源,向上擴充至數千個獨立的平行虛擬執行個體,因此能夠在一天內針對單一疾病的疫情產生完整分析結果,過程中可能會進行多達 25 萬次的獨立模擬作業。」

除了讓研究人員瞭解茲卡病毒的傳播過程之外,這個模型可能會成為分析其他傳染病 (如登革熱) 的範本。雖然茲卡病毒已不再是世界衛生組織所宣布的國際緊急事件,但是在預防蚊媒傳染病爆發方面仍有待努力之處。藉由使用大數據和無窮的強大運算能力,MoBS 的團隊希望協助研究人員與公共衛生官員達成這個目標。

Matteo Chinazzi 說:「在疫情爆發時,時間相當寶貴,而 Google Cloud 提供的工具讓我們得以大規模快速採取行動。」

如要進一步瞭解 Northeastern University MoBS 實驗室的茲卡病毒研究與分析成果,請參閱由《美國國家科學院院刊》所刊登的「Spread of Zika virus in the Americas」(茲卡病毒在美國的擴散情形)。

「我們可以靈活調度資源,向上擴充至數千個獨立的平行虛擬執行個體,因此能夠在一天內針對單一疾病的疫情產生完整分析結果,過程中可能會進行多達 25 萬次的獨立模擬作業。」

Matteo Chinazzi, 副研究員, Northeastern University