疫情地圖走紅后——
揭秘約翰斯·霍普金斯大學(xué)
作者:本報(bào)記者 鄧暉
隨著新冠病毒在全球范圍蔓延,透明、真實(shí)的疫情數(shù)據(jù)備受關(guān)注。一段時(shí)間以來,在眾多實(shí)時(shí)可視化數(shù)據(jù)發(fā)布平臺(tái)中,約翰斯·霍普金斯大學(xué)的疫情數(shù)據(jù)頻頻出現(xiàn)在包括美國(guó)本土在內(nèi)的多國(guó)媒體、機(jī)構(gòu)的報(bào)道和分析中。
相關(guān)數(shù)據(jù)顯示,從該疫情數(shù)據(jù)1月22日上線以來,每日平均使用量從1月底的2億次,在3月初上升到每日12億次,高峰時(shí)每日近20億次。
統(tǒng)計(jì)數(shù)據(jù)的機(jī)構(gòu)和網(wǎng)站如此之多,為何約翰斯·霍普金斯的數(shù)據(jù)更受青睞?這是一所什么樣的學(xué)校?在科研、教學(xué)等方面有什么特色?它和中國(guó)大學(xué)又有哪些合作?
火爆的疫情地圖背后:
權(quán)威的大學(xué)研究實(shí)力在“背書”
作為約翰斯·霍普金斯大學(xué)疫情可視化數(shù)據(jù)圖的核心開發(fā)成員,過去很長(zhǎng)一段時(shí)間,約翰斯·霍普金斯大學(xué)土木與系統(tǒng)工程學(xué)院博士一年級(jí)學(xué)生杜鴻儒一直在“連軸轉(zhuǎn)”。他告訴記者,這一疫情可視化數(shù)據(jù)圖由他的導(dǎo)師、該校系統(tǒng)科學(xué)與工程研究中心的勞倫·加德納(Lauren Gardner)副教授倡議開發(fā),最初的核心成員只有他和另外一位中國(guó)學(xué)生董恩盛。
“最開始,這一系統(tǒng)叫作‘約翰斯·霍普金斯大學(xué)系統(tǒng)科學(xué)與工程研究中心疫情可視化數(shù)據(jù)圖’。”杜鴻儒介紹,在今年1月份,新冠肺炎疫情還未在全世界范圍流行起來時(shí),董恩盛就與導(dǎo)師達(dá)成一致意見,要做一個(gè)疫情數(shù)據(jù)地圖,并于1月22日完成并上線了最早一版。最早數(shù)據(jù)的收集完全靠手動(dòng)整理,每天最多更新4-5次,但隨著疫情發(fā)展,這樣的工作模式難以持續(xù),2月1日,杜鴻儒開始加入。進(jìn)入3月以后,數(shù)據(jù)已經(jīng)可以實(shí)現(xiàn)每20分鐘自動(dòng)更新一次,并且加入了人工審核,保證數(shù)據(jù)準(zhǔn)確性。
杜鴻儒告訴記者,他的工作主要分為兩個(gè)階段:“在手動(dòng)收集的階段主要負(fù)責(zé)數(shù)據(jù)收集整理以及美國(guó)數(shù)據(jù)的更新;進(jìn)入自動(dòng)更新階段后,我主要負(fù)責(zé)編寫自動(dòng)更新的代碼,同時(shí)負(fù)責(zé)維護(hù)Github數(shù)據(jù)庫(kù),通過對(duì)比WHO的數(shù)據(jù),驗(yàn)證數(shù)據(jù)的準(zhǔn)確性。”此外,為了不斷完善可視化效果,研發(fā)團(tuán)隊(duì)還對(duì)數(shù)據(jù)地圖進(jìn)行了多次改版。
記者注意到,約翰斯·霍普金斯大學(xué)的疫情數(shù)據(jù)地圖并不是“獨(dú)此一家”。隨著疫情在全球蔓延,哈佛大學(xué)與牛津大學(xué)合作、美國(guó)CDC官方以及《紐約時(shí)報(bào)》、CNN等媒體都構(gòu)建了自己的數(shù)據(jù)發(fā)布體系。“對(duì)手”眾多,約翰斯·霍普金斯大學(xué)的數(shù)據(jù)為何吸引到如此多的關(guān)注?采訪中,多位專家告訴記者,美國(guó)是聯(lián)邦制國(guó)家,各州可以根據(jù)自身情況制定不同的防疫措施,所以CDC地圖的更新速度和精度都很有限。而約翰斯·霍普金斯大學(xué)疫情數(shù)據(jù)地圖走紅的背后,既有著“最早啟動(dòng)”等偶然性因素,也跟約翰斯·霍普金斯大學(xué)本身在醫(yī)學(xué)和公共衛(wèi)生領(lǐng)域的權(quán)威性相關(guān)。
“約翰斯·霍普金斯大學(xué)疫情數(shù)據(jù)圖的‘走紅’主要是兩方面原因,一是他們及時(shí)搜集整理了來自中國(guó)網(wǎng)站丁香園、美國(guó)和歐洲疾控中心等的疫情數(shù)據(jù),數(shù)據(jù)覆蓋全球,更新及時(shí),完整性和時(shí)效性甚至超過了WHO網(wǎng)站;二是約翰斯·霍普金斯大學(xué)在醫(yī)學(xué)和公共衛(wèi)生方面的研究歷史悠久,實(shí)力雄厚,公眾更加愿意相信它作為學(xué)術(shù)機(jī)構(gòu)的權(quán)威性和獨(dú)立性。這個(gè)數(shù)據(jù)系統(tǒng)的開發(fā)只是一項(xiàng)很具體的工作,社會(huì)效應(yīng)是主要的,學(xué)術(shù)價(jià)值是次要的?;羝战鹚勾髮W(xué)的研究實(shí)力是他們?cè)谝咔槲<睍r(shí)刻得到公眾和媒體認(rèn)可的主要原因。”清華大學(xué)醫(yī)學(xué)院教授洪波告訴記者。
除此之外,清華大學(xué)醫(yī)院管理研究院副院長(zhǎng)薛鐳認(rèn)為,與其他數(shù)據(jù)發(fā)布平臺(tái)相比,約翰斯·霍普金斯大學(xué)疫情可視化數(shù)據(jù)發(fā)布的界面易于導(dǎo)航和閱讀,同時(shí)更新最頻繁,在系統(tǒng)升級(jí)后可以自動(dòng)抓取數(shù)據(jù),即時(shí)性較高。“在這個(gè)過程中,值得點(diǎn)贊的是約翰斯·霍普金斯大學(xué)極強(qiáng)的學(xué)術(shù)敏感性,校方在發(fā)現(xiàn)這個(gè)疫情數(shù)據(jù)地圖‘火’了之后,迅速給予了相關(guān)團(tuán)隊(duì)強(qiáng)有力的支持,保證了這項(xiàng)工作的可持續(xù)性和專業(yè)性。”薛鐳說。
但在更新過程中,這一疫情數(shù)據(jù)地圖也曾經(jīng)出現(xiàn)過大的失誤,比如北京時(shí)間4月14日上午8時(shí)曾誤報(bào)“全球確診病例200萬”。
“因?yàn)槲覀冏龅氖侨蛞咔榈貓D,但每個(gè)國(guó)家的播報(bào)標(biāo)準(zhǔn)一直在變,比如西班牙會(huì)突然引入疑似病例,但我們因?yàn)檎Z言障礙有時(shí)無法將這一變化及時(shí)反映出來。所以現(xiàn)在學(xué)校給我們配備了一個(gè)很大的團(tuán)隊(duì)在做這件事情,系統(tǒng)也更名為‘約翰斯·霍普金斯大學(xué)疫情可視化數(shù)據(jù)圖’,圖書館、應(yīng)用物理實(shí)驗(yàn)室的很多科研人員給我們提供了很大的幫助。目前,所有數(shù)據(jù)都已經(jīng)實(shí)現(xiàn)了自動(dòng)更新,只需要人工做一些異常情況的應(yīng)對(duì)工作。”杜鴻儒介紹,他現(xiàn)在的工作重心已經(jīng)轉(zhuǎn)向了數(shù)學(xué)建模,即在數(shù)據(jù)展示的基礎(chǔ)上進(jìn)行更多的分析和預(yù)測(cè),“一是評(píng)估美國(guó)現(xiàn)有的疫情應(yīng)對(duì)政策效果,二是精準(zhǔn)到郡縣一級(jí)對(duì)疫情走勢(shì)進(jìn)行預(yù)測(cè)。”
