48小時的戰(zhàn)役
美國時間11月9日晚上,團隊抵達美國達拉斯。
“我們周五把機器裝箱打包運到美國,周六周日一直在安裝機器,調試到最優(yōu)的狀態(tài)。”翟季冬介紹說,周一早上先進行基準測試程序,測到下午5:30。在這之后,周一晚上7:00開始到周三晚上7:00為正式比賽時間,要求機器運行48小時不間斷,不能再對機器進行任何配置的修改。
在這48小時中,參賽隊伍需要在3000瓦功率內搭建計算機集群系統(tǒng),并在集群系統(tǒng)上進行6個應用程序的性能比拼。除了考察成員的計算機“腦力”, 比賽設置了采訪、參會、海報設計等環(huán)節(jié),成員需在比賽中向評委介紹自己優(yōu)化的應用和正在進行的軟件優(yōu)化設計。團隊還需要在48小時內完成一篇在國際權威雜志具有發(fā)表能力的英文論文。
與其他兩個大賽不同的是,SC大賽還有隨機斷電環(huán)節(jié)的設置。
“什么時候斷、斷幾次都是未知。”于紀平告訴中國青年報·中青在線記者。正因為如此,他決定48小時不離開比賽現場,甚至睡在地上。
一次,隊友在比賽場地找不到于紀平,幾個人轉了一圈才發(fā)現,這個身高超過180cm的大小伙子正蜷縮著身子,睡在了一個寬僅有60cm左右的長桌下面,撩開桌布才能看見。“其實比賽中是可以回酒店休息的,但是回去需要步行20多分鐘,我不放心,所以干脆就睡在這了。我們要保證48小時場地里始終有醒著的人”。
這次大賽是在第一天晚上12點斷電。斷電后組委會要求所有參賽隊伍把插頭拔下來檢查。團隊除了拔插頭不能進行任何操作。于紀平表示,當時機器的一個鏈狀結構出現了問題,由于比賽規(guī)定不能碰機器,不能檢查線纜,只能通過遠程的方式檢測。“我們正在排查故障的時候斷電了。斷電重啟后,故障竟然消失了”。
幸運不會一直陪伴著團隊,隨著比賽的深入,挑戰(zhàn)接踵而來。
比賽期間,比賽規(guī)則的突然調整讓經驗豐富的于紀平也措手不及。于紀平回想起當天的“驚險”經歷仍然心有余悸。“因為HPL(直譯為高性能線性系統(tǒng)軟件包)跑完電腦功耗已經很大,電腦過熱將影響緊接著的HPCG(直譯為高性能共軛梯度)的速度。連續(xù)跑完兩項測試大概需要40分鐘到1個小時的時間,大約下午4點半我得到的結果我不太滿意,所以又重新跑了一次,很驚險地在結束的那一刻上交了成績。”
興趣是最大的戰(zhàn)斗力
對于這些年輕人來說,輸與贏并不會改變他們與老師同學們的關系,也不會讓他們省去比賽期間耽誤的考試和作業(yè),更不會改變他們對于超算的熱愛和夢想。興趣,成為這個團隊成員的最大動力。
正如成員鄭立言所說,“我們要讓一個程序不停地優(yōu)化,讓它跑得更快,還要降低功耗需求,我覺得特別有趣。”
“從進入清華就拜托班主任打聽超算團隊了。”大學剛入學,成員趙成鋼就對超算產生了濃厚的興趣,從參加組會、熟悉規(guī)則到做外圍支援,從優(yōu)化程序、操控機器到訓練臨場應變,一年多之后,剛剛上大學二年級的他就進階為正式隊員。
翟季冬介紹,同學們在日常培訓中會表現出不同的興趣。“比如紀平、欣健對硬件感興趣,成鋼、晨耀在程序優(yōu)化和程序分析方面有很大的發(fā)揮空間,立言和家傲的英文表達非常好……我們會在比賽中極力去發(fā)掘和培養(yǎng)他們的特長。”
然而在清華,即使是參加這種規(guī)格的國際賽事,老師們也不會允許同學們落下應該完成的功課。于是在比賽現場和返程的飛機上,鄭立言、何家傲等人一直在寫作業(yè)。
“賽前、賽中、賽后,我最大的感受就是缺覺。”鄭立言笑著對中國青年報·中青在線記者說,當時機器在身邊跑著程序,等待中的他便開始寫“編譯原理”等課程的作業(yè)。這兩天,他每天都是凌晨4點才睡,仍是為了寫作業(yè)。
比賽的收獲也可以是感性的。鄭立言說,收獲有很多方面,除了在與專業(yè)人士的交流上,還有友誼上的收獲。“這14支參賽隊,有的隊伍中華人比較多,我們在比賽中和其他的選手也有很多交流,賽前、賽中我們會討論解決技術問題,比賽后我們還會一起加微信、約吃飯,我們通過這場比賽與選手們結下友誼。
在比賽的過程中,團隊成員們也對自己的未來規(guī)劃有了更深的認識。
何家傲告訴中國青年報·中青在線記者,這次比賽中自己有幸聆聽了多場講座,“一位高性能計算領域的行業(yè)專家給大家分享了自己的專業(yè)如何為社會貢獻。這些前輩的人生歷程很具指導作用。我才發(fā)現原來自己有很多事情可以去做。我現在研究記憶學習,經過這一次比賽的經歷,我明白了自己未來可以在哪些方向發(fā)力。”
中國青年報·中青在線記者 葉雨婷 來源:中國青年報
