中國超級電腦即將接近量子效能

作者 : Sally Ward-Foxton,EE Times歐洲特派記者

在2021年全球超級運算大會(SC21)上,一支來自中國的團隊摘得赫赫有名的Gordon Bell獎,該獎相當於超級電腦領域的諾貝爾獎…

在2021年全球超級運算大會(SC21)上,一支來自中國的團隊摘得赫赫有名的Gordon Bell獎,該獎相當於超級電腦領域的諾貝爾獎。該團隊的論文「Closing the Quantum Supremacy Gap: Achieving Real-Time Simulation of a Random Circuit Using a New Sunway Supercomputer」(縮小量子霸權差距:利用全新神威超級電腦實現隨機電路的即時模擬)描述了他們如何使用新型超級電腦來模擬隨機量子電路。

事實上,Google對其2019年研發出的Sycamore量子電腦自稱「量子霸權」,當時頗受爭議,而此次中國團隊採用的即為同一測試基準。Google曾聲稱,Sycamore量子電腦在200秒內能完成的運算任務,像Summit這樣的經典超級電腦需要一萬年才能完成。這一說法當時就遭到IBM的批駁,認為真實數字可能只是2.5天。而最新的中國超級電腦結合了中國團隊的演算法研究,在304秒內就能完成相同的運算任務。看起來量子電腦似乎仍然比經典超級電腦略勝一籌,但差距無疑在縮小。

據該論文描述,基於神威的超級運算機具有1.2ExaFLOPS的單精確度性能。雖然這並沒有從官方上證實中國所具備的Exascale性能的傳聞(1.2ExaFLOPS為單精確度,而「Exascale」這個術語則需要1ExaFLOPS的雙精確度性能),但這款新型超級電腦似乎確實是世界上最強大的超級電腦之一。儘管它尚未命名,但可以確定,這項研究採用了4,190萬個神威RISC處理器核心進行運算。

超級電腦500強出爐

人們都對世界上首個Exascale系統翹首以待,但全球超級電腦排行榜500強HPC基準測試結果顯示,前十名幾乎沒有變化。中國並沒有為其基於神威的新型超級電腦系統報名參加評選,而2021年末上線的美國1.5ExaFLOPS系統Frontier似乎也還沒有準備好(圖1)。

在中國新型超級電腦和美國Frontier缺席的情況下,500強榜首仍然是衛冕者Fugaku,這個記錄自2020年6月以來就一直保持著。這台日本超級電腦的高性能Linpack (HPL)基準分數為442PFLOPS,是排名第二的超級電腦Summit性能的三倍。

 

圖1:1.5ExaFLOPS的Frontier將成為美國第一個Exascale超級電腦系統。

(來源:Oak Ridge National Laboratory)

 

事實上,前十名幾乎沒有變化,唯一的新進者是排在第十位的微軟Azure超級電腦Voyager-EUS2。該系統基於AMD Epyc Rome CPU和Nvidia A100 GPU。本輪值得注意的新晉者還包括四個俄羅斯的超級電腦系統,排名位於19~43名之間。

總體而言,本輪競賽中,中國進入500強的系統從186個下降到173個,而美國從123個增加到150個。

MLPerf HPC得分

大會還公佈了AI基準測試套件MLPerf HPC的測試結果。這種基準測試專門用來衡量AI性能——AI在科學工作中的佔比正變得越來越大。與上一輪提交相比,最佳基準測試結果提高了4~7倍,這說明,新一代超級電腦無論是硬體、軟體還是系統規模都有大幅的提升。

除了日本Fugaku由其基於Arm的CPU提供支持,沒有使用加速器之外,其他所有提交都由Nvidia的GPU加速器提供支援,具體包括P100、V100和A100。

Nvidia還是CosmoFlow和DeepCAM基準測試中的贏家。CosmoFlow被用於根據宇宙學圖像資料進行物理量的估計。最佳CosmoFlow測試結果為,採用1024個NvidiaA100-SXM4-80GB GPU能夠在8.04分鐘內完成訓練,而Fugaku則是用512個CPU在114.35分鐘內對其進行管理。

DeepCAM被用於在氣候模擬資料中辨識颶風和大氣流。在此,Nvidia仍居魁首,這次使用了相同的GPU但數量翻倍,時間為1.67分鐘。

美國Lawrence Berkeley National Laboratory則跑贏了新的OpenCatalyst基準測試,他們採用了512個40GB版本相同的Nvidia GPU,訓練時間為111.86分鐘。OpenCatalyst主要用於根據圖形的連通性預測分子構型的能量。提交人表示,將圖形網路包含進來非常重要,因為它反映了材料科學和化學工作負載的最新技術水準。其運算特性不同於其他類型的神經網路,因為它們往往具有稀疏性,而且不同的資料集會導致網路具有不同的結構和連線性,這會導致負載的不均衡,從而使負載難以有效地平行。

另外,測試中還導入了新的性能指標——弱縮放模式意味著系統能夠同時訓練同一模型的多個實例。其目標是要獲得對共用資源(如儲存系統和互連)的影響。

多裸晶(Multi-Die) GPU

就在本屆SC21大會之前,部分半導體公司發佈了一些重要公告。大會前不久,AMD推出了首款多裸晶GPU。AMD Instinct MI200將包含兩個GPU裸晶,它們之間透過一種新的2.5D矽橋技術(高架扇出橋,EFB)連接。該公司表示,與嵌入式矽橋架構競爭技術不同,這項技術支援標準的襯底和組裝技術。

MI200將是第一款基於AMD第二代CDNA2架構的GPU,該架構針對運算密集型HPC和AI工作負載進行了最佳化。與去年的第一代產品MI100相比,這款新元件尺寸大1.8倍,擁有220個運算單元和880個矩陣核心。MI200還將擁有多達8個HBM2e記憶體堆疊,從而成為第一款具有128GB HBM2e記憶體的GPU。其記憶體容量是MI100的4.7倍,記憶體頻寬是MI100的2.7倍。其FP64向量運算峰值性能為 47.9 TFLOPS,FP64矩陣數學峰值性能為95.7 TFLOPS。

 

圖2:AMD首款多裸晶GPU MI200。

(來源:AMD)

 

據了解,美國首個Exascale超級電腦Frontier就將採用AMD Instinct MI200 GPU。「當我們去想我們這一代人所面臨的最重要的挑戰,例如能源轉型、氣候變化,以及克服我們目前所面臨的新冠疫情等問題時,Frontier將使我們能夠利用由AMD處理器所驅動並提供支援的機器的能力來應對這些重要挑戰。」美國橡樹嶺國家實驗室(Oak Ridge National Laboratory,Frontier的所在地)實驗室主任Thomas Zacharia表示,「這使得MI200成為目前科學家們可利用的最強大的處理器。其單個GPU的性能就比目前美國最快超級電腦頂點的整個節點還要強大。」

Zacharia表示,Frontier將很快上線,並於明年年初提供給科學家。

模擬地球

Nvidia共同創辦人暨執行長黃仁勳在Nvidia GTC大會開幕主題演講中透露,該公司將建造一台新的超級電腦 Earth 2,它將成為地球的數位孿生,主要用來模擬和預測氣候的變化(圖3)。黃仁勳還透露,Earth 2 將全部由Nvidia出資開發,其規模將與Nvidia內部的Selene超級電腦和用於醫學研究的Cambridge-1 UK設備大致相同。他補充,Earth 2的架構將使其成為「有史以來最節能的超級電腦」,不過,這台超級電腦具體位於何處還未定。

 

圖3:Earth 2將致力於模擬和預測氣候變化。

(來源:Nvidia)

 

(參考原文:SC21: Chinese Supercomputer Approaches Quantum Performance,by Sally Ward-Foxton)

本文原刊登於EDN China 2022年1月刊

 

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論