AMD助攻 El Capitan超級電腦將突破2 exaflops

作者 : Brian Santo,EE Times美國版主編

AMD的下一代CPU/GPU獲得El Capitan超級電腦採用,包括其Epyc CPU和Radeon GPU的未來版本,並搭配其Slingshot互連,可望協助HPE/Cray打造突破2 exaflops運算效能的最快超級電腦…

AMD在高性能運算(HPC)領域傳出捷報,其CPU和GPU雙雙獲得El Capitan超級電腦採用,可望打造突破2 exaflops的運算效能。El Capitan超級電腦預計將於2023年上線,屆時可望成為世界上最快的超級電腦。

美國能源部(DoE)國家核能安全管理局(National Nuclear Security Administration:NNSA)於去年8月宣佈打造El Capitan超級電腦,Cray Inc.並贏得了這項6億美元的合約。當時,Cray仍在與Hewlett Packard Enterprise (HPE)併購的過程,如今在收購完成後,由HPE接手這項合約。

在El Capitan計劃發佈之初,DoE和HPE/Cray均未指定採用哪一款處理器。El Capitan最初預計達到1.5 exaflops的運算效能,但AMD說服了HPE/Cray和DoE採用其Epyc CPU和Radeon GPU的未來版本,並搭配使用其Slingshot互連,可望協助HPE/Cray為此超級電腦系統帶來高達2 exaflops的運算效能。

AMD, HPE/Cray El-Captain Supercomputer

El Capitan系統將以HPE/Cray的Shasta exascale超級電腦架構為基礎。
(來源:HPE)

HPE HPC & AI資深副總裁兼技術長Steve Scott說,2 exaflops的運算效能比當今最強大的超級電腦更快10倍,也比全球前200大的現有超級電腦加總起來還要快。Steve Scott之前是Cray的首席架構師。

HPE/Cray預計將於2023年交付El Capitan給勞倫斯·利弗莫爾國家實驗室(Lawrence Livermore National Laboratory;LLNL)。這台機器將由LLNL和其他兩座國家實驗室(Los Alamos和Sandia)共同使用,主要用於建模美國核武儲備以確保其安全性、可靠性和安全性。

LLNL目前營運的是全球第二快的超級電腦,稱為Sierra,由IBM建構,採用了IBM Power9 CPU以及Nvidia V100 GPU。

由Sierra超級電腦執行的這種建模需要非常複雜的模擬,而且隨著核武儲備的老化,複雜性也只會增加,這一任務接下來將交由El Capitan。LLNL Livermore Computing技長Bronis R. de Supinski解釋說:「我們需要越來越強大的系統,以確保擁有所需的性能。El Capitan將能符合這項目標。」他並補充說,採用El Capitan讓LLNL能夠例行性地同時進行三項模擬。

El Capitan將使用代號為‘Genoa’的AMD下一代Epyc處理器,配備AMD Zen 4處理器核心。AMD資料中心和嵌入式解決方案業務部資深副總裁兼總經理Forrest Norrod說,這些都將是標準的部份。El Capitan中所使用的處理器將會一直縮小到桌上型電腦。

Norrod還表示,El Capitan處理器將基於該公司第三代的Infinity架構,該架構基本上是一種附加的晶片結構網路。

Norrod說:「提供最強大運算能力的元件是下一代Radeon Instinct,它針對深度學習進行了最佳化(由我們的主要客戶設計),以用於機器學習和人工智慧(AI)。」

統一記憶體將可在CPU和GPU組合之間使用。他說,這將使程式人員更易於使用El Capitan,因為這讓他們不必處理記憶體資源。Norrod說:「我們認為這是釋放El Capitan性能的關鍵。」

LLNL希望將El Capitan的一部份任務用於探索AI的應用。De Supinski說LLNL的工作負載並不依賴於深度學習,但是實驗室正在進行認知模擬。他說:「我們將利用AI和其他模型來承擔我們的工作量,主要是為了加快模擬速度並提高準確性。」

至於是否開放El Capitan架構以添加專用AI晶片,Scott表示,Radeon GPU目前就是實際可用的AI加速器,但該系統的架構方式也可以添加專用的AI加速器。

De Supinski表示LLNL正在研究專用的AI加速器,並表示可以為El Capitan添加專門為此目的而設計的其他節點。他說,「我們將視LLNL當前超級電腦的運作情況而定。」如果進展順利,將會與HPE合作把這些節點添加至El Capitan。

AMD一直在利用其於GPU的競爭地位,以及在CPU中不斷進展的實力,以滲透至向來由英特爾、IBM、Nvidia等少數幾家公司獨佔的超級電腦處理器俱樂部。該公司的Epyc “Rome” CPU已獲法國替代能源和原子能委員會(CEA)的Joliet-Curie Rome超級電腦採用。去年5月,AMD宣佈與Cray合作開發Frontier超級電腦——美國橡樹岭嶺國家實驗室(Oak Ridge National Laboratory;ORNL)的1.5 exaflops機器,在發佈時也曾經是世界上最快的超級電腦。

編譯:Susan Hong

(參考原文:AMD wins CPU and GPU slots in HPE/Cray’s El Capitan,by Brian Santo)

發表評論