ARM開發了一種向量指令集(vector instruction),旨在將64位元的V8架構推進高性能運算應用領域;而日本業者富士通(Fujitsu)採用ARM架構所開發、設置於日本理研研究所(Riken Institute)的K Computer (原本採用Sparc架構)後續版本(Post-K),達到了8 petaflops的運算性能,成為2011年時全球最強的超級電腦系統。

K Computer讓ARM處理器首次進軍超級電腦領域,一個由Intel x86架構稱霸的稀有市場;而ARM期望能進一步擴展在這個市場的版圖,慢慢取代如IBM或Cray等由超級電腦廠商自主開發的處理器。ARM的強項在於其相較於x86架構更具省電效益的潛力,此特性對於實際上不太容易為想要打造的超大規模系統提供大量電力的超級電腦設計工程師來說頗具助益。

目前ARM支援的Neon SIMD指令集僅限於128位元,鎖定客戶端系統的成像與視訊應用;而其可伸縮向量擴充指令集(scalable vector extensions,SVE),支援在128位元上128~2,048位元長度的增量(increment),使用者能寫入一次向量程式碼,並能無須重新編譯、在任何尺寸的向量設計上執行該程式碼,而此功能號稱是其他架構無法支援的。

SVE是一組新的指令集,鎖定科學研究任務而非以數位訊號處理器(DSP)為基礎的多媒體加速應用;富士通表示,該公司打算在2020年推出的K Computer後續版本採用SVE,讓系統性能比前一代提升五十倍、省電效益提升十五倍。

據了解,SVE是一種負載/儲存(load/store)架構,採用最多32個向量暫存器(register)以及16個述詞(predicate)暫存器,加上控制暫存器以及一個first-fault暫存器;所謂的述詞暫存器是用來管理關於控制迴路的不同決策,ARM為其未來對SVE的擴展預留了編程空間。

SVE規格是由數個合作夥伴共同開發,預定明年初公佈,ARM才該開始研究將如何為該擴充指令集製作開放源碼Linux修補程式。

20160823 ARM NT03P1

ARM展現了SVE上不同向量長度的可伸縮特性,圖中的結果是根據以不同向量長度編譯的程式碼之模擬
(來源:ARM)

所有的ARM 64位元核心授權廠商都能取得SVE技術;ARM院士暨主架構師Nigel Stephens在近日於美國矽谷舉行的Hot Chips大會上表示,該公司已經有多個合作夥伴正在進行開發,但目前不能透露任何公司名稱。

而對富士通來說,K Computer的合作案,提供與開始進軍高性能運算領域的ARM建立更進一步夥伴關係的機會;負責開發K Computer後續版本處理器、目標是讓該系統在2020年達到exaflop性能等級的富士通主架構師Toshio Yoshida 表示,Sparc目前仍是該公司商業用伺服器偏好的架構,不過他們也看到一系列採用ARM晶片之技術與科學用新系統的商機。

Yoshida透露,富士通的K Computer後續版本將採用512位元SIMD向量單元,在I/O部分將採用該公司的某個版本Tofu互連以及其他加速器核心;不過他對於該處理器晶片目前鎖定採用哪種「先進」製程節點三緘其口。他表示,富士通選擇512位元向量長度,是因為那正好是其前一代Sparc架構系統256位元SIMD的一倍:「我們想在這個領域把步伐放慢一點。」

20160823 ARM NT03P2

SVE佔據28位元的編碼區域,而且只有ARM的64位元核心能支援
(來源:ARM)

編譯:Judith Cheng

(參考原文: ARM Reaches for Supercomputers,by)