7家晶片供應商近日宣佈將聯手針對伺服器加速器(server accelerators)聯手定義快取一致性互連架構(cache-coherent interconnect),在雲端運算應用領域提供英特爾(Intel)、Nvidia以外的替代方案。此舉是橫跨ARM、x86與Power架構處理器的伺服器硬體架構合作。

上述7家晶片廠商包括AMD、ARM、華為(Huawei)、IBM、Mellanox、高通(Qualcomm)與賽靈思(Xilinx),將聯手為定義伺服器加速器快取一致性互連(Cache Coherent Interconnect for Accelerators,CCIX)規格;該聯盟預計在今年底公佈規格草案,但到目前為止並未公布任何關於此合作案的技術或財務細節。

英特爾在去年以167億美元收購了可程式化邏輯元件供應商Altera,有部分原因就是為了使用後者的FPGA做為Xeon伺服器處理器的加速器;英特爾已經開始推出在單一封裝中整合Altera之FPGA與其Xeon處理器的產品。至於其他處理器供應商則是分別與賽靈思接洽,試圖為其晶片建立快取一致性連結;於是Xilinx提出了定義適用所有處理器之單一連結的想法。

從去年開始,以加速器晶片來提高處理器性能的需求如野火般延燒整個運算產業,大部分來自於各家網路巨擘開始在眾多新興應用領域如語音識別、影像識別以及上下文搜尋等,採用新一代的機器學習演算法。

Google在甫落幕的年度Google I/O大會上也宣佈已經自行開發加速器晶片(參考閱讀),稱為張量處理單元(tensor processing unit,TPU);應用於相對速度較低且非一致性快取的PCI Express匯流排。目前TPU已經應用於Google的資料中心處理各種任務,被視為該公司雲端服務的差異化特色之一。

微軟(Microsoft)與百度(Baidu)也已經在資料中心使用FPGA,加速從搜尋引擎到網路安全性等不斷增加的任務處理速度;他們通常是在PCIe板卡上使用FPGA。而Nvidia今年稍早發表首款採用快取一致性連結介面NVLink的繪圖處理器Pascal;該介面用以連結Nvidia的GPU以及採用IBM Power架構的處理器。

今年稍早,Facebook發表了以GPU為基礎、應用於人工智慧任務的伺服器設計;而Google的一位頂尖工程師則於不久前透露(參考原文),該公司在資料中心採用越來越多數量的GPU。

除了機器學習,上述的CCIX組織成員表示,將開發的介面會有助於加速器進駐包括巨量資料分析、網路處理等應用;特定功能加速器在協助通用處理器方面所扮演的角色重要性越來越顯著,因為後者若要趕上摩爾定律的步伐(Moore’s law),成本變得越來越高昂。CCIX標準可望應用於廣泛的加速器與伺服器處理器,但合作成員都尚未透露具體計畫。

賽靈思表示該規格將應用於16奈米製程FPGA,但未提及產品何時上市;Mellanox則可能會在高階網路控制器以及收購自EZChip的網路處理器都採用該規格。而IBM在今年稍早展示的、預計2017年問世之Power 9處理器電路圖(參考原文),其中的快取一致性介面應該就是CCIX。

高通與華為可能會在開發中的ARM架構伺服器單晶片採用新介面;AMD則應該會在未來的ARM架構與x86架構伺服器處理器、還有Radeon繪圖處理器都採用CCIX,不過到目前為止AMD並未像是競爭對手Nvidia那樣著重GPU加速器的市場。

CCIX會是開放性FPGA應用程式介面的補充

CCIX組織尚未決定其介面規格將會採用免費授權模式,或是將之交由經認證的標準機構來經營;此外該組織也尚未透露任何關於介面頻寬、資料傳輸速率或延遲等方面的技術目標,僅表示相關參數至少都能與目前的其他替代方案媲美。

「我們將能與所有現存替代技術競爭,在某些應用案例中甚至表現可以更好;」賽靈思架構副總裁Gaurav Singh表示:「我們將有單一個跨越x86、Power與ARM架構的一致性協議──這是以往從未有過的。」

網路巨擘如Google正準備探詢由英特爾x86架構轉移至例如ARM或是Power架構的可能性;今年稍早,一位微軟工程師表示,資料中心日益龐大的工作負載將迫使運算架構重新設計,而有一部分焦點將集中在新種類的加速器。

最近開放源碼軟體開發商Red Hat正在主導重整針對包括FPGA在內之伺服器加速器軟體編程介面的支援,對此Singh表示:「CCIX將與其行動互補;」他進一步指出:「CCIX不會定義應用程式介面(API),那個部分將會由軟體業者來主導。CCIX會需要一些平台軟體方面的改變來支援,但我們不預期會動到作業系統。」

「我們將因為擁有選擇性而獲益,有像是CCIX這樣的替代方案對產業界是好事;」Red Hat負責上述針對加速器之開放性編程介面的Jon Masters表示,CCIX提供了產業界需要的一些功能;是在英特爾的QPI以及IBM的CAPI (Coherent Accelerator Processor Interface)以外,另一個很不錯的替代技術。他指出在軟體部分,目標是定義使用加速器的開放性軟體介面,因此無論底層互連技術是QPI、PCI Express、CAPI或CCIX等等,都有免驅動程式的編程環境。

CCIX成員有大量現有技術可利用,例如ARM有一套一致性SoC互連,AMD主導的異質系統架構基金會(Heterogeneous Systems Architecture Foundation)為手機處理器的CPU、GPU開發了快取一致性連結;此外IBM已經在Power架構晶片中使用一致性加速器處理器介面(即CAPI)。

市場研究機構Moor Insights and Strategy的資深分析師Karl Freund認為,如果CCIX能順利推廣,潛在好處將會非常龐大;不過他預期最終成果可能要到2019年甚至2020年才會看到,因為該連結介面得等到IBM的Power 9、AMD的Zen以及ARM的新一代處理器核心問世之後才會現身。

而Freund也表示,推動CCIX的七家大廠還少了一家──Nvidia的缺席會在它們進入運算加速以及圍繞其軟體建立了有價值的生態系統時成為問題。

編譯:Judith Cheng

(參考原文: Accelerators Unite ARM, IBM, X86,by Rick Merritt)