Google的大規模資料中心正準備好從英特爾(Intel)的x86架構轉向IBM Power伺服器;同時,該公司也為轉向ARM伺服器準備就緒;然而,這條道路其實還沒有走多遠。

在日前於美國加州聖荷西舉行的OpenPower Summit 2016,展示了近60種OpenPower系統,數量較去年多好幾倍。另一方面,Google也已為轉向Power伺服器架構做好了準備,將大多款Google App和基礎架構軟體移植到兩年前開發的Power8伺服器。

Google平台部門工程技術經理Maire Mahony表示,「對於優秀的軟體開發人員來說,使用Power伺服器只需修改設定檔中的一個標示就可以了。」Maire Mahony負責Google的資料中心硬體,他同時也是OpenPower Foundation總監。

Google目前正與一家小型資料中心服務供應商Rackspace合作,共同設計Power9伺服器。這款被稱為Zaius的伺服器(參考圖1)將使用兩顆Power9晶片、32個支援第4代PCI Express的DDR4 DIMM插槽和插座,以及IBM的CAPI介面和Nvidia的NVLink互連介面。這是一種為48V機架設計的48V伺服器。

20160509 Power NT31P1 Google和Rackspace透露雙方正合作開發一種雙插座的IBM Power9伺服器

在這次大會上,IBM首次介紹了Power9的發展藍圖。這款處理器將搭載24個最新設計的核心、最新版的CAPI和NVLink互連,以及IBM尚未正式發佈的全新25Gbit/s互連介面(如圖2)。

Power9有兩種款式,一種使用直連記憶體,用於大型資料中心實現向外擴展叢集,另一種使用緩衝記憶體,用於大企業的向上擴展系統。Power9處理器即將投片,預計將採用Globalfoundries的14nm製程製造,在2017年底上市。

Google並未自行搭建Power8伺服器,移植大多數的軟體只是為了在與英特爾議價時能有更多的話語權。Google平台部門資深總監Gordon MacKean表示,「這牽涉到掌握著所有可用的技術,然後選擇最佳性價比的技術加以部署,最終實現最佳的平台化。」

Google也在其實驗室中準備了ARM硬體,並將一些軟體移植到這些硬體上。然而,MacKean表示,「我認為在使用ARM方面有點落後,而在使用Power時倒是遙遙領先。」但他並未披露移植所採用的ARM硬體細節。

「我們將繼續觀察整體情況⋯⋯針對實際部署,你在任何時間點都必須準備好『扣扳機』」,MacKean說道。

MacKean補充道,「每一種平台間都會彼此跨越,就像AMD/英特爾時代一樣⋯⋯如今,競爭表現在指令集架構上,因此情況更加複雜,但我們會全力以赴⋯⋯尤其現在還有Open Compute可以使用,因而帶來更多選擇。」他並透露,Google在今年稍早加入了Facebook主導的開放源碼硬體小組。

Power和Open Power發展藍圖

20160509 Power NT31P2 IBMPower9處理器包含尚未發佈的全新25G互連介面

IBM的Power發展藍圖(圖3)包含了將在2018至2020年間採用10nm和7nm節點製造的各種Power8和Power9晶片計畫。另外,協助成立Open Power小組的IBM院士兼Power開發副總裁Brad McCredie透露,IBM還計畫在2020年後開發一種全新的架構。

從PowerPC開始就一直在研究IBM處理器的McCredie強調,「幾年來,我們至少都有一個人在負責Power 10⋯⋯,而且我們經常開會,積極地執行既定計劃。」

Power9採用的最新加速器互連仍然是個謎。就像Nvidia NVLink2.0一樣,它可作業於最高達25Gbit/s的速率。但本質上是否就是CAPI 2.0或與其一致則無法確定。

IBM開發CAPI的部份原因在於需要一種比PCI Express更快的介面,而且不至於在傳輸層造成負擔。McCredie只說這種新的互連就像任何介面一樣,關注的是提高頻寬和縮小延遲等擴展功能。

20160509 Power NT31P3 IBM已經在研發即將於2020年後推出的Power10架構

在I/O方面,Power9「將是首款支援PCI Gen 4的首款處理器,我們已經走在PCI SIG標準委員會的前面,不久即將投產了。」McCredie指出,從技術角度來看,Gen 4規格最早要到今年年底才會發佈。

在致力於開放IBM Power架構約兩年後,只出貨了大約6種未加上IBM商標的伺服器設計。另外,IBM在CAPI互連方面有6家合作夥伴,至今出貨約20種不同可插入CAPI互連介面的電路板。

「微處理器設計非常昂貴、耗時且難度大。」McCredie在大會中表示,「開放匯流排的影響較設計微型單元更大,因為圍繞匯流排存在許許多多的創新。」

在今年的高峰會上,IBM也宣佈同時開放Power記憶體匯流排。開放的目的在於當推出新的儲存級記憶體與記憶體堆疊時,讓開發人員更易於打造新的主記憶體系統類型。

這種記憶體匯流排規格目前處於0.2版草案階段,預計在今年底可能推出最終版。Open Power技術工作組主席Jeff Brown表示,它可以幫助開發人員「在前端增加處理功能,讓他們不必擔心Power記憶體到主機介面之間如何作業。」

Open Power技術工作組最近還完成了連接CAPI元件和Linux的軟體介面任務。去年,該工作組成立了其他的一些工作組,包括研發最新25G介面的工作組。

加速是新的主旋律

OpenPower高峰會上的潛在意義是摩爾定律(Moore’s Law)變慢了,無法提供正常的性能與價格進展。這個產業已經開始競相從使用加速器的更高整合伺服器架構中獲益了。

英特爾收購Altera以及發佈3D XPoint記憶體的行動顯示,該公司正穩步走向專有化道路。考慮到這種解決方案的高成本,使得Google和Rackspace等公司開始探索開放硬體產品替代方案,Rackspace資深總監Aaron Sullivan表示。

在研發具體應用時,Rackspace發現使用CAPI加速器可以使性能提升10倍。「現在我們想為我們的所有應用導入開放硬體。」Sullivan並補充說,「在實現開放加速器的道路上,我們已經走了三分之一的路程,」只要是該公司的雲端服務客戶都可以使用這些加速器。

20160509 Power NT31P4 Google展示史丹佛大學整理的圖表指出,微處理器的進展跟摩爾定律一樣放緩了腳步

進一步向前發展必須使用可編程晶片,Sullivan引用微軟(Microsoft)在FPGA方面的工作時表示。這時需要具有硬體描述語言等底層編碼經驗的大量程式設計人員。

Mackean表示同意這樣的看法:「我們都看到代工廠的現況以及這種製程技術,節點微縮的速度並未如我們想像的快速,每個人都在設法實現,整個產業也正努力加以因應。」

事實上,OpenPower大會和Nvidia的年度盛會是在同一地點舉辦的,Nvidia發佈了一款高階的通用處理器(GPU),微軟則針對這種通用處理工作使用了FPGA。

「我們認為,Power是針對英特爾架構的一種有趣替代產品,因為它擁有強大的核心,足以與英特爾的核心一較高下。」MacKean表示,「IBM的發展藍圖中只包含設計技術,並不涉及節點縮小,IBM希望透過改善架構以提升頻寬和整合度⋯⋯就像是增強I/O性能一樣。」

最新OpenPower系統

20160509 Power NT31P5 中國推出新款Zoom伺服器,最多可整合4顆Nvidia GPU加速器

中國也許是OpenPower的最大機會,部份原因在於中國亟需不必付高額授權費用的架構。

然而,今年的高峰會與去年相較基本上變化不多。去年,OpenPower的一家晶片製造商——蘇州中晟宏芯(Suzhou PowerCore)展示了一款名為Zoom的處理器,並獲得一家不具名的伺服器製造商採用。

「設計一款處理器需要花費很長的時間。」McCredie表示,「預計今年6月在中國舉行的OpenPower大會上將透露更多的消息,此外,中晟宏芯的CP1已經開始出貨了。」

20160509 Power NT31P6 中晟宏芯推出的Power架構處理器

在今年的大會上展示了近60種OpenPower系統,數量較去年多好幾倍。然而,其中約有20多種是介面卡而不是伺服器,而且還有幾種是網路交換機或擴展箱,有些伺服器則貼的是原型機標籤。

20160509 Power NT31P7 Penguin的系統

Penguin的系統(圖7)使用了Nvidia GPU加速器。該公司正部署Rackspace系統(圖8),很快地就能提供給使用者。

20160509 Power NT31P8 Penguin部署Rackspace的系統

ITL(圖9)是另外一家新加入的中國伺服器製造商。RTDS Technologies(圖10)則展示一款原型系統,主要用於電力公司進行模擬。

20160509 Power NT31P9 20160509 Power NT31P10

業界巨擘齊聚一堂

在這次大會上,IBM還邀請業界巨擘一起和產品進行拍攝。為了驅動創新以及鼓舞士氣,該部門將在今年舉行一項創新設計競賽,並在今秋舉行的超級運算大會(Supercomputing)上頒發16,000美元的獎金給獲?的創新設計。

該工作小組並緩步推動認證計畫。目前已經有68種產品標示了易於取得的OpenPower商標。相容性工作小組已經開始制定認證計畫,並於4月8日舉行首次插拔測試大會。

(參考原文:Google Preps for IBM, ARM Shift,by Rick Merritt)