網路巨擘們在近日於美國矽谷舉行的年度開放運算高峰會(Open Compute Summit 2018)上呼籲在連網、儲存與軟體等技術領域的大幅改革,才能讓他們不被大數據潮流所淹沒。

Facebook表示,該公司在三年內就需要配備光學介面的交換器ASIC,以支援下一次網路大升級;微軟(Microsoft)則宣佈為NAND快閃記憶體硬碟開發了一種低階介面,以更妥善利用儲存。此外開放運算計畫(Open Compute Project,OCP)與Linux基金會建立了策略聯盟,目標是解決整合方面的問題,並讓系統與軟體能一起測試。

有趣的是,很少有人談到關於機器學習的採用,這是讓資料量大爆發的最新推力;而安全性則是日益受到關注的話題,去年發表的信任根(root-of-trust)模組有越來越多支持者,同時有更廣泛的安全技術開發專案剛剛起步。

OCP贊助、在2011年由Facebook發起的Open Compute Summit今年是第九屆,有超過3,000人報名參加;現在OCP擁有175家廠商會員,訂定了375項與資料中心開放性硬體相關的規格。近幾年OCP吸引了Google,還有中國的阿里巴巴、騰訊,以及電信業者如AT&T、Verizon加入,但供應商們卻表示,那些網路巨擘對技術之需求並不一致。

確實,就算是OCP最具影響力的成員──如Facebook與微軟──在高峰會上也表達了在伺服器與交換器設計方面的不同偏好;而全球最大資料中心營運商亞馬遜(Amazon),則繼續默默地走自己的路。

Facebook呼籲將光學介面導入交換器ASIC

有一位Facebook工程師表示,因為網路流量需求淹沒了來自第三方供應商的設備,他們去年不得不以纜線把機架等級(rack-scale)交換器綁在一起。

為了跟上流量,Facebook將部份資料中心的範圍從一棟或兩棟建築,擴展到六棟建築物;要把資料中心連結在一起,需要的交換器數量,會是高階產品512個100-Gbit/second連接埠的三倍。Facebook專案經理Sree Sankar表示:「我們已經採用市面上最大的交換器,但沒有其他我們可以買得到的方案。」

Sankar的團隊將幾十台Wedge 100交換器堆疊在一個機架裡,用一個背板的纜線以及配線板(patch panels)把它們綁在一起;最後成果是名為Fabric Aggregator的100 Tbit/s交換器(參考文章上方大圖),在5個月內從概念到實現量產,有四種配置,都執行該公司的FBOSS連網軟體。

而為了要在約兩年後邁進下一代400G介面,Facebook呼籲直接在商用交換器ASIC上導入光學介面;這會是非常大幅度且在技術上有困難的躍進,晶片供應商認為還需要幾年時間。在最近舉行的年度光纖通訊大會(OFC 2018)上,由Microsoft資料中心專家率領的一個產業團體COBO發表了朝該方向跨出半步的第一版規格,也就是將光學介面導入主機板模組。

但Sankar表示,上述的COBO提案恐怕不適合Facebook所有機頂式交換器對400G連結的需求;她擔心採用400G技術時,工程師們無法為個別ASIC與光學模組散熱。

在這方面,網通技術專家Andy Bechtolsheim (編按:Sun Microsystems共同創辦人)也呼應了Facebook的看法,認為需要為400G網路開發將ASIC與光學元件以封裝技術整合在一起的方案;他認為這種設計能將功耗降低30%。

Bechtolsheim的提案是利用2.5D晶片堆疊,讓交換器ASIC以及光學模組在矽中介層上併排;他指出,打造一種介面的技術與商業挑戰,就在於低功耗,以及夠可靠、能在繁重的處理任務中存活。此外這種新設計也會重新定義網通供應鏈的各廠商角色。

20180321_OCS2018_NT03P1

Bechtolsheim建議以2.5D晶片堆疊結合交換器ASIC晶片與光學元件,圖為美國業者Luxtera的研發
(來源:OCP)

「這會是一個需要多年時間的計畫,別期望很快發生,但讓我們現在就著手進行;」Bechtolsheim也呼籲工程師們在400G的多來源協議(multi-source agreements,MSA)上團結一致,以催生新一代的可插拔光學模組。

英特爾(Intel)曾表示將於今年稍晚開始提供基於CWDM8 MSA的400G模組,傳輸距離可達10公里;有數家供應商預期會推出400G可插拔模組,估計至2019年會有50萬埠的出貨量。

SSD介面新規格與硬體信任根

微軟在大會上宣佈Denali專案(Project Denali),旨在打造一種pBLK介面規格;這種介面讓網路業者能控制固態硬碟(SSD)上的CPU、SoC與FPGA功能,包括記憶體回收(garbage collection)、耗損平均(wear leveling),還有應用程式在何處執行、如何加速等等。

該專案基本上是一種妥協,不那麼極端要求開發無韌體SSD;在Denali專案下,SSD供應商可以使用控制器來驗證與管理多媒體及電源故障。包括博通(Broadcom)、英特爾、Marvell、美光(Micron)、三星(Samsung)與海力士(SK Hynix)都對這種新介面表達支持,美國矽谷業者Cnex Labs開發的一款TB等級M.2固態硬碟就採用了該種介面。

雖然網路巨擘們採用的快閃記憶體晶片量、僅佔整體出貨的六分之一,這些公司仍在SSD的採購上花費了數十億美元,所以微軟雲端硬體部門總經理Kushagra Vaid表示:「我們要推動效率,不過我們不會透露利用快閃記憶體可達到的性能表現;」他指出該介面也可以用於新興的儲存級記憶體。

Vaid表示,採用新介面的硬碟將會在今年投入量產,而他也歡迎來自各方對新規格的回饋意見;Facebook、Google與東芝(Toshiba)預期也終會支持該專案。對此擔任OCP董事會成員的Bechtolsheim表示,傳統標準組織可能會需要幾年的時間才能達成共識,但他希望可以在幾個月內讓Denali規格定案。

20180321_OCS2018_NT03P2

Denali專案能讓網路營運商透過嵌入加速器的方法來加快固態硬碟的運作速度
(來源:OCP)

此外Vaid還提供了Cerberus專案(Project Cerberus)的新進展,即一種以MCU為基礎的信任根;該非關CPU與作業系統的方案,獲得了博通、Cavum、英特爾、恩智浦(NXP)、Mellanox與高通(Qualcomm)的支持。

在大約三個星期前,OCP展開了一項範圍更廣的安全計畫,由Google與微軟共同主導,但相關細節公布不多;該計畫的目標是因應整個供應鏈以及所有資料中心產品在生命週期中面臨的所有安全威脅。

開放軟體重量級結盟

著眼於暴增的開放源碼軟體開發案,Linux基金會與OCP建立了伙伴關係,將在自動化與測試開放性系統加載的軟體,以及探索新專案方面進行合作。

Linux基金會連網部門總經理Arpit Joshipura 表示:「我們必須要提供涵蓋硬體與軟體的測試,像是OPNFV;」該基金會正在開發網路虛擬化的開放源碼,而因為在開放性連網軟體領域有越來越多競爭專案,使得互通性議題備受關注。舉例來說,AT&T提供的dNOS程式碼、Google為最近宣佈的Stratum專案提供的程式碼,還有Facebook自家的FBOSS等等。

20180321_OCS2018_NT03P3

Linux基金會與OCP將在連網軟體的測試上進行合作
(來源:OCP)

在Linux基金會也有超過20個與連網相關的開放源碼開發案正進行中,該基金會最近將觸角伸向物聯網裝置、儲存與區塊鏈(blockchain)應用的軟體領域。與OCP的合作是否能透過認證程序強化軟體互通性,還有待觀察;此合作的動機目前看來是基於營運商在提供服務之前,對滿載網路系統之測試需求。

Open Compute Summit 2018上的其他重要訊息,還包括Facebook展示了採用8顆Nvidia Volta晶片的Big Basin GPU伺服器,耗電量為2.5kW;該公司的一位工程師表示,他們嘗試在系統相對閒置時,利用龐大的CPU資源來訓練其眾多神經網路模型。

編譯:Judith Cheng

(參考原文: Web Giants Want Optical, Flash Advances,by Rick Merritt)