開放式機架設計推動資料中心革命

2018-12-24
作者 MD Truong, Molex資料中心架構總監

現代化的超大規模資料中心重心已經從伺服器設計轉向機架式設計。Open19基金會圍繞此一架構,為資料中心產業提供一個硬體平台,並為19英吋機架環境建立了開放的標準與設計...

在現代化的超大規模資料中心內,重心已經從伺服器的設計轉向了機架的設計,因此出現了機架式(rack)架構。成立Open19基金會的目的,就是圍繞此一架構,為資料中心產業提供一個硬體平台,並且建立一組可以自訂、高度靈活並且極具經濟效益的標準與設計;同時,這些標準與設計必須可配合任何19英吋機架環境使用——因此稱為Open19。

透過與世界各地的產業技術領導者開展廣泛的協作,Open19解決方案的重點圍繞在作業的簡易性、功率效率以及靈活的設計──這些都是機架式架構的主要考慮因素。並且,隨著重心正從以伺服器為中心的世界轉向以機架為中心的環境,資料中心的管理人員可以突破常規,妥善因應一個常見的挑戰:營運。

超大規模資料中心的營運範圍十分浩大,所佔據的面積往往會達到幾個足球場這麼大。在硬體採購成本的背後,大規模的執行硬體所產生的營運費用可以對總購置成本(TCO)產生顯著的影響。在如此龐大的空間中,電源效率(或者,更為常見的是效率不足)、氣流阻礙以及硬體的簡單維護的問題,都會迅速的積少成多起來。此外,這類場所的維護僅僅通過少數幾名現場的技術人員來完成,使得問題更為複雜,這就意味著維修和升級常會花很多的時間。

開發Open19的目的是因應大規模的挑戰。這一協作組織的發起人包含了近30家公司,其中包括Molex在內,這些公司都已經認識到機架整合、作業和維護的成本是重大的財務負擔。Open19最初的目標非常簡單:降低整合成本,包括在機架上安置硬體、伺服器佈線和網路連接上花費的時間,以及包紮線纜以利於氣流通過的時間。透過與其他領先的技術企業協作,Molex致力於開發合適的解決方案以省卻這些高昂的整合成本:外部線纜化背板,能夠向每個伺服器塊或者一個半寬的1U高度機架單元伺服器提供高達100Gbps的乙太網路連接。

線纜化的背板解決方案基於背板連接器中所含的相同技術,這類連接器通常部署在內部盲插應用中。這一核心的背板技術經過增強後可以滿足新的Open19標準要求,意味著使用者可以不再使用高接觸的QSFP、QSFP至SFP分支DAC線纜,以及通常用於乙太網路的CAT-5乙太網路電纜。這些成纜背板改善了氣流效果,並且透過減少安裝錯誤而簡化了安裝過程,並且為高速乙太網路提高了訊號的完整性。成纜背板安裝在殼體內部,可以為十二個伺服器塊建立起主幹。

作為容器的伺服器塊

運輸產業使用尺寸一致的貨運集裝箱來運送貨物。在軟體的世界上,也有採用一致的容器和方式來輸送軟體。然而,在伺服器領域,則尚未有統一的慣例。最接近的方法是一種統一的平台,其單元的定義為寬19英吋、垂直高度1.75英吋。Open19致力於為此實現標準化,將Open19生態系統中最小的構建塊、也就是伺服器塊,定義為一個機架單元的半寬伺服器,可以支援速度高達100Gbps的連接以及400瓦的功率。

由於Open19是一種可擴展的架構,可以聚合起各伺服器塊來擴展功率,並且支援高達100Gbps的乙太網路,伺服器塊的尺寸可以達到標準的1U伺服器的大小,而功率和實現的網路速度則可達到標準伺服器的兩倍,或者,在採用2U伺服器的尺寸時,可用功率則可達到2U伺服器的四倍(以及高達400Gbps的乙太網路連接能力)。背板連接器組專為這一架構開發而成,也將擴展到56Gbps PAM-4;而當今的25/50/500Gbps乙太網路則是使用目前的25Gbps NRZ訊號系統。隨著乙太網路矽技術的不斷演進,每個埠都具有使可用頻寬翻倍的潛力。

此外,伺服器塊是完全自持式的獨立設備,含有安全與合規所需的全部相關認證。伺服器塊可以放入到鈑金機殼中,這種機殼提供盲插供電以及成纜幹線功能。機殼提供8U和12U的產品變型,分別可容納16和24個伺服器塊。通常1U的電源框和1U的乙太網路交換機即可為這些伺服器塊提供支援性的基礎設施。

統一的力量

一致而又統一的設計,易於排除大規模作業過程中存在的困難。曾經在伺服器後部作業的任何人都知道,作業乙太網路連接所需的各種RJ-45埠、SFP埠以及QSFP埠會產生無窮無盡的組合,更不用說還要花很多時間來與身處其他地方、收費高昂的技術人員進行交流,這對於技術人員以及負責解決問題的員工來說,都會產生巨大的壓力。在開發自身的邊緣運算平台的過程中,一家邊緣運算和裸金屬雲端運算領域的領先供應商認識到了這一問題。團隊立即就認識到了Open19的優勢:可以簡單而又統一的來部署伺服器塊。每個伺服器塊都只能在一個方向插入並配對。沒有外部的乙太網路電纜會插入到錯誤的埠中。對於任何可用的插槽,只要尺寸足夠容納伺服器塊,就可以進行填充。作業的複雜性降低到了接近零的程度。 

功率的代價

在大規模資料中心內,功率、配電與冷卻佔到了總營運成本的31%。電源使用效率(PUE)是相對於為基礎設施提供支援而消耗的功率或者轉換損耗,而對IT負載使用的電源效率的測量結果,這種損耗在電源將交流電轉換為直流電時發生。在接近額定功率下工作時,電源會以峰值效率執行。比如說,與1500瓦電源上的400瓦負載相比,500瓦電源上的400瓦的負載受到的轉換損耗會低一些。通過動態的啟用和停用電源框上每個獨立的電源,從而對負載需求作出回應,電源框可以降低此類的轉換損耗。數百個到數千個機架上的損耗累積起來,所涉及的營運成本可以高達數百萬美元。

Open19設計中的電源框可以為伺服器塊提供12伏的直流電源以及Open19網路交換機。共用的電源框還採用了電纜配電系統,與其他系統中使用的外部直流母線有所不同。電源框還具有100伏到277伏交流的「通用」輸入電壓。這種通用的設計允許實施特定於部署地區的電源線,從而在部署的後勤方面排除了一個令人頭疼的重大問題。

打破常規

在機架式的架構中,存在著打破常規的可能性,以全域的方式來解決問題。統一構建塊的應用可以使系統的設計人員在運算塊的內部創造價值。這類運算塊能夠部署在機殼的內部,使機殼以均勻一致的方式來供電並提供網路基礎設施。以大規模部署來說,Open19可以節省可觀的總購置成本。邊緣解決方案的供應商已經認識到了統一的設計以及架構的一致性所帶來的強大力量。

大規模的營運可以說是不進則退,不成則敗的。Open19開發並部署了尺寸一致的硬體容器與硬體塊,為商業組織提供了創新性的機架式設計。憑藉成纜背板,在部署了硬體塊後可以滿足多種應用對於功率和網路的要求,同時還可以解決大規模營運的問題。

為資料中心的部署評估新的架構時,一個主要的考慮因素就是打破常規,將統一的設計與成纜背板整合起來。這種修改後的架構可使您在專注於自身業務的同時,簡化大規模部署中的許多營運問題。

活動簡介

人工智慧(AI)無所不在。這一波AI浪潮正重塑並徹底改變科技產業甚至整個世界的未來。如何有效利用AI協助設計與開發?如何透過AI從設計、製造到生產創造增強的體驗?如何以AI作為轉型與變革的力量?打造綠色永續未來?AI面對的風險和影響又是什麼?

AI⁺ 技術論壇聚焦人工智慧/機器學習(AI/ML)技術,涵蓋從雲端到邊緣、從硬體到軟體、從演算法到架構的AI/ML技術相關基礎設施之設計、應用與部署,協助您全面掌握AI最新技術趨勢與創新,接軌AI生態系佈局,讓機器學習更快速、更經濟、更聰明也更有效率。

贊助廠商

發表評論

訂閱EETT電子報