以48V PDN因應AI時代資料中心配電挑戰

作者 : Phil Davies,Vicor公司

以資料中心為例,人工智慧(AI)、機器學習和深度學習的加入,使機架功率迅速上升了兩倍,達到20kW範圍,而超級電腦伺服器機架則已接近100kW或更高。

配電網路(PDN)是所有電源系統的主體。隨著系統電源需求的不斷上升,傳統 PDN 面臨提供足夠效能的巨大壓力。就功耗和熱管理而言,主要有兩種方法可以改善 PDN 對電源系統效能的影響:一是使用更大纜線、連接器和更厚主機板電源層(power planes)以減少 PDN 電阻;二是在既定的傳輸功率下提高PDN電壓以減小電流,這允許使用更小的纜線、連接器和更薄的主機板銅箔電源層,從而可縮減相應的尺寸、成本和重量。

多年來,工程師們一直使用第一種方法,因為該方法與數十年來為單相AC及12V DC-DC轉換器及穩壓器建構的大型生態系統相容。其他原因還包括DC-DC轉換器拓撲效能不足,無法有效率地將更高電壓直接轉換為負載點(PoL)電壓,以及這些高電壓轉換器及穩壓器的高昂費用等。

然而,現代電源設計越來越多使用第二種提高PDN電壓的方法;這一趨勢的推動力源於系統負載功率的顯著提升的需求。以資料中心為例,人工智慧(AI)、機器學習和深度學習的加入,使機架功率迅速上升了兩倍,達到20kW範圍,而超級電腦伺服器機架則已接近100kW或更高。

 

理想的負載點電源系統。穩壓器在Vin=Vout時提供最高效率。大電流低電壓在供電最接近負載點時效率最高,從而可最大限度降低 I2R 損耗。

 

這一電源需求的成長促使系統工程師對其整個PDN進行了重新評估,從機架到機架內部的配電,乃至刀鋒伺服器上的PDN,無一例外,因為現代CPU和AI處理器功耗更大。機架功率為5kW水準時,單相AC到機架是最常見的,再將AC轉換為12V,配送到刀鋒伺服器。功率為5kW時,PDN電流為416A (5kW/12V),配電則透過大徑值纜線進行。

處理器功率大約從2015年開始急劇上升,機架電源上升到了12kW,所以必須在12V PDN的機架內對1kA電流進行管理。OCP聯盟成員主要包括雲端運算、伺服器和CPU業者,該聯盟持續開發精進其12V機架設計。OCP機架從纜線轉移到了匯流排(Bus Bar),並在機架內分配多個單相AC至12V轉換器,以最大限度縮減機架到刀鋒伺服器的PDN距離以及阻抗。與以往機架供電的主要改變是其中的單向交流電是取自三相交流電中的單相而來。

能夠自主建構自有機架及資料中心解決方案的公司開始轉而採用48V配電,此一策略將12kW機架的大電流PDN問題削減到了250A,但刀鋒伺服器的功率轉換卻也帶來了新的難題。

傳輸大電流的「最後一吋」(Last Inch)優點,為高功率處理器障礙提出了新挑戰。Vicor 的技術不僅解決了這個問題,而且還可簡化主機板設計。

 

機架電源超過20kW的範圍時,伺服器機架PDN設計須不斷精進發展。人們為了維持12V原有系統的設計,在許多方面都得有所創新;但資料中心導入的AI處理器穩態電流超過1kA、峰值電流接2kA時,就會讓基於12V傳統的PDN不切實際。AI的核心是效能,12V PDN則會限制效能和競爭力。

為了解決高功率機架的諸多難題,OCP 聯盟正朝著可運用48V PDN的機架發展。從12V配電轉向48V,可將輸入電流需求降低4倍(P=V×I),將損耗銳減16倍(功耗= I2R)。此外,汽車、5G、LED 照明和顯示器市場以及工業應用,也在朝48V配電轉型。因此48V 電源轉換器生態系統正在迅速發展,轉用48V有很好的商業意義。但不是所有的48V轉換器拓撲及架構都相同,48V轉換器市場效能參差不齊,這是一個值得仔細考慮的現實情況。

由於高效能和電源效率位居高功率機架及資料中心需求的榜首,有幾家公司正在採用三相AC 至48V,為刀鋒伺服器配電。另外,也可使用機架內傳輸的高電壓DC (源自整流三相輸入的380V)。多家高性能運算(HPC)業者正在將HVDC PDN用於功率高達100kW的機架。

刀鋒伺服器供電的PDN轉換為48V時,主機板上的電源轉換也必須改變。這種轉變導致了DC-DC轉換器與穩壓器在架構、拓撲與封裝的多種選擇。

48V模式對於資料中心伺服器而言還很陌生,但在路由器和網路交換機等通訊應用中卻很普及,因為它們使用可充電的-48V鉛酸備用電池系統。資料中心伺服器中以前使用的通用架構叫中間匯流排架構(Intermediate Bus Architecture,IBA)。IBA包括隔離式非穩壓匯流排轉換器,可將-48V轉換為+12V,提供給一系列多相降壓穩壓器,用於負載點。一些雲端運算公司和HPC業者最初為其48V系統複製了這一架構,但在功率增加而PoL電壓降至1V以下時,設計人員開始尋找可替代的架構和拓撲。

電源系統架構、開關拓撲和封裝散熱對於高效能高密度設計而言非常重要。隨著AI及CPU處理器電流的增加,由於穩壓器和PoL之間的PDN電阻影響,PoL處的功率傳遞電路密度成為AI應用中最關鍵的元素。

業界一流的最新AI處理器具有大約1kA的穩態電流需求,峰值電流達1.5kA至2kA。考量到處理器多相降壓穩壓器輸出的典型PDN電阻在200至400μΩ之間,所帶來的PCB功耗為穩態(P = I2R) 200至400W,對於任何系統來說,都太高了,根本無法處理。

PDN損耗成了DC-DC穩壓器設計效率及效能的主導因素。這是一個負載點問題,而且提高電壓根本不切實際(PoL電壓正在快速下降,以維持摩爾定律的有效性),因此唯一可行的方法是減少PDN電阻,讓穩壓器儘可能靠近處理器。在多相降壓穩壓器的案例中,通常會使用16至24個相位,才能支援AI處理器所需的大電流。這不是一種高電流密度方案,無法解決PDN功耗問題。

 

分比式電源架構

IBA的替代方案是Vicor的分比式電源架構(Factorized Power Architecture,FPA),它包含前置穩壓級(pre-regulation stage,PRM) 和緊隨其後的變壓級(voltage-transformation stage,VTM);此專有架構可最佳化每個階段的效能。PRM執行非隔離──48V為安全超低電壓(SELV)穩壓──其48V輸入經過嚴格穩壓,可提供準確的48V輸出,所需的PoL電壓在VTM中轉換,VTM是一款固定比例(fixed ratio)轉換器,輸出電壓為輸入電壓的固定比例。

MCM 模組能夠提供大電流並緊靠著處理器佈署,可以在主機板上,也可以在處理器基板上;這種近距離佈署不僅可最大限度降低PDN損耗,而且還可減少電源所需的處理器基板BGA接腳數量轉作其他用途。

 

這種架構及其效能都可透過PRM及VTM中使用的專有拓撲增強。PRM使用零電壓切換拓撲,VTM則使用專有高頻諧振正弦振幅轉換器(SAC)拓撲。轉換為PoL電壓都是使用零電壓和零電流切換。

VTM實際上是一款DC-DC變壓器,電壓以1/K的比例降低,電流則按K因子(K factor)增加;VTM也叫電流倍增器(current-multiplier),是一種高電流密度 PoL 轉換器(新產品目前可達到2A/mm2)。它可緊靠著處理器佈置,因為它採用創新ChiP封裝技術並支援高密度整合磁性元件。

這種位準的高電流密度可為設計人員提供極大的靈活性。工程師可根據處理器電流,在橫向供電或縱向供電(LPD及VPD)之間做出選擇。在LPD (lateral power delivery)中,電流倍增器佈置在AI處理器的幾公釐(mm)範圍內,可在處理器基板上也可以在主機板上,從而可將PDN電阻降至大約50μΩ。

縱向供電(VPD)可進一步消除配電損耗及VR PCB板面佔用空間。VPD與 Vicor LPD解決方案類似,在電流倍增器或 GCM 模組中則更整合了對旁路電容。

 

為了進一步提高效能,VPD (vertical power delivery)將電流倍增器移到了處理器的正下方,在那裡其輸出功率引腳點陣圖與其上方的處理器電源引腳的間距和位置吻合。此外,電流倍增器封裝還整合高頻大容量電容器,其一般位於主機板或基板上的處理器的正下方。這種電流倍增器簡稱為(Geared Current Multiplier,GCM)。VPD可將PDN電阻降至令人難以置信的5至 7μΩ從而可幫助AI處理器實現其真正的效能極致。

對於如此複雜的電源問題,一個整體的設計方法才能確保獲得成功的高效能結果,需要對架構、拓撲以及封裝進行創新,才能因應最艱鉅的電源挑戰。提高PDN的電壓可解決大量系統效能挑戰。降低PDN電阻是開啟新一代HPC電源大門、兌現AI承諾的關鍵。

 

本文中文版由Vicor公司提供,並同步刊登於《電子工程專輯》雜誌2002年4月號

 

掃描或點擊QR Code立即加入 “EETimes技術論壇” Line 群組 !

 EET-Line技術論壇-QR

發表評論