下一代AI處理器需要48V供電

作者 : Maurizio Di Paolo Emilio,Power Electronics News & EEWeb主編

為當今的ASIC和GPU供電不是透過簡單更換元件增加功率就可以實現。從高壓電源開始,結合創新的架構與拓撲,並使用高效的高密度電源模組才是最有效的解決方案。

人工智慧(AI)處理器需要大量電力,但較低的能效將導致整個配電網路(PDN)的損耗增加。如何在保持效率的同時實現高品質的演算法執行?Vicor副總裁Robert Gendron在接受《EEWeb》採訪時指出,由於AI、機器學習和深度學習的加入,資料中心的伺服器機架功率已躍升了200%以上,達20kW。這促使Vicor重新評估其PDN能力,改用48V解決方案。但儘管重新設計解決了大電流PDN問題,卻也為電源轉換帶來了新的挑戰。

PDN需求飆升

供電和電源效率已成為大規模運算系統中最大的問題(圖1)。隨著處理複雜AI功能的ASIC和GPU的出現,業界已經見證了處理器功耗的急劇攀升。在大規模學習和推理應用部署中,AI能力不斷增加,伺服器機架電源需求也成比例成長。在大多數情況下,由於新型CPU消耗的電流持續增加,供電成了運算性能的限制因素。最佳電力傳輸方案不僅對電力分配有一定要求,還對效率、尺寸、成本和散熱性能有嚴格要求。

 

圖1:CPU/FPGA峰值電流的要求在逐步提高。

(來源:Vicor)

 

為了支援大量資料運算,傳統PDN需要承擔巨大的功率需求負擔,這對散熱管理也造成壓力。延長PDN系統纜線以降低電阻或提高工作電壓以降低電流是可用的兩種解決方法,為滿足不斷成長的功率需求,現代設計常採用後一種方法來更有效地滿足資料中心的嚴格要求。

「當前的電力需求遠遠超過傳統電力輸送網路的能力,」Gendron說,「改用48V架構並採用更創新的供電方法,這是提供高性能電源以滿足驚人AI/高效能運算(HPC)需求的唯一途徑。」

2015年,當處理器功耗開始急劇攀升時,主要由雲端運算、伺服器和CPU公司成員組成的開放運算計畫(OCP)聯盟也不斷改進其12V機架設計。具體而言,他們從電纜切換至母線架構,並在機架內部署更多12V單相交流轉換器,以最大限度地縮短PDN與刀鋒伺服器之間的距離並減少電阻。其中最主要的變化是,由於功耗增加,單相交流電從三相電源的各個相位傳送到機架,之後,在500A~1,000A處理器的資料中心中導入AI,這一舉措促使一些公司轉用48V配電架構。這將12kW機架的大電流PDN問題降低到了250A,但也為整個系統的電源轉換帶來了新的挑戰。由於為刀鋒伺服器供電的PDN轉換到了48V,因此刀鋒伺服器端也需要進行電源轉換。但無論如何,從12V配電架構切換到48V可將輸入電流要求降低4倍,將損耗降低16倍。

48V架構應用

48V電源用於可充電備用電池系統,為電信設備供電。傳統上,這些系統使用的通用架構被稱為中間匯流排架構,它由一個隔離的非穩壓匯流排轉換器組成,用於將48V電壓轉換為12V,然後再饋送到一組多相降壓穩壓器,以處理12V的轉換,以及負載點(POL)調整。隨著AI處理器和CPU電流的增加,由於穩壓器和POL之間的PDN電阻,POL供電解決方案的密度成為AI應用中最關鍵的元素,PDN損耗是計算DC/DC穩壓器設計效率和性能的主要因素。

為了減少損耗,Vicor建議使用48V預穩壓模組(PRM),以及固定比率(1/K因數)的變壓模組(VTM)。這種專有架構可以最佳化每一級的性能。

PRM採用零電壓開關拓撲,而VTM採用專有的高頻正弦振幅轉換器(SAC)拓撲。VTM可以看作是一個DC/DC變壓器,電壓比為1/K,電流比為K。VTM提供高功率密度,部署位置可以盡可能靠近處理器。

VTM採用SAC拓撲,與多相開關及其相關電感相比,輻射低且頻寬窄。而且,由於單個VTM取代了六個多相開關級,它可以提供比多相設計更高的功率密度。VTM佔用空間小,完全滿足支持四通道記憶體的高階處理器佈局限制,不會佔用儲存子系統的佈局區域。

 

圖2:橫向供電。

(來源: Vicor)

 

大電流傳輸透過模組化電流倍增器(MCM)模組提供,這些模組可以靠近處理器部署在主機板上或處理器基板上。將電流倍增器佈置在基板上,不僅可最大限度降低PDN損耗,而且可以減少電源所需的處理器基板BGA接腳數量。LPD可以支援OCP加速器模組卡和客製AI加速器卡的供電需求和獨特尺寸。

 

圖3:垂直供電。

(來源: Vicor)

 

垂直供電(VPD)進一步消除了配電損耗和VR PCB面積消耗。它在設計上與Vicor橫向供電(LPD)方案相似,只是將旁路電容整合到電流倍增器或變換電流倍增器(GCM)模組中。

根據處理器電流的不同,工程師可以選擇LPD或者VPD。若採用前者,電流倍增器部署在同一基板的AI處理器旁邊,或直接部署在幾毫米之內的主機板上,這樣可以使PDN電阻降低到大約50μΩ。為了獲得更高的性能,VPD則將電流倍增器直接移到處理器下方,同時還整合高頻接地電容,這種類型的電流倍增器稱為變換電流倍增器。VPD可以將PDN電阻降至5~7μΩ,讓AI處理器充分發揮效能。

最大化AI處理器性能

圖4顯示了一個典型的Vicor高階AI處理器加速模組VR解決方案。Vicor VR由三個動力模組組成,包括一個模組化電流驅動器(MCD)和兩個電流倍增器,可以提供48VIN~0.8VOUT VR,並提供高達650A的連續電流和超過1,000A的峰值電流。這種供電水準就如同飛機的噴氣燃料,可確保AI處理器以最佳的時脈頻率運作,並最大限度提高性能。

 

圖4:該AI解決方案重點介紹了Vicor 48V直接負載VR解決方案,它支援高達650A的連續電流和超過1,000A的峰值電流傳輸。

(來源:Vicor)

 

Gendron說:「如果這些先進的AI應用沒有採用我們的技術,多相VR元件的數量將超過電路板尺寸,並且無法保持相同的封裝。此外,還可能因為雜訊過高而無法保持訊號的完整性。」

採用Vicor的NBM2317,可相容傳統的12V伺服器機架配電,同時為Vicor VR提供48V電壓。該12V到48V轉換器還可以「反」向運作,實現48V到12V的轉換。

傳統電源架構已無法應對現今高能耗的AI處理器,也無法將之應用於雲端運算中。Vicor的電源配置支援48V配電,並利用VR來滿足高階AI處理的需求。與CPU使用的傳統多相設計不同,Vicor解決方案專為在雲端伺服器中快速遷移的新型處理器而開發。

採用新方法為AI/HPC供電勢在必行。從雲端伺服器機架分配12V電源已不再可行,且為現在的ASIC和GPU供電不是透過簡單更換元件增加功率就可以實現。從高壓電源開始,結合創新的架構與拓撲,並使用高效的高密度電源模組,這才是最有效的解決方案。

(參考原文:Next-Gen AI Processors Need 48 V,by Maurizio Di Paolo Emilio)

本文同步刊登於《電子工程專輯》雜誌2021年8月號

 

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論