DPU市場一片混戰

作者 : 邵樂峰,國際電子商情(ESMC)

據IDC統計,全球運算力的需求每3.5個月就會翻一倍。在此驅動下,全球運算、儲存和網路基礎設施也在發生根本轉變,一些在通用CPU上不能得到很好處理的複雜工作負載開始轉向SmartNIC和DPU…

市場研究機構Dell’Oro的資料顯示,預計到2024年,智慧網卡(SmartNIC)市場規模將超過6億美元,佔全球乙太網路適配器市場的23%。而整體控制器和適配器市場將以7%的年複合成長率成長,其中25Gbps和100Gbps的銷售將是主要成長驅動力。

CPU不能承受之重

之所以能夠取得如此高的成長率,原因在於目前資料中心內部流量(也稱橫向流量)的年複合成長率都在25%以上,但與此同時,隨著SDN的增加,雲端伺服器會在CPU和軟體中使用很多SDN功能,使得高達30%的資料中心運算資源被分配用於連網I/O處理雲端資料。

坦率地說,如果聽之任之,這個問題隨著時間的推移只會越來越嚴重。

當前,以幾何級數幅度成長的連網埠速度,遠超摩爾定律和Dennard縮放比例定律(Dennard’s scaling)的運算週期速度,這種差距的存在使得伺服器中所有的CPU資源都將遭到擠佔,而無暇顧及應用級處理,降低了CPU利用率。如果是公有雲的話,需要把這樣的資源出售給客戶進行變現。但如果不能出售這些核心內容,雲端服務商就會賠錢,這是一個非常嚴峻的問題。

 

圖1:埠速度超過摩爾定律。

 

亞馬遜(Amazon)和微軟(Microsoft)這樣的一級雲端服務提供者在很多年前就意識到了上述問題的嚴重性,紛紛選擇卸載掉伺服器的連網功能,並將這部分工作轉移到SmartNIC上運作,以便釋放出更多的CPU核心,最佳化伺服器利用率,降低連網成本。

例如亞馬遜收購了一家名為Annapurna的新創企業,專門開發類似的元件和SmartNIC,並在2017年發佈了AWS Nitro;微軟先前也透過將FPGA整合到SmartNIC上去卸載伺服器的連網功能,並實現了數以百萬計規模的部署;VMware則宣佈將SmartNIC整合到VMware Cloud Foundation中的Project Monterey專案;而阿里雲的做法是在其神龍伺服器核心元件MOC卡中使用了專用的X-Dragon晶片,統一支援網路、I/O、儲存和周邊的虛擬化。

電信服務供應商則是另一大具有強勁成長潛力的市場,他們正考慮將SmartNIC從核心網整合到邊緣網,為NFV和AI推斷等應用提供服務。不過,並非每一家公司都擁有足夠的研發能力和人才儲備去部署SmartNIC,因此目前有80%以上的雲端服務供應商尚未採用SmartNIC。相比之下,二、三級的廠商們就更加需要現成且方便的SmartNIC解決方案——無需自行開發,只需隨插即用就可滿足資料中心的卸載、儲存和運算加速等需求。

數位基礎設施中的新物種

2020年10月,Nvidia將基於Mellanox的SmartNIC方案命名為資料處理單元(Data Processing Units,DPU),並將CPU、GPU、DPU稱為組成「未來運算的三大支柱」。

不過,需要指出的是,從SmartNIC變為DPU並非簡單的改改名字。為了在資料中心充分實現應用程式的效率,傳輸卸載、可程式設計的資料平面,以及用於虛擬交換的硬體卸載等功能是SmartNIC的重要部分,但只是DPU的最基本要求之一。要將SmartNIC提升到DPU的高度,還需要支援更多的功能,比如能夠執行控制平面,以及在Linux環境下提供C語言程式設計等。

說得再直白一些,DPU是針對資料中心的專用處理器,新增了AI、安全、儲存和網路等各種加速功能,將成為新一代的重要運算力晶片。它能夠完成性能敏感且通用的工作任務加速,更好地支撐CPU、GPU的上層業務,成為整個網路的中心節點。

當然,我們還是要佩服Nvidia執行長黃仁勳的「帶貨」能力,能讓DPU概念一炮而紅,吸引業內眾多競爭者紛至沓來。從海外的英特爾(Intel)、博通(Broadcom)、Nvidia、賽靈思(Xilinx)、Marvell、Netronome、Pensando、Fungible、Dream Big Semiconductor,到中國的DPU創企中科馭數、星雲智聯、大禹智芯、芯啟源、雲豹智慧,每一家企業都在摩拳擦掌,躍躍欲試。

從Nvidia公佈的DPU產品藍圖來看,BlueField-3/3X和BlueField-4將分別於2022年和2023年問世,屆時,將可提供400TOPS的AI運算力和400Gbps的頻寬性能,從而解放GPU,只在單晶片DPU上就可實現網路、儲存、安全等關鍵任務的加速工作。

Marvell今年6月最新推出的OCTEON 10系列DPU,採用了Armv9架構的Neoverse N2 CPU核心和台積電(TSMC) 5nm製程,支援最新的PCIe 5.0 I/O與DDR5記憶體。作為DPU的重要補充,Marvell還為OCTEON 10引入了內部機器學習(ML)引擎。這樣,從本質上講,Marvell正在成為Nvidia的直接競爭對手。

英特爾在2021架構日上推出的全新基礎設施處理器(IPU) Mount Evans其實也值得一提。依照英特爾的官方說法,IPU是一種可程式設計網路設備,擴展了英特爾的SmartNIC功能,旨在使雲和通信服務提供者減少在CPU方面的開銷,並充分釋放性能價值。利用IPU,雲端營運商可以將基礎設施任務卸載到IPU上,更大化實現CPU利用率和收益;客戶則可以透過一個安全、可程式設計、穩定的解決方案更好地利用資源,使其能夠平衡處理與儲存。

再回到中國。根據Canalys Cloud Channels Analysis預測,到2023年,中國DPU市場規模將達人民幣190億元。當然,還有其他分析機構的預測更加樂觀,認為中國DPU市場規模預計將在2025年超過37億美元,約人民幣240億元。

有產業人士表示,未來,用於資料中心的DPU量級將達到和資料中心伺服器等量的等級。「每台伺服器可能沒有GPU,但一定會有一塊或者幾塊DPU/IPU卡,這將是一個千億量級的市場。」作為數位基礎設施中的新物種,火熱的DPU賽道未來會走出怎樣一波行情,值得期待。

本文原刊登於國際電子商情網站

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論