超微半導體(Advanced Micro Devices;AMD)在近日舉行的‘Next Horizon’大會上推出專為資料中心打造的首款7奈米CPU和GPU。相形之下,英特爾(Intel)目前最新一代Xeon處理器仍採用14奈米,輝達(Nvidia)目前的Volta GPU則採用12奈米FFN技術製程。

AMD並未透露太多該新晶片及其性能的相關細節。然而,業界分析師普遍看好該公司可望延續自2016年底推出首款14奈米Zen晶片以來的成長動能。

AMD總裁暨執行長蘇姿豐(Lisa Su)在媒體和分析師活動上表示,AMD持續專注於高性能,並正全力投入資料中心的發展,著眼於未來主導這一領域。

她展示以一顆7奈米EPYC x86處理器進行渲染任務的性能,要比起採用雙插槽的英特爾Skylake Xeon系統性能更強。此外,在一項推論任務展示中,AMD的7奈米Vega GPU基準測試比分也與Nvidia V100旗鼓相當。

新創公司Highwai展示採用AMD 7奈米Vega執行於其人工智慧(AI)模擬軟體,以實現自動駕駛計程車導航功能。該公司首席技術專家兼共同創辦人Raul Diaz也表示,AMD的晶片大致上相當於Volta GPU。

但他說:「我們還沒有時間進行任何系統級的比較。」他指出,AI訓練才是最需要更高性能的應用。

AMD Epyc and Vega EPYC (左)和Vega都採用多晶片封裝技術(來源:AMD)

AMD於去年5月推出的現有14奈米EPYC,將該公司在x86伺服器市場原本僅佔0.5%的佔有率提高到1.5%。市調機構國際數據公司(IDC)半導體研究副總裁Mario Morales表示,隨著AMD的客戶關係重新步入軌道,7奈米版本可望有助於AMD在2019年中期推動其x86伺服器市佔率更上層樓。

IDC運算半導體研究副總裁Shane Rao表示,今年第二季,基於Zen的x86晶片已經將AMD的整體微處理器單元(MPU)市佔率提高到9.23%了,高於2016年第二季的7.43%。從營收來看,IDC估計AMD的處理器佔有率在同期間也從2.64%成長到5.3%。不過,英特爾的x86業務仍持續主導這兩類市場的所有架構,其市佔率超過90%。

AMD持續積極利用創新封裝技術,以提供更低成本的EPYC。單個模組包括多達8個7奈米處理器晶片,並以AMD的Infinity Fabric連接至帶有記憶體控制器的單個14奈米I/O晶片。這一途徑擴展了14奈米EPYC在單一封裝上堆疊四顆晶片的封裝方式。

AMD首席技術專家Mark Papermaster說:「對於14奈米EPYC而言,一顆較大晶片的成本將會增加1.7倍......類比I/O的擴展性又不如數位邏輯,因此這部份持續沿用14奈米技術即可......其他的也將採取類似的方法。」

包括Moor Insights & Strategy的Patrick Moorhead等分析師均表示認同。

Moorhead說:「我認為這是整個晶片產業的未來,特別是當製造大型單晶片變得越來越困難,也越來越昂貴了。產業的下一步將是採用2.5D和3D封裝,讓這些晶片彼此堆疊在一起。」

7奈米EPYC代號為Rome,是第一款使用PCIe Gen 4的x86伺服器處理器。相較於英特爾目前的高階伺服器晶片採用96通道,它可以支援多達128個互連通道。

Rome包含多達64個雙執行緒Zen 2核心,數量是使用第一代Zen核心的14奈米Naples晶片的兩倍。這些晶片和下一代Milan都將適用於相同插槽,因此廠商無需再設計新的主板。

AMD表示,Rome的傳輸速率是Naples的2倍,浮點性能更高4倍。然而,AMD並未提供目標資料速率、具體基準比分或有關該晶片的其他詳細資訊。不過,該晶片預計將在2019年正式推出。

AI運算:Vega vs Volta

AMD一方面以7奈米EPYC架構展示與英特爾Xeon伺服器晶片的比較,同時也針對機器學習和商用繪圖處理器提供直接競爭Nvidia Volta的替代方案。AMD Radeon繪圖技術事業群工程部資深副總裁王啟尚(David Wang)說:「產業需要競爭。」

7奈米Vega GPU包含132億顆電晶體。與新款EPYC一樣,AMD表示7奈米Vega的性能較上一代14奈米晶片提高了25%。這款高階的MI60版本用於GPU運算,可支援64個運算單元、4,096個串流處理器,以及高達32GB的HBM2記憶體並支援PCIe Gen 4。

相較於其競爭對手Nvidia在其GPU上附加多重累積單元,AMD對於AI採取了不同的途徑,主要是在其所有的運算單元中,支援從4位元和8位元整數器增加到16位元、32位元和64位元浮點數學的格式,並使用混合精度的32位元累加器。

AMD資深產品經理Evan Groenke說:「我們想要的是一款高度靈活的加速器,而不是專用於FP16。」

其結果是使得這款晶片大約較Volta在最佳化之前的性能領先約7%,而面積還不到Volta的一半——Vega晶片尺寸331mm2 vs Volta晶片尺寸800+ mm2。Groenke強調,提高機器學習的性能並不需要使用大型專用晶片。

Vega vs Volta 平均而言,7奈米Vega在AI任務中的性能領先Nvidia Volta約7%

AMD表示,Vega能夠為AI訓練提供29.5Tera FP16的每秒作業性能。針對推論作業,它可為8位元整數提供59TOPS性能,針對4位元整數任務則可達到118 TOPS。

此外,AMD還在晶片上增加了硬體虛擬化功能。因此,一個7奈米Vega能支持多達16個虛擬機,或者一個虛擬機可以將其工作分成八個以上的GPU。

王啟尚說:「這就是我們差異化的一部份,而且是免費的。它搭配GPU一起推出,因而無需授權。」

雲端巨擘預計可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大約較MI60低10%,支援高達16GB的HBM2,將在明年4月之前推出。

Vega架構GPU加速卡的銷售將取決於AMD為GPU運算發佈的開放來源ROCm軟體應用。該公司已經發佈該程式碼的更新版本,現在可以支援更多的機器學習架構、數學庫、Docker和Kubernetes。

拉攏AWS服務互別苗頭?

在主題演講中,Papermaster介紹了7奈米Zen x86核心的改進。他並表示,採用台積電(TSMC) 7nm+製程的新晶片版本可望在2020年正式推出,它可能類似於AMD為其原始Zen元件提供的12奈米升級版。

Zen 2核心支援更新的分支預測器、更好的指令預取、更大的微指令(micro-op)快取和重新最佳化的指令快取。浮點暫存器和加載/儲存單元還倍增到256位元。

因此,AMD聲稱其7奈米x86晶片將在性能和上市時間方面領先英特爾的10奈米版本(英特爾預計要到明年底才能上市)。此外,該公司還增強其Infinity Fabric互連技術,但並未透露更多細節。

此外,由於AMD已經針對Spectre安全漏洞提供增補軟體,Zen 2處理器核心將在硬體層面完全防堵Spectre側通道攻擊。Papermaster說,該晶片也不至於遭受Meltdown或Foreshadow的攻擊。

AMD看好整體高達290億美元的資料中心市場,並持續取得更多市場動能,除了EPYC如今已廣泛用於百度(Baidu)、Dropbox、Microsoft Azure、Oracle和騰訊(Tencent),阿里巴巴(Alibaba)、百度和微軟也使用了AMD的GPU。

Lisa Su with Epyc Rome Lisa Su展示將在明年正式上市的7奈米EPYC

亞馬遜(Amazon)也成為AMD最新且最引人注目的客戶,AWS並宣佈採用EPYC的M5a、R5a和T5a計劃。AWS運算服務副總裁Matt Garman說:「我們希望支援每一項工作負載,而AMD是客戶感興趣的目標之一。」

英特爾也很快地回應表示其Xeon晶片已用於大部份的AWS案例,其中包括54項基於其最新Skylake晶片的服務。

分析師Moorhead表示,全球最大的雲端服務供應商提供EPYC,可說是當天活動的最大亮點,同時也證明了EPYC的實力。此外,他並補充說,從英特爾的快速反應也顯示一場x86領域的競賽將再次拉開。

編譯:Susan Hong

(參考原文:AMD Beats Intel, Nvidia to 7 nm ,by Rick Merritt)