比蘋果M1更「牛」的晶片即將誕生?

作者 : 黃燁鋒,EE Times China

蘋果M1證明了Arm也能用來開發高性能處理器,但並不意味著其他同在Arm陣營的企業有這種能力。和蘋果存在直接競爭關係,且同處Arm陣營、市場表現較出色的應該就是高通了:無論是在手機處理器,還是在PC處理器上。

蘋果(Apple) M1作為Arm之光,似乎已經成為很多晶片廠商的噩夢。它不光是英特爾(Intel)、AMD的噩夢,也是高通(Qualcomm)、聯發科(MTK)這類廠商的噩夢,因為它刷新了晶片的單核心性能與IPC,整體還能保持很低的功耗。Timothy Donald Cook最近還偷偷潛入蘋果總部,偷偷把M1從MacBook身上搬到了iPad與iMac內部。

有關M1的剽悍能力,在先前的文章裡已多有介紹。簡單回顧蘋果自己宣傳中的資料:

 

 

這張宣傳圖橫軸代表CPU功耗,縱軸代表CPU性能。其囂張之處在於,一方面它沒有明確尺規和對比物件(常規傳統),另一方面則從圖中可見,在相同功耗下(如10W),其性能領先幅度遠高於競品——蘋果當前的宣傳數字是,同功耗下最高2倍性能領先。與此同時,僅需「25%的功耗」就達到傳統PC所能達到的峰值性能(筆者記憶中的說法,蘋果也許修改過陳述)。

雖然所謂的「競品」並未明確指出是哪一家的產品,但大抵上也就是指Intel的第十代或十一代Core處理器了。這張含糊不清的圖,幾乎已經到了無視摩爾定律和產業常規的程度,「在座的都是XX」——當然我們知道,具體數值並沒有蘋果宣傳中那麼理想,畢竟x86處理器仍有頻率方面的顯著「優勢」。

如先前探討性能詳情時所述,這張圖不僅狂勝Intel (Ice Lake/Tiger Lake)、AMD (Zen 2/Zen 3),也將高通(Snapdragon 8cx一代、二代)、三星(Mongoose)等Arm同陣營的其他市場參與者遠遠拋在後頭。似乎在未來很長一段時間內,都很難再出現這麼囂張的能效比較資料了,直到Nuvia製作了另一張打臉蘋果的圖。

高通處理器性能有多高?

蘋果M1證明了Arm也能用來開發高性能處理器,但並不意味著其他同在Arm陣營的企業有這種能力。和蘋果存在直接競爭關係,且同處Arm陣營、市場表現比較出色的應該就是高通了:無論是在手機處理器,還是在PC處理器上。

單純從CPU核心的角度來看,高通目前的高性能核心實際上也就是Arm Cortex-X1,具體的晶片產品即Snapdragon 888——X1也代表了Arm自己目前的高性能核心微架構。

 

 

Cortex-X1實則表現出Arm有進一步朝高性能領域,包括PC、資料中心等市場進軍的意思(針對伺服器的Arm Neoverse V1高性能核心,正是Cortex-X1的改進版)。因為傳統Arm微架構普遍在低功耗方面做文章,比如Cortex-A系列IP是追求PPA性能、功耗和成本三方均衡;而Cortex-X1突破了這種傳統,首次在PPA三角中向性能偏移,並一定程度犧牲功耗和成本。

微架構層面,Cortex-X1在寬度上明顯加寬,雖然還沒到蘋果M1的Firestorm核心的程度,但比同代Cortex-A系列已經是規模上的擴展了,比如5-wide decoder前端,ROB條目增加40%,NEON寬度加倍,L2和L3快取(cache)容量加倍,Mop cache條目加倍。很多指標甚至比Intel的Sunny Cove (第十代Core)還要剽悍,Cortex-X1 IPC比Cortex-A77約提升30%。

30%的IPC提升仍然是相當出色的反覆運算數字。不過對PPA平衡的打破,也一定程度表示至少從核心層面來看,提升CPU單核心性能即便是Arm,也變得越來越有難度。

 

 

Cortex-X1的具體實現,主要包括了高通Snapdragon 888和三星Exynos 2100。上圖包含了AnandTech針對這兩顆處理器的SPEC2006性能測試資料,左邊的柱狀條代表跑完整個測試的能耗(越短越好,單位焦耳;其中柱狀條右邊的第一個數位表示平均功耗-單位瓦特-即單位時間內做的功),右邊的柱狀條代表性能成績(越長越好)。

無論是整數還是浮點測試,Cortex-X1的IPC提升基本符合Arm的預期(雖然三星和高通都未用到Arm為X1設計的頂級配備,比如僅一半容量的L3 cache),但Snapdragon 888,以及Exynos 2100)還是被蘋果A14(與M1一樣的Firestorm核心)領先一截,從能耗與性能的角度來看都是如此。實實在在地表現蘋果自身在高性能CPU核心設計方面的能力。

至於另一個方向,高通針對筆記型電腦的Snapdragon 8cx,這顆處理器在CPU核心層面還在用Cortex-A76 (高通客製版的Kryo 495),從系統層面加倍記憶體頻寬、提升晶片TDP,來提高其性能。但從已上市的筆記型電腦產品來看,在性能層面把Snapdragon 8cx可謂看不到蘋果M1車尾燈,無論多核心還是單核心性能,M1都是Snapdragon 8cx的2.2~2.5倍。應用Snapdragon 8cx的Surface Pro X,輕度辦公是夠了,但在更追求性能的生產力應用中,Snapdragon 8cx表現還是比較悲慘。

雖然以上內容更多探討了手機、筆記型電腦這樣的行動領域,但核心本身很多時候是在不同應用領域共用的,只不過會有頻率、cache、規模方面的彈性擴展。現階段,高通是很難拿出在性能上能和蘋果抗衡的處理器,單純從性能的角度來看,即便有新推的Arm Neoverse,其單執行緒、每核心性能也依然達不到x86處理器的水準(雖然資料中心的很多應用可能並沒有那麼看重單核性能,而且Neoverse有功耗方面的優勢)。

促使高通收購Nuvia

高通在Snapdragon 820之前一直有自行研發微架構的傳統,像如今的蘋果一樣,即基於Arm指令集進行自有微架構的嘗試。不過這個動作從Snapdragon 835開始便停止了,自2017年之後,高通在Snapdragon處理器的CPU之上,就採用Arm「公版」核心IP、放棄自行研發微架構了。

這與當時的多種因素相關,可能包括早期Kryo架構(Snapdragon 820/821)在路線上走偏(過於注重浮點性能,以及功耗崩邊致最終產品規格被砍等問題),Arm後期針對核心IP授權模式越來越靈活(表現在可半客製,或更多可選配置)。Arm自己的技術日趨成熟,以及高通當時在自身發展上也遇到了一些問題。

自行開發微架構之路沒那麼好走,三星Exynos處理器從自己研發架構的入門到入土(2016~2020)都沒有一款真正可拿得出手的作品。這也更能襯托蘋果晶片的厲害之處。

 

 

所以高通選擇了收購一家新創公司Nuvia,收購價格14億美元,並於今年3月完成收購。從宣佈收購到收購完成,也就幾周時間。高通收購Nuvia實在是順理成章的事,這家公司除了設計基於Arm的核心產品,該公司的人才亦令人相當眼饞。

Nuvia成立於2019年,創始人包括蘋果CPU團隊的前任首席架構師Gerard Williams;聯合創始人John Bruno之前也在蘋果和Google擔任過系統架構師。這兩人都有數十年的處理器設計經驗,另外加入這家公司的大神還有Manu Gulati,也是前Google與蘋果晶片團隊核心成員。

其中Gerard Williams不僅在Arm工作了12年,而且還曾領銜蘋果A系列晶片Cyclone (蘋果A7處理器CPU核心,iPhone 5S)、Typhoon (A8,iPhone 6)、Twister(A9,iPhone 6S)、Hurricane (A10的大核心,iPhone 7)、Monsoon (A11大核心,iPhone 8/X),以及Vortex (A12大核心,iPhone XS)架構的設計。2019年12月,蘋果狀告Gerard Williams,稱其違反合約,包括擅自創辦企業,以及挖角旗下員工——這類事件仍能說明Williams在業界的地位。

有關Nuvia旗下產品,很難找到什麼細節。為數不多的線索就是Nuvia發佈的幾篇部落格文章——且可料想後續看不到Nuvia更新更新部落格了。從Nuvia最後一篇更新的文章可見,下一篇原本是打算談更多晶片功耗管理方面的技術,可能會提及Nuvia相關技術;被高通收購後,就要依循高通在相關技術公開方面的策略了。

Nuvia實際的晶片產品尚未問世,而在上個月的高通發佈會上,高通提到「首個搭載高通全新內部設計CPU的高通Snapdragon平台,預計將在2022年下半年出樣,設計上針對高性能Ultrabook產品。」換句話說,Nuvia為高通貢獻的Arm自行開發架構處理器最早可能會在2022年問世。

不過Nuvia這家公司原本著力的方向是資料中心伺服器處理器。如前所述,去年8月這家公司畫了一張比蘋果M1更囂張的圖,如下:

 

 

這張圖橫軸同樣代表功耗,縱軸代表單核性能(Geekbench 5測試性能)——大致上與前面蘋果呈現那張圖的維度是類似的。這張圖中,紫色、藍色、綠色那幾條比較平緩的曲線,是Intel和AMD近代的處理器產品,包括Intel第十代Core的Sunny Cove核心、AMD Zen 2核心等。

而紅色、黑色、灰色那三條曲線分別代表高通Snapdragon 865 (Arm Cortex-A77)、蘋果A12X (Vortex)、蘋果A13 (Lightning)。最左側那條深藍色輻射狀「曲線」就是Nuvia的Phoenix核心(據說畫成這個形狀,是為了將來再揭曉具體數值)。不管這個表達方式有多奇特,在Nuvia標定的深藍色區間內,隨便勝過蘋果前幾代晶片產品CPU性能和功耗是沒問題的。

 

 

雖然圖中沒有加入蘋果M1/A14 (Firestorm),也沒有加入最新的AMD Zen 3和Intel Tiger Lake (第十一代Core,事實上Intel最新的Xeon伺服器處理器就是十代Core的Sunny Cove核心),但查一查Firestorm的Geekbench 5性能測試就不難發現,Phoenix才是真正的全方位大勝。蘋果前員工創辦的公司,果然有蘋果公司的調性…

這張圖內含的訊息量也比較大,雖然Geekbench 5可能未必有那麼可靠:

第一,觀察高通Snapdragon 865 (紅色)與x86處理器(藍色、綠色、紫色)可發現,x86處理器在性能上高出不少,但付出了巨大的功耗代價(x86處理器核心頻率普遍很高)。在Geekbench 5測試中,x86平台以6~11倍的功耗,才達成了大約50%的性能領先。這一點算是符合預期,功耗和性能的提升關係本來就不呈現線性。因此可推測,如果考慮提高Snapdragon 865的頻率,其功耗同樣大概也是會面臨崩壞。

第二,AMD和Intel是旗鼓相當的水準,雖說AMD近兩年有製程和核心數方面的優勢,但相比Intel的優勢並不算大(圖中未列出更新的Zen 3,在多核心性能上,AMD應該會有更大的優勢;另外,單純從微架構的角度來看,Zen也並沒有顯得多先進)。

第三,蘋果A系列晶片,在CPU性能上比高通Snapdragon晶片有顯著優勢,在CPU性能與x86平台持平或略高的前提下(請注意:是單核心性能),功耗有顯著優勢。

Nuvia認為,作為其主業,資料中心的伺服器SoC晶片如今對功耗也相當敏感,在限定功耗的問題上與行動SoC一致。且伺服器CPU的核心數目在增加,但TDP需要限制,則每個核心的功耗就必須有所限制。我們知道以Neoverse為代表的伺服器處理器架構,目標設計一顆處理器最多可以有128個核心,未來架構更新還會提升至192個核心。

依照晶片整體TDP限定在250~300W,以及CPU週邊功耗10~120W,每個核心可以分配到1~4.5W功耗。上圖就是Nuvia用所謂的架構性能模型技術,規劃出來的Phoenix核心性能表現。Nuvia在部落格文章中提到,其CPU核心性能是競品的2倍,而且還在1~4.5W這個TDP區間內。

產生這張表的測試方法,有興趣的讀者可以去看一看Nuvia的部落格。我們無從瞭解Nuvia如何達到這個性能和效率水準,或者最終產品是否真的能達到宣稱的水準。相關具體的說明,其部落格只透露了這樣幾段話:

「Nuvia專注於開發一款提供產業領先性能,且最高效率的SoC。為了達成這一點,我們以一種全新的方式打造了一款伺服器CPU,為CPU流水線做出了全面變革。」

「雖然市場還會有更多的成長空間(指在Amazon Graviton問世以後),但市場核心對於特定TDP之下的最高單執行緒性能與全核心性能,有著很明確的需求。對於絕大部分需求大規模集群的客戶而言,這是提升性能與成本之比(Performance/TCO,TCO即擁有權總成本)的最快方法。」

「我們採用了不同的方法,以沒有累贅的CPU設計,提供性能和功耗的優雅平衡,最大化記憶體頻寬和核心利用率。我們的解決方案不需要增加額外的核心來彌補單執行緒性能不足的缺陷。與此同時,也不需要採用市場上吹噓的增加頻率的方式——由於TDP限制,這樣的頻率在伺服器SoC的真實應用中根本無法達到。」

 

 

值得一提的是,這項測試比較顯著的一個有可吐槽的點是測試工具選擇了Geekbench 5。這個工具一方面並不是針對伺服器處理器,另一方面其測試項也伴隨較大爭議;通常認為SPEC才更具備涵蓋伺服器使用場景的代表性,從編譯到AI到天氣預測應用等。不過Nuvia特別撰寫了一篇文章來闡述Geekbench 5和SPEC的區別,以及說明採用Geekbench 5的合理性。

例如他們實測認為,Geekbench與SPEC測得的成績基本上是同步的,較少存在某款處理器一個測試分數很高,而一個則很低的情況。它們的關係接近線性,如上圖所示;甚至用這種關係,得知某個測試的分數後,就能推測另一項測試的分數,準確率還頗高。

Windows筆記型電腦是第一目標

從Nuvia幾名大老的從業經驗來看,以上這些說法有更大的概率是可靠的。高通亦極有可能借助收購Nuvia,在未來針對不同領域的產品中再度採用自己開發的微架構處理器,以取得技術上的新一輪優勢。

Nuvia融入高通後,似乎暫時將不再從事伺服器CPU的研究。先前高通接受採訪時提到,收購Nuvia是為了填補這麼多年來IP設計的空白,因為這些年高通一直在採用外部的IP,如Arm的Cortex核心;而Nuvia當前最直接的目標是設計針對Windows筆記型電腦的Snapdragon SoC晶片(Intel再度成為目標)。

另外,伺服器和企業市場並非收購Nuvia的直接目標;且長期規劃尚未完全敲定。高通在今年1月發佈的新聞稿中提到將針對不同的市場,融合Nuvia的CPU技術與內部的各種加速處理器產品,智慧手機、ADAS、AR、網路基礎設施、筆記型電腦等應用均在其列。可以預期明年到後年,Nuvia的設計進入市場,這些領域的處理器市場又要熱鬧很久了。

本文原刊登於EE Times China

 

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論