蘋果M1 Pro/Max性能「震撼」的秘密

2021-10-29
作者 Challey,EE Times China

蘋果M1 Pro和M1 Max處理器超強的性能足以「震撼」整個PC界。雖然其CPU性能比M1提升僅70%,GPU的速度提升最高達到4倍,NPU的速度提升3倍,但這些都不足以說明M1 Pro/Max的「震撼」……

日前,蘋果(Apple)發佈了M1 Pro和 M1 Max處理器,其超強的性能足以「震撼」、整個PC界雖然其CPU性能比M1提升僅70%,GPU的速度提升最高達到4倍,NPU的速度提升3倍,但這些都不足以說明M1 Pro/Max的「震撼」。因為目前的性能都是蘋果自己所說而不是實測,且蘋果每發佈新一代處理器,官宣其性能都是動輒比上代提升40%以上。那真正讓PC界震撼的是什麼呢?蘋果的每一代新處理器性能強勁的秘密是什麼?

來看看M1 Pro和M1 Max的系統架構圖:

 

 

 

在架構圖上看到的最大的數字是33.7billion和57billion。沒錯,真正讓PC界「震撼」的其實是電晶體數量:M1 Pro的電晶體數量達到337億,M1 Max更是達到恐怖的570億。

誰是電晶體數量最多的晶片?

Graphcore第二代IPU GC200:594億

在此之前,電晶體數量最多的處理器是英國AI公司Graphcore於2020年7月發佈的第二代IPU GC200,採用7nm製程,電晶體數量達到594億,是10月19日前,無論是手機、PC界還是伺服器界,迄今為止電晶體數量最多的單一處理器。這是目前AI處理能力最強的處理器之一,其價格是三萬美元起。

 

 

2019年,Graphcore CEO Nigel Toon參加第二屆「全球CEO峰會」時曾表示:「將來他們可能會在英國構建第一個能夠和蘋果或者阿里巴巴媲美的大規模企業。」

Graphcore公開了基於GC200處理器的IPU-M2000的應用性能。Benchmark顯示,相比NVIDIA A100,在IPU-M2000上,ResNet的傳輸量提升了4倍,ResNeXt的傳輸量提升了5.4倍,EfficientNet的傳輸量達到18倍,Deep Voice 3達到了13倍。

2021年10月22日,Graphcore發佈了迄今為止最大型的最新產品IPU-POD128和IPU-POD256,分別能夠提供32 petaFLOPS和64 petaFLOPS的AI運算。

阿里巴巴平頭哥倚天710:600億

當然,阿里巴巴平頭哥在10月19日舉行的2021雲棲大會上,發佈了基於Arm架構的自研雲晶片「倚天710」,採用5nm製程,單晶片可容納高達600億顆電晶體。這應該是目前電晶體數量最多的單一處理器,其處理能力也非常強勁,當然,「這款晶片不出售,主要是阿里雲自用。」阿里雲智能總裁、達摩院院長張建鋒表示。倚天710造價估計遠超Graphcore的第二代IPU GC200。

 

 

電晶體數量=處理器性能?

根據摩爾定律:IC上可容納的電晶體數量,約每隔兩年便會增加一倍,同時處理器的性能也會成倍增長。儘管最近幾年,IC晶片界,特別是Inel CPU的擠牙膏式升級,讓大家認為摩爾定律似乎也停滯了。不過,總體來說,目前為止摩爾定律一直都是有效的。

 

 

在處理器內部,電晶體數量正比於邏輯閘數量,也正比於電路複雜度。如果新一代處理器單位面積電晶體數量翻倍,那麼這一代處理器的核心數量就可以加倍,性能也會相應提高,其製造成本也會降低。

在目前通用的連續處理器架構下,業界基本認為處理器性能與電晶體數量成正比。但是,也並不完全認同這一說法。CPU性能並非僅與電晶體數量有關,還與主頻、製程、架構、流水線長度等有關係。

一個最經典的例子就是Intel Pentium 4 (P4),P4時代的時候Intel一味追求主頻,導致流水線過長並且功耗巨大。被當時的K8壓在地上摩擦。

在同一時代,同一製程下,也電晶體數量也並非越多越好。用AMD的Ryzen 7 1800X和Intel 的i7 6900K,兩個性能不相上下的CPU來進行對比:1800X和6900K的性能不相上下,而且二者都是14nm製程。Ryzen 7全系都是192mm2,48億電晶體。而i7-6900K為246mm2,34億電晶體。這是因為AMD在FinFET技術上還是比較落後,這也證明電晶體數量不能決定一切。

從上面的對比來看,處理器性能的確與電晶體數量有關,但似乎單位面積的電晶體數量並不是影響CPU性能關鍵。電晶體數量也並非越多越好。處理器性能與電晶體數量、頻率、高速匯流排,以及現在的GPU和NPU都有關係。

M1 Pro/M1 Max及A系列性能分析

筆者統計了蘋果自開始公佈電晶體數量以來的主要處理器的性能及參數,見下圖:

 

蘋果系列處理器性能分析。

 

性能參數。

 

蘋果處理器各資訊。

 

 

其中,M1 Pro/Max提升的對比對象均為M1。

當然,在A系列處理器,蘋果還發佈了A8X等AnX處理器,有時候性能比An+1還強,那些處理器主要是配備在iPad系列上。

蘋果在發佈新一代處理器時,一般會官宣其CPU、GPU、NPU(A11開始)的性能會比上一代提升多少,偶爾還會與業界同行處理器進行比較,其性能提升一般都是30~40%以上。筆者用特定演算法針對CPU、GPU、NPU的性能提升進行了處理,得出了一個有關處理器的整體綜合性能提升情況分析(見上表中的「比上代綜合性能提升」)。從這裡發現處理器綜合性能的提升確實與電晶體數量的增長比率成正比。

結語

2013年的Haswell是Intel最後一次透露電晶體數目的CPU,其4核心的型號是14億。與Intel恰恰相反,自A7開始,蘋果每發佈新一代,都要「大張旗鼓」的宣佈其電晶體數量增加了多少,其性能提升了多少,雖然有其行銷的成分在裡面,但綜合分析來看,沒錯,蘋果處理器性能強勁的「密碼」就在於電晶體數量的不斷增加。

當然,其不斷升級的製程和縮小的面積,還有功耗的降低也是蘋果處理器性能強勁的原因,同樣還離不開各種輔助處理器、GPU、NPU、不斷提升速度的統一記憶體(M1 Pro 200GB/s, M1 Max 400GB/s),以及整體架構的最佳化,更重要的是還有其自家的iOS或者macOS系統最佳化。

蘋果M1 Pro 和 M1 Max處理器的推出,對整個桌上型處理器市場將帶來長遠的影響,對Intel和AMD也會帶來不小的衝擊。

基於M1 Pro/Max非常可期的市場預期,三星、Intel、台積電已經展開對蘋果處理器代工的激烈爭奪戰。更重要的是,M1 Max的電晶體數量級已經達到了Graphcore第二代IPU GC200和阿里平頭哥倚天710伺服器處理器500~600億的水準。因此,蘋果M1 Pro/Max之後,其不斷提高電晶體數量進而提升性能的新處理器,對伺服器市場的衝擊也將逐漸出現。未來,不同於針對普通邊緣運算的嵌入式小處理器的大邊緣運算處理器市場也將會很快出現。

本文原刊登於EE Times China網站

 

 

 

 

 

 

活動簡介

從無線連接、更快的處理和運算、網路安全機制、更複雜的虛擬實境(VR)到人工智慧(AI)等技術,都將在未來的每一個嵌入式系統中發揮更關鍵功能。「嵌入式系統設計研討會」將全面涵蓋在電子產業最受熱議的「智慧」、「互連」、「安全」與「運算」等系統之相關硬體和軟體設計。

會中將邀請來自嵌入式設計相關領域的研究人員、代表廠商以及專家,透過專題演講、產品展示與互動交流,從元件、模組到系統,從概念設計到開發工具,深入介紹嵌入式系統設計領域的最新趨勢、創新和關注重點,並深入分享關於嵌入式系統設計的經驗、成果以及遇到的實際挑戰及其解決方案。

贊助廠商

發表評論

訂閱EETT電子報
論壇動態