從跑分看手機GPU這兩年發展

作者 : 黃燁鋒

恰逢高通和聯發科前不久都相繼宣佈了新品,是時候來看看如今的手機GPU相比2年前發展成了什麼樣…

去年初筆者曾過談手機GPU的發展現狀,到如今差不多2年過去了,行動GPU格局是否已經發生變化?或者說蘋果獨孤求敗的地位是否還在?恰逢高通(Qualcomm)和聯發科(MTK)前不久都相繼宣佈了新品,是時候看看如今的手機GPU相比2年前發展成了什麼樣。

 

 

主流行動GPU一覽

要做比較,自然要先明確對象。今年這個時間點的對比物件仍相當明確,本文分別取主流手機SoC的近兩代GPU,則其名稱和配置大致如下:

 

 

Imagination的GPU IP雖然有出現在展銳虎賁T710晶片上,但其高階IP並不見於主流旗艦智慧型手機產品,所以此處未列出Imagination的產品。華為則因為眾所周知的原因,自去年發佈麒麟9000晶片後便再未有新品更新,所以這個比較或許對華為而言沒那麼公平。

Google是最新加入戰局,今年為其Pixel 6手機推出了自家的Tensor晶片,這顆晶片實際上是Google和三星(Samsung) LSI的合作產品。

聯發科、華為、三星的手機SoC所用GPU IP都來自Arm (以及最新加入的Google);蘋果(Apple)和高通都用自家的GPU IP,不過蘋果GPU基因較大程度沿襲自Imagination。值得一提的是,三星和AMD之前已經達成合作,可能明年的三星Exynos晶片上就能看到AMD GPU的成果。

請注意,本文只專注於GPU的繪圖性能,而不探討AI性能——像高通Snapdragon這樣的晶片,也著力於強調GPU對AI加速的協助。

先看各家的紙面數字

行動GPU的紙面數字其實沒什麼好看的,包括核心、頻率等都極大程度受到架構的影響。比如Arm Mali系列GPU核心這麼多,麒麟9000所用的Mali-G78用上了頂配的24個核心;而蘋果和高通Adreno GPU的核心都是個位數;這種對比就顯得沒有意義。

行動GPU產品中,Arm Mali的架構透明度還相對大些,高通和蘋果的GPU幾乎不對外披露任何架構層面的技術細節。不過從隔代性能、效率提升,多少還是能有一些簡單的認知。

 

 

先說說Arm Mali。上圖產品表中,這兩年Arm Mali家族出現最多的是Mali-G77和Mali-G78,明年預計Mali-G710將問世。這3代GPU IP實則都屬於同一個架構,Arm也是從Mali-G77開始推行這種Valhall架構,Valhall架構除了在ISA方面的改進,還包括執行引擎的變化,warp size拓寬到16-wide,每個執行引擎兩條資料通路。

Mali-G77發佈的時候,筆者曾預測Arm Mali GPU將有機會改變性能孱弱的現狀,甚至趕上並超越高通。像麒麟9000這種將Mali-G78堆滿核心(24核心)的SoC的確在性能上開始逐步趕超高通Adreno GPU,但實際情況會更複雜。

事實上之前G72 -> G76 -> G77 是兩次比較大的性能躍進,也是追趕高通的幾代重要產品。而G78相比G77的變動其實不大,屬於原有架構的改款。不過G78支援的最大核心數目增多至24個,麒麟9000就把GPU的配置拉滿了。

而三星Exynos 2100僅配了14核心的Mali-G78。從這一點至少可知Exynos 2100的GPU理論峰值性能會顯著弱於麒麟9000。聯發科天璣1200則因為產品定位差異,幾乎沒有和麒麟9000、Exynos 2100站在同一起跑線上。

比較值得一提的是Google Tensor晶片,所用的Mali-G78為20核心,規模僅次於麒麟9000,而且頻率也不低。Tensor所用的Mali-G78 MP20可能是市面上唯一選擇了Mali-G78不同步時鐘域方案的產品——這個特性先前筆者也提過,就是shader核心與GPU的其他模組可以跑在不同的頻率下(shader頻率848MHz,tiler與L2 cache頻率996MHz)。

來年聯發科天璣9000將要採用的Mali-G710是G78的演進產品。G710雖然也是Valhall架構,但規模上是有變化的,包括shader核心中的執行引擎、執行引擎內部結構等,整體較大程度提升了shader性能、紋理單元吞吐(理論翻倍),還有一些節能設計。Mali-G710的可配置核心為7~16個。

不過從總體來看,Arm說G710相比G78有20%性能提升(可能主要是因為可選配的核心數變少了),且同性能達成20%功耗下降,這個數字相比競品是相當保守的。從這個角度來說,天璣9000的毀圖運算力在明年的競品中可能會很被動——天璣9000選配的是10核心的Mali-G710,單純從這個數位來看,絕對性能是否足夠應付上一代的麒麟9000都有待觀察——當然理論上能效會有提升。

 

 

接下來聊聊高通Adreno GPU。Snapdragon 888的Adreno 660仍然是6字頭,這好像還是高通歷史上頭一次一個大版本號用了這麼多代的GPU。從Snapdragon 845的Adreno 630,到855、865、888都在用Adreno 600系列。

不過Adreno 660發佈之際同時導入了可變速率著色(VRS),這對行動繪圖運算很有價值。性能方面高通宣稱Adreno 660相比上代(Snapdragon 865,Adreno 650)提升性能最多達35%;能效提升20%。單看這個數字,必然是比A77 -> A78的提升幅度要大不少。

而前不久隨Snapdragon 8 Gen 1而來的新一代Adreno (有一說是Adreno 730)應該在架構上有了較大的改進。像是GMEM容量增加,而且可讀可寫,以前僅作為回寫cache存在。高通表示這次新版Adreno帶來的性能躍進,可能無法直接反映到跑分上。

高通提供的資料是新一代Adreno的峰值性能提升30%,在與Snapdragon 888達到相同性能的情況下節能25%。這回高通還特別強調要改變現如今行動GPU市場惡性追求峰值性能的現狀,力求改變GPU性能與功耗曲線的行為方式,爭取讓曲線平滑化,在3~5W功耗區間內實現切實的性能提升。

 

 

蘋果今年對A15的說法,普遍是在對比市面上所謂「主流」競爭對手,連與A14的比較數值都沒有提供。A14的GPU無論效率還是性能都已經十分彪悍了,是高通都難以望其項背的,預設A15的表現自然不會差。

先前蘋果發佈過一段視訊,談到了架構方面的變化,包括A15相比前代FP32 ALU翻倍;而且A15還導入了有損可渲染紋理,以節約儲存和頻寬等。從SemiAnalysis發佈的die shot來看,A15的GPU整體增大了30%的面積,畢竟這回滿血版A15的核心數也多加了1個。在不增加頻寬資源的情況下,據說就能實現性能的極大提升。

本文照例還是援引收集AnandTech的測試資料。以上表格中列出的晶片和GPU,唯有天璣9000還沒有實測成績。Snapdragon 8 Gen 1目前也沒有手機產品問世,不過前幾天AnandTech和極客灣都拿到了Snapdragon 8 Gen 1的手機裝置(或高通參考設計),做了一輪測試——測試資料仍不完整,以下僅作參考。

需要指出的是,晶片性能發揮很大程度受制於OEM的系統設計(包括機型尺寸、用料、散熱設計等;例如小米11 Ultra和三星Galaxy S21 Ultra雖然都採用Snapdragon 888,但前者的功耗控制更激進,遊戲中允許長時間停留在在5~6W間;而後者則只允許整機功耗長時間持續在3.5W水準上,則性能表現自然就有差異),以下援引的成績無法保證代表了該晶片的最佳性能和效率,但作為已經量產的終端產品,還是具備參考價值。

本文的機型選擇上,Snapdragon 888對應Galaxy S21 Ultra (Snapdragon版),麒麟9000對應華為Mate40 Pro,蘋果A14對應iPhone 12 Pro,蘋果A15對應iPhone 13 Pro,Exynos 990對應Galaxy Note 20,Exynos 2100對應Galaxy S21+ (Exynos版),Google Tensor對應Pixel 6。

筆者沒有找到天璣1200的資料:天璣1200的GPU為Mali-G77 MC9,從與其配置比較類似的Exynos 990 (Mali-G77 MP11)可以做簡單的推測。天璣1200在以下對比中,整體繪圖與遊戲性能都將排在最末的位置,無論其能效表現如何。

對比項目為GFXBench Manhattan 3.1離屏渲染測試,以及GFXBench Aztec Ruins高畫質離屏渲染測試。這兩個測試無法完整代表GPU繪圖性能,但受限於精力和資源,也只能收集這兩項測試的資料,對比結果如下:

 

(來源:AnandTech)

 

(來源:AnandTech)

 

如果單看性能的話,蘋果的一騎絕塵是毋庸置疑的,無論是峰值性能還是持續性能都領先其他競爭對手一個身位。除了蘋果之外,在GPU絕對性能上比較亮眼的應該是華為麒麟9000,在性能專案上能夠完敗Snapdragon 888。

可見一方面Mali-G78堆滿24個核心是的的確確有用的,以及Arm這邊的GPU在絕對性能方面真正意義上在這1~2年對止步不前的高通Adreno GPU構成了威脅——當然這也是要付出相當的代價的,且本文沒有嘗試探討面積效益:Arm Mali在這方面也是吃虧的。

這裡相對匪夷所思的Google Tensor,GPU雖然也堆了20個核心的Mali-G78,在峰值性能上的確和Snapdragon 888互有勝負,但持續性能卻一言難盡,到頭來比規格更低的Exynos 2100 (14核心Mali-G78)還不如。當然還是那句話,這與手機本身的系統設計乃至OEM的軟體都有很大的關係,不單是晶片的問題。

這兩年Android陣營這邊的晶片產品逐步落入峰值性能與持續性能嚴重不對等的怪圈。實際上蘋果這邊的峰值性能是實實在在有價值的,iOS對於GPU突發性能的日常操作利用率越來越高;而且蘋果這幾年也在刻意強調峰值的突發性能。但Android生態中,GPU峰值性能的實際價值暫時就沒有那麼大了——大概主要是有利於做行銷宣傳吧。

性能部分最後需要提的是,AnandTech測試Snapdragon 8 Gen 1晶片的參考設計,發現其峰值性能幾乎和蘋果A15是一個水準。當然參考設計和最終量產的產品,在形態和系統設計上大約還將差異頗多。不過起碼Snapdragon 8 Gen 1手機來年的遊戲體驗可以期待。

 

 

 

這兩張表的縱軸表示跑分(越靠上越好,表中每個專案的第2個數字),橫軸表示跑分對應的平均功耗(越靠左越好,表中每個專案的第1個數字);每個點表示的是處理器跑在峰值性能或持續性能下,其跑分與功耗對應的位置。

到加入功耗考量的環節,蘋果之外的其他晶片就多少都有些慘不忍睹了。這兩張表將大部分晶片分成峰值性能和持續性能兩個狀態,並統計峰值性能下的平均功耗(單位W)和持續性能下的平均功耗。

雖然暫態功耗高不是太大的問題,只要效率高就行。眼見著現在所有手機晶片GPU的峰值功耗都比先前提到的功耗爆炸的蘋果還高,跑出來的性能卻一點也不美麗。這裡尤為值得點名批評的是Google Tensor。AnandTech在評測文章中提到,Tensor在跑Aztec Ruins高畫質離屏渲染測試時,暫態功耗可以超過9~10W,在這種功耗下很快就會因為發熱被迫快速拉低功耗。所以Tensor的GPU規格雖然比Exynos 2100大不少,實際性能紅利卻遠沒有規格看起來的那麼多(當然,這口鍋很大程度上也需要Pixel手機的系統設計來背)。

Snapdragon 888、Exynos 2100、麒麟9000也都沒有好到哪裡去,都是以遠高於前代產品的功耗(普遍在8W附近,甚至更高),換來更多的性能。其數秒內的暫態功耗都能飆到10W乃至更高,它們在峰值性能狀態下的效率都比前代產品顯著更差。

 

 

對於這兩張表,各位可以用跑分÷功耗,得到一個可反映效率的值。GFXBench Aztec Ruins測試中,Exynos 2100和Snapdragon 888在峰值性能下的效率極其不堪;而Manhattan 3.1測試,效Google Tensor、Snapdragon 888、麒麟9000和Exynos 2100的糟糕程度都不遑多讓,尤其Exynos 2100和麒麟9000兩種性能狀態下的效率都很不理想。

有個比較有趣的點值得一提,Snapdragon 888持續性能下的效率很出色,和蘋果A14是差不多的水準。與此同時,麒麟9000的GPU在Mate40 Pro手機的省電模式下,效率也不錯,接近A14。當然這兩者在此狀態下的性能和A14就有較大差距,但從這一點就不難發現,手機晶片廠這兩年頗有刻意拉高規格和功耗的嫌疑,大約是都希望在性能上向蘋果看齊。因此早就越過性能與功耗的甜蜜點,致效率十分低下(另外,三星5LPE製程實在是有嚴重的debuff)。

A14的GPU在這兩項測試裡,即便是跑在峰值性能狀態下,其效率也比其他絕大部分晶片持續性能狀態下的效率高;而A15更是將這種差距拉到了另一個紀元。只不過iPhone的GPU也並非完美,即便有著最好的性能和效率,iPhone手機的系統設計仍然限制了其性能發揮:包括PCB板上更密集的元件排佈,以及SoC夾在雙層PCB板中間的方案,iPhone 13 Pro因此在持續功耗方面有著更大的限制。

 

 

從已經公開的天璣9000和Snapdragon 8 Gen 1的消息來看,筆者認為天璣9000在GPU理論繪圖運算力方面恐怕很難與蘋果相較——即便聯發科對Mali-G710的實施方案再神乎其神,台積電N4製程再省電,其規格都決定了這局依然沒什麼可比的。

Snapdragon 8 Gen 1的GPU目前偷跑的性能成績倒是十分亮眼——如前面圖表中列出的,其峰值性能已經和蘋果很接近。但從極客灣最近剛剛公佈的測試來看,Snapdragon 8 Gen 1在跑Aztec Ruins測試的時候,峰值功耗也突破了11W,遠高於蘋果A15。這個測試結果可能仍然有待商榷。

大概仍可說,這兩年甚至在接下來至少一年時間裡蘋果A系列晶片的GPU還將在性能和功耗、效率方面獨佔鰲頭。現階段有機會挫敗蘋果的,大概只能等等看三星和AMD的合作了。

本文原刊登於EE Times China網站

 

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論