用MacBook Air和ThinkPad跑AI的結果…

作者 : 黃燁鋒,EE Times China

雖說用不帶獨顯的輕薄筆電、商務型筆電來跑AI測試蠻不靠譜的,因為真的要做AI開發,顯然不會用這樣的配置。但這兩年的筆電處理器動不動就12核心,光跑Cinebench渲染也是可惜…

最近拿到一台聯想ThinkPad X13 Gen 3 (以下簡稱ThinkPad X13)——這個系列素有小X1 Carbon之稱。雖然在名義上常被人稱作「商務型筆電」,但其體態和定位都基本可明確為輕薄筆電。本文打算對這台輕薄筆電進行AI Benchmark,借這篇文章,希望能大致窺見今年的輕薄筆電和低壓CPU,在性能表現上達到了怎樣的程度,畢竟此前體驗的都是採用標壓處理器的「全能型筆電」。

雖說用不帶獨顯的輕薄筆電、商務型筆電來跑AI測試蠻不靠譜的,因為真的要做AI開發,顯然不會用這樣的配置。但這兩年的筆電處理器動不動就12核心,光跑Cinebench渲染也是可惜了…倒不只是圖一樂,這樣的測試對預估同核心微架構、不同規模的CPU,應該也能有個概念。

為對測試成績有大致的量級認知,本文仍將MacBook Air (M1 7-core GPU, 16GB RAM, 256GB SSD)做主要比較對象。定價上,這台ThinkPad X13 Gen 3 (Core i5-1240P,16GB RAM,512GB SSD)和最入門款的MacBook Air差不多,從選購的角度有對比的價值。

實際上正在販售的M1 + 16GB RAM配置MacBook Air價格仍然達人民幣9000+元。當然主要也是因為手上沒有M2版MacBook Air的關係…何況雖說比的不是M2,但i5-1240P畢竟也不是Intel產品線裡最強的晶片。

除了MacBook Air之外,在某些測試裡,本文也會加入2021年款MateBook X Pro (上一代Core,Corei7-1165G7, 16GB RAM)和2022款ROG幻16 (Core i9-12900H, 24GB RAM)的測試成績作為參考。

 

MacBook Air (M1)和ThinkPad X3 Gen 3的體態很相近,價格也相似。

 

這是台性能釋放奇特的筆電

在談性能之前,照例先看看ThinkPad X13筆電在系統層面的性能釋放水準,以搞清楚它在輕薄筆電中,性能表現上是否具有代表性。

ThinkPad X13 Gen 3的主要配置資訊如下:

 

 

系統層面,ThinkPad X13的亮點還是比較多。例如SSD是高階產品,和知名的980Pro同出一門。無線連接部分,這台筆電支援接插nano-SIM卡,實現4G通訊——算是出差商務人士的一大便利特性吧。

作為商務型筆電,絕大部分配置項都算比較有誠意,且鎂鋁合金機身的輕薄程度雖然還沒到X1 Carbon的水準,但也已經相當不錯。缺點也是有的,主要是300nit亮度的1,080p螢幕,在滿是1,440p的世界裡已經比較落伍;還有指紋辨識比較難用。

 

從拆解可見,記憶體顆粒來自SK海力士;SSD則來自三星——從先前拆過的幾台筆電來看,現在OEM為SSD加的散熱配置也真是越來越豪華,上下都有導熱介面材料。

 

4G通訊模組是上海移遠通訊的EM05-CE;內部晶片來源不明。

 

Wi-Fi模組則是Intel AX211。

 

核心部分的處理器Intel Core i5-1240P——這裡的尾碼P是今年Intel針對第12代Core新增的系列代號。Intel為P系列官方設定的基礎功耗(TDP)是28W,屬於低壓處理器系列。

和更低功耗設定的U系列(15W/9W TDP)相比,P系列和H系列(45W TDP)用的是同一塊die。換句話說,P系列屬於H系列的下放;而U系列則在「低壓」與「超低壓」屬性上更純粹一些。所以Intel形容P系列在第12代Core處理器的定位上是「高性能輕薄筆電」。手上這台ThinkPad X13所用的處理器Core i5-1240P,和同系列i7的主要差異在核心頻率和cache大小上。

 

熱管下的應該就是Core i5-1240P處理器。

 

雖說不應對輕薄筆電的性能釋放抱太大期望,不過ThinkPad傳統的側邊散熱鰭片都還在,那應該就比常規輕薄筆電的性能釋放更好吧?不過實際情況比較複雜)以下所有測試均插電,並採用Windows作業系統電源策略設定中的最佳性能;測試環境溫度:24℃):

 

 

上圖是跑4輪Cinebench R23,用HWiNFO記錄的CPU封裝溫度(紅線)與功耗(藍線)曲線。頭兩輪還比較正常:第一輪測試時,CPU封裝功耗能夠衝高到55W;隨後緩緩下滑到35W附近;第二輪能衝高至42W左後,後續平穩在33W。這兩輪測試的CPU封裝溫度一般在97℃附近跳動,這已經超出去年不少輕薄筆電的性能釋放水準。

而第三輪的情況就回到了輕薄筆電定位上——第三輪測試前半程還能堅持在35W的功耗水準上,但後半程驟降至27W附近,並滑向24W,此時CPU封裝溫度掉到了85℃附近。第四輪測試中,除了起初功耗曾一度衝高到41W,後續一路跌到了18W,CPU封裝溫度此時只有70℃。

18W這個數字在輕薄筆電上也不算罕見。但ThinkPad X13的起點高,基於其散熱設計,拋開系統層面的其他限制不談,這樣的持續性能釋放可以被稱作保守。這對一些長時間的高負載應用不友好,比如說遊戲、AI應用等。不過ThinkPad X13原本也不是用來做這些事的,辦公場景基本也不需要長時間高負載的持續性能輸出。但這的確將影響到下面要做的許多測試,也說明ThinkPad X13的確不適合用來跑AI。

 

 

半小時的Cinebench R23迴圈測試結果與上述情況基本吻合。第一輪測試時,ThinkPad X13還能拿到10,002分的成績,但到了第15輪,就只剩下75%的性能水準了。這個程度的性能折損和一些極致輕薄筆電很相似,只不過並不是溫度牆限制所致。

實際上,ThinkPad X13的突發性能供給還是給力的。在PCMark 10現代辦公測試過程中多次觀察到將近60W的瞬間功耗釋放(主要發生在網頁流覽、照片編輯測試中;要知道官配電源也就65W的功率)——這種突發性能釋放也正是不少辦公應用、網頁流覽等場景所需,說明聯想對於這台筆電的定位還是相當清晰。

筆者認為這樣的策略放在P系列輕薄筆電上比較合理。今年有不少P系列輕薄筆電的性能釋放都堪稱激進,比如同樣用Core i5-1240P的聯想Yoga Slim 7i Pro,據說PL1都設定在了50W,導致它比不少i7的多核性能都要高。

 

 

用AIDA64進行30分鐘的CPU壓力測試(FPU壓力測試),CPU封裝的溫度和功耗走勢比較「蜿蜒」。ThinkPad X13的行為方式似乎傾向於在持續的全力性能輸出一會兒後,就休息一會兒,等到了某個時間點再全力輸出,散熱系統在此期間其實也沒什麼壓力。

全程有幾個相對穩定的功耗輸出點:35W、25W、18W;溫度自然也隨著功率的變化上下跳動。另外,還有一個從系統層面來看、ThinkPad X13可能並不怎麼適合用來玩遊戲的證據:

 

 

上圖是用AIDA64 + FuMark進行CPU和GPU的雙重壓力測試下,處理器封裝功耗(藍線)與溫度(紅線),以及CPU核心功耗(綠線)、GPU核心功耗(黃線)的變化情況。

CPU核心功耗全程都算相對穩定,維持在13~19W之間;而GPU核心(核顯)的功耗搖擺幅度就比較大了。受制整體處理器的封裝功耗限制,GPU核心起初也能分配到20W的功耗,但在測試進行到4分多鐘的時候,驟降至2W附近;然後一段時間內在1~3W區間內工作…

這對於某些對CPU有性能需求的3D遊戲而言,會產生影響,比如《原神》。不過聯想在系統層面對此也有策略,Lenovo Vantage (類似電腦管家)有個Game Boost模式,猜測是可在遊戲場景裡規避這種情況的發生。

 

 

用輕薄筆電跑AI Benchmark

接下來就讓用台並不適合跑AI的筆電,來跑一跑AI Benchmark吧。針對ThinkPad X13和MacBook Air,都沒有啟用GPU、NPU加速,單純是用CPU跑——AI Benchmark本身似乎也還暫時不支援蘋果GPU、Intel GPU或其他單元的加速。

另外就是所用的瑞士蘇黎世聯邦理工學院的AI Benchmark,針對PC的測試還相當不完善,這個專案目前還處在Alpha階段(AI Benchmark v.0.1.2)。雖然項目介紹裡說只需要敲幾行命令,用Python就能跑AI Benchmark,但在前期環境配置過程裡還是遇到了各種問題,比如各元件的版本適配問題,像macOS系統還有內建Python和後裝Python不同版本等等問題。好在所有測試都順利跑完了,但基於該項目所處的早期階段,以及部分專案的優化設定仍然不夠,以下測試結果僅供參考。

作為比較,手上還有一台先前測過的ROG幻16——處理器是筆電中的天花板Core i9-12900H (除了HX系列),還配了獨顯:筆電版GeForce RTX 3070 Ti。另一方面,用i9-12900H也跑了一遍AI Benchmark;另一方面則藉由CUDA和cuDNN,用GPU也跑一遍AI Benchmark,作為成績參考。

 

 

所有測試基於TensorFlow庫(TensorFlow 2.9),測試內容比較輕量。實際上TensorFlow 2.4在適配蘋果ML Compute後,GPU加速似乎已經取得了階段性成果。但本文的測試沒有用這部分資源,未來若還有機會,會在GPU加速方面做進一步的深入。

因為測試項目比較多,這裡只列出了部分子項的測試結果。每個測試模型分為推理和訓練兩部分成績。從結果來看,Core i9-12900H的成績算是基本符合預期,在CPU中明顯領先——畢竟在核心數、核心頻率方面都有優勢;而Nvidia GeForce RTX 3070 Ti Laptop,作為GPU因為有著大量平行運算單元,能夠以快N倍的速度在大量矩陣乘加運算中表現出巨大的性能優勢。

Core i5-1240P的表現在此似乎並不理想;蘋果M1在部分子項裡有比較亮眼的成績。前面提到,ThinkPad X13系統層面的持續性能輸出不穩定,CPU經常出現性能顛簸,對這樣時間稍長的測試應該會有大量的負加成。

這類測試,軟體和各類中介軟體在其中造成的影響極為巨大。所以再度借助Windows 11作業系統的WSL子系統跑Ubuntu,在Ubuntu子系統裡面再跑一次AI Benchmark。

 

 

這輪測試過程中,比較神奇的是,測試程式還特別提示「此TensorFlow binary針對Intel的OneAPI Deep Neural Network庫進行了最佳化,所以會充分利用AVX2、AVX_VNNI和FMA指令」(不過第12代Core事實上是禁用了AVX-512指令集);不知道為何用Windows的Powershell來跑就沒有這項提示。

大約因為有Ubuntu的加持,這次ThinkPad X13的Core i5-1240P跑出來的成績相較於單純在Windows 11系統中的跑分有大幅提升。很多子項有超過1倍的性能進步,且在絕大部分項目上,相較於M1 CPU也有了顯著優勢。基於上次的跑分,理論上如果換用原生Linux,成績還有提升空間。成績匯總最終得到下圖:

 

 

再次強調,前三者都是基於CPU的測試,且系統與平台均存在差異(請注意i9-12900H和3070Ti Laptop是用Windows跑)。這次的測試在各方面的準備上都比較倉促,且測試程式能夠反映實際性能的程度本身也相對初級,就權當對CPU絕對性能的某個反映維度。

CPU與GPU理論性能測試

真實負載測試前還是要看看處理器的理論性能水準。首先是CineBench R23和Geekbench 5:

 

 

測試結果基本符合預期:Core i5-1240P的基頻和睿頻相較更高定位的Core處理器都不算高,1.7GHz基頻/4.4GHz睿頻理論上會拉低單核性能表現——畢竟以前接觸的那些高階端處理器動不動就5GHz頻率。不過和M1比,i5-1240P在Cinebench R23測試中依然有優勢。至於多執行緒性能,這一代Core大幅增多核心的優勢,在此時也就能顯現出來。

 

 

另外,新版Blender Benchmark (3.2.1)渲染測試已經完全去掉了Iris Xe加速支援;加上Blender對M1 GPU加速支援仍然很初級,所以這項測試就也當作是CPU理論性能對比,結果如上圖。

 

 

GPU性能也是之前吐槽蘋果晶片的一個重點,即因為其生態發展的滯後,真實應用與GPU通用運算加速過程裡,蘋果GPU表現出來的效率比較低下。不過一方面是Core i5-1240P並沒有用96EU的Iris Xe GPU,另一方面則是M1 GPU在堆料上明顯更充沛(從GPU佔據的die size可以看得出來,雖然這裡參測的M1也是7核GPU的簡易版),在3DMark這類圖形理論性能測試裡,M1一定有優勢。

這項測試中,將華為MateBook X Pro 2021的測試成績列出來。這是一款更為純粹的輕薄筆電。MateBook X Pro 2021所用的處理器是第11代Core i7-1165G7——這顆處理器內部堆了96EU的Iris Xe核顯。

單純從GPU執行單元數量來看,ThinkPad X13還少了16個EU,MateBook X Pro 2021應該有更好的表現,但實際情況卻並非如此。這個結果能夠充分說明,系統層面的設計對於晶片性能的發揮會造成多大程度的影響。也不光是MateBook X Pro 2021的處理器穩定性能發揮只有15W,還在於ThinkPad X13的LPDDR5記憶體更高的頻寬對於核顯性能發揮也有幫助。

遊戲、辦公和生產力創作表現

所以遊戲裡得到的測試成績也大致相似:96EU也未必比得過80EU。但有所不同的是,M1 GPU理論性能雖然更高,但由於其開發生態仍然不成熟,在更真實的應用場景裡,其性能還很難得到充分發揮。所以MacBook Air在很多遊戲裡,體驗甚至還不及80EU Iris Xe核顯的ThinkPad X13。

 

 

這和晶片廠商之外的更多「中間商」也有很大關係,包括圖形標準API、遊戲引擎開發商、遊戲開發者等角色。所以說軟體生態的高下,影響著是否浪費晶片die size和成本的根本問題,這一點也適用AI。

畢竟MacBook Air和ThinkPad X13都不是用來玩3A遊戲,不過ThinkPad X13在這項測試裡的成績還是超出預期,總體表現在同等配置和定位的筆電裡都算中上水準。值得一提的是,網遊測試中,Steam平台的CS:GO先前在支持macOS後,M1似乎在遊戲影格率上持續得到「神優」”,都能跑100+ fps了。可惜實際遊戲體驗並不好,卡頓和bug都不少,macOS到目前為止都不是遊戲玩家們的選擇。

 

 

多媒體創作方面,筆者將Adobe四件套升級到了2022版。除了較大程度受制於CPU單核心性能的Photoshop專案,Core處理器仍然有優勢;像After Effects這類已經開始原生支持M1的測試項,測試成績就得到了較大幅度的提升——只是換個軟體版本,這一項的提升幅度比上一版似乎就高80%,充分說明了生態的重要性。

至於視訊編輯工具Premiere Pro,這是蘋果晶片的主場。本文也觀察了Pr測試的分項——Pr測試對視訊短片過程中,視訊重播流暢性、視訊編碼輸出速度、增加特效的性能等都有考察。Intel在特效這類對多核心性能有需求的場景下得分仍然不錯,丟分主要在GPU上。

 

 

主流的辦公測試工具,macOS都不支援,包括UL Procyon、PCMark,所以將MateBook X 2021的成績拿來對比。可以看出今年的低壓版Core i5,相較於去年低壓版Core i7,在Word、Excel這兩項上有了大幅提升——雖然如前所述,這兩台筆電的性能發揮差異也比較大。

UL Procyon的測試項目還是相當複雜,執行的Word、Excel腳本基本都算重度負載;所以ThinkPad X13是真適合用來寫Word和做Excel表格。

 

 

「真實負載」還是少不了PCMark 10現代辦公測試。這個測試恰到好處地吻合了ThinkPad X13這樣的辦公筆電;其中測試分項包括應用啟動速度、視訊會議、網頁流覽、表格、文檔寫作、照片編輯、視訊編輯等。這才是ThinkPad X13的正職。

PCMark 10更新到現在,還真的不單是CPU性能的反映。如其中網頁流覽、視訊編輯、渲染與視覺化都大量用到了GPU加速。從與MateBook X Pro 2021的這三項對比,也能看出96EU也未必就比80EU強。

 

 

目前為數不多能跨平台比日常真實負載的測試就是CrossMark了。CrossMark的測試大方向包含生產力、創作、回應。測試流程裡能看到,其中的細分項包括照片編輯、照片整理、視訊編輯、網頁流覽等。所以CrossMark本質上應該就屬於PCMark 10的跨平台版,可惜CrossMark提供的測試細節比較少。單就CrossMark的測試結果來看,輕薄筆電日常最常見的這些項目裡,ThinkPad X13的表現還是優於MacBook Air。

除了後半部分的常規測試外,本文花了一些篇幅用兩台輕薄筆電跑AI Benchmark,雖然實際價值不大,不過隨著PC CPU廠商這兩年在技術上的競爭,處理器核心數增加:從4、5年前的雙核心,到現在的12核心,能做的事和運作效率都已經不可同日而語,這也是現在能用輕薄筆電跑AI的基礎。

另外,隨著傳統晶片廠商都開始在GPU方面加大投入——如Intel開始了獨立GPU的佈局,雖說本文並未就AI負載的GPU加速做多少嘗試,而且CUDA目前仍然有著絕對優勢,但這方面的競爭未來只會更加激烈。希望下次在做AI Benchmark測試的時候,處理器核顯的加速都已經能開出來鬥一鬥了。

本文原刊登於EE Times China網站

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論