Intel獨立顯卡有何過人之處?

2022-04-01
作者 黃燁鋒

Intel正式發佈Intel Arc A系列行動端獨立顯卡,鎖定筆電裝置。配置有Arc 3、Arc 5、Arc 7之分,其中搭載Arc 3 GPU的筆電已經準備好推向市場,更高性能的Arc 5/7則會在初夏上市…

Intel要發佈獨立顯卡已經不是什麼新鮮事了,畢竟Intel不僅做了這麼多年的核顯/集顯,2020年也有試水性質的Xe DG1獨立顯卡問世。去年的Intel Architecture Day之上,Intel就宣佈了針對PC的獨立GPU發佈計畫,GPU產品名為Arc,初代Arc GPU產品代號Alchemist。

當時就已知道新GPU將採用台積電N6製程、基於Intel Xe-HPG架構——這還不是第11代、第12代Core處理器Xe-LP核顯簡單的規模化擴展。Intel Arc A系列行動端獨立顯卡針對筆電裝置,配置有Arc 3、Arc 5、Arc 7,其中搭載Arc 3 GPU的筆電已經準備好推向市場,更高性能的Arc 5/7則會在初夏上市。首款採用Arc 3的三星(Samsung) Galaxy Book 2 Pro已經上市,但並未在中國上市,預計從今年第二季開始,中國市場才會看到採用Arc獨顯的筆電產品。

 

 

值得一提的是針對筆電的Arc不會適配第12代Core的U系列處理器(而僅搭配更高TDP的Alder Lake-H與Alder Lake-P),Intel對此的解釋是搭載U系列低壓處理器的輕薄本的功耗餘量有限,故不會有搭配Arc獨顯的筆電問世,這可能和低壓處理器的I/O限制也有一定的關係。

另外,Intel也確認了,Arc GPU可以在其他平台使用——也就是和別家CPU搭配。只不過考慮到eep Link技術讓Intel GPU和CPU配合致性能和效率最大化,以及操作上的可行性問題,筆者認為筆電平台恐怕很難會看到AMD CPU+Intel GPU的奇怪組合。

未來針對桌面PC的板卡產品自由搭配,倒是有這種可能性。但Intel Fellow Tom Peterson在評價這一問題時則說:「這個問題更多取決於OEM和ODM的規劃,從技術角度來說並不難實現。隨著Intel推出獨立顯卡產品,我們很期待接下來在市面上看到更多可能性。」

Arc 3先到,Arc 5/7要等到夏天

Intel自己對於Arc 3/5/7的定位分別是:Arc 3針對「主流遊戲」,Arc 5可應用於「性能遊戲」,而Arc 7則針對「硬核心性能遊戲」。

 

 

這次發佈的Arc「A系列」行動獨立GPU產品包含了上圖這幾款:A350M、A370M、A550M、A730M、A770M。不同型號在Xe核心數量、頻率、光線追蹤單元數量、顯存容量與位元寬,以及顯卡功耗上均有差異。

依照Nvidia的常規,他們還會列出tensor core數量。對Intel Alchemist而言,每個Xe核心都配16個向量引擎+16個矩陣引擎(XMX),所以看Xe核心數大致也就知道了矩陣引擎數量。Alchemist在AI單元方面的堆料,看起來比Ampere猛一點。

舉例說,其中A370M有8個Xe核心與光線追蹤單元,GDDR6顯存64bit位元寬、4GB容量,功耗設計35-~50W。Intel並未提供與競品之間的比較,單純從顯存容量、位元寬及功耗來看,Arc 3比較可能的對標物件是GeForce RTX 2050 Mobile和MX570 (但後者並沒有光線追蹤、超分這些特性,顯存容量也低很多)。

不過現在的GPU,在光線追蹤、AI專用單元之類的配比上都比較「個性化」,很難有綜合的性能評定與比較;加上不同GPU廠商與架構對於「核心」定義差別甚大;而且Arc獨顯率先用上N6製程也會有功耗和效率方面的優勢;最終還是要看不同應用的實際性能比較。

而A550M則在各方面的用料上,都比A370M翻了一倍。目前最高配的A770M則有32個Xe核心,256bit位元寬、16GB GDDR6顯存,以及最多150W的參考功耗,Arc 5和Arc 7應該會以GeForce RTX 3060及以上定位的GPU為競爭目標。

 

 

Intel展示了兩種尺寸和規格的di e(ACM-G10/G11),對應於不同的規格。有可能其中的ACM-G11是專門用於Arc 3,而ACM-G10則透過binning process做成Arc 5/7更多的SKU。

 

值得一提的是,Intel特別提到了顯卡時脈頻率的定義問題。Intel強調GPU在間歇性的輕度負載狀態,可以跑在比較高的頻率下;而遊戲這類負載很重的場景,在大量運算單元發揮作用時,頻率就會比較低;於是GPU的時脈頻率在一個動態範圍內;接近中間的頻率出現的概率會更高。

Intel表示:「考慮到這種分佈情況,我們制定獨立顯卡參數配置時,先標定一個有代表性的負載,然後在該負載運作時,全程測量並統計時脈頻率分佈。最終將平均時脈頻率作為參數配置中的定義。」於是前面看到的頻率,應該並不是指其最高頻率。另外OEM的不同功耗設定下,頻率的分佈範圍可能也會有變化。

 

 

以上是Arc 3 A370M與第12代Core的Xe核顯(96EU)在部分遊戲中的性能比較。包括《殺手3》、《F1 2021》、《最終幻想14》等遊戲,都有不同程度的影格(Frame,亦稱為幀)率提升。尤其《毀滅戰士:永恆》、《巫師》之類的遊戲,理想情況下最高有2倍影格率提升。注意其中的畫質設定是有差異的,不過都是以1,080p解析度測試。

《堡壘之夜》、《GTA5》之類的競技類遊戲,在1,080p中等畫質下也能越過90fps的影格率。這兩組對比的樣本量感覺還是太小,也沒有非常近代的3A大作,畢竟Arc 3在定位上還是偏向入門。另外就是這些測試也沒有發揮XeSS、光線追蹤特性,與Nvidia和AMD筆電獨立GPU對比可能還需要等更多的實測資料。

 

 

除了遊戲之外,Intel也提供了內容創作應用的性能對比,包括用Handbrake和達文西進行4K H.264→4K H.265轉碼測試,還有用Premiere執行兩個特定功能操作——這裡的Auto Reframe和Scene Edit Detect應該都是需要用到AI加速——Arc GPU的XMX矩陣引擎就能發揮作用了。

這幾個場景下,A370M比第12代Core的Xe核顯有不同程度的性能優勢,雖然感覺這幾個場景都好具體,並非很綜合的系統性能測試。值得一提的是,這兩者的對比並不單純是Arc 3與核顯之間的較量,因Intel的Core處理器和Arc GPU有一些特別的協作特性(Deep Link),所以Arc獨顯可以和Xe核顯一起對某些工作負載做加速,且Intel並未提供Arc 5和Arc 7的性能比較資料。

光線追蹤、超分、Smooth Sync等特性

Alchemist全系GPU都支持DirectX 12 Ultimate的那些知名新特性,包括光線追蹤、可變速率著色(VRS) Tier 2、網格著色(mesh shading)、採樣器回饋(sampler feedback)等。光線追蹤功能的實現,Intel也為Arc GPU加入了專門的光線追蹤硬體單元——用於光線遍歷(ray traversal)與包圍盒相交(bounding box intersection)及三角形相交運算。

光線追蹤之外的另一個重要特性就是超分(或超級採樣)技術了。亦即透過計算將低解析度畫面升格到高解析度的過程,GPU只需要渲染低解析度的畫面,最終也能獲得近似原生高解析度畫面的觀感,節約資源的同時提升了影格率。

Intel的XeSS即是應用了AI的超分技術:XeSS原理是藉由畫面中的臨近畫素,以及過去影格進行運動補償,來重建畫素細節,該過程也需要透過神經網路進行,和Nvidia的二代DLSS比較類似。此時,Xe核心內的XMX矩陣引擎(或也可以是DP4a指令)就能發揮作用了。

當然很難搞清楚Intel XeSS在實現細節和效果上與DLSS的區別。Tom Peterson在接受採訪時說:「我們利用AI和深度學習技術已經訓練過各種不同的遊戲了,相信我們的網路模型能夠很好地適配不同類型的遊戲。」至於與別家比較,基於AI做超分「將來會成為激烈競爭的領域…這對對比、評估、基準測試來說,其實都是個全新的領域,很難去直接比較我們的AI網路和別家的同類技術。」

 

 

從Intel的演示來看,效果還是相當不錯的。具體表現如何,其實還有待對遊戲的更多複雜場景做測試。畢竟DLSS一代在某些動態場景下也是會翻車,而且這項技術要以最高效率跑起來,也依託於Intel的GPU生態建構能力,作為一個新的入局者,Intel有待市場考驗。

Intel在會上宣佈了首批支援XeSS的14款遊戲,預計未來幾個月還會有更多遊戲加入。

值得一提的一項特性,是為解決影格率與刷新率不一致導致的畫面撕裂問題相關的同步技術。Intel獨顯除了支援VESA標準的Adaptive Sync (調整顯示器刷新率,使其與GPU輸出影格率吻合的技術),還有個Speed Sync。

Speed Sync是Intel自家的技術,其目標也是解決垂直同步導致更高回應延遲的問題。「Speed Sync透過關閉V-Sync來改善這一點——減少排隊——我們將始終顯示最後一個渲染影格的整體,而不是撕裂。」不過在媒體發佈會上,Intel並未詳述是如何「改善」。

除了Speed Sync以外,還有個「全新的Intel技術」Smooth Sync。這種技術的方案是對兩個撕裂影格之間的邊界進行模糊化處理,降低畫面撕裂帶來的體驗影響。思路還是相當新奇…靜態畫面看起來基本可接受,不知道畫面動起來體驗效果會是怎樣。

 

 

CPU與GPU應該搭配工作

AMD這兩年正努力發揮同時研發CPU、GPU的優勢,推一些專屬於自家平台的優勢技術,比如說SAM (Smart Access Memory)。不難想見Intel開始研發針對PC的獨顯,也必然全力發揮這方面的優勢——尤其在CPU還另有核顯的情況下,不能讓真金白銀的die白白浪費了。

Arc獨顯可與第12代Core及其核顯搭配,最佳化效率或協同完成某些工作。這類技術統稱為Deep Link。Intel主要列舉了Deep Link的動態功率共用、超級編碼、超級運算力三項特性。

其中動態功率共用是類似Nvidia Dynamic Boost的技術。Intel說當年的Kaby Lake G (就是傳說中加上Vega die的處理器)之上,就已經在用自家的「第一版動態功率共用」技術了;後續Tiger Lake (第11代Core)、Alder Lake (第12代Core)一直在技術改進。這類技術的本質都是在CPU或GPU任何一方更需要功率的情況下,有個動態分配機制。

另外在系統處於高負載狀態下,如遊戲場景,為加快回應負載變化,系統會以100毫秒為最小間隔來動態調控功率配比;而在輕載場景下,不需要快速回應時,為實現節能則該時間視窗會變大,這也更符合筆電這類形態裝置的需求。

而超級編碼技術是把媒體編碼工作交給Arc獨顯和Core處理器的Xe核顯去協同完成。我們知道以蘋果(Apple)為代表的處理器SoC,越來越看重媒體引擎的性能。第11代Core之後,Intel就在刻意加強Core處理器某些格式的媒體編解碼能力。

所以核顯與獨顯的配合工作就顯得順其自然了,不過該特性要求開發者去調用oneVPL的API。原始影格通過API交給oneVPL,把工作依組分配給獨顯與核顯;oneVPL最後完成打包工作,把編碼後的影格拼接成最終視訊並輸出。

Deep Link技術中還有一項具代表性的特性是「超級運算力」,在某些應用中同時結合核顯與獨顯的運算力。比如說對一段視訊進行去噪、超分之類的處理,則由MLS (機器學習服務,OpenVINO中的一個框架)獲得視訊每一影格切分成的tile以後,將這些tile智慧地分配給不同的運算力模組——這個過程會考量負載的延遲敏感度、傳輸量、性能要求、功率消耗等因素進行分配。

似乎「超級編碼」、「超級運算力」這類特性本質上都屬於Intel XPU生態的組成部分和在PC平台上的延續。這種不同運算力模組的協同、配合方式,就Intel的介紹來看,性能和效率的提升幅度都還頗大。

在Deep Link技術生態的擴展上,Intel表示會跟不同的ISV合作,實現這些技術在不同系統上的支援。「我們現在已經在達文西、Handbrake這些軟體上賦能。未來會在更多的軟體裡看到這些功能的實現。」筆者認為,Deep Link只是整個Intel大生態的一個組成部分罷了;而這部分的成功與否其實能夠很大程度窺見Intel現如今的號召力,也須拭目以待。

與此同時,Deep Link技術在我們看來可能會成為Intel在PC獨顯市場競爭成功與否很重要的一個組成部分。畢竟Nvidia的GPU生態已非一日兩日,而AMD則有遊戲主機這一天然優勢市場,Deep Link則屬於Intel這名新入局者的優勢項目。

Alchemist GPU的其他能力

Intel本次媒體分享會花了比較大的篇幅去談Xe-HPG架構。不過去年的Intel Architecture Day上,Intel並未談到配套的Xe媒體和顯示引擎。Intel在本次的產品發佈中,強調Xe媒體引擎是「業界首個為AV1建構硬體編碼支援的GPU供應商」,強調比軟體編碼「快50倍」。FFMPEG、Handbrake、Premiere Pro、達文西、Xsplit都已經對Arc的硬體級AV1加速做出支援。

而在Xe顯示引擎方面,Arc獨顯當前主要支持HDMI 2.0b、DP1.4a規格,「遊戲玩家能夠享受1080p@360Hz,或4台具有4k@120Hz HDR的顯示器。」除此之外,Intel當前已經發佈了Arc Control app,提供各種相關Arc GPU的設定、性能調整、驅動升級等特性,有性能監測、虛擬攝影機、直播設置等功能。

這一階段發佈的獨顯主要針對的是筆電市場,而且首先以Arc 3為主。如果筆電如期上市,則最應感到壓力的應該是Nvidia目前應用於入門市場的一眾獨顯產品——雖然最終還是要看內建Arc獨顯的筆電產品售價。

不過在更高階的市場上能否搶佔先機,還要看Intel的動作是否夠快,尤其是在如今RTX 4000系列尚未問世的利好時期。無論如何,PC GPU市場多出一個市場參與者對消費者而言終歸是好事,像Tom Peterson說的「接下來,大家可能需要更加習慣聽到關於『I+I』的故事了」,更何況這還將有利於顯卡價格的進一步平穩。

本文原刊登於EE Times China網站

 

 

 

 

 

 

活動簡介

人工智慧(AI)無所不在。這一波AI浪潮正重塑並徹底改變科技產業甚至整個世界的未來。如何有效利用AI協助設計與開發?如何透過AI從設計、製造到生產創造增強的體驗?如何以AI作為轉型與變革的力量?打造綠色永續未來?AI面對的風險和影響又是什麼?

AI⁺ 技術論壇聚焦人工智慧/機器學習(AI/ML)技術,涵蓋從雲端到邊緣、從硬體到軟體、從演算法到架構的AI/ML技術相關基礎設施之設計、應用與部署,協助您全面掌握AI最新技術趨勢與創新,接軌AI生態系佈局,讓機器學習更快速、更經濟、更聰明也更有效率。

贊助廠商

黃燁鋒

暫無

發表評論

訂閱EETT電子報