整合顯卡前塵往事知多少

作者 : 黃燁鋒,EE Times China

究竟什麼是「整合顯卡」(簡稱為整合顯卡)?英文原文是Integrated Graphics Processor (或iGPU)。在中文語境裡,「顯卡」一詞似乎已經轉義為指代GPU,而不再特指板卡形態的硬體。但「整合顯卡」原本就不是板卡,而是一顆晶片、一片die或者die上的一部分…

PC/伺服器領域過去的「整合顯卡」(亦簡稱為集顯),現在的「核心顯卡」(簡稱核顯),一度被戲稱為「亮機卡」(編按:是指性能最低的獨立顯卡)——因為相較於「獨立顯卡」(簡稱獨顯),其繪圖運算性能不值一提,能滿足作業系統圖形介面的最基礎性能要求就不錯的,不要說用來玩遊戲、設計。 不過這兩年,處理器廠商的核顯競爭似乎內卷(編按:向內演化,寬泛的說法是,所有無實質意義的消耗)了起來。Intel的第11代Core處理器96EU規模的Xe核顯,在繪圖運算跑分上已經趕超筆記型電腦上的入門級GPU (Nvidia GeForce MX350);今年AMD這邊的Ryzen 6000系列處理器RDNA 2核顯(Radeon 680M)性能都超越10年前的GPU卡皇(Radeon HD 7970)了...實在是不得不讓人驚歎時代發展之迅速。  

(來源:極客灣)

  現在的AMD Ryzen 6000系列行動處理器,靠核顯跑1,080p高畫質的《艾爾登法環》(Elden Ring),遊戲影格(frame,亦稱幀)率就能上40fps;更不用說應付常規的網遊和競技類遊戲。Intel很快要發佈的第13、14代Core預計還會在核顯規格上持續內卷,讓核顯性能更上一層。 拋開蘋果(Apple) M1 Max/Ultra這類晶片不談,雖說整合顯卡和真正的高性能獨顯比起來,性能仍然是不值一提;但以前的「亮機卡」現在都能玩3A遊戲了。這核顯的發展究竟經歷了怎樣的過程?本文嘗試回顧過去這幾十年,「整合顯卡」的發展史。 「整合顯卡」的定義 依照分析歷史事物的常規,首先還是要定義究竟什麼是「整合顯卡」?「整合顯卡」英文原文是Integrated Graphics Processor (或iGPU)。在中文語境裡,「顯卡」一詞似乎已經轉義為指代GPU,而不再特指板卡形態的硬體。?整合顯卡」原本就不是板卡,而是一顆晶片、一片die或者die上的一部分。 而「核顯」可以認為是整合顯卡的某種進化形態。更早以前的整合顯卡雖然說是「整合」的,但它主要是和北橋晶片整合,和CPU離得比較遠;而從2010年開始,Intel將GPU和CPU放到了同一顆晶片上,「核顯」這個說法就出現了——也就進化成了真正的「整合顯卡」。 實際上,和CPU放在一起的GPU,無論如何都沒有了板卡形態,但中文仍然親切地稱呼它為「核心顯卡」。Intel官方也沿用了「整合顯卡」、「核心顯卡」這樣的說法,本文也不再嚴格區分。 前「整合顯卡」時代 早在1995年(或之前)就已經有整合的圖形控制器問世了。Weitek、矽統(SiS)都有這樣的晶片產品。比如矽統的SiS6204,應該就是第一顆針對Intel處理器、應用PC的整合圖形控制器,與北橋晶片整合在一起;而再略早一點的Weitek則針對SPARC平台推出過對應的產品。 可見自古以來,「整合顯卡」最早就在於表達,從事繪圖運算工作的處理單元與其他處理器放在一起;雖然這裡的「顯」究竟是圖形控制器,還是繪圖處理器,仍可區分。當時GPU這個詞都還沒有出現,且圖形單元的構成也還遠不像現在這麼複雜。 矽統當年發佈的整合顯卡包含最高解析度支援到1,280 × 1,024 1,680萬色的整合VGA,以及具備視訊解碼器介面(Philips SAA 7110)的64位元BitBLT引擎,支援色彩空間轉換、視訊縮放、色鍵視訊覆蓋等。最初似乎只有矽統、揚智科技(Ali)兩家公司獲得了Intel Pentium處理器生產晶片組的協力廠商授權。 1999年矽圖(SGI)發佈兩款工作站產品,採用Intel Pentium處理器,以及自己設計的Cobalt整合顯卡——據說這顆晶片的成本比一般的CPU還高。SGI首款整合顯卡的價值在於採用統一記憶體存取架構(UMA),即繪圖處理器和CPU共用系統記憶體,雖然當時的UMA和現在常說的UMA (如蘋果M1晶片的UMA)差異比較大。 同年,Intel發佈了代號為Whitney的i810晶片組——其中就包含Intel自己的首顆整合顯卡——位於北橋晶片內部(代號為i752),整合顯卡時代大概是從這個時候正式拉開序幕。 Intel在獨顯市場失利 從PC GPU的市場份額來看,現在市佔率最高的並不是Nvidia,而是Intel——從Jon Peddie Research今年一季的資料來看,Intel在PC GPU市場的比重達到60%,Nvidia是21%,AMD為19% (這份資料也需要考慮到AMD的整合顯卡)。這當然主要歸功於Intel這麼多年都在推自家的整合顯卡或核顯產品,畢竟大部分PC使用者並不需要高運算力的獨立GPU。  

(來源:Jon Peddie Research)

  Intel前不久發佈了自家的獨顯產品,打算和Nvidia、AMD一較高下。不過這可不是Intel進駐GPU或獨顯的開端。這家公司在其發展歷程中,始終與繪圖處理器、加速卡有著千絲萬縷的聯繫。 早在1980年代,Intel看到NEC、日立(Hitachi)等公司的獨立圖形控制器產品生意紅火,也打算進駐這一市場。1986年Intel發佈82786圖形輔助處理器(並且在此之前就和NEC有過圖形技術授權合作)。後來持續有多家公司(AIB顯卡廠商)基於這顆晶片推出了板卡產品。不過,其實Intel和同期的競爭對手比起來是沒有技術優勢的。 1998年,相對更知名的i740獨顯問世——這是一顆主頻220MHz、2-8MB VRAM顯存的獨顯,支援DirectX 5.0和OpenGL 1.1。Intel其實很清楚其顯存容量相比同期競爭對手過小的問題,該公司的想法是充分利用當時AGP介面的一大特性:板卡可以用主記憶體。i740上的小顯存只用作影格緩衝(frame buffer),而所有的圖形紋理都放在系統主記憶體裡,如此一來i740的成本也就比較低了。 不過這麼做的弊端也很明顯:記憶體讀取速度緩慢,成為性能的巨大瓶頸;而且還和CPU爭搶頻寬資源。加上Intel糟糕的驅動,i740算是相當失敗的產品。即便Intel後續要求主機板廠商綁定銷售,也未能挽回其頹勢。 i740產品開發同期,是有些產業八卦可以聊。1995年,大名鼎鼎的Lockheed Martin開設了一個新的部門——Real3D (據說是因為模擬器圖形技術比較花錢,Lockheed Martin決定回點血)。Real3D的首個客戶就是世嘉,憑藉世嘉在街機市場的巨大成功,Real3D的圖形加速器產品出貨量相當之大。     同期Intel正準備在這一領域一展拳腳。所以協同當時的另一家公司Chips and Technologies,一起和Real3D展開合作。這就是後來i740誕生的背景,與此同時Intel也購入了Real3D的部分股權。 如前所述,i740失敗了。Intel就把Real3D從Lockheed Martin那裡買了下來。之後有一段Real3D遺產的故事,包括ATI搶了一部分人、3dfx和Real3D打專利官司、Intel把Real3D的全部IP都賣給了3dfx (後來自然成為了Nvidia的一部分),後續又有ATI參與的專利官司等...然後Intel就退出了獨顯市場,畢竟i740銷量不怎麼樣,還鬧出一大堆的破事。在此之後,Intel主攻方向就變成了整合顯卡...若說Intel在獨顯市場的嘗試,後續還有個Larrabee專案——但產品以胎死腹中告終。 據說i740的失敗,以及Real3D的一系列變故,為Intel造成了不小的打擊,當時Intel內部甚至傳出不會再涉足獨顯的傳言。不過2007年Larrabee、2012年的Xeon Phi,以及現如今的Arc獨顯,都說明Intel和GPU藕斷絲連的關係始終在持續。起碼在i740以後,Intel的繪圖運算主戰場都轉向了整合顯卡與核顯,只不過這些應該也是整合顯卡得以發展的必要條件。 Intel整合顯卡上半場發展簡史 1999年的i810晶片組,及其中的i752整合顯卡,可以說是i740的演進——可見技術仍然是有延續性的。2001年有幾個重要事件。第一是矽統針對其整合顯卡產品加入了T&L (Transform, Clipping, and Lighting)支援——這是繪圖運算領域的一項重要特性,包括3D場景的2D化、只保留場景中可見的部分、基於光照資訊轉化場景中各個面的色彩資訊。從這個時候開始,「整合顯卡」稱謂才真正變得名正言順;至少它在功能上完整了不少。 第二件事情是Nvidia針對AMD處理器平台,推出了nForce 220整合顯卡,當然也是整合到主機板晶片組裡。不久後Nvidia就和在技術轉向後的Intel發生矛盾,兩家公司打起了曠日持久的官司。Nvidia後來於2012年退出了整合顯卡市場,以至於當時該市場只剩下AMD、Intel和威盛(VIA)。 第三件事則是2001年,Intel建立Extreme Graphics整合顯卡家族——這個系列的整合顯卡名稱沿用到了2004年。初代Extreme Graphics整合在i830晶片組內部,配套的處理器是Pentium III-M。二代Extreme Graphics出現了筆記型電腦平台版,配套Pentium M處理器。這時期的整合顯卡基本就是亮機卡,頂多可以玩一些老遊戲。其實即便是2004年的GMA 900整合顯卡(i915晶片組),內部都還沒有頂點著色器(vertex shader),需要依靠CPU來做這部分工作;且主記憶體頻寬低,自然不需要多指望性能。 從2002年開始,ATI也開始開發整合顯卡,初代IGP 320 (ATI A3)。如果以Intel的整合顯卡產品型號為依據,則PC市場的整合顯卡後續經歷了GMA系列(2004年起)、HD Graphics系列(2010年起)、Iris系列(銳炬,2013年起)。從2010年的HD Graphics開始,整合顯卡開始有了「核顯」基因。     從整合顯卡走向「核顯」 早在2006年AMD收購ATI之際,AMD就期望打造所謂「真正的整合GPU」,就是將CPU和GPU放到同一顆晶片,甚至同一片die上(雖然感覺這在行動領域似乎一點也不新鮮)。但以當時的技術來看,AMD和ATI不同的晶圓廠、不同的設計工具,還有企業文化方面的差異,都讓這樣的工作充滿挑戰。 2010年,Intel率先把32nm製程的CPU die,和45nm製程的GPU die放到了同一個封裝內,CPU和GPU算是正式會師,這對於降低延遲有相當的價值。而且HD Graphics在性能上比更老的GMA有了不小的提升:23個執行單元(EU),最高900MHz 43.2GFLOPS運算力,能夠以最高40fps速率解碼H.264 1,080p視訊。 當時Intel已經開始宣稱核顯要鎖定休閒和主流PC遊戲。似乎對於這顆Westmere架構處理器,很多人才承認它作為iGPU的名副其實;這才算是「integrated」。 2011年,Sandy Bridge架構處理器(第2代Core)問世,隨之而來的是第二代HD Graphics核顯,而且這次的核顯更進了一步,GPU和CPU真正放到了同一顆die上。AMD也是在這一年將APU理念付諸實踐,從架構來看,Sandy Bridge處理器上的GPU已經可以和CPU共用L3 cache。 翌年HD Graphics 4000核顯伴隨Ivy Bridge處理器(第3代Core)出現的時候,有關Intel核顯性能的宣傳就全面開啟了——當時的不少媒體口徑都在說「堪比獨顯」。不過即便HD 4000性能的確大幅攀升,還能以低畫質暢玩《英雄聯盟》(League of Legends),但也僅限於此了。即便這在當時也稱得上驚豔了,整合顯卡的風是從這個時候全面吹起來的。  

左邊那片小die是Broadwell的eDRAM。

  在Xe核顯(第11代Core)之前,近代Intel核顯發展相對激進的應該是Broadwell (第5代Core,2014年)——這一代的Iris Pro核顯基於GT3e架構,片上特別配了128MB的整合eDRAM,核顯規格稱得上豪華。據說其性能達到了GeForce GT 730的水準——雖然現在聽起來不算什麼。 值得一提的是,除了API方面的支持演進、架構變化、規模增大,歷代核顯也在多媒體支援上有顯著提升,包括各類格式的編解碼硬體加速——這好像也是當代整合顯卡乃至獨顯內卷的重要組成部分。 整合顯卡發展史上的其他故事 Intel整合顯卡發展史上有一款十分有趣的處理器,代號Kaby Lake-G (第8代Core,2018年)。這顆晶片的有趣之處在於,同時整合在一個封裝內的核顯,乃是AMD的Radeon RX Vega M。Intel官方推出了一款搭載AMD核顯的Intel處理器,聽起來有沒有很新奇? 從Kaby Lake-G的外形來看,這代晶片總共有3片die,一片是Intel CPU,一片是AMD GPU,還有一片是4GB HBM2顯存,有沒有感覺十分高級?這款處理器同時也是Intel比較早期的2.5D先進封裝(EMIB)試水溫的產品。從堆料來看,核顯性能應該是同一代Core核顯的2.5倍。  

採用AMD核顯的Intel處理器Kaby Lake-G。

  從當年的實測性能來看,Kaby Lake-G繪圖運算力應該和筆記型電腦GeForce GTX 1050差不多,有些測試還超過了1050——現在的大部分核顯都還做不到這樣的程度,應該算是核顯方面當時最有誠意之作了吧;只是這樣的合作在歷史上都是不可多得的。 不過整合顯卡的發展故事也不僅限於PC設備。隨便舉幾個例子,2004年高通(Qualcomm)發佈MSM6150/6550,其中就有ATI的Imageon「整合顯卡」(也就是後來的Adreno GPU);2005年德州儀器的OMAP2420「整合顯卡」是來自Imagination的PowerVR GPU,應用於諾基亞(Nokia) N95手機;現在的手機AP SoC都應該說是整合了「顯卡」的晶片。 遊戲主機、掌上型遊戲市場的核顯就更為常見了:比如任天堂(Nintendo)的Switch遊戲機基於Nvidia的Tegra處理器;2013年,PS4和Xbox One X都採用AMD的APU;那麼實際在更多市場都有類似的應用,比如奧迪(Audi) 2008年就把Nvidia的Tegra晶片加到了汽車的資訊娛樂系統中。 這方面的基因造就了現在蘋果Mac所用的M系列晶片都是「核顯」,且核顯性能依蘋果的說法是媲美GeForce RTX 3090這種獨顯最高配,當屬「整合顯卡」或「核顯」的究極形態了吧。不過蘋果封閉生態的特殊性,以及其盈利方式與傳統晶片公司的差異決定了該公司可以這麼做;但其他晶片公司大概率是無法發展這種程度的「核顯」。 AMD的APU理念與蘋果的續寫 若沒有以AMD處理器為線索,來寫這段整合顯卡發展史可能是不對的。AMD收購ATI以後,就在努力打造APU晶片——也就是將CPU和GPU放到同一顆die上,並建構UMA為基礎的HSA聯盟。 2011年AMD推出的首款APU代號Llano,結合了4顆K10 CPU,以及Radeon HD 6000系列GPU,放在同一顆die上。這顆晶片基於GlobalFoundries的32nm製程。當時AMD的理念是期望GPU日常能夠頻繁參與到通用運算工作中來,隨時把有高度平行需求的密集型數值運算任務交給GPU去做,讓CPU和GPU真正作為同一顆晶片來用。只不過AMD的號召力不足以支撐起這樣的生態,除了在遊戲主機領域得到普及,PC平台的APU生態是事實上失敗的。 不過APU客觀上促成了整合顯卡性能的內卷。因此AMD都是基於強核顯性能這一理念來推APU晶片,Intel也對應地在每一代加強核顯性能,所以才能在這兩年看到PC處理器核顯性能的持續飛躍。     今年的RDNA 2核顯勉強都能玩3A遊戲了;12CU規格的Radeon 680M,運算力單元規模相當於Radeon RX 6400 (雖然儲存系統還是差遠了)。雖說和歷史上出現過的一些核顯怪胎不同,但還是讓Nvidia的入門級獨顯首次感到了白色恐怖。 比較有趣的是,AMD雖然未能在APU with HSA的理念上真正有所斬獲,但蘋果續寫了這個故事。蘋果在M1晶片發佈之際就在宣傳UMA——這不是什麼新東西;只不過以蘋果的半封閉生態及生態號召力,蘋果GPU參與更多通用運算工作加速顯得更為尋常。 而且蘋果晶片起於手機AP SoC,基因裡有著天然的「核顯」屬性,GPU就是和CPU放在同一片SoC晶片上。這麼算來,M1 Max/Ultra也都屬於「核顯」範疇,以其規模堆砌程度,應當還沒有核心晶片可與之在絕對性能上相提並論。或許蘋果的M1 Ultra正是AMD當年APU理念締造之初的終極目標,包括UMA,以及接近高階獨顯顯存頻寬的記憶體頻寬(800GB/s)水準。 本文原刊登於EE Times China網站        

發表評論