從雲端運算與物聯網(IoT)到越來越多的智慧型手機和智慧車輛,為了滿足各式各樣的新應用需求,記憶體業者正面對前所未有的壓力。此外,還有人工智慧(AI)和機器學習(ML),也正成為Google、Facebook和Amazon等全球主要的「超大規模業者」(hyperscaler)開發下一代平台的重要組成部份。

編按:這些全球數一數二的業界巨擘曾經顛覆業務並改寫產業生態,如今正開始重塑半導體產業。他們究竟正進行哪些前所未有的計劃?為什麼?又將帶來什麼樣的結果?

他們都在期待廣大的電子產業和記憶體製造商帶來大量創新,無論是進一步改善DRAM和NAND flash等現有記憶體,還是推動整合新材料的新型記憶體實現商用化,使其成為新運算架構的部份記憶體元件。但是,就算他們的口袋再深,也沒有哪一家公司可能投資製造設備來自行製造記憶體元件,更不可能支付高價購買。因此,如果DRAM仍然可用,他們就不會為了每台裝置多付5美元去購買新型記憶體。

Objective Analysis首席分析師Jim Handy表示,這些超大規模業者所具有的影響力是前所未有的;他所能想到歷史上最接近的情況是蘋果(Apple)在15到20年前所擁有的「龐大」購買力。然而,Apple僅著眼於對傳統運算架構進行些微改動——例如只是換了一個接腳,而且這一變化並未產生額外費用。「他們更傾向於採用現有的電腦架構,然後以更一種優質或更友善的方式提供給客戶。」

相形之下,超大規模業者則致力於尋求一系列或大規模的架構變化。Handy說,「他們的動機實際上是非常不同的,因為他們著眼於需要花費多少錢來買東西,然後也會考慮它得消耗多大的功率才能執行。」超大規模業者期望產業來解決這個問題,他們並不打算自己挺身而出以及支付新資本設備的費用。

JEDEC更新高頻寬記憶體(HBM)的規格,以滿足AI應用的要求,但其製造成本仍相當高
(來源:JEDEC)

美光科技(Micron Technology)先進運算解決方案副總裁Stephen Pawlowski表示,沒有一家超大規模業者會想自行製造記憶體,尤其是DRAM,除了其揮發性之外,他們也無法提供可媲美像DRAM一樣的可靠性、速度和耐用性。同時,NAND和一些較新的儲存級記憶體在材料方面更複雜,而且要瞭解它們如何在溫度、多個週期和不同工作負載下運作也不容易。因此並不至於讓Micron等記憶體製造商面對什麼威脅。「使用這些元件需要投資大量的創造力和人才,」他說:「簡言之,為了提高容量以及性能效率,我們需要為記憶體和儲存子系統做些什麼呢?協同合作似乎會更好。」

Pawlowski認為超大規模業者取代了OEM自2000年代中期起所扮演的角色。他說,OEM持續推動創新讓儲存更接近CPU,而超大規模業者則試圖以一種前所未有的方式推動網路頻寬,這意味著必須消耗大量電力才能移動數據。「當我們著眼於如何提高資料中心的效率時,務必做到確保讓運算系統與記憶體儲存子系統之間的資訊傳輸達到盡可能的低延遲。」

Globalfoundries嵌入式記憶體資深總監Martin Mason表示,人們對於在資料中心的運算密集型應用中部署MRAM和ReRAM十分感興趣,包括在伺服器集群實現主流的AI處理——其關鍵挑戰就在於功耗和記憶體頻寬。「你將會在此領域開始看到新型記憶體技術的部署。我認為現階段還沒有任何一種技術可真正被商業開發,但MRAM和RRAM都被視為可在該應用中取代SRAM的高密度記憶體技術。」

Martin表示,這一趨勢反映了超大規模業者過去五年來的發展,「他們從以軟體為主導的公司轉變得越來越垂直整合導向,包括所提供的企業基礎設施解決方案,以及更進一步在其解決方案中增加了晶片開發。」他們認為晶片開發可望在兩方面促進其發展,首先是實現與所有商品化企業硬體的差異化,其次則是經濟規模。透過垂直整合並將其設計直接帶到代工廠,他們最終得到了一種更具成本效益的解決方案,可以更快且更經濟地擴展。

這些超大規模業者超越軟體發展的最佳典範就是Google為其AI工作負載開發的Tensor處理單元(TPU),應用材料(Applied Materials)先進製程技術開發總經理Mahendra Pakala表示,這一類的處理器技術通常來自像英特爾(Intel)這樣的公司。而今,這些超大規模業者開始使用現有的一些技術來實現其AI加速器,「但是,一旦你開始設計和建構自家的加速器,就會看到不足之處。」他認為加速器也將推動新興記憶體的採用,以及因應其需求的整體記憶體開發藍圖。

應用材料公司將其Endura平台從單一製程系統發展為整合製程系統,作為新興記憶體材料工程基礎的一部份
(來源:Applied Materials)

高頻寬記憶體2.0 (HBM2)是在AI應用中備受關注的現有記憶體之一,傳統上用於高階繪圖和高性能運算。但Pakala指出,雖然在製造方面業已成熟,但HBM2技術仍然相當昂貴。他說,從新型記憶體來看,3D XPoint形式的PCRAM以及MRAN都已經可以看到一些應用了。「我們確實看到這二項技術日趨成熟,重點開始擺在降低每位元成本。同時,也確實出現了降價的途徑。」

Applied Materials認為材料工程是持續前進的基礎。因此,為了滿足包括AI等新興用例,必須以更具成本效益的方式製造PCRAM、ReRAM和MRAM。例如,該公司最新的Endura平台重點在於讓這些新記憶體的關鍵新材料能夠以原子級的精確度進行沉積。最新發佈的300mm MRAM量產系統由整合於超高真空環境的9個特殊晶圓處理反應室組成,每個反應室可分別沉積多達5種材料。

儘管代工廠正大力探索如何在基於新興記憶體的裝置上與超大規模業者合作,但是,Handy並未看到超大規模應用顯著推動對其需求,因為超大規模業者寧願花更少的費用或使用以DRAM和flash製造的複雜設置。Globalfoundries的Mason也認同超大規模業者更傾向於走務實路線,致力於讓當今的方案可行並尋求最佳的漸進式發展。但是,如果價格合適,那麼也可能出現大逆轉,讓他們願意投資於開發真正具有突破性的產品。他說:「我認為在他們之中已經有業者看到重大突破發生中。」

Handy說,這些超大規模業者使用記憶體的目的在於希望持續遵循摩爾定律,讓未來的界限進一步拓展。「為此,記憶體公司必須持續其資本支出,但如果資本支出變得太大,或者如果他們試圖更快速地擴展,那麼不但無法降低成本,還可能進一步堆高成本!」

編譯:Susan Hong

(參考原文:Memory Makers and Foundries Step Up to Hyperscale Demands,by Gary Hilson)