超大規模業者(hyperscale companies)主宰了電子世界。這些簡稱為「FANG」──包括Facebook、亞馬遜(Amazon)、蘋果(Apple)、Netflix、Google,以及阿里巴巴(Alibaba)、騰訊(Tencent)、百度(Baidu),還有微軟(Microsoft)──的公司,無論你選擇哪一種指標來衡量,都比世界上最大的晶片製造業者來得有份量;我們在接下來十年可以確定,這些巨擘將以我們很少人能想得到的方式重塑這個產業。

蘋果與台積電(TSMC)之間的關係就是一個例證;蘋果的訂單佔據了這家全球晶圓代工龍頭銷售業績的五分之一左右,還有一半以上的7奈米製程產能。而隨著越來越多FANG為了人工智慧(AI)與高性能運算(HPC)應用量身訂製晶片,這種趨勢將為半導體產業帶來變革,也對該產業領域的傳統業者帶來更多壓力。

那些顛覆商業、改變文化的「全球最大公司」,正開始重塑半導體產業;而它們到底做了什麼前所未見的事情、為什麼要這麼做?又可能會產生哪些後果?

兩年前,Google發表了自家開發的張量處理器(TPU),在機器學習測試上超越了英特爾(Intel)的Xeon處理器以及Nvidia的GPU好幾個等級;Google的TPU晶片是委託台積電以28奈米製程技術生產。

大約一年前,亞馬遜發表了用以驅動其客戶網站以及其他服務的Graviton伺服器晶片,該晶片也是在台積電以28奈米製程生產。Gravitron的表現超越了英特爾與AMD現有的通用處理器,能在亞馬遜的環境中以高效率運作,有助降低成本;使用以Gravitron驅動之伺服器的客戶,也能將某些服務的開銷節省一半。

現在,Facebook也正著手自己設計晶片。而像是英特爾、AMD與Nvidia等公司必須注意,FANG公司已經踩到它們的地盤。

可以確定的是,FANG們不太可能會加入收購行列,在半導體產業掀起另一次「整併瘋」;那些網際網路巨擘已經是美國政府「反壟斷」行為審查的對象。但是它們有可能會嘗試其他低調一點的作法,例如從晶片業挖角人才──這它們完全負擔得起。FANGs通常都會與IC設計服務業者合作,它們能輕易地與例如台灣的無晶圓廠IC業者接觸,延攬關鍵人才。

到目前為止,大多數由FANG設計的AI晶片是針對資料中心應用;今年稍早,高通(Qualcomm)也宣佈進軍該領域的計畫,估計資料中心市場到2025年可達到170億美元的規模。英特爾預期會在今年稍晚發表Nervana NNP-L1000,但該款AI晶片恐怕在性能表現上難以超越Nvidia最新的資料中心應用GPU。

影像與語音辨識以及大數據處理等應用,正在讓晶片的功能性延展到PC之外;AI晶片能有助於降低資料中心的功率消耗──資料中心的功耗每年以倍數增加,以一種不應該永續發展的速率。而全球有超過40家公司正在開發AI專用加速器,大多數是為了推論而非模型訓練;後者以Nvidia為霸主,囊括數十億美元市場。

當越來越多公司為邊緣裝置打造AI晶片,會發生什麼事?雖然現在這種案例還沒有到非常多,但時機已經到來;大多數專家預期,邊緣AI會是一個比資料中心AI更大的市場。

「在現實世界所佈署的邊緣AI應用究竟需要多大的運算力,現在還沒有答案;」Arm的機器學習事業群副總裁Steve Roddy 表示,在車用領域可能需要數個分散式系統或是單一個中央化系統,在工廠則可能需要每一台智慧裝置以無線連結到後端的中央CPU或分散式運算。

Roddy也指出城市中的相同問題:在5G網路中需要多大密度的運算?集中化程度有多高?「Arm的目標之一是打造一種系統,在中介軟體層可允許應用程式無縫地從不同的運算模式中轉換,而且那些模型會隨著時間進化。」

顯然Arm打算在分散式AI領域扮演關鍵角色,Google也是一樣──Google的TensorFlow行動/嵌入式團隊領導人Pete Warden表示:「能支援智慧功能如語音控制介面或加速度器的感測器,正朝向低功耗、低價發展,因此它們將隨處可見。」

「由AI驅動的運算裝置將以各種可能的方式進入我們的生活,」《AI at the Edge: A GigaOm Research Byte》一文的作者Byron Reese表示:「那些在資料被收集的邊緣執行推論之裝置,在功耗、安全性與速度方面的要求,會讓那些在我們日常生活中扮演要角的數位裝置,以一種越來越普及的方式擴張規模。」

包括意法半導體(ST)、賽靈思(Xilinx)以及其他許多傳統晶片業者,也以進軍規模可望遠勝資料中心AI的邊緣AI市場為目標,但它們才剛起步。這些傳統業者與那群規模更大的「新人」站在同一條起跑線上,而我賭贏得勝利的會是後者。

編譯:Judith Cheng

(參考原文: The FANGs & the Foundries,by Alan Patterson)