最近在深圳舉行的高通(Qualcomm)AI開放日上,高通發佈全新的Cloud AI 100產品,但沒有透露太多細節,因為要到下半年才能出樣,量產要等到2020年。《電子工程專輯》中國版分析師通過現場採訪、市場分析人士訪談及外媒資訊,逐漸梳理出高通開發Cloud AI 100背後的邏輯,揭開其神秘的面紗。

瞄準雲端AI推理

據市調公司預測,資料中心AI加速器市場規模將從2018年的25億美元增長到2023年的212億美元。眾所周知,在雲端運算平台的AI加速包括訓練和推理兩部分,其中AI訓練側重運算力和性能,而AI推理更看重能效比,即每瓦性能。

從AI晶片的用量來看,AI推理加速器使用場景更廣泛,需求量自然更大。根據市調機構Tractica預測資料,單單資料中心AI推理這一細分市場從2018年到2025年將有10倍的增長,達到170億美元。在目前的資料中心處理器玩家中,英特爾(Intel)壟斷著伺服器CPU和AI推理,而Nvidia霸佔著AI訓練,AMD和賽靈思(Xilinx)正在聯合進攻這一令人垂涎的市場。此外,還有眾多AI晶片初創公司想進來分一杯羹,比如Wave Computing、Graphcore和基於RISC-V架構的Esperanto。

全球Superscale雲端平台服務商是AI加速器的主要需求者,其中Google會使用自家開發的TPU,而亞馬遜(Amazon)也在大力宣傳自己的Inferentia機器學習推理晶片。看來潛在的大客戶只有Facebook、微軟(Microsoft)、阿里雲、騰訊雲和百度了。因此,曾經嘗試進軍伺服器CPU市場而失敗的高通欲涉足雲端AI推理領域,能成功嗎?

5G行動是高通獨家王牌

高通產品管理副總裁Ziad Asghar在介紹Cloud AI 100時,列出了高通在四個方面的優勢,包括採用先進的7nm製程、規模化、訊號處理技術,以及低功耗設計專長。高通和Nvidia的高階晶片都是交給台積電(TSMC)代工,這方面高通並沒有特別的優勢。在規模化方面,高通的手機晶片出貨量以億計,規模和成本優勢可以部分轉移到新的產品上,但剛開始應該不會很明顯。

20190425NT61P1

在行動終端的訊號處理方面,高通確實有獨到之處。內建AI引擎的Snapdragon 855 SoC是高通目前最高階的行動處理器,而Asghar宣稱Cloud AI 100的性能是855晶片的50倍,即其峰值AI性能將達到350 TOPS。這個AI引擎就是高通所謂的神經處理單元(NPU),整合了「Hexagon」DSP和「Adreno」GPU,在行動終端上與其「Kryo」CPU配合,可以高速執行密集的浮點和整數運算。

20190425NT61P2

終端的AI性能如何在雲端同樣發揮其優勢呢?高通有兩張王牌可以打,即5G和低功耗設計。在行動應用處理器方面,高通的Snapdragon晶片並不比蘋果(Apple)、三星(Samsung)和華為的自研晶片強多少,但在5G基頻上就無人能及了。最近蘋果別無選擇,只好跟高通達成和解,繼續使用高通的5G晶片,不然5G iPhone都不知道什麼時候能夠出來。現在高通腳踏iOS和Android兩隻船,在即將到來的5G時代必將獨立船頭,一路領先。具有高速度和低延遲特性的5G必將成為嫁接行動終端和雲端的橋樑,成為高通將AI性能帶到雲端的驅動器。

英特爾和Nvidia都曾嘗試進入智慧型手機和平板電腦的行動市場,但都以失敗告終。究其原因,主要就在於他們的CPU/GPU功耗太大,這是電池供電的行動終端無法忍受的。好在他們兩家都在資料中心市場找到了用武之地,但現在注重環保節能和節約成本的資料中心也開始以能效比為主要衡量指標了。高通在低功耗設計方面的專長在雲端又可以充分發揮了,特別是用量比較大的雲端邊緣伺服器,因為它起著連接行動終端和雲平台的橋接作用。

Asghar在演講中宣稱Cloud AI 100的能效將比目前市面上AI推理晶片強10倍,並多次強調它將作為輔助處理器(co-processor)以插卡形式「隨插即用」到雲端伺服器上。小尺寸和低功耗的AI推理加速器插卡將會得到雲平台服務商的青睞。

20190425NT61P3

此外,Cloud AI 100不需要單獨的作業系統和軟體支援,因此可以最大限度地支援現有的主流深度學習框架,包括Caffe、Keras、mxnet、TensorFlow、PaddlePaddle和Cognitive Toolkit等。廣泛的平台和軟體支援可以吸引更多的軟體和應用開發商,從而構建自己的生態圈。

應用為王

高通總裁Cristiano Amon在一次視訊訪談中談到Cloud AI 100的應用前景,預言到雲端就是新的遊戲平台,這是Cloud AI 100的「完美應用場景」。在雲端伺服器上執行的高能效AI推理可以減輕行動終端的AI處理負荷,行動遊戲要求低延遲,因此AI操作要從資料中心的大型伺服器中走出來,儘量接近行動終端。

20190425NT61P4

Google最近公佈的雲遊戲平台Stadia似乎也驗證了這一預言。在深圳AI開放日上,高通邀請Vivo、王者榮耀開發團隊和騰訊AI Lab負責人助陣,一起演繹了一場專業遊戲電競賽。由此可以看出行動遊戲將是最能發揮Cloud AI 100極致性能的應用,而騰訊雲也可能成為中國首批Cloud AI 100用戶。

高通的多元化嘗試

為應對增長逐漸放緩的手機市場,以及來自聯發科(MTK)和紫光展銳的蠶食競爭,高通早就開始進行多元化嘗試,以分散業務過於依賴手機的風險,同時也在尋求新的增長點。欲借收購NXP進入汽車電子市場的計畫破滅後,以Arm伺服器晶片進軍伺服器市場的雄心壯志也未能實現。過去幾年又遭受多個政府的反壟斷調查,再加上官司纏身,高通似乎迷失了方向。

Amon承認在伺服器CPU市場跟英特爾展開正面交戰,付出的代價太大,而收效甚微。於是果斷裁掉Centriq伺服器業務部門,雖然裁員對公司員工會造成負面影響,而且高通與貴州省的合作項目華芯通也遭受到關閉的命運,但從公司戰略角度來看是正確的決定。

這次瞄準雲端AI推理這一細分市場的嘗試能否成功呢?筆者認為,高通這次比較務實,從自身核心優勢出發,以全新的產品切入一個有很大增長潛力的新興市場,成功的概率還是比較大的,只要高通在策略執行上不出大錯,能夠沉下心來堅持幾年的話。雲端AI加速市場還沒有出現明顯的技術領先者,無論是高性能CPU,還是GPU、FPGA,還是特定域的ASIC,都有機會佔據一席之地。也許這次高通真的能夠將其在行動端的優勢延伸到雲端,借助AI和5G這兩個高速運轉的飛輪,開闢出一個新的領地來。

本文為姊妹刊EE Times China原創文章