儘管蘋果(Apple)和三星(Samsung)都擁有自主開發的應用處理器,在高階的智慧型手機市場形成一定的門檻;但是,聯發科技(MediaTek)最近在全球行動通訊大會(MWC)上推出最新的曦力(Helio) P60晶片組,期望藉由行動AI應用重振其智慧型手機市場。

聯發科的計劃是重新進軍直接與高通展開競爭的中、高階智慧型手機市場。

聯發科將Helio P60視為「首款內建多核心人工智慧(AI)處理器(行動APU)和聯發科NeuroPilot AI技術的新一代智慧型手機SoC平台。」

此舉突顯了智慧型手機市場競爭焦點的重大轉變——開始轉移至行動AI。各家晶片供應商正競相將神經網路引擎用於手持裝置上。他們的目標很簡單,希望啟用人工智慧體驗——語音使用者介面(UI)、人臉解鎖、擴增實境(AR)等——在客戶端裝置上處理得更快、更好,無論有沒有網路連接。

The Linley Group資深分析師Mike Demler說:「光是去年我們就看到第一批搭載嵌入式神經引擎的智慧型手機處理器,這些幾乎都是旗艦級的處理器,例如Apple All、華為麒麟(Huawei) Kirin 970、高通(Qualcomm)驍龍(Snapdragon) 835以及聯發科的Helio X30等。」

Demler表示:「聯發科將在更低層添加神經引擎的作法並不令人意外,但有意思的是,他們打算採用較其旗艦產品X30更強大的核心來實現。」

換句話說,一個主要由中國手機製造商推動的中階智慧型手機供應商社群,開始顯得蠢蠢欲動。他們盡快出擊行動AI市場。

聯發科將其所謂的「新高階」(new premium)定義為「以中等價格提供優質性能與特性的裝置」。聯發科全球銷售總經理Finbarr Moynihan解釋:「這是當今智慧型手機的動向,包括Oppo、Vivo與聯想(Lenovo)等中到高階業者都渴望能地縮小其與頂級競爭對手的差距,希望在應用程式(app)、特性與AI方面取得重大進展。」

聯發科指出,2017年全球智慧型手機出貨量的48%來自中國OEM,主要針對新興市場。聯發科引用TrendForce的報告指出,2017年中階消費品牌大幅成長,小米(Xiaomi)智慧型手機的產量增幅高達76%,而Transsion、OPPO和Vivo也有顯著的成長。

Helio P60在八核心CPU中配備4個Arm A73處理器和4個Arm A53處理器。聯發科聲稱,由於採用big.LITTLE八核心設計,Helio P60的CPU性能較其前代產品Helio P23和Hleio P30提升了70%。藉由使用最高800MHz的新型Mali G72 GPU,P60還可將GPU性能提高70%。

神經網路引擎

然而,Helio P60之所以特別之處在於其內建NeuroPilot AI平台,橋接CPU、GPU與板載AI加速器。聯發科的AI架構藉由在SoC中協調CPU、GPU與AI加速器之間的運算負載,以管理異質的AI運算架構,並使得性能與能效最大化。

聯發科並證實,P60的AI加速器中整合了Cadence Vision P6核心。

20180227_MWC_NT01P1 Cadence Vision P6(來源:Cadence)

相較於聯發科技旗艦級Helio X30——採用Cadence Vision P5實現每秒70 GMAC的高性能,Helio P60每秒可處理280 GMAC。Demler表示:「因此,P60的整體處理器性能僅降低一個等級,神經引擎性能則提高了4倍。」

相較於Helio P60神經網路引擎的性能,Demler說:「華為麒麟970可達到〜1 TMAC/s(FP16),因而能以更高解析度實現較P60更高4倍的神經網路性能。在280 GMAC/s時,P60可媲美Apple A11的300GMAC/s性能。」

缺乏AI基準

然而,我們所諮詢的大多數分析師都同意,由於缺乏深度學習加速器的基準,在進行比較時幾乎沒有什麼意義。Demler稱此為「一個重大的開放問題」,並指稱這一行動AI的困境讓我們很容易就陷入「GOPS/TOPS的市場炒作之戰」。

Tirias Research首席分析師Jim McGregor表示贊同。他說:「這是一個令人困惑的話題,因為目前並沒有什麼細節和基準可參考。聯發科和其他公司使得這些AI解決方案聽起來就像可以完成任何事情一樣,但這一切通常並不真實。」

例如,Demler說,聯發科P60中使用的Cadence Vision P6核心的最佳化主要針對電腦視覺應用,而非通用神經網路。

McGregor解釋,「首先,你必須了解大多數的AI處理器,例如聯發科、Apple和華為稱其解決方案為『專用』的意思——這意味著他們使用單個IP區塊進行AI加速。在大多數情況下,這表示從Cadence或Ceva等其他業者取得授權的IP區塊。」 McGregor指出,這種IP區塊「支援有限的可配置神經網路,但是「沒人會確切地說出這些限制是什麼。」

因此,很顯然地,在應用處理器內部放置神經網路引擎並不是最後的任務。McGregor指出,開發和訓練新的神經網路,仍然需要在資料中心進行,他們必須依賴更多高精確度、強大的訓練處理器。

如果應用開發人員和OEM要利用智慧型手機應用程式處理器內部的神經引擎,他們就需要一個連接至底層硬體的軟體架構。根據Demler的觀察,「所有主要的行動處理器設計商(高通、聯發科、華為、Apple)都提供神經網路SDK。」但他們都需要支援像Caffe和Torch這樣的廣泛訓練架構。

以聯發科而言,Moynihan指出,該公司提供了NeuroPilot AI SDK架構,能讓App開發人員和OEM「直接下探至硬體,看看AI軟體如何在CPU、GPU和專用AI加速器上運行」。

同時,隨著Google為Android機器學習開發了Android NNAPI和運行引擎,App開發人員和OEM也需要能夠「查找並察看Android Networks API (Android NNAPI)所說的內容,」Moynihan補充說,「聯發科的NeuroPilot SDK完全符合Android NNAPI。」

20180227_MWC_NT01P2 Android Neural Networks API系統架構(來源:Google)

在部署讓智慧型手機處理器執行AI應用程式的各種方法中,高通似乎採取了一個稍微不同的方法。

McGregor說,高通的解決方案很不一樣,因為「他們採用已經用於晶片上的多種資源,包括Hexagon DSP、Adreno GPU和Kryo CPU核心。」

不過他也補充說:「由於沒有可用的基準,就很難確定哪一種方法比較好,但高通的架構模式確實提供了更大的靈活性。」

AI軟體之爭

無論底層硬體如何,這些軟體最終都能真正區分在任何智慧型手機上的AI體驗。

McGregor說:「現在,這些應用針對的是手機上的常見功能,例如攝影和數位助理。然而,通常由第三方軟體開發人員來開發和訓練模型供裝置使用。」

他指出,「在有限的情況下,有些模型或工具庫可用。高通以影像辨識為基礎,開發了一些工具庫,三星則著重於攝影技術,Apple預計也在開發自家的模型。」

其他情況則取決於應用程式開發人員,但這存在明顯的限制,McGregor說:「許多應用開發人員並不習慣深度學習,或者無法存取深度學習所需的大型資料中心。」

The Linley Group的Demler則在最近的《微處理器報告》(Microprocessor Report)中對於AI軟體的開發提出了警告。「處理器架構的多樣性為Android App開發人員帶來了挑戰,因為即使是在缺乏專用深度學習加速器的裝置上,這些App也必須能夠工作。」另一方面,他指出iOS App的開發人員只需要支援一些專為Apple設計的處理器。

同樣地,Tirias Research首席分析師Kevin Krewell警告道:「我看到最大的問題是每家晶片和IP供應商都以不同的方式耕耘機器學習領域。但Arm可能擁有最佳機會,能在一個IP上為多家供應商提供標準化。」

編譯:Susan Hong

(參考原文:Mobile AI Race Unfolds at MWC,by Junko Yoshida)