著眼於5G、物聯網(IoT)、人工智慧(AI)和機器學習(ML)等技術帶來數據驅動的全新運算需求,Arm在日前於台北舉辦的2019 Arm科技論壇中提出以客製化SoC為核心的「完全運算」(Total Compute),期望在其強大的安全基礎下,協助開發人員實現從雲端、邊緣到終端的新世代運算效能。

根據Arm預測,到了2035年,全球將有1兆個連網裝置,屆時結合5G網路以及AI與ML的運算效能,可望為裝置用戶帶來沉浸式體驗。Arm為此發表一系列專為主流市場而設計的產品與解決方案,包括加速ML部署的神經網路(NN)開源架構、均衡ML效能與功耗效率的Ethos-N57以及關注成本效益的Ethos-N37 NPU系列、首款基於Valhal架構的Mali-G57 GPU以及單位面積效率最高的Mali-D37 DPU,期望為邊緣到終端裝置的運算賦予機器學習能力。

基於機器學習的處理能力正逐漸普及於從邊緣到終端的各類裝置,Arm強調在處理器設計方面從來都不是問題,但這對於設計帶來的主要挑戰就在於如何因應不同市場對於機器學習的處理要求。

Arm機器學習事業群商業與行銷副總裁Dennis Laudick說他經常被問到一個有趣的問題:「哪一種處理器最適合機器學習?」當然,對於Arm而言,這是沒有單一答案的。Laudick說,Arm期望透過廣泛多元的選擇,讓客戶根據應用需求選擇最適合的解決方案。因此,「我們必須讓客戶幾乎可以採用任何處理器來實現機器學習,他們只需權衡應用所需要的效能、功耗與成本。」

繼去年推出首款ML產品Ethos-N77後,Arm不久前於北京的論壇中發表N57和N37系列,進一步延伸產品線至中階應用市場。Laudick介紹,如今其NPU系列更能滿足不同市場區隔對於機器學習的需求,「N77瞄準高效能應用,N57兼具成本與效能的優點,而N37則滿足更具成本考量的裝置需求。」

Arm Ethos NPU family

Arm Ethos NPU系列為裝置提供多種不同的IP選擇。(來源:Arm)

Arm NPU系列的產品設計雖然針對不同市場區隔,但其優點在於採用了相同的資料管理架構。Laudick說,機器學習主要目的就在於「解決資料管理的問題,它取決於有多少頻寬可用,而這又涉及處理器的效能。」他說,NPU系列在最差效能情況下的頻率也至少達到1-GHz,並已針對INT8/INT16資料類型實現最佳化。

最新的Mali-G57 GPU也針對INT8實現了最佳化。Arm運算事業群行銷總監Ian Hutchinson介紹,這有助於G57可在裝置實現的機器學習效能較G52提高了60%,能源效率與效能密度更高30%,不僅讓開發人員能夠開發出更高效能的裝置,為裝置用戶提供最佳體驗,還十分適於《要塞英雄》(Fortnite)和《絕地求生》(PUBG)等高階遊戲應用。

針對DPU設計,今年除了支援VR功能的D77,Arm並為主流市場發表採用Komeda架構的小型D37。「D37採用16nm製程技術,支援2K與Full HD,體積雖然還不到< 1mm2,但由於把原本在GPU執行的工作負載移至DPU處理,使其可節能達30%。」

Hutchinson說,當G57和D37搭配使用時,可望為智慧型手機、平板電腦以及智慧音箱等裝置用戶帶來沉浸式體驗。

Arm AI platform for ML

包括CPU、GPU與NPU等多種Arm AI平台,可為各種裝置日益增加的機器學習工作負載需求提供多種IP選擇。(來源:Arm)

本文同步刊登於EE Times Taiwan 12月號雜誌