微控制器大軍進攻低功耗終端AI應用市場

作者 : Sally Ward-Foxton,EE Times歐洲特派記者

利用微控制器等級的元件實現有意義的機器學習並非易事。例如,AI運算的關鍵標準——記憶體——通常受到嚴重限制...

如果把人工智慧(AI)和物聯網(IoT)相結合,會得到什麼呢?答案很簡單,智慧物聯網(AIoT),不過還有一系列的微控制器新應用;得益於神經網路技術的進步,機器學習不再侷限於超級電腦的世界了。如今智慧型手機應用處理器可以(也確實已經在)執行AI推論,用於實現影像處理、推薦引擎(recommendation engines)和其他複雜的功能。

20200407_MCU_NT31P1

未來幾年,數十億IoT設備的生態系統將擁有機器學習能力。
(圖片來源:NXP)

將上述功能導入不起眼的微控制器,意味著巨大的商機。想像一下,助聽器可以使用AI來濾除對話中的背景雜音;智慧家電可以識別使用者人臉並切換到其個性化設置;支援AI的感測器節點僅需很小的電池即可運作數年。在終端處理資料具有不可忽視的優點,比如低延遲、高安全性和隱私保護等。

然而,利用微控制器等級的元件實現有意義的機器學習並非易事。例如,AI運算的關鍵標準——記憶體——通常受到嚴重限制。但資料科學正在迅速發展,以縮小模型的尺寸;裝置與IP供應商也正透過開發工具並整合針對現代機器學習需求量身打造的功能來因應挑戰。

tinyML嶄露頭角

作為這個領域正快速發展的例證,一場在2月初於美國矽谷舉行的產業會議tinyML Summit正變得越來越盛大。主辦單位表示,2019年舉辦的首屆會議有11家贊助公司,而2020年贊助商則有27家,展位賣完的時間也早很多。主辦單位還表示,針對工程師的全球性月會參與成員數量也急遽增加。

tinyML委員會(tinyML Committee)聯合主席、任職於高通(Qualcomm)的Evgeni Gousev在該場大會開幕演說中表示:「我們看到了一個新世界,擁有由tinyML技術實現之數以兆計的智慧裝置,可以共同感知、分析和自主行動,為所有人創造一個更健康、更具永續性的環境。」

Gousev將這種成長歸因於更節能的硬體和演算法的發展,以及更成熟的軟體工具之開發;他指出,企業和VC投資正在增加,新創公司和企業併購案例也在增多。如今,tinyML委員會認為此技術已經得到驗證,且預測在微控制器中使用機器學習的第一批產品將在23年內上市,「殺手級應用」則預計將在35年內問世。

去年春季,Google首次演示了用於微控制器的TensorFlow框架版本,這是技術驗證的重要部分。微控制器的TensorFlow Lite設計為在只有KB容量記憶體的裝置上運作(Arm Cortex M3核心可在16KB內執行,加上足夠執行語音關鍵字檢測模型的運算子,總共佔用22 KB),僅支援推論(不支援訓練)。

主要廠商

當然,大型微控制器製造商正興趣濃厚地關注tinyML社群的發展,隨著研究進展讓神經網路模型越來越小,其商機也越來越大。大多數方案都提供針對機器學習應用的某些支援;例如意法半導體(STMicroelectronics)可提供擴展軟體工具套件STM32Cube.AI,能夠在基於Arm Cortex-M的STM32系列微控制器上映射和執行神經網路。

瑞薩(Renesas)則有自己的e-AI開發環境,可在微控制器上實現AI推論,能有效地將模型轉換為一種在其e2 studio工具中可用的形式,並且與C/C++開發案相容。

NXP則表示,已有客戶將其低階Kinetis和LPC MCU應用於機器學習;該公司正在結合AI硬體和軟體解決方案,儘管起初主要圍繞其較大的應用處理器和跨界處理器(介於應用處理器和微控制器之間)進行。

強大的Arm核心陣營

大多數微控制器領域的老牌公司都有一個共同點,就是採用Arm核心;這家嵌入式處理器核心巨擘以Cortex-M系列產品主導微控制器市場,最近還發表了全新的Cortex-M55核心,是專門為機器學習應用設計的,特別是與Ethos-U55 AI加速器結合時,這兩種方案都是為資源受限的環境而設計。

但是,新創公司和較小型的公司要如何在這個市場上與大公司競爭?「並不是透過打造Arm核心SoC!因為他們在這方面已經做得很好;」英國業者 XMOS執行長Mark Lippett笑著說:「與這些對手競爭的唯一機會是擁有架構優勢…(該公司的)Xcore在性能方面就具有獨特優勢,也不失靈活性。」

雖然XMOS最新發佈的語音介面應用跨界理器Xcore.ai,不會與微控制器直接競爭,以上觀點仍是正確的。任何公司要製造以Arm核心為基礎的SoC來與大公司競爭,都最好要在他們的秘密武器中有一些比較特別的東西。

擴展電壓和頻率

新創公司Eta Compute在tinyML展會期間發佈了備受期待的超低功耗元件,可應用於不斷線影像處理,以及功耗預算僅100μw之感測器融合應用中的機器學習。該晶片採用Arm Cortex-M3核心加上一顆NXP DSP核心,其中任一個核心或兩者一起都可用來處理機器學習工作負載。這家公司的秘密武器有幾個關鍵要素,最主要的則是在這兩個核心上連續擴展時脈頻率和電壓,這樣可節省大量電能,特別是在沒有鎖向迴路(PLL)的情況下實現。

20200407_MCU_NT31P2

Eta Compute的ECM3532使用Arm Cortex-M3核心加NXP CoolFlux DSP核心。機器學習的工作量可以由其中任一核心來處理,也可以兩顆一起。
(圖片來源:Eta Compute)

不過如今市場上已出現Arm陣營的有力競爭對手,包括由RISC-V基金會開發的新興指令集架構;既是如此,為何Eta Compute仍選擇使用Arm核心來實現超低功耗的機器學習加速呢?

對此Eta Compute執行長Ted Tewksbury接受《EE Times》採訪時表示:「答案很簡單,Arm的生態系統已經發展得很好;採用Arm方案實現量產比採用目前的RISC-V架構要容易得多。這種情況將來可能會有變化…RISC-V有自己的優勢,這在中國市場肯定會有利,不過我們現在主要是利用[我們的元件]之生態系統來服務美國國內和歐洲市場。」

Tewksbury指出,AIoT面臨的主要挑戰是應用的廣度和多樣性;該市場相當分散,許多相對利基的應用數量相當小;不過整個AIoT市場的裝置數量可能擴展到數十億台。

「開發人員面臨的挑戰是,他們負擔不起為每個應用案例量身打造解決方案所需的時間和金錢;」Tewksbury表示:「這也是靈活性和易用性變得相當重要的地方,以及我們選擇Arm架構的另一個原因──Arm有自己的生態系統、有自己的工具,客戶無需做大量的客製化就可以很容易地快速開發產品並將之推向市場。」

而Arm在鎖定指令集架構(ISA)數十年之後,終於在去年10月宣佈允許客戶構建自訂指令,以處理機器學習之類的專業工作負載;如果使用得當,這種功能還有機會進一步降低功耗。不過Eta Compute還不能利用此新功能,因為它不適用於現有的Arm核心,所以也不適用於Eta正在使用的M3核心。

但Tewksbury是否預期Eta Compute在未來的產品中使用Arm客製化指令來進一步降低功耗呢?他的回答是:「當然會。」

可替代的ISA選項

RISC-V在近來一直備受矚目,此開放性ISA能讓設計工程師不需先支付授權費就進行處理器設計,不過就像其他類型的IP一樣,採用RISC-V ISA的設計同樣可以受到保護。設計人員可以選擇要添加的擴展,並可以添加自訂的擴展。

有多家業者使用RISC-V核心瞄準超低功耗機器學習領域,法國新創公司GreenWaves就是其中之一,其GAP8和GAP9晶片分別使用8顆與9顆核心的運算叢集。

20200407_MCU_NT31P3

GreenWaves的超低功耗AI晶片GAP9的架構,現在使用了10顆RISC-V核心。
(圖片來源:GreenWaves)

GreenWaves負責業務開發的副總裁Martin Croome對《EE Times》解釋了公司使用RISC-V核心的原因。他表示:「首先是因為RISC-V讓我們能夠在指令集層級客製化核心,我們大量使用此功能;」他解釋,客製化擴展是用以減少機器學習和訊號處理的工作量,「公司剛成立的時候,如果想用其他處理器架構來完成這件事,不是不可能就是得花一大筆錢,而且等於是讓你的投資人付錢給另一家公司,這很難令人信服。」

與未修改的RISC-V核心相比,GreenWaves的自訂擴展使其核心功耗表現有3.6倍的改善;但Croome也表示,RISC-V之所以具有基本的技術優勢,就是因為它是全新的;「這是一套非常簡潔、現代化的指令集,沒有任何累贅,所以從實作的角度來看,RISC-V核心實際上結構更簡單,也就意味著更低的功耗。」

Croome還認為控制是一個重要因素。GAP8的運算叢集有8顆核心,而GreenWaves需要對核心執行進行非常精細、具體的控制,以實現最大的能效;他說RISC-V能實現這一點。「最後如果我們可以用Arm來實現所有上述功能,那我們就會用Arm,這是更合乎邏輯的選擇…因為從來沒有人會因為採購Arm而被炒魷魚;」他開玩笑說:「(Arm)的軟體工具成熟度遠高於RISC-V…但話又說回來,現在RISC-V如此受矚目,其工具成熟度也快速提升。」

總而言之,儘管一些人認為,Arm在微處理器市場的主導地位正在減弱,在一定程度上是因為來自RISC-V的競爭加劇;但GreenWaves從一開始就採取客製化擴展指令的策略,針對機器學習開發全新的核心來因應競爭。

事實上,Arm核心和非Arm核心元件都會進軍超低功耗機器學習應用市場,隨著tinyML社群繼續致力於縮小神經網路模型的尺寸、開發專屬框架和工具,該領域將發展成為一個健康的應用領域,為各式各樣的不同類型裝置提供支援。

本文同步刊登於《電子工程專輯》雜誌2020年4月號;責編:Judith Cheng

(參考原文:Adapting the Microcontroller for AI in the Endpoint,by Sally Ward-Foxton)

發表評論