作為成千上萬的智慧物聯網(IoT)產品核心,嵌入式處理器的獨特之處在於提供量身打造的功能和性能。展望未來的互連世界,我們發現傳統嵌入式處理器與千變萬化的IoT需求之間存在的差距正不斷擴大,人們需要處理器提供更低功耗、更經濟的可擴充性、更強的運算能力、更高的安全性,以及更好的使用者體驗。

為了滿足這一需求,我們需要突破應用處理器和微控制器(MCU)之間的界限,打造一類新的「跨界」嵌入式處理器。這種新型應用處理器採用MCU核心,但基於應用處理器的架構方式,既能實現應用處理器的高性能和豐富功能,同時兼具傳統MCU的易用性和即時低功耗運作特性。本文介紹這種跨界處理器(crossover processor)的架構及其提供的優勢。

應用處理器與MCU

多年來,嵌入式處理領域一直根據設計的需求分為兩個不同的陣營。要求經濟實惠和靈活實用的應用依賴於MCU,而超出MCU功能範圍的設計則使用應用處理器。但是,對於嵌入式設計師而言,在MCU和應用處理器之間實現無縫擴展並非易事。

在MCU和應用處理器之間做決定時,嵌入式設計師通常遇到幾個痛點,包括: ‧需要比MCU更多的功能(更高性能、更多顯示與更多連接選項),但不能增加成本或複雜度 ‧缺少經驗豐富的員工和/或預算資源,難以為基於Linux的應用處理器設計提供支援 ‧既需要即時系統,也需要應用處理器級的性能和整合度 ‧必須為應用處理器的設計降低整體物料成本,同時保持原有的性能水準

消費者對於提升智慧安全領域產品的使用體驗以及功能的需求從未止步,這也推動了MCU和應用處理器的雙雙發展。但是,對於很多新興的使用案例,不管是應用處理器還是MCU,都無法完全滿足這一需求。例如,裝置設計師想要在產品設計中添加IoT功能(如資料處理、無線連接、顯示支援),但無法大幅增加單台裝置的成本,也不能因為大範圍的重新設計而延長上市時間。

「跨界」處理器—從性能空白到新方案領域

更智慧的互連世界發展應當由創新推動,不應受限於MCU和應用處理器之間的選擇。嵌入式產品設計師應該能夠自由選擇最能為其設計帶來創新的處理器,而不是讓處理器的選擇限制最終設計中可能實現的創新。

在MCU和應用處理器之間靈活擴展是可行的,但需要採用一種新的跨界嵌入式處理器來打破高階MCU和低階應用處理器之間的技術鴻溝。這些跨界嵌入式處理器主要針對消費者、工業和不斷發展的IoT應用,為其提供應用處理器的高性能和功能性,同時兼具MCU的易用性、低功耗、即時執行以及低中斷延遲特性。此外,跨界處理器的架構無需使用嵌入式快閃記憶體、外部DDR記憶體和電源管理IC (PMIC),因此降低了系統的總成本。

跨界處理器使用應用處理器架構,提供高整合度、高速週邊裝置、更高的安全性以及可提升使用者體驗的引擎(如2D/3D顯示卡),但僅透過執行即時作業系統(例如RTOS)的低功耗MCU核心為系統提供動力。因此,跨界處理器在市場中界定了一個全新的需求領域,有助於MCU客戶升級到應用處理器級的性能,同時沿用當前的工具鏈,而不必花時間和成本將複雜的Linux(或其他作業系統)軟體發展納入其產品設計週期。

降低成本—無需內建快閃記憶體

理想情況下,當可執行程式碼和資料被儲存在晶片內建SRAM中,並自此記憶體執行CPU核心作業時,嵌入式處理器的性能達到最高。即便在晶片內建SRAM中,也只有「緊耦合記憶體」(TCM)能夠為核心提供單週期存取。對TCM以外任何記憶體的存取都會增加所需的CPU週期,從2級(L2)快取到內建快閃記憶體再到外部快閃記憶體的存取損耗越來越大。因此,只有由高密度晶片內SRAM配置的TCM才能提供理論上最高的性能。

但在現實中,整合SRAM的每平方毫米成本非常高昂,對於以更加成熟製程節點製造的MCU來說更是如此。因此,嵌入式快閃記憶體成為MCU所需的元件,作為晶片內建SRAM的補充。MCU中的嵌入式快閃記憶體被用於儲存可執行程式和重要的使用者/系統資料,以便核心快速存取這些內容,而無需從外部記憶體存取。

但是,在滿足MCU和應用處理器之間的需求時,內建嵌入式快閃記憶體的技術限制和相關的成本成為一大負擔。嵌入式快閃記憶體價格昂貴且具挑戰性,特別是先進製程技術節點。嵌入式快閃記憶體所需的額外處理將大幅增加晶片的成本。擺脫內建快閃記憶體的負擔不但能夠降低成本,還有助於實現更高頻率,從而提升處理器性能,進而讓設計師能提升產品的性能、效率並增加更多功能。

由於跨界處理器採用了應用處理器架構,因而能在先進技術節點(40nm~)上製造,具有大幅縮小的SRAM位元單元,使得整合高密度SRAM比嵌入快閃記憶體更加經濟高效。在跨界設計架構中,SRAM可以配置為具有「零等待」單週期存取的TCM,從而大幅提升系統性能。這種關鍵設計特性讓跨界處理器的有效性能遠遠超出MCU同級產品。

集高性能、低延遲、高效能和安全性於一

高性能:想像一下TCM和快取(內建SRAM)極小,但嵌入式快閃記憶體密度極高的典型MCU。執行應用程式碼期間,最近的指令和資料通常都被儲存在TCM/快取中,以便後續從CPU核心快速存取。但由於快取密度低,大部份的指令和資料都必須在嵌入式快閃記憶體、外部NOR或NAND快閃記憶體中。因此,CPU核心不得不存取非TCM或非快取記憶體——或稱為「快取未命中率」(cache miss rate)——每次存取都會大幅降低有效性能,因為CPU必須等待數十個週期以待資料抵達。因此,快取未命中率越高,MCU的有效性能越低。

對於合理架構、具備高密度TCM和快取的跨界嵌入式處理器而言,即使快取未命中率高達5%,其有效性能也始終高於MCU。但是,對於最常見的IoT應用,具備高密度晶片內TCM或快取的跨界處理器之快取未命中率可低至1-2%,因此能夠提供明顯高於MCU的有效性能。

低中斷延遲:中斷延遲指的是CPU回應內部或外來事件插斷要求時所需的時脈週期數。對於大部份具有即時回應要求的IoT應用,中斷延遲成為衡量有效性能的重要指標之一。

對於執行高階作業系統(非即時作業系統)的通用應用處理器,服務外部中斷並非首要任務。在完成當前的任務之前,CPU通常不會回應插斷服務常式(ISR)請求,這就導致在提出插斷要求之後,需要經過多達數百個延遲週期,核心才會開始服務此請求。對於執行即時作業系統、核心優先回應中斷的MCU而言,就不會出現這種情況。即使在不同中斷之間,也可以透過合理安排優先順序結構,確保最高優先順序的中斷達到最低中斷延遲。

跨界處理器採用MCU核心建構,因此即使它們採用應用處理器架構,也延續了低中斷延遲這一重要特性。跨界處理器的中斷延遲最低可達到10-20ns,而應用處理器的延遲通常長達1毫秒。因此,跨界處理器最適合IoT應用。

高能效:跨界嵌入式處理器整合了高性能DC-DC轉換器,並採用閘控電源技術使效能最佳化。由於採用目前嵌入式處理器廣泛使用的40nm處理平台,其執行功率最低能夠達到100uA/MHz,較現有MCU更低一半以上。對於如今市場上未整合DC-DC轉換器的MCU,或者當系統設計出於成本考慮而未使用外部DC-DC轉換器或PMIC時,其電流消耗最高達到300uA/MHz,使其不太適合以電池供電的應用。

對於MCU,嵌入式快閃記憶體的優勢之一是可以實現更低的動態功耗。相較於存取外部記憶體,資料必須透過電容I/O驅動,處理器因此需要耗費更多能量。但跨界處理器由於整合高密度晶片內SRAM,對外部快閃記憶體的存取很有限。此外,跨界處理器採用先進技術節點和低功率處理平台製造,並整合低功耗SRAM,因此較傳統MCU更能降低整體動態功耗。

再者,記憶體製造商目前以極低的成本提供超低功耗的串列NOR快閃記憶體,從而降低了系統級的功耗。如果將採用低功耗串列快閃記憶體的跨界嵌入式處理器封裝到SiP,能效可進一步提升,因為I/O接腳的電容負載較低。如果SiP成本對某些應用能夠合理化,那麼兼具跨界處理功能和額外記憶體的解決方案將更具有吸引力。

安全性:儲存在嵌入式快閃記憶體中的資料安全可靠,這通常被援引為在處理器設計中採用嵌入式快閃記憶體的原因。晶片記憶體的關鍵資料和敏感應用程式可即時獲取,無需透過外部接腳與晶片之間來回傳輸,避免讓駭客有機可乘(旁路攻擊),透過監控資料接腳中的電訊號攔截或破壞資料。如果資料未加密,這一弱點尤其令人擔憂。

跨界嵌入式處理器則沒有這種隱憂,因為它們採用了與應用處理器類似的資料保護架構。透過硬體加速加密模組,資料能以加密的格式儲存在外部記憶體中。需要時,加密資料被傳輸至晶片,在讀取時「即時」解密,無需經過等待解密的週期。這些先進的加密加速器能夠大幅提高加密/解密輸送量,因而無需使用內建非動態記憶體來滿足安全需求。

即使在不適用硬體加密的情況下,跨界處理器的高性能核心也可用來實施軟體加密。相較於傳統MCU,由於其核心性能較低,必須採用硬體加密模組以提供IoT應用所需的加密輸送量。

基於半導體產業在開發先進記憶體方面的進展,預計在未來2~3年內,非揮發性記憶體(例如MRAM、RRAM等)可望與嵌入式處理器整合,支援多樣化功能以及即開即用的使用者體驗,可用於內建安全資料庫,或取代傳統嵌入式快閃記憶體。跨界處理器有望整合這些新興記憶體,從而發揮更大優勢。

滿足IoT市場的嵌入式方案

當今市場越來越需要高能效且高性能的嵌入式處理技術,提供增強的使用者體驗和更高的資料處理能力,而不至於增加成本和功耗,這就導致嵌入式處理器領域出現了空白。為了填補這種空白,恩智浦半導體(NXP Semiconductors)開發了全新的嵌入式處理器系列——i.MX RT跨界系列處理器,囊括了跨界處理器的所有特性,並將應用處理器級的性能帶到了MCU領域,為市場提供填補MCU和應用處理器之間空白的解決方案。

新型的i.MX RT基於ARM Cortex-M7核心,採用i. MX 6ULL應用處理器架構,不僅具備應用處理器典型的性能等級和安全功能,同時兼具MCU的易用性、即時運行和低功耗特性,可為更加智慧、安全且不斷發展的IoT市場提供最高性能且經濟高效的嵌入式解決方案。