利用RISC-V客製化擴展優化TWS耳機PPA

作者 : John Min,晶心科技(Andes Technology)美國分公司解決方案架構總監

透過對RISC-V指令集架構(ISA)擴展的研究,發現有助於大幅降低功耗,同時在不增加額外成本的情況下能實現所需性能的結果…

許多IC設計的共同目標都是實現功率、性能和面積(PPA)的最佳組合。透過對RISC-V指令集架構(ISA)擴展的研究,發現有助於大幅降低功耗,同時在不增加額外成本的情況下能實現所需性能的結果。

真無線立體聲(true wireless stereo,TWS)晶片主要包含一個藍牙射頻(RF)收發器。它包括128分接頭(tap)有限脈衝響應(FIR)濾波器、128分接頭最小均方(LMS)自我調整濾波器、主動降噪(ANC)混合函數,以及運算這些函數所需的運算單元和匯流排。在這種設計中,四個單元中的前三個需要最多的運算資源:FIR濾波器需要1,693指令週期,LMS濾波器需要1,820個週期,而ANC功能所需的週期則高達10,404個。圖1的系統框架圖顯示了TWS設計的主要元件,左邊為類比功能,右邊為數位功能。藍牙收發器(左上)由一個RF基頻控制器和64kb交換記憶體組成。位於下方的收發器和音訊子系統很複雜,因為TWS的設計有兩個獨立工作的揚聲器和麥克風。兩者的鎖相迴路(PLL)必須同步,以確保它們都能以相同的頻率工作。

 

圖1:TWS設計的關鍵元件,左邊是類比功能,右邊是數位功能。

(來源:晶心科技)

 

更複雜的是,藍牙系統處理的是小位元組順序(endian,亦稱端序或尾序)格式的16位元資料,而音訊系統用的則是大位元組順序格式的24位元資料,因此需要運算密集型格式轉換。ANC功能對運算資源的需求最大,它需要大量的計算,如乘法和加法。ANC與高精準度DAC和低延遲ADC互動。即時模擬採樣要求每輸出一個樣本就有一個樣本輸入。

右側的數位部分是一個具備P (DSP/SIMD)擴展的RISC-V CPU和用於處理雜訊控制和音訊轉碼器運算的獨立DSP。此外,該設計包含少量的SRAM硬體DMA和AXI/AHB匯流排矩陣。該設計具有消費設備所需的通用I/O功能,包括GPIO、I2C、即時時脈、UART等。

為了執行最複雜的TWS函數,混合ANC電路需要高分接頭數濾波器,在本例中,需要128分接頭FIR濾波器和128分接頭的最小均方濾波器。為了處理這些函數,每個樣本總共需要896次加法和896次乘法。在本例中,ADC和DAC主頻為192kHz,大約每5.2微秒(µs)進行一次採樣。

在圖1的框架圖中,處理ADC和DAC操作時,運算資源必須執行以下功能:載入樣本的DMA,然後是音訊轉碼器運算、藍牙和內務操作。接下來是FIR和LMS濾波器所需的繁重處理任務。除了這些操作之外,ANC也增加了相當多的運算需求,主要是大量的乘法和加法。

客製RISC-V擴展減少運算週期數量

認識到對更多運算資源的需求,設計團隊決定為RISC-V處理器創建專用於處理FIR和LMS濾波器的客製化擴展,每個處理器增加一條指令。另外開發了乘法器、加法器和記憶體來處理ANC運算。這些擴展使用Andes自訂擴展(ACE)和CoPilot工具來創建,這些工具省掉了將客製指令整合到設計和驗證流程中的耗時任務,從而最大限度地減少了設計團隊實施修改所需的時間。

結果如表1所示。純C程式碼的128分接頭FIR濾波器原來需要大約1,600個運算週期,添加客製指令後,週期數減少到128個,速度提高了12倍。同樣,運算128分接頭LMS濾波器所需的週期也從1,820個週期減少到128個,速度提高了14倍。而最顯著的加速發生在ANC功能上,所需週期從10,404個下降到250個,減少了40倍。應用於TWS平台直接記憶體訪問功能的CPU週期計數還取決於SoC架構。通常情況下,流量越大,需要的週期就越多。ACE和CoPilot工具分配了附加的指令背景屬性,為了確保最佳功能的實現,客製指令平行運作,因此,CPU可以採用較慢的80MHz時脈頻率,從而降低了功耗,並延長了電池壽命。

 

表1:透過自訂擴展實現的加速(在ACE週期列下)效果。最顯著的加速發生在ANC功能上,降低了40倍。

(來源:晶心科技)

 

雖然暫且還不能對這種專有設計的實際結果發表正式評論,但表1中所示資料已清楚說明得到的明顯改進之處,這正是向設計添加客製化擴展所產生的結果。除了性能提升之外,使用客製化擴展的設計團隊還受益於一種電路,該電路以較低的時脈速率運作,可以節省功耗,並且使用更少的邏輯閘,從而所用的晶片尺寸更小。

使用客製化擴展的另一個重要好處是,競爭對手不能輕易地對設計進行反向工程。最後,對於那些擔心客製化會增加設計驗證時間的設計師來說,60%成功使用ACE工具的客戶經驗已證明這不是問題。憑藉這種特殊的設計,最終實現了晶片的成功流片,沒有任何設計自旋(design spin),且目前已用於Razer的True Wireless Pro耳機中。

(參考原文:Case study: optimizing PPA with RISC-V custom extensions in TWS earbuds,by John Min)

 

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論