法國電子暨資訊技術實驗室(Leti)日前展示,以電阻式隨機存取記憶體(RRAM)為基礎的三態內容可定址記憶體(TCAM)電路性能媲美基於CMOS的動態隨機存取記憶體(SRAM)電路,儘管仍存在性能和可靠性之間的權衡折衷,但適於多核心的神經形態網路處理器應用。

TCAM電路的工作原理是使用指示範圍(range)的遮罩位元來搜尋大量資料組合。相較於典型記憶體系統透過物理定址方式檢索記憶體單元儲存的資訊,TCAM則是透過內容搜尋儲存的資訊。因此,這些電路的性能非常適於複雜的路由和大數據(big data)應用——這類應用通常不太需要精確匹配。相較於典型的記憶體搜尋演算法,TCAM電路的方式由於平行比對了所有儲存資料以及單次時脈週期內的搜尋資料,從而縮短了搜尋的時間。

傳統基於SRAM的TCAM電路通常以16個CMOS電晶體建置,這使得TCAM在標準記憶體結構下的儲存容量經常受限於幾十個百萬位元組(megabyte;MB),而且在神經形態運算神經網路晶片中佔用寶貴的晶片面積。

Leti在最近的國際電子元件會議(IEDM)上發表研究人員在TCAM技術的最新突破——在TCAM電路中以RRAM取代SRAM記憶體單元,可將所需的電晶體數量減少到2個(2T)以及在電晶體之上製造兩個RRAM (2R),據稱這是迄今為止生產這種電路的最緊湊結構。相較於傳統的16電晶體TCAM結構,2T2R結構能讓所需的TCAM面積減少8倍(假設兩種類型的電路中電晶體尺寸相同)。

雖然這帶來了晶片尺寸和功耗方面的優勢,但Leti表示仍存在兩項挑戰。其一是電路可靠性強烈依賴於記憶體單元的ON和OFF狀態之比:相較於16T結構(~105),基於RRAM的TCAM可靠性可能會受到相對較低ON/OFF比重(~10-100)的影響。其次,RRAM對於CMOS電晶體的耐受度(endurance)有限,而這也會影響到系統的壽命。

克服這些挑戰需要某些折衷:

  • 在搜尋作業期間降低施加電壓,可以提高系統可靠性;然而,這也會降低系統性能,例如搜尋速度變慢。
  • 在每次搜尋期間降低施加電壓或提高用於預先編程TCAM單元的功率,能夠克服有限的耐受度;這兩種方式都能高系統的耐受度,但也同時減慢了搜尋的速度。

在IEDM發表的《深入表徵基於電阻式記憶體的三態內容定址記憶體》(In-depth Characterization of Resistive Memory-based Ternary Content Addressable Memories)一文中,Leti介紹RRAM電氣特性和TCAM性能之間的關係,以及製造基於RRAM的電路特性。它顯示在TCAM性能(搜尋速度)和TCAM可靠性(匹配/不匹配檢測和搜尋/讀取耐受度)之間存在折衷。這有助於瞭解如何對基於RRAM的TCAM電路進行編程,以用於網路封包路由等其他應用。

該論文的主要作者Denys RB Ly說:「假設未來的許多神經形態運算架構都具有數千顆核心,研究人員開發的TCAM電路由於具有非揮發特性,將帶來更多關鍵優勢,[因為]使用者僅必須在第一次配置網路時上傳所有配置位元。」他說,這意味著使用者可以在每次晶片重設或電源重啟時,跳過這個耗時的過程。

Ly在接受《EE Times》採訪時表示,該計劃所採用的神經形態處理器來自蘇黎世神經訊息學研究所(INI)的NeuRAM3計劃,該計劃同時也支持部份基於RRAM的TCAM研究。「如果我們比較神經形態處理器的內容可定址記憶體(CAM)電路所需性能,以及基於RRAM的TCAM性能,將會發現儘管存在上述問題,但結果實它確實能滿足這些要求。」

Leti TCAM 神經形態處理器的CAM電路性能和Leti TCAM電路性能比較

研究人員並在論文中比較神經形態處理器的CAM電路以及Leti的TCAM電路性能。從搜尋延遲來看,當然是越低越好。然而,由於晶片能夠承受非常長的延遲(脈衝相當長,大約為微秒等級),即使搜尋延遲約為90ns,Leti基於RRAM的TCAM也可能用於處理器。當前的CAM電路能夠實現低至27ns的搜尋延遲,但是對於像網路路由(延遲~1ns)等典型應用中的CAM電路,這一延遲數字仍然相對較高。

支持Leti方法可行的另一個要點在於現有晶片的CAM電路長約10位元,而Leti的TCAM電路則長128位元。「如果我們將TCAM電路縮小到10位元,我們的搜尋延遲還會更低,甚至可能至少低至27ns。而在搜尋耐受度方面,基於RRAM的TCAM電路能夠處理所有事件。」再以編程耐受度來看,RRAM極其適用於神經形態處理器的CAM電路,因為它們只需要一次編程。

「總而言之,對於神經形態處理器應用,採用基於SRAM的CAM電路可能帶來更好的性能、可靠性和耐受度,但我們可以採取折衷途徑——即以RRAM取代SRAM單元,則可提高記憶體密度並降低功耗,同時使該系統仍能滿足神經形態處理器的要求。」

編譯:Susan Hong

(參考原文:RRAM-Based TCAM Shown to Match SRAM Performance,by Nitin Dahad)