將資料中心晶片轉化為系統感測器

2021-10-27
作者 proteanTecs供稿

較低的功耗意味著更低的營運成本,這並不是什麼秘密,但將這一概念轉化為現實卻需要遠見卓識和數據。

較低的功耗意味著更低的營運成本,這並不是什麼秘密,但將這一概念轉化為現實卻需要遠見卓識和數據。

資料中心功耗過大是營運商面臨的一個多維度問題。保證硬體正常工作所需的能源會增加共用事業費用,同時管理者則竭盡所能維持最佳的設施溫度。其中並未考慮由於伺服器或交換機未工作在最佳狀態而造成熱量累積,進而導致內部元件過度磨損而引起的成本。

現在,功耗、性能、可靠性和成本是可以相互轉化的。雖然這個問題並不是什麼新問題,但新興的深度數據領域正在使這一轉化方程變得更加明朗。

零和遊戲

每顆晶片都無法完全相同。批次、晶圓甚至晶片內製程偏差(OCV)在先進SoC中都很常見,製造商需要單獨檢查每顆晶片。有些晶片速度快,有些速度慢;有些晶片漏電較大,有些則較小。為了平衡這種差異,工程師在其最佳工作條件下確定不同晶片的參數和保障區間,在保證品質和可靠性的同時判定其是否具備上市資格。

但當前方法的解析度和深度不足。功耗特徵分析是在選定的樣本上進行,這些樣本往往來自於刻意偏移的工程批次,以代表不同的「製程邊界」(極限條件)。最知名的技術也是收集許多參數並對其進行平均,使其難以將測量資料與準確製造參數關聯在一起,所以也只能提供非常粗略的可見性。

為了克服這些局限性,生產團隊在其測量基礎上增加保障區間,以補償不準確性。此外,由於時間推移發生的性能衰減,也將終身老化效應考慮在內,進而造成資料中心甚至採用更高的工作電壓。

顯而易見,我們需要一場數據革命。

通用晶片遙測(UCT)技術透過在先進SoC中嵌入智慧,將晶片轉化為智慧系統感測器。資料中心營運商及其供應鏈最終能夠不折不扣地獲得降低功耗所需的可見性。

個性化電源

proteanTecs的UCT技術將晶片監測器與AI驅動洞察力(AI-driven insights)相結合,導入了內部可見性(visibility from within)的概念。應用雲端分析平台對UCT資料應用機器學習演算法,能夠以高覆蓋率、高解析度理解系統在其整個生命週期內的功耗、性能和可靠性。

與健康領域的革命性基因組測序一樣,UCT使電子製造商能夠理解每片晶片獨一無二的DNA,提供精密特徵分析。工程師能夠逐晶片進行個性化評估,而不依賴於全樣本統計。

 

基於UCT的精密特徵分析支援點對點節能。

 

如果一顆SoC能夠以較低電壓達到最佳速度,proteanTecs基於UCT的平台就能夠在特徵分析期間給出較低的功耗水準建議,保證晶片在技術指標範圍之內。這可減少過熱、過早磨損,並顯著降低營運成本。另一方面,對於速度較慢的晶片,則會給出理想電壓建議,使其能夠滿足技術指標,避免將其報廢。

在時間零點,當每顆晶片均實現晶片與電源之間的最佳匹配後,UCT在現場對系統進行持續監測,以進行後續和預測性最佳化。

資料中心由UCT保駕護航

UCT使資料中心營運商能夠對元件降級具有預見性,允許現場進行精確的電源和熱管理。

  • 對定時餘量、電壓和時脈完整性、工作負載、應用效果及熱梯度進行持續性能監測,就能夠在系統執行任務的同時採取糾正措施。透過這種對老化效應的全面理解,就能夠實現積極的資料驅動更新,最佳化實現目標頻率要求的工作電壓,在不中斷系統工作的前提下執行動態電壓調整。
  • 前所未有的第一次,資料中心能夠深入、切實可行地理解軟體對系統性能的影響。現在,晶片能夠「感測」軟體相關問題,以及確保正確測試和實施更新。利用這些新數據,營運商就能夠獲得正確的措施建議,最佳化工作負載和保證可靠性,轉型到預測性維護策略。

 

通用晶片遙測(UCT)技術透過在先進SoC中嵌入智慧,將晶片轉化為智慧系統感測器。

(來源:proteanTecs)

 

電源感測性能

當今的資料中心必須具備全天候韌性,同時維持必要的規模經濟平衡。電源管理就像計畫外停機一樣,已經從不便利變成了一種痛苦的責任。

由於新一代晶片製造技術及複雜架構的影響,矽老化可能意味著需要提高電壓才能實現相同水準的性能。這難題如果需要提高功率密度,就會立即影響到冷卻要求,而冷卻要求本身比以往任何時候都更嚴格。

借助來自於晶片本身的新型UCT資料流程,能夠獲得全生命週期深度分析洞察力的能力,支援從設計到現場的電源最佳化。製造商可在製造期間進行個性化評估,而雲端供應商則可延長電子系統在現場的壽命。UCT資料不僅延長當今資料中心硬體的使用壽命和可靠性,而且可降低成本和提高可持續性。

了解更多關於proteanTecs:https://www.proteantecs.com/

 

本文同步刊登於《電子工程專輯》雜誌2021年10月號

 

 

 

 

活動簡介

人工智慧(AI)無所不在。這一波AI浪潮正重塑並徹底改變科技產業甚至整個世界的未來。如何有效利用AI協助設計與開發?如何透過AI從設計、製造到生產創造增強的體驗?如何以AI作為轉型與變革的力量?打造綠色永續未來?AI面對的風險和影響又是什麼?

AI⁺ 技術論壇聚焦人工智慧/機器學習(AI/ML)技術,涵蓋從雲端到邊緣、從硬體到軟體、從演算法到架構的AI/ML技術相關基礎設施之設計、應用與部署,協助您全面掌握AI最新技術趨勢與創新,接軌AI生態系佈局,讓機器學習更快速、更經濟、更聰明也更有效率。

贊助廠商

發表評論

訂閱EETT電子報