風冷水冷還不夠 片上水冷直接挖水道導熱

作者 : 劉于葦,EE Times China

若未來晶片大量採用垂直3D堆疊技術,大量集體管集中在晶片中間,要怎樣才能即時將熱量傳導出去呢?

各類處理器的性能越來越高,讓人們在使用電子設備時的體驗也隨之升高,但是高整合度帶來的副作用之一就是巨大的發熱量。再加上電子產品在高性能、高功率化的同時,還向著超薄、微型化發展,電子元件散熱空間越來越小,單位面積內產生的熱量卻越來越多。

晶片散熱的不同方法

研究顯示,幾十年來電腦發熱密度一直呈指數級增長,如果熱量不能及時散出,則會導致元件中自由電子和金屬原子動能顯著增加,碰撞概率加大,帶來「電子遷移」效應使電腦不能正常工作。美國DARPA甚至還對此動員了國家實驗室和著名大學等科研機構,進行了針對性的研究,主要分佈在固體和流體散熱技術兩個領域。

早期PC產業普遍對高階CPU、GPU等發熱量大的元件,採用塗抹導熱矽脂,加裝散熱鰭片、導管,以及風扇的風冷方式散熱,這屬於固體散熱(導熱)的範疇。對於超頻愛好者來說,風冷已經不能滿足他們,所以將晶片浸泡在迴路非導電液體水冷散熱,甚至超低溫液氮中成了一個更為高效的選擇,這就屬於流體研究的領域。

 

導熱材料散熱工作原理示意圖。

 

對於伺服器機房這種熱源集中地,資料中心24小時冷氣是最基本的,很多業界巨頭還會將資料中心建在寒冷的高緯度地區,甚至放進海中或者將設備浸泡在特殊液體、壓縮氣體裡,提高散熱的效率。

大型設備散熱可以不考慮體積,但手機等可攜式裝置可不行。目前智慧型手機中的發熱源除了SoC,還有螢幕、射頻前端、相機模組及電池,且緊湊的結構讓廢熱更加難以匯出。市面上智慧型手機散熱的方案主要有:導熱凝膠、石墨片、石墨烯、均溫板、熱管等。5G的到來帶來了加倍的射頻元件,也帶來了更多的熱,手機散熱需求暴漲。

晶片堆疊時代「中間樓層」降溫不易

但不管單純的物理導熱,還是風冷、水冷、液氮散熱解決方案,都是導熱介質接觸晶片內封裝層(裸晶,Die),只能對直接接觸面散熱。這種方式也會給晶片頂層帶來壓力,因為整個晶片的熱量都要從矽晶片傳導到內部導熱材料,再傳導到Die,最後才能集中透過導熱介質傳到散熱器散發出去。若未來晶片大量採用垂直3D堆疊技術,大量集體管集中在晶片中間,這些散熱效果就會大打折扣。另外,水冷的方法需要加裝較複雜的外部設備,不適合在輕薄型裝置中使用,價格也十分昂貴,不適合普通消費者。

 

 

據Hardwareluxx報導,近期台積電(TSMC)在VLSI研討會上,展示了對片上水冷的研究,作為新的散熱解決方法,涉及將水通道直接整合到晶片的設計中。這個理論很簡單,有些類似CPU散熱器中內嵌微熱管的方式,不少玩家曾經無數次幻想過的這樣的微熱管也能存在於晶片裡,但對於本就不寬敞的晶片內部而言實現起來極其困難。

 

 

台積電開展這項研究的背景如我們之前所述,晶片設計的複雜化,以及製程製造技術的發展,帶來了更緊密的製程和垂直3D晶片堆疊等技術。縮小晶片體積讓電晶體之間的空間被壓縮得更厲害,以往的多重傳導聚頂式散熱已經不能滿足要求了。

 

 

三種片上水冷,三種矽上水道

據tom’s Hardware報導,台積電的研究人員認為未來的解決方法是讓水在夾層電路之間流動,為此他們對三種不同的矽水道做了相關的模擬試驗:一種只有直接水冷(Direct Water Cooling,DWC),作為製造過程的一部分,水有自己的迴路通道直接蝕刻到晶片的矽片中;另一種設計將水通道蝕刻到晶片頂部自己的矽層中,使用OX (氧化矽融合)的熱介面材料(Thermal Interface Material,TIM)層將熱量從晶片傳遞到水冷層;最後是一種將OX層換成更簡單、更便宜的低熔點液態金屬熱介面材料(Liquid Metal TIM,LMT),這種屬於沒有水道的方式。

 

 

台積電在報告中說,結果顯示第一種方法最好,因為水道直接蝕刻在晶片本體中。其次是第二種方法,因為第二第三種都是在矽晶片表面再加了一層帶水路蝕刻的矽材料,用導熱材料黏接,效果會打些折扣。

 

 

台積電還在受控實驗室條件下對虛擬半導體進行了測試。如上圖所示,一種熱測試載體(Thermal Test Vehicle,TTV)本質上是一種由銅製成的加熱元件,本身有溫度感測器。加熱元件的表面為540mm2,TTV的總面積為780mm2。TTV在它自己的基地中被拉伸,這使得電力供應、供水和排放,以及感測器的連接成為可能。筆者認為導入溫度感測還有一個作用是,需要在25℃的恆溫下引入水,以免出現晶片過熱時突然遇冷「炸鍋」。

 

 

台積電在可控條件下測試了三種矽水通道的整合:一種是基於柱狀結構的通道,水可以在主動半導體柱周圍流動以冷卻它們(想想島嶼周圍的水);以溝渠設計為特色的設計(想像一條被河岸控制的河流);在矽晶片的其餘部分上安裝一個簡單的平坦的水通道。水透過一個外部冷卻機制,將水流過矽晶片的過程冷卻到25℃。

 

 

 

 

從台積電的報告可以看出,目前最好的解決方案是直接水冷方法,它可以消散高達2.6kW的熱量,提供63℃的溫度差。第二好的設計自然是基於OX TIM的設計,它仍然可以散去2.3kW的熱量,提供83℃的溫度差。液態金屬解決方案排在最後,仍能散發出1.8kW的熱量(溫度差為75℃)。在所有的水流設計中,柱式設計是迄今為止最好的。

 

 

當然,只靠晶片內這一點水流不足以使其降溫,最終晶片內的「河流」還是會把內部深處的熱量帶到表面,由散熱器或外部水冷系統散發到空氣中。其本質在於將原本晶片上層的散熱層「打薄」並將導熱材質分散到內部各層中,讓晶片中熱源不再依賴矽晶本體傳導熱量,減少電子遷移為處理器性能帶來的負作用。

 

結語

 

早在20世紀初,英特爾(Intel)迫於Pentium處理器的發熱量過大問題,不得不放棄增加工作頻率來提高處理器運算速度的做法,轉而走雙核心路線,但雙核的Pentium 4功率居然也高達200W左右。當時還在英特爾擔任技術長的Pat Gelsinger放話,如果晶片耗能和散熱的問題得不到解決,當晶片上整合了2億個電晶體時,就會熱得像「核反應爐」,2010年時會達到火箭發射時高溫氣體噴射的水準,而到2015年就會與太陽的表面一樣熱。

 

如今,各大廠商已經把單顆晶片上的電晶體堆上了百億級別。Nvidia的A100加速器連同HBM2E和作為SXM4模組,已經有高達500W的廢熱;英特爾的Xe-HPC晶片Ponte Vecchio甚至有高達600W的餘熱。但主流空氣強制對流散熱方案,也只是在散熱器的結構和材質上做文章,並沒有深入晶片內。雖然也有科學家在研究奈米微氣流冷卻、熱電/熱聲冷卻、光子主動冷卻等黑科技,但真正能大規模商用的幾乎沒有,英特爾、AMD、Nvidia,以及後來的手機處理器廠商高通(Qualcomm)、蘋果(Apple)等,只能從最佳化架構、提升製程甚至軟體降頻上去減少發熱量。

據悉,今年底AMD就將使用3D V-Cache作為處理器的附加SRAM,這些額外的高功耗犬將直接位於現有的L3快取之上,而不是位於Zen 3核心,不能直接接觸散熱器將使冷卻它們變得異常困難。AMD會不會用上台積電提出的晶片內「水道戰」冷卻解決方案?筆者估計還沒這麼快,實驗室中的技術離商用可能還有數年時間。但這絕對在電晶體密度持續增加、每區域性能指標持續改進的大趨勢下,未來3D堆疊晶片設計需要考慮的散熱方向之一。

本文原刊登於EE Times China網站

 

 

 

 

加入LINE@,最新消息一手掌握!

發表評論