不管是天命打工人,還是投資人,都需要了解行業、技術方向等信息,才能更好的把握未來的命脈......
工作需要腳踏實地,人生需要仰望星空。
核心要點:AI算力發展與政策PUE等驅動下,芯片級散熱將從熱管/VC轉向更高效的3DVC與液冷,芯片級散熱有望打開成長空間。
電子設備發熱的本質原因就是工作能量轉化為熱能的過程。散熱是為解決高性能計算設備中的熱管理問題而設計的,它們通過直接在芯片或處理器表面移除熱量來優化設備性能并延長使用壽命。
隨著芯片功耗的提升,散熱技術從一維熱管的線式均溫,到二維VC的平面均溫,發展到三維的一體式均溫,即3D VC技術路徑,最后發展到液冷技術。
主要散熱技術:從風冷到液冷,冷板到浸沒式
散熱技術包括風冷與液冷兩類。風冷技術中,熱管與VC的散熱能力較低,3D VC散熱上限擴至1000W,均需搭配風扇進行散熱,技術簡單、便宜,適用于大多數設備。
液冷技術具備更高散熱效率,包括冷板式與浸沒式兩類,其中冷板式為間接冷卻,初始投資中等,運維成本較低,相對成熟,英偉達GB200 NVL72采用冷板式液冷解決方案;浸沒式為直接冷卻,技術要求較高,運營維護成本較高,曙光數創研發“1拖2”雙相浸沒液冷結構。
AI算力發展與政策PUE等驅動下,芯片級散熱將從熱管/VC轉向更高效的3DVC與冷板,芯片級散熱有望打開成長空間、迎量價齊升。
相關公司
1)芯片散熱:曙光數創、飛榮達、中航光電、立訊精密、中石科技、思泉新材;
2)數據中心散熱:英維克、高瀾股份、申菱環境、佳力圖、朗威股份、依米康、同飛股份、川潤股份、潤澤科技、科華數據、網宿科技;
3)服務器整機:浪潮信息、中科曙光、工業富聯、華勤技術、紫光股份、中興通訊、軟通動力、神州數碼、烽火通信、中國長城等。
據《電子芯片散熱技術的研究現狀及發展前景》,如對于穩定持續工作的電子芯片,最高溫度不能超過85 ℃,溫度過高會導致芯片損壞。

芯片散熱革新:浸沒式散熱效果好,冷板式更為成熟
根據ODCC《冷板液冷服務器設計白皮書》,綜合考量初始投資成本、可維護性、PUE 效果以及產業成熟度等因素,冷板式和單相浸沒式相較其他液冷技術更有優勢,是當前業界的主流解決方案。
熱管:高效傳熱器件,適用大功率和空間小場景
熱管,也稱為Heat Pipe,是一種高效的傳熱器件。它能夠通過內部工作流體的相變過程,快速地將熱量從一端傳遞到另一端,其結構簡單,由密閉容器、毛細結構、工作流體組成。
VC:相比熱管,具備更高的導熱效率與靈活性
VC均溫板,全稱為Vapor Chamber,即真空腔均熱板散熱技術,是一種比熱管更先進、更高效的導熱元件,尤其在處理高密度電子設備的熱管理問題時表現出色。
相比熱管,VC的導熱效率與靈活度更強。銅的導熱系數為401W/m.k,熱管可以達到5000~8000 W/m?k,而均熱板則可以達到20000~10000W/m?k,甚至更高。熱管是一維導熱,受其形狀顯示。
而均熱板形狀則不受限制,可以根據芯片的布局,設計任意形狀,甚至可以兼容處于不同高度的多個熱源的散熱。
3D VC:具備高效散熱、均勻溫度分布、減少熱點優勢
3D VC基礎知識與應用場景
3D VC(三維兩相均溫技術):是利用熱管與均溫板蒸汽腔體貫通的散熱技術。
3D VC具有“高效散熱、均勻溫度分布、減少熱點”等解熱優勢,可滿足大功率器件解熱、高熱流密度區域均溫的瓶頸需求,也可以保證獲得更強的超頻性能以及超頻后的系統穩定性。
對比熱管/均溫板間導熱,是把熱量傳遞至二次組裝的多根熱管/均溫板,存在接觸熱阻以及銅本身的熱阻;而3D VC通過三維結構連通下,內部液體相變、熱擴散,直接、高效地將芯片熱量傳遞至齒片遠端散熱。
冷板式液冷:需改造服務器,滲透率逐漸提升
冷板式服務器需要對服務器進行管路、結構等改造:如浪潮信息基于2U四節點高密計算服務器i24,新增多塊冷板與CPU、I/0、內存等發熱單元接觸,也設置多條管路在內與冷板連通、在外連接機柜級別的分歧管道,實現系統中95%左右熱量通過冷板接觸熱源由液體直接帶走,剩余5%左右熱量經由PSU電源后置的風液式換熱器里面的冷卻水帶走。
單相浸沒:實現服務器全液冷,技術難度較高
單相浸沒液冷機柜:是將液冷服務器內置于Tank內部,CDU與Tank之間由管道鏈接,下部管道輸送低溫冷卻介質到t ank內,液冷介質吸收了液冷服務器的熱量,溫度上升后流回CDU,熱量由CDU帶走。此種結構可實現服務器的全液冷,無風扇的設計使功率密度更高,相比風冷PUE更低。但技術難度較高,滲透率相對較低。
阿里云布局浸沒式液冷系統:2016年,阿里云發布首套浸沒式液冷系統,于2017年完成浸沒式液冷集群構建;2018年,建成首個互聯網液冷數據中心;2020年,打造中國最大規模的單相浸沒式液冷數據中心暨全國首座5A級綠色液冷數據中心。
雙相浸沒:技術要求較高,可大幅提升系統功率密度
1)“1拖2”單元結構:由中間CDM液冷柜和左右兩側計算機柜構成。兩側機柜內服務器產生的熱量由中間CDM液冷機柜帶走。
中間液冷柜內集成CDM、循環管路等系統。此種結構可以大幅度提升系統功率密度,降低數據中心建設難度。
2)刀片式相變浸沒腔:獨立可插拔設計,完全解耦節點與節點之間的熱循環路徑,使得每一個節點都可以進行獨立的插拔,方便用戶對單獨的節點進行硬件升級或維護。
3)芯片強化沸騰散熱設計:由于服務器內主芯片功率較高,芯片表面需要進行強化沸騰處理,以增加其表面的氣化核心,增強相變換熱效率。曙光數創的浸沒相變液冷數據中心基礎設施產品對芯片采用了強化沸騰封裝的方式,換熱區域采用高密翅片來強化沸騰界面的沸騰換熱,最高可實現100W/cm²以上的散熱密度。
最近,我也在研究2個新的方向,一個是氟利昂多相流fluent仿真分析、另一個是壓電風扇的逆向建模與仿真分析。
目前進展順利,第一個方向已基本搞清楚原理、注意事項還有相關參數設置等;第二個3D逆向建模已完成90%,后續研究幾篇博士論文,開始進行壓電風扇的流固耦合等分析,后續再和大家分享。