談 AI 硬體,前面都在講算力:GPU 多強、記憶體多快、封裝多難。但有一個常被忽略的關卡,正在變成 AI 資料中心的硬限制:熱。當一整櫃 GPU 的功耗衝破一百多千瓦,怎麼把這些熱搬走,已經跟算力一樣關鍵。

這篇就把 AI 散熱與液冷一次講白。先看為什麼風冷不夠用、液冷怎麼做,再談它普及到哪、台灣供應鏈在哪。這是 AI 硬體供應鏈一條龍 第 6 關「散熱與液冷」的深入版。


為什麼 AI 伺服器非液冷不可

先用數字感受一下熱有多誇張。一顆 B300 GPU 的功耗,市場報導估計上看約 1400 瓦(研調機構 TrendForce 則概括為一千瓦以上);而 NVIDIA 最新的 GB300 NVL72,把 72 顆 GPU 加 36 顆 CPU 塞進一櫃,整櫃功耗高達約 130 到 142 千瓦。

對照一下:傳統機房用冷氣加伺服器風扇,常見大概只壓得住每櫃 5 到 15 千瓦。產業普遍認為,超過每櫃 15 到 25 千瓦之後,純風冷的設計與耗電就會快速變得困難。AI 機櫃動輒衝到 50、100、甚至 130 千瓦以上,風冷的風量、噪音、風扇耗電全都失控。

所以解法很直接:趁熱還沒擴散到整台伺服器,先從晶片旁邊把它帶走。讓冷卻液貼到晶片上、直接導熱,會比用大量空氣間接帶熱有效得多。這就是液冷登場的原因。


液冷怎麼做?三個關鍵詞

液冷聽起來高科技,拆開來其實就三個關鍵詞。

直接晶片液冷(冷板式,英文 Direct-to-Chip):把一塊金屬冷板緊貼在 GPU 上,冷卻液流過冷板內部的細小流道,把晶片的熱帶走。伺服器本體不直接碰到液體,導入門檻較低,是目前 AI 資料中心的主流做法。

浸沒式(immersion):更激進,直接把整台伺服器泡進一種不導電的介電液裡,熱直接進到液體。散熱效率更高,但維修麻煩、材料相容與標準化的門檻也高,普及比較慢。

CDU(冷卻液分配單元):液冷系統的心臟。它負責幫浦、熱交換、控溫、過濾,把冷卻液穩定地送到每一個冷板,再把吸收的熱交給機房的水路或散熱設備。沒有 CDU,冷板和冷卻液就是一灘死水。


核心數據快照

下面的數字幫你抓住「為什麼非液冷不可」與「普及到哪」。滲透率為研調機構估計值。

項目數值時點/性質
傳統企業機櫃功率密度約 5-15 kW/櫃(風冷可壓)現況
純風冷吃力門檻約每櫃 15-25 kW 以上產業共識
GB300 NVL72 整櫃功耗約 130-142 kW(全液冷標配)2026,NVIDIA/研調
AI 資料中心液冷滲透率2024 約 14% → 2025 約 33%TrendForce 估計
AI 晶片液冷滲透率2026 約 47%TrendForce 估計
下一代極端機櫃Rubin Ultra/Kyber 上看約 600 kW2027 展望

2026 走到哪:從選配變標配

液冷最大的轉變,是它在 2026 年從「進階選項」變成「預設配備」。

最具代表性的訊號,就是 NVIDIA 的 GB300 NVL72:官方直接把它設計成全液冷的整櫃架構,不再提供風冷版本。研調機構的滲透率數字也一路往上:AI 資料中心液冷從 2024 年的約 14% 升到 2025 年的約 33%,AI 晶片的液冷滲透率 2026 年估計來到約 47%。技術上,目前以「液對氣(L2A)」當過渡主流(冷卻液先帶走晶片的熱,再把熱排到空氣),2027 年起「液對液(L2L,直接接到機房的冷卻水路)」會加速普及。

再往前看更誇張。NVIDIA 在路線圖上展示的 Rubin Ultra/Kyber 機櫃,整櫃功耗上看約 600 千瓦,目標 2027 下半年(量產規格仍可能調整)。這代表散熱已經從「裝完伺服器後的收尾工作」,變成一開始就要跟供電、機櫃一起設計的核心問題。


台灣散熱供應鏈:又一個隱形強項

液冷這一關,台灣同樣站在關鍵位置。先說清楚:以下只描述公開的供應鏈角色,不整理受益股、目標價或買賣時點。

台灣本來在散熱零組件(風扇、熱管、均熱片、機殼)就有完整供應鏈,現在順勢切進高階液冷。NVIDIA 的 Blackwell 合作夥伴生態系名單,就公開點名了奇鋐(AVC)、台達電(Delta)等台廠。產業分工上,冷板由奇鋐、雙鴻(Auras)等供應,冷卻液分配單元(CDU)以台達電為要角,健策則在均熱片、熱導零件等環節參與。

常見的打法,是「伺服器+機櫃+電源+散熱」整套由台灣團隊輸出,這也是台灣能從晶片一路吃到整櫃系統的原因。這裡只做產業地圖,不對個股做任何投資判斷。


散熱其實連著電

最後補一個容易被忽略的連動:散熱和供電是綁在一起的。

機櫃功耗衝到一百多千瓦、未來上看百萬瓦級,既有的供電架構在效率與銅損上開始吃緊。NVIDIA 因此推動 800 伏直流(800 VDC)的資料中心供電架構,目標支援 100 千瓦到百萬瓦級的機櫃,並宣稱能提升效率、大幅減少銅用量。GB300 也在電源端加入儲能,把 AI 運算對電網的尖峰需求壓低最多三成。

換句話說,當算力越塞越密,真正的天花板正從「晶片」往「散熱與供電」移動。這條延伸的故事,會在 供應鏈總覽 的資料中心與電力那一關接著談。


這一關的重點

看完散熱,先記住那條因果鏈:AI 晶片越來越耗電,一櫃功耗衝破一百多千瓦,風冷壓不住,於是液冷從選配變成標配。

液冷主要靠三個東西:貼在晶片上的冷板、把整台泡進液體的浸沒式,以及調度冷卻液的 CDU。普及速度很快,研調估計 AI 晶片液冷滲透率 2026 年來到約 47%,NVIDIA 的 GB300 更直接全面液冷。台灣在冷板、CDU、均熱片這些環節是供應鏈要角。

想知道這些發熱怪獸長什麼樣,可以看 Blackwell 是什麼;想看整條鏈八關怎麼串,回到 供應鏈總覽