每次講到 AI 晶片缺貨,除了台積電的 CoWoS 封裝,另一個被點名的瓶頸就是 HBM。新聞常說「某家記憶體廠 HBM 又被預訂一空」,但 HBM 到底是什麼、為什麼 GPU 非它不可、跟你電腦裡那條記憶體又差在哪?
這篇就把 HBM 一次講白。先看它是什麼、和一般記憶體差在哪,再談為什麼 AI 非用它不可、三家寡占怎麼打,以及 HBM4 為什麼是 2026 年的新戰場。這是 AI 硬體供應鏈一條龍 第 2 關的深入版。
HBM 是什麼?一句話加一個畫面
HBM 的全名是 High Bandwidth Memory,高頻寬記憶體。它做的事,是把好幾層 DRAM 記憶體晶片垂直疊起來,中間用「矽穿孔(TSV,等於在晶片裡打一條條垂直通道)」上下打通,再透過一條非常寬的介面(GPU 和記憶體之間的資料通道),緊貼在 GPU 旁邊。
先給一個畫面:一般電腦裡的記憶體,是一條一條橫躺著插在主機板上;HBM 則是把記憶體站起來、層層往上疊,再搬到離 GPU 幾乎貼著的位置。所以最好記的一句話是:HBM 是「站起來的超寬記憶體」,目的是別讓 GPU 等資料等到餓死。
為什麼要疊起來、又要貼這麼近?因為 AI 晶片每秒要吞的資料量大得驚人。橫躺的傳統記憶體,介面不夠寬、距離又遠,根本餵不動。把記憶體疊高、加寬介面、再縮短距離,頻寬就能一口氣拉到每秒好幾 TB。代價是它得用 CoWoS(把 GPU 和 HBM 放進同一個高階封裝的技術)這類先進封裝才能跟 GPU 貼合,製造難度和成本都高。
和一般記憶體(DDR)差在哪
很多人會問:那 HBM 是不是要取代我電腦裡的記憶體?不是。它們服務不同場景。
一般的 DDR 記憶體是通用系統記憶體,便宜、好擴充,跑作業系統、開網頁、玩遊戲都靠它,像四通八達的一般道路。HBM 則是為 AI 與高效能運算量身打造的特規品,貴、難做、產能有限,像專門貼在 GPU 旁邊的超寬高速公路。它真正的強項是寬度和距離:車道多到誇張、離終點又超近。
所以這兩種記憶體是並存的關係。你的筆電不會用 HBM,AI 伺服器裡的 GPU 也不會只靠 DDR。理解這一點,就不會把「記憶體缺貨」和「HBM 缺貨」混為一談。後面會看到,真正卡 AI 的是 HBM 這條特規高速公路。
為什麼 AI 晶片非 HBM 不可
把 GPU 想成一具超強引擎。引擎再猛,油管太細,照樣跑不起來。對 AI 晶片來說,那條油管就是記憶體頻寬。
AI 在訓練和推論時,要不停把模型權重、中間運算結果搬進運算核心。一旦記憶體餵資料的速度跟不上,幾千個運算核心就會卡在「空等」,再貴的算力都浪費掉。HBM 的存在,就是把這條供油管做到夠粗,讓 GPU 的核心一直有資料可吃。
這也是為什麼旗艦 AI 晶片動輒綁上好幾顆 HBM。一句話:HBM 是 AI 加速器的供油管,頻寬不夠,引擎再強也吃不到資料。
核心數據快照
下面這些是理解 HBM 戰局的關鍵數字。先說清楚,市占這類數字是研調機構的估計值、會隨季度變動,看的時候抓量級和趨勢比抓小數點實際。
| 主題 | 數值 | 時點/性質 |
|---|---|---|
| HBM 營收市占 | SK 海力士約 57%、三星約 22%、美光約 21% | 2025 Q3,Counterpoint 估計 |
| HBM3e 規格(美光) | 1024-bit 介面、每 pin 逾 9.2 Gb/s、單顆逾 1.2 TB/s;8 層 24GB、12 層 36GB | 2025-2026 量產 |
| HBM4 標準(JEDEC) | 2048-bit 介面、每 pin 最高 8 Gb/s、單堆疊最高 2 TB/s;標準支援更高堆疊與容量 | 2025-04 發布 |
| HBM4 實際產品 | 美光 36GB/12 層、逾 2.8 TB/s;三星每 pin 11.7-13 Gb/s、最高 3.3 TB/s(48GB/16 層仍在送樣或規劃) | 2026 Q1 起量產 |
| 供給狀態 | 需求遠大於供給,業界警告短缺恐延續至 2027 年以後 | 2026,多家報導 |
三家寡占的戰局
HBM 是標準的三強賽局,門檻極高,新玩家幾乎進不來。
SK 海力士長期領先,市占過半,技術和良率都站在前頭;連最新的 HBM4 也是它最早完成開發、率先備妥量產(2025 年下半,速度突破每秒 10 Gb)。三星一度在 HBM3 世代落後,2026 年初宣布 HBM4 量產、開始商用出貨,追了上來。**美光(Micron)**這兩年衝得最猛,市占從個位數一路拉到約兩成,2026 年第一季量產了明確對應 Nvidia 新一代 Vera Rubin 平台的 HBM4。
值得留意的是這場仗的節奏:誰先把最新一代 HBM 做到量產、又通過 Nvidia 認證,誰就能在下一輪分到最大的訂單。所以三家比的不只是「做得出來」,而是「誰先、良率多高、能供多少」。
HBM3e 與 HBM4 差在哪,下一步又是什麼
HBM 每一代主要在比三件事:介面多寬、單顆能堆多高、跑多快。
目前大量出貨的是 HBM3e,介面 1024-bit,單顆頻寬已經超過每秒 1.2 TB。新一代 HBM4 在 2025 年 4 月由 JEDEC 定案,最大的改變是把介面從 1024-bit 直接加寬到 2048-bit,等於把高速公路的車道再翻一倍。實際產品比標準還猛:美光、三星的 HBM4 單堆疊頻寬都做到每秒 2.8 到 3.3 TB 等級。
更前面的戰場已經在排隊。三星在 2026 年的 Nvidia GTC 大會(Nvidia 的年度開發者大會)上展示了更快的 HBM4E,宣稱每 pin 衝到 16 Gb/s、單顆 4.0 TB/s,並預告客製化 HBM 會在 2027 年送樣。簡單說,HBM4 才剛量產,下一代和客製化版本的競賽就已經開打。
供給為什麼一直這麼緊
HBM 缺貨,不只是需求旺,真正麻煩的是擴產速度天生慢,背後有結構性原因。
它製程複雜、良率難拉、又要搭配 CoWoS 先進封裝,產能擴張的速度天生跟不上 AI 的胃口。結果就是長約把供給鎖死:據財報電話會議的報導,美光 2026 年的 HBM 產出大致已被客戶長約包走;三星與 SK 海力士則公開警告,AI 帶動的記憶體短缺可能延續到 2027 年甚至更久,客戶已經在預訂未來幾年的量。
供不應求也反映在價格上。研調機構 TrendForce 估計,HBM4 單價比 HBM3e 貴三成以上;若供應商擴產順利,HBM4 有機會在 2026 下半年超越 HBM3e 成為主流,但這是預估,2026 年 HBM3e 仍大量出貨。對整條 AI 供應鏈來說,這代表就算 GPU 和封裝產能擴出來,只要 HBM 跟不上,整機一樣出不了貨。
台灣在這關的角色
先講一個常見的誤解:台灣並沒有本土量產的 HBM 品牌,HBM 晶圓主要握在韓國的 SK 海力士、三星,以及美國的美光手上(美光在台灣有 DRAM/HBM 相關製造與擴建布局,但 HBM 的品牌與產品責任仍屬美光,不是台灣本土品牌)。所以單看「誰做 HBM」,台灣不是主角。
但把鏡頭拉到下游就不一樣了。HBM 要發揮作用,必須靠 CoWoS 這類先進封裝,緊貼在 GPU 旁邊,而這一關高度集中在台灣。HBM 越缺、越貴,先進封裝和系統整合的議價力就越被放大。再加上 Nvidia 新一代平台的伺服器代工,點名的幾乎全是台系廠商。所以台灣在 HBM 這關,角色落在封裝、測試、伺服器整合這些關鍵下游環節,會直接被 AI 加速器的需求牽動。
這一關的重點
看完 HBM,有幾件事值得記住。
HBM 就是「站起來的超寬記憶體」,當 AI 加速器的供油管。頻寬不夠,GPU 再強也吃不到資料,所以它是和先進封裝並列、卡住整條 AI 供應鏈的關鍵零件。
它由 SK 海力士、三星、美光三家寡占,供不應求看到 2027 年以後,價格還在往上走。最新的 HBM4 已在 2026 年量產,美光更明確對應 Nvidia 的 Vera Rubin 平台,而 HBM4E 與客製化 HBM 的下一輪競賽也已經開打。
想接著看把 HBM 和 GPU 綁成一塊的先進封裝,可以讀 CoWoS 是什麼;想看整條鏈八個關卡怎麼串起來,回到 供應鏈總覽。