每次讲到 AI 芯片缺货,除了台积电的 CoWoS 封装,另一个被点名的瓶颈就是 HBM。新闻常说「某家内存厂 HBM 又被预订一空」,但 HBM 到底是什么、为什么 GPU 非它不可、跟你电脑里那条内存又差在哪?

这篇就把 HBM 一次讲白。先看它是什么、和一般内存差在哪,再谈为什么 AI 非用它不可、三家寡占怎么打,以及 HBM4 为什么是 2026 年的新战场。这是 AI 硬件供应链一条龙 第 2 关的深入版。


HBM 是什么?一句话加一个画面

HBM 的全名是 High Bandwidth Memory,高带宽内存。它做的事,是把好几层 DRAM 内存芯片垂直叠起来,中间用「硅通孔(TSV,等于在芯片里打一条条垂直通道)」上下打通,再通过一条非常宽的接口(GPU 和内存之间的数据通道),紧贴在 GPU 旁边。

先给一个画面:一般电脑里的内存,是一条一条横躺着插在主板上;HBM 则是把内存立起来、层层往上叠,再搬到离 GPU 几乎贴着的位置。所以最好记的一句话是:HBM 是「立起来的超宽内存」,目的是别让 GPU 等数据等到饿死。

为什么要叠起来、又要贴这么近?因为 AI 芯片每秒要吞的数据量大得惊人。横躺的传统内存,接口不够宽、距离又远,根本喂不动。把内存叠高、加宽接口、再缩短距离,带宽就能一口气拉到每秒好几 TB。代价是它得用 CoWoS(把 GPU 和 HBM 放进同一个高阶封装的技术)这类先进封装才能跟 GPU 贴合,制造难度和成本都高。


和一般内存(DDR)差在哪

很多人会问:那 HBM 是不是要取代我电脑里的内存?不是。它们服务不同场景。

一般的 DDR 内存是通用系统内存,便宜、好扩充,跑操作系统、开网页、玩游戏都靠它,像四通八达的一般道路。HBM 则是为 AI 与高性能计算量身打造的特规品,贵、难做、产能有限,像专门贴在 GPU 旁边的超宽高速公路。它真正的强项是宽度和距离:车道多到夸张、离终点又超近。

所以这两种内存是并存的关系。你的笔记本不会用 HBM,AI 服务器里的 GPU 也不会只靠 DDR。理解这一点,就不会把「内存缺货」和「HBM 缺货」混为一谈。后面会看到,真正卡 AI 的是 HBM 这条特规高速公路。


为什么 AI 芯片非 HBM 不可

把 GPU 想成一具超强引擎。引擎再猛,油管太细,照样跑不起来。对 AI 芯片来说,那条油管就是内存带宽。

AI 在训练和推理时,要不停把模型权重、中间运算结果搬进运算核心。一旦内存喂数据的速度跟不上,几千个运算核心就会卡在「空等」,再贵的算力都浪费掉。HBM 的存在,就是把这条供油管做到够粗,让 GPU 的核心一直有数据可吃。

这也是为什么旗舰 AI 芯片动辄绑上好几颗 HBM。一句话:HBM 是 AI 加速器的供油管,带宽不够,引擎再强也吃不到数据。


核心数据快照

下面这些是理解 HBM 战局的关键数字。先说清楚,市占这类数字是研究机构的估计值、会随季度变动,看的时候抓量级和趋势比抓小数点实际。

主题数值时点/性质
HBM 营收市占SK 海力士约 57%、三星约 22%、美光约 21%2025 Q3,Counterpoint 估计
HBM3e 规格(美光)1024-bit 接口、每 pin 逾 9.2 Gb/s、单颗逾 1.2 TB/s;8 层 24GB、12 层 36GB2025-2026 量产
HBM4 标准(JEDEC)2048-bit 接口、每 pin 最高 8 Gb/s、单堆叠最高 2 TB/s;标准支持更高堆叠与容量2025-04 发布
HBM4 实际产品美光 36GB/12 层、逾 2.8 TB/s;三星每 pin 11.7-13 Gb/s、最高 3.3 TB/s(48GB/16 层仍在送样或规划)2026 Q1 起量产
供给状态需求远大于供给,业界警告短缺恐延续至 2027 年以后2026,多家报道

三家寡占的战局

HBM 是标准的三强赛局,门槛极高,新玩家几乎进不来。

SK 海力士长期领先,市占过半,技术和良率都站在前头;连最新的 HBM4 也是它最早完成开发、率先备妥量产(2025 年下半,速度突破每秒 10 Gb)。三星一度在 HBM3 世代落后,2026 年初宣布 HBM4 量产、开始商用出货,追了上来。**美光(Micron)**这两年冲得最猛,市占从个位数一路拉到约两成,2026 年第一季量产了明确对应 Nvidia 新一代 Vera Rubin 平台的 HBM4。

值得留意的是这场仗的节奏:谁先把最新一代 HBM 做到量产、又通过 Nvidia 认证,谁就能在下一轮分到最大的订单。所以三家比的不只是「做得出来」,而是「谁先、良率多高、能供多少」。


HBM3e 与 HBM4 差在哪,下一步又是什么

HBM 每一代主要在比三件事:接口多宽、单颗能堆多高、跑多快。

目前大量出货的是 HBM3e,接口 1024-bit,单颗带宽已经超过每秒 1.2 TB。新一代 HBM4 在 2025 年 4 月由 JEDEC 定案,最大的改变是把接口从 1024-bit 直接加宽到 2048-bit,等于把高速公路的车道再翻一倍。实际产品比标准还猛:美光、三星的 HBM4 单堆叠带宽都做到每秒 2.8 到 3.3 TB 等级。

更前面的战场已经在排队。三星在 2026 年的 Nvidia GTC 大会(Nvidia 的年度开发者大会)上展示了更快的 HBM4E,宣称每 pin 冲到 16 Gb/s、单颗 4.0 TB/s,并预告定制化 HBM 会在 2027 年送样。简单说,HBM4 才刚量产,下一代和定制化版本的竞赛就已经开打。


供给为什么一直这么紧

HBM 缺货,不只是需求旺,真正麻烦的是扩产速度天生慢,背后有结构性原因。

它制程复杂、良率难拉、又要搭配 CoWoS 先进封装,产能扩张的速度天生跟不上 AI 的胃口。结果就是长约把供给锁死:据财报电话会议的报道,美光 2026 年的 HBM 产出大致已被客户长约包走;三星与 SK 海力士则公开警告,AI 带动的内存短缺可能延续到 2027 年甚至更久,客户已经在预订未来几年的量。

供不应求也反映在价格上。研究机构 TrendForce 估计,HBM4 单价比 HBM3e 贵三成以上;若供应商扩产顺利,HBM4 有机会在 2026 下半年超越 HBM3e 成为主流,但这是预估,2026 年 HBM3e 仍大量出货。对整条 AI 供应链来说,这代表就算 GPU 和封装产能扩出来,只要 HBM 跟不上,整机一样出不了货。


台湾在这关的角色

先讲一个常见的误解:台湾并没有本土量产的 HBM 品牌,HBM 晶圆主要握在韩国的 SK 海力士、三星,以及美国的美光手上(美光在台湾有 DRAM/HBM 相关制造与扩建布局,但 HBM 的品牌与产品责任仍属美光,不是台湾本土品牌)。所以单看「谁做 HBM」,台湾不是主角。

但把镜头拉到下游就不一样了。HBM 要发挥作用,必须靠 CoWoS 这类先进封装,紧贴在 GPU 旁边,而这一关高度集中在台湾。HBM 越缺、越贵,先进封装和系统整合的议价力就越被放大。再加上 Nvidia 新一代平台的服务器代工,点名的几乎全是台系厂商。所以台湾在 HBM 这关,角色落在封装、测试、服务器整合这些关键下游环节,会直接被 AI 加速器的需求牵动。


这一关的重点

看完 HBM,有几件事值得记住。

HBM 就是「立起来的超宽内存」,当 AI 加速器的供油管。带宽不够,GPU 再强也吃不到数据,所以它是和先进封装并列、卡住整条 AI 供应链的关键零件。

它由 SK 海力士、三星、美光三家寡占,供不应求看到 2027 年以后,价格还在往上走。最新的 HBM4 已在 2026 年量产,美光更明确对应 Nvidia 的 Vera Rubin 平台,而 HBM4E 与定制化 HBM 的下一轮竞赛也已经开打。

想接着看把 HBM 和 GPU 绑成一块的先进封装,可以读 CoWoS 是什么;想看整条链八个关卡怎么串起来,回到 供应链总览