前面 ASIC 那一关 提过,云端大厂除了买英伟达,也都在自研 AI 芯片,其中最资深的就是谷歌的 TPU。这篇专门把 TPU 讲清楚。
先看 TPU 是什么、和 GPU 差在哪,再看它的世代演进、会不会取代英伟达,以及为什么连 Anthropic 都大量采用、博通和台厂在里面做什么。这是 AI 硬件供应链一条龙 第 1 关「AI 芯片」的谷歌 TPU 深入版。
TPU 是什么
TPU 的全名是 Tensor Processing Unit(张量处理器),是谷歌自研、专为机器学习打造的定制芯片,属于一种 ASIC(为特定任务量身打造的芯片)。
它和 GPU 的设计哲学不同。GPU 是较通用的并行运算芯片,什么都能算,软件生态(CUDA)成熟。TPU 则把矩阵运算、HBM 内存、芯片间互连、编译器与框架一起 co-design(共同设计),专攻 AI 的训练与推理,目标是在成本、功耗、延迟与规模化上更划算。打个比方:GPU 像什么都能切的瑞士刀,TPU 像谷歌为自家那几道菜定制的厨刀。
要澄清一点:谷歌并不是不用英伟达。谷歌云明讲会与英伟达密切合作、提供新一代英伟达机种,TPU 和 GPU 在谷歌云里是并行的两条产品线。
核心数据快照
下面帮你抓住 TPU 的关键节点。规格为谷歌官方,占比为研究机构估计。
| 项目 | 内容 | 时点/性质 |
|---|---|---|
| 已商用最新代 | 第七代 Ironwood(TPU7x) | 谷歌云文档(2026-05) |
| Ironwood 规格 | 单一 superpod 串 9,216 颗芯片、每颗 192 GiB HBM | 谷歌官方 |
| 第八代 | TPU 8t(训练)/8i(推理)2026-04 公开,尚未商用 | 谷歌官方发布 |
| 谷歌 AI 服务器 TPU 占比 | 2026 估约 78%(云端业者中唯一 ASIC 出货多于 GPU) | TrendForce 估计 |
| Anthropic 采用 | 最多上看百万颗、2026 逾 1GW;2027 起经博通约 3.5GW | Anthropic/博通 SEC |
世代简史:从 v1 到 Ironwood
TPU 不是新东西。谷歌从 2015 年就在自家数据中心内部用第一代 TPU,早期跑 RankBrain、街景、AlphaGo 这些服务。之后一路演进:第二、三、四代逐步从推理走向大规模训练,第五代分成省成本的 v5e 与拼性能的 v5p,第六代叫 Trillium(v6e)。
目前已商用、在谷歌云上可用的最新一代,是第七代 Ironwood(TPU7x):单一 superpod 可串到 9,216 颗芯片、每颗配 192 GiB 的 HBM,专攻大型模型的预训练与推理。第八代 TPU 8t(训练)与 8i(推理)已在 2026 年 4 月公开规格,官方主打更高的每美元性能与每瓦性能,但目前只开放意向登记,还没看到正式上线(GA)的文档,先理解成「已公开、待商用」即可,别当成已经能租到。
TPU vs GPU:会取代英伟达吗
这是最常被问的问题,答案要分「谷歌自家」和「整个市场」两个尺度看。
TPU 的强项在于垂直整合:谷歌自家模型(如 Gemini)的需求能直接影响芯片设计,加上主打的成本与能效、超大规模互连,在谷歌自己的工作负载上很有优势。研究机构 TrendForce 就估,2026 年 TPU 在谷歌自家 AI 服务器出货的占比逼近八成,谷歌是主要云端业者中唯一「自研 ASIC 出货多于 GPU」的一家。
但那是谷歌自家的配比,不是全球市占。放到整个市场,英伟达的护城河还在:CUDA 软件生态、成熟的开发工具、跨云跨框架的通用性,都让 GPU 维持主流,连谷歌云自己也继续卖英伟达机种。TPU 对外部开发者还有迁移成本,连谷歌都还在把 TPU 对 PyTorch 的原生支持标成「预览」阶段。所以务实的看法是:TPU 在谷歌自身与部分 AI 实验室快速放量,但短期谈不上取代英伟达,比较像并存与分工。
谁在用 TPU
先是谷歌自己。从早年的搜索排序、街景,到现在的 Gemini,谷歌自家大量 AI 产品都跑在 TPU 上。外部用户则可透过谷歌云(Cloud TPU VM、GKE、Vertex AI)租用。
最受瞩目的外部客户是 Anthropic。它在 2025 年 10 月宣布扩大采用谷歌云 TPU,规模最多上看百万颗、2026 年带来逾 1GW 容量;2026 年 4 月再与谷歌、博通签约,2027 年起透过博通取得约 3.5GW 的次世代 TPU 算力。要注意 Anthropic 采分散策略,同时也用 AWS Trainium 与英伟达 GPU,亚马逊仍是它的主要云端与训练伙伴。多家并用、分散押注,正是现在大型 AI 公司的常态。另外,私募巨头黑石(Blackstone)也在 2026 年 5 月宣布与谷歌合资,要在美国建 TPU 云端,提供谷歌云之外的另一条 TPU 取得管道。
谁帮谷歌做 TPU、台厂的角色
TPU 的架构与软件由谷歌自己掌握,但芯片的细部设计、制造、封装要找伙伴。
最明确的是博通(Broadcom)。博通在 2026 年 4 月的 SEC 文件中确认,与谷歌签了长期协议,会为谷歌未来世代的 TPU 做定制设计与供应,并提供下一代 AI 机柜的网络等元件,合作期间长到 2031 年。制造方面,市场普遍把 TPU 的先进制程与封装连到台积电,但谷歌官方并未公开具体制程节点,这部分属供应链与媒体推测。另外也有媒体报道联发科参与谷歌下一代推理版 TPU 的设计,但同样未见官方证实,只能当「市场报道」看。
至于台股常讲的「TPU 概念股」,市场与法人会点名一票供应链厂商(设计服务、测试、封测、测试接口、载板、散热电源等)。这里要特别说清楚:这些名单多来自券商的供应链推测与受惠想象,不是谷歌或博通的公司公告;列名不代表已接到订单、也不代表受惠程度。本文只描述产业角色,不整理受益股、不做个股排名,也不构成投资建议。
这一关的重点
TPU 是谷歌自研的 AI 专用芯片,把运算、内存、互连、软件一起设计,走的是垂直整合、主打成本与能效的路线。最新已商用是第七代 Ironwood,第八代 8t/8i 已公开、待商用。
在谷歌自家 AI 服务器里,TPU 占比已很高(研究机构估 2026 约近八成),但放到全球,英伟达靠 CUDA 生态与通用性仍是主流,两者在谷歌云内并存。连 Anthropic 都大量采用 TPU 跑 Claude,背后有博通做定制设计。台厂相关名单多属法人推测,理解产业角色就好,别当选股清单。
想看谷歌 TPU 属于哪一类芯片,回头读 ASIC 是什么;想看 GPU 主流那一边,读 GPU 是什么 与 Blackwell;想看这些芯片怎么喂数据,读 HBM;想回头看整条链,回到 供应链总览。