TPU 是什么？谷歌自研 AI 芯片，为何敢跟英伟达分庭抗礼

TPU 是谷歌自研的 AI 专用芯片，从 Gemini 到谷歌搜索背后都靠它。这篇用大白话讲 TPU 是什么、和 GPU 差在哪、世代演进到第七代 Ironwood，以及为什么连 Anthropic 都大量采用 TPU 跑 Claude、博通与台厂在里面扮演什么角色。

5/28 · Penna

Google TPU 示意：一颗专为 AI 打造的定制芯片放在暖色材质上，象征张量运算

TL;DR

TPU（张量处理器）是谷歌自研、专为 AI 运算打造的定制芯片（ASIC），把运算、内存、互连、软件一起设计，追求成本与能效。它从 2015 年内部使用至今，最新已商用的是第七代 Ironwood；第八代 8t／8i 已在 2026 年 4 月公开、尚未商用。谷歌自家 Gemini、搜索都靠它，连 Anthropic 都大量采用 TPU 跑 Claude。
想搞懂「TPU 是什么、和 GPU 差在哪、会不会取代英伟达、为什么 Anthropic 也用」的入门读者与长线观察者。
TPU 是谷歌垂直整合的 AI 芯片路线：为自家工作负载量身打造，主打成本与能效。它在谷歌自己的 AI 服务器里占比已很高（研究机构估 2026 约近八成），但放到全球市场，英伟达 GPU 靠 CUDA 生态与通用性仍是主流。TPU 与 GPU 在谷歌云内并存，短期是分工而非取代。台厂相关名单多属法人推测，本文不构成投资建议。

本文目录

前面 ASIC 那一关提过，云端大厂除了买英伟达，也都在自研 AI 芯片，其中最资深的就是谷歌的 TPU。这篇专门把 TPU 讲清楚。

先看 TPU 是什么、和 GPU 差在哪，再看它的世代演进、会不会取代英伟达，以及为什么连 Anthropic 都大量采用、博通和台厂在里面做什么。这是 AI 硬件供应链一条龙第 1 关「AI 芯片」的谷歌 TPU 深入版。

TPU 是什么

TPU 的全名是 Tensor Processing Unit（张量处理器），是谷歌自研、专为机器学习打造的定制芯片，属于一种 ASIC（为特定任务量身打造的芯片）。

它和 GPU 的设计哲学不同。GPU 是较通用的并行运算芯片，什么都能算，软件生态（CUDA）成熟。TPU 则把矩阵运算、HBM 内存、芯片间互连、编译器与框架一起 co-design（共同设计），专攻 AI 的训练与推理，目标是在成本、功耗、延迟与规模化上更划算。打个比方：GPU 像什么都能切的瑞士刀，TPU 像谷歌为自家那几道菜定制的厨刀。

要澄清一点：谷歌并不是不用英伟达。谷歌云明讲会与英伟达密切合作、提供新一代英伟达机种，TPU 和 GPU 在谷歌云里是并行的两条产品线。

核心数据快照

下面帮你抓住 TPU 的关键节点。规格为谷歌官方，占比为研究机构估计。

项目	内容	时点／性质
已商用最新代	第七代 Ironwood（TPU7x）	谷歌云文档（2026-05）
Ironwood 规格	单一 superpod 串 9,216 颗芯片、每颗 192 GiB HBM	谷歌官方
第八代	TPU 8t（训练）／8i（推理）2026-04 公开，尚未商用	谷歌官方发布
谷歌 AI 服务器 TPU 占比	2026 估约 78%（云端业者中唯一 ASIC 出货多于 GPU）	TrendForce 估计
Anthropic 采用	最多上看百万颗、2026 逾 1GW；2027 起经博通约 3.5GW	Anthropic／博通 SEC

世代简史：从 v1 到 Ironwood

TPU 不是新东西。谷歌从 2015 年就在自家数据中心内部用第一代 TPU，早期跑 RankBrain、街景、AlphaGo 这些服务。之后一路演进：第二、三、四代逐步从推理走向大规模训练，第五代分成省成本的 v5e 与拼性能的 v5p，第六代叫 Trillium（v6e）。

目前已商用、在谷歌云上可用的最新一代，是第七代 Ironwood（TPU7x）：单一 superpod 可串到 9,216 颗芯片、每颗配 192 GiB 的 HBM，专攻大型模型的预训练与推理。第八代 TPU 8t（训练）与 8i（推理）已在 2026 年 4 月公开规格，官方主打更高的每美元性能与每瓦性能，但目前只开放意向登记，还没看到正式上线（GA）的文档，先理解成「已公开、待商用」即可，别当成已经能租到。

TPU vs GPU：会取代英伟达吗

这是最常被问的问题，答案要分「谷歌自家」和「整个市场」两个尺度看。

TPU 的强项在于垂直整合：谷歌自家模型（如 Gemini）的需求能直接影响芯片设计，加上主打的成本与能效、超大规模互连，在谷歌自己的工作负载上很有优势。研究机构 TrendForce 就估，2026 年 TPU 在谷歌自家 AI 服务器出货的占比逼近八成，谷歌是主要云端业者中唯一「自研 ASIC 出货多于 GPU」的一家。

但那是谷歌自家的配比，不是全球市占。放到整个市场，英伟达的护城河还在：CUDA 软件生态、成熟的开发工具、跨云跨框架的通用性，都让 GPU 维持主流，连谷歌云自己也继续卖英伟达机种。TPU 对外部开发者还有迁移成本，连谷歌都还在把 TPU 对 PyTorch 的原生支持标成「预览」阶段。所以务实的看法是：TPU 在谷歌自身与部分 AI 实验室快速放量，但短期谈不上取代英伟达，比较像并存与分工。

谁在用 TPU

先是谷歌自己。从早年的搜索排序、街景，到现在的 Gemini，谷歌自家大量 AI 产品都跑在 TPU 上。外部用户则可透过谷歌云（Cloud TPU VM、GKE、Vertex AI）租用。

最受瞩目的外部客户是 Anthropic。它在 2025 年 10 月宣布扩大采用谷歌云 TPU，规模最多上看百万颗、2026 年带来逾 1GW 容量；2026 年 4 月再与谷歌、博通签约，2027 年起透过博通取得约 3.5GW 的次世代 TPU 算力。要注意 Anthropic 采分散策略，同时也用 AWS Trainium 与英伟达 GPU，亚马逊仍是它的主要云端与训练伙伴。多家并用、分散押注，正是现在大型 AI 公司的常态。另外，私募巨头黑石（Blackstone）也在 2026 年 5 月宣布与谷歌合资，要在美国建 TPU 云端，提供谷歌云之外的另一条 TPU 取得管道。

谁帮谷歌做 TPU、台厂的角色

TPU 的架构与软件由谷歌自己掌握，但芯片的细部设计、制造、封装要找伙伴。

最明确的是博通（Broadcom）。博通在 2026 年 4 月的 SEC 文件中确认，与谷歌签了长期协议，会为谷歌未来世代的 TPU 做定制设计与供应，并提供下一代 AI 机柜的网络等元件，合作期间长到 2031 年。制造方面，市场普遍把 TPU 的先进制程与封装连到台积电，但谷歌官方并未公开具体制程节点，这部分属供应链与媒体推测。另外也有媒体报道联发科参与谷歌下一代推理版 TPU 的设计，但同样未见官方证实，只能当「市场报道」看。

至于台股常讲的「TPU 概念股」，市场与法人会点名一票供应链厂商（设计服务、测试、封测、测试接口、载板、散热电源等）。这里要特别说清楚：这些名单多来自券商的供应链推测与受惠想象，不是谷歌或博通的公司公告；列名不代表已接到订单、也不代表受惠程度。本文只描述产业角色，不整理受益股、不做个股排名，也不构成投资建议。

这一关的重点

TPU 是谷歌自研的 AI 专用芯片，把运算、内存、互连、软件一起设计，走的是垂直整合、主打成本与能效的路线。最新已商用是第七代 Ironwood，第八代 8t／8i 已公开、待商用。

在谷歌自家 AI 服务器里，TPU 占比已很高（研究机构估 2026 约近八成），但放到全球，英伟达靠 CUDA 生态与通用性仍是主流，两者在谷歌云内并存。连 Anthropic 都大量采用 TPU 跑 Claude，背后有博通做定制设计。台厂相关名单多属法人推测，理解产业角色就好，别当选股清单。

想看谷歌 TPU 属于哪一类芯片，回头读 ASIC 是什么；想看 GPU 主流那一边，读 GPU 是什么与 Blackwell；想看这些芯片怎么喂数据，读 HBM；想回头看整条链，回到供应链总览。

FAQ

TPU 是什么？和 GPU 差在哪？

TPU（Tensor Processing Unit，张量处理器）是谷歌自研的 AI 专用芯片，属于一种 ASIC（为特定任务量身打造的芯片）。它把矩阵运算、HBM 内存、互连与软件一起 co-design，专攻 AI 训练与推理。GPU 则较通用、软件生态（CUDA）成熟。简单说，TPU 是谷歌为自家工作负载定制的刀，GPU 是什么都能切的瑞士刀。

谷歌为什么要自己做 TPU？

因为谷歌内部的 AI 用量太大，自研芯片能在成本、功耗、延迟和规模化上更划算，也能让芯片和自家模型（如 Gemini）、谷歌云服务深度整合、做出差异化。TPU 从 2015 年就在谷歌数据中心内部使用，早期用于 RankBrain、街景、AlphaGo 等。

TPU 最新到第几代？

截至 2026 年 5 月，已商用的最新一代是第七代 Ironwood（TPU7x），单一 superpod 可串 9,216 颗芯片、每颗配 192 GiB HBM。第八代 TPU 8t（训练）与 8i（推理）已在 2026 年 4 月公开、发布了规格，但官方目前只开放意向登记，还没看到正式上线（GA）的文档，属于已公开、待商用阶段。

TPU 会取代英伟达吗？

短期不会。在谷歌自己的 AI 服务器里，TPU 占比已经很高（研究机构 TrendForce 估 2026 约近八成，谷歌是主要云端业者中唯一 ASIC 出货多于 GPU 的一家）。但那是谷歌自家的配比，不是全球市占。放到整个市场，英伟达靠 CUDA 软件生态与通用性仍是主流，连谷歌云也继续提供英伟达机种。比较务实的说法是并存与分工，不是取代。

为什么连 Anthropic 都用 TPU？

Anthropic 采多家并用、分散押注的算力策略。它在 2025 年 10 月宣布扩大采用谷歌云 TPU，规模最多上看百万颗、2026 年带来逾 1GW 容量；2026 年 4 月再与谷歌、博通签约，2027 年起透过博通取得约 3.5GW 的次世代 TPU 算力。但 Anthropic 同时也用 AWS Trainium 与英伟达 GPU，亚马逊仍是它的主要云端与训练伙伴。

免责声明与利益披露

本文仅供一般信息与教育参考，不构成投资、法律、税务或任何专业建议。市场与法规可能随时变化，文中信息仅反映撰写当时状况。

本站并非经监管机构许可的证券投资顾问。文中提及的任何证券、虚拟资产或金融商品，仅为信息整理，不构成买卖建议。所有投资决策请自行判断并承担风险。

本文部分或全部内容涉及 AI（Penna）参与生成，实际比例依个别文章而异，内容可能存在信息错误或遗漏，不构成投资或财务建议。请以原始来源查证为准。

作者可能持有文中提及的部分资产，持仓可能随时变动，恕不逐次更新。

详见本站法律声明与利益披露与隐私政策。