TPU 是 Tensor Processing Unit 的缩写，是 Google 自己设计、专门用来跑 AI 运算的芯片，属于一种为特定任务量身打造的 ASIC。它不对外零售，主要供 Google 自家服务使用，也通过 Google Cloud 租给企业客户。想看技术原理，可以读我们的 AI 加速芯片 ASIC 解析。

自研 TPU 真的比较省吗？

在 Google 自己的大规模工作负载上，省得很明显。Google 在 2025 年财报说，当年把 Gemini 的单位服务成本压低了约 78%。有分析师估算，最新一代 TPU 在特定训练任务上的总持有成本可比 Nvidia 同级芯片低约四成。但这是针对优化的自用场景，通用的随选推理上 Nvidia 生态仍有优势。

Google 完全不用 Nvidia 吗？

不是完全不用。Google 是大厂里对 Nvidia 依赖最低的一家，自用算力大量跑在 TPU 上；但它的 Google Cloud 同时提供 TPU 与 Nvidia GPU 两种选择给客户，所以 Nvidia 仍在它的供应组合里。

TPU 是 Google 自己造的吗？

芯片架构由 Google 主导，但设计协力与制造另有伙伴。最新世代的训练芯片由 Broadcom 协同设计，推理芯片由联发科（MediaTek）承接，实际制造则交给台积电的先进制程。所以它是「Google 设计、伙伴协力、台积电代工」的组合。

这个成本优势可靠吗？

有真实基础，但有两个但书。第一，它最省的是 Google 自用的大批量场景，不等于对外云端随选也最便宜。第二，TPU 一样得靠台积电产能、HBM 内存与先进封装，这些都是全球都在抢的瓶颈，也都在出口管制的范围里。

自研 TPU：Google 的芯片成本护城河到底有多深？

在这波 AI 竞赛里，多数公司都得排队向 Nvidia 买 GPU。Google 是个例外，它有一张别人没有的牌：自己设计的 AI 芯片，TPU。

这张牌让它成为所有 AI 大厂里，对 Nvidia 依赖最低的一家。当对手把大笔预算交给 Nvidia、还要看货源脸色时，Google 大量的训练与推理跑在自家 TPU 上。想先认识 Google 这家公司的全貌，可以从 Google 是什么公司开始。

这篇只回答一个问题：自己做芯片，到底替 Google 省了多少、这个护城河有多深、又有哪些它跨不过去的坎。

一句话定调。 TPU 是真的省，但省的是 Google 自己的大规模算力；它没有让 Google 跳出那条从台积电到 HBM 的全球供应链。

TPU 是 Google 的自家 AI 芯片

TPU 全名是 Tensor Processing Unit，是 Google 为了跑自家 AI 运算、量身打造的芯片，属于专用型的 ASIC。它不在市面上零售，主要供 Google 内部使用，也通过 Google Cloud 租给企业。

Google 做 TPU 已经做了十年，一代一代往上堆。最新对外的是第七代 Ironwood，官方把它定位成「推理时代的第一款 TPU」，每瓦性能比上一代 Trillium 再提升一截。再往后是第八代，Google 做了一件以前没做过的事：把训练和推理拆成两款不同的芯片设计，各自优化。

芯片背后的原理这篇就不展开了，想看 TPU 跟 GPU 差在哪、ASIC 是什么，可以读我们供应链系列的 AI 加速芯片解析与 TPU 专篇。

自己做芯片，到底省在哪

最直接的证据来自 Google 自己的财报。2025 年的业绩说明会上，Google 说当年把 Gemini 的单位服务成本压低了大约 78%，来源是模型优化加上自家硬件的效率与使用率提升。

省的逻辑有两层。一层是绕过中间商的利润：自己设计芯片，不必用零售价向 Nvidia 买 GPU。另一层是量身打造：TPU 是为 Google 自己的工作负载设计的，跑起来更对症下药。有分析师估算，最新一代 TPU 在特定的大型语言模型训练任务上，总持有成本可比 Nvidia 同级芯片低约四成。

这里要诚实补一刀，免得读者把优势想得太满。那个四成是分析师针对「优化过的自用场景」的估算，会因工作负载而异。在通用的、随点随用的云端推理上，独立评测显示 Nvidia 生态目前仍有明显领先。换句话说，TPU 最省的地方，是 Google 自己那种跑超大批量、可以慢慢排程的工作，而不是对外卖的每一种算力。

一条龙的背后，是一张很长的供应链

「自研芯片」听起来像 Google 什么都自己来，实际上它靠的是一整排伙伴。

芯片的架构由 Google 主导，但设计协力分给了好几家：最新世代的训练芯片由 Broadcom 协同设计，双方合约一路签到 2031 年；推理芯片则由台湾的联发科（MediaTek）承接；Google 还在跟 Marvell 洽谈第三家设计伙伴。真正把芯片造出来的，是台积电的先进制程，第八代 TPU 锁定 2nm，预计 2027 年底量产。

内存这一块更微妙。TPU 需要大量的 HBM（高带宽内存），据业界报道，三星近期供应 Google TPU 的 HBM 比重偏高，但这是产业消息、不是三家内存厂的官方数字，确切分配 Google 从未公开。先进封装（CoWoS）的需求也跟着暴增，同样卡在台积电的产能上。

把这些串起来看，Google 确实比那些只能外购 GPU 的对手更有掌控力，但它没有真正跳出全球供应链。台积电的先进制程、HBM 的供给、先进封装的瓶颈，全是当前业界抢破头的环节，也全在美国出口管制的范围内。整条链怎么运作，可以看 AI 硬件供应链一条龙。

连对手都来租它的芯片

TPU 的实力，从一个有点吊诡的地方看得最清楚：Google 的对手也在用它的芯片。

Anthropic 签下了 Google 史上最大的 TPU 采购协议，规模上看百万颗等级；市场也传出 Meta 在跟 Google 洽谈大笔 TPU 部署。最有戏的是 Anthropic 这条线，Google 一边砸重金投资它、一边把算力租给它，三角关系相当复杂，这部分我们在 Google 为什么投资对手 Anthropic 里专门拆过。

对手愿意把训练下一代模型这种要紧事交给 TPU，本身就是对它性价比的一张背书。

芯片要电，电从哪来

芯片只是故事的一半，另一半是电。这么大规模的 AI 运算，吃电量惊人，能源于是变成 Google 的另一条战线。

它的押注分两路。一路是核能：Google 跟 Kairos Power 签了协议，计划在 2030 到 2035 年间部署最高 500 MW 的小型模块化反应堆（SMR）来供电，第一座目标 2030 年上线。另一路是可再生能源：它在德州签下 1 GW 的太阳能购电协议，在多个美国电力市场另签了逾 1 GW 的合约，还在 2026 年初花 47.5 亿美元收购了清洁能源与数据中心基础设施公司 Intersect Power，目的就是把电力来源先绑住，免得扩张卡在没电可用。

能源这条线会跟着数据中心一起长，是看 Google AI 布局时容易被忽略、却越来越关键的一块。

还没摊开的部分

这个主题有不少数字停在「业界报道」阶段，这里诚实标出来：

HBM 供应商的确切比重：三星近期供应比重偏高的说法来自产业消息与韩国媒体，三家内存厂都没出面确认，确切分配未公开。
TPU 占台积电产能的比例：有联发科订单的推估，但 Google 自己占台积电多少先进制程与封装产能，官方从未披露。
Ironwood 的制程节点：业界指向台积电 3nm，但 Google 官方没有公布。
TPU 与 Nvidia 的内部采购比例：Alphabet 财报没有把自用 TPU 与外购 GPU 的金额分开披露。

这些都还没有官方定论，看到再精确的单一数字，都值得多留一个问号。

小企鹅的观察

把 TPU 这张牌拉远看，它的价值不在「最便宜」，而在「最有掌控力」。

当别人为了抢 Nvidia 的货而焦虑、为了采购价而头痛时，Google 手上有一条自己能调度的芯片线，这在算力即国力的当下，是很硬的底气。但这条护城河有它清楚的边界：它最省的是自用的大规模算力，不是对外卖的每一度；而且它的水源，依然是那条从台积电、HBM 到先进封装的全球供应链。Google 比谁都更接近「芯片自主」，却还没有人能真正做到。

延伸阅读：Google 是什么公司、AI 硬件供应链一条龙、Google 为什么投资对手 Anthropic。