在这波 AI 竞赛里,多数公司都得排队向 Nvidia 买 GPU。Google 是个例外,它有一张别人没有的牌:自己设计的 AI 芯片,TPU。
这张牌让它成为所有 AI 大厂里,对 Nvidia 依赖最低的一家。当对手把大笔预算交给 Nvidia、还要看货源脸色时,Google 大量的训练与推理跑在自家 TPU 上。想先认识 Google 这家公司的全貌,可以从 Google 是什么公司 开始。
这篇只回答一个问题:自己做芯片,到底替 Google 省了多少、这个护城河有多深、又有哪些它跨不过去的坎。
一句话定调。 TPU 是真的省,但省的是 Google 自己的大规模算力;它没有让 Google 跳出那条从台积电到 HBM 的全球供应链。
TPU 是 Google 的自家 AI 芯片
TPU 全名是 Tensor Processing Unit,是 Google 为了跑自家 AI 运算、量身打造的芯片,属于专用型的 ASIC。它不在市面上零售,主要供 Google 内部使用,也通过 Google Cloud 租给企业。
Google 做 TPU 已经做了十年,一代一代往上堆。最新对外的是第七代 Ironwood,官方把它定位成「推理时代的第一款 TPU」,每瓦性能比上一代 Trillium 再提升一截。再往后是第八代,Google 做了一件以前没做过的事:把训练和推理拆成两款不同的芯片设计,各自优化。
芯片背后的原理这篇就不展开了,想看 TPU 跟 GPU 差在哪、ASIC 是什么,可以读我们供应链系列的 AI 加速芯片解析 与 TPU 专篇。
自己做芯片,到底省在哪
最直接的证据来自 Google 自己的财报。2025 年的业绩说明会上,Google 说当年把 Gemini 的单位服务成本压低了大约 78%,来源是模型优化加上自家硬件的效率与使用率提升。
省的逻辑有两层。一层是绕过中间商的利润:自己设计芯片,不必用零售价向 Nvidia 买 GPU。另一层是量身打造:TPU 是为 Google 自己的工作负载设计的,跑起来更对症下药。有分析师估算,最新一代 TPU 在特定的大型语言模型训练任务上,总持有成本可比 Nvidia 同级芯片低约四成。
这里要诚实补一刀,免得读者把优势想得太满。那个四成是分析师针对「优化过的自用场景」的估算,会因工作负载而异。在通用的、随点随用的云端推理上,独立评测显示 Nvidia 生态目前仍有明显领先。换句话说,TPU 最省的地方,是 Google 自己那种跑超大批量、可以慢慢排程的工作,而不是对外卖的每一种算力。
一条龙的背后,是一张很长的供应链
「自研芯片」听起来像 Google 什么都自己来,实际上它靠的是一整排伙伴。
芯片的架构由 Google 主导,但设计协力分给了好几家:最新世代的训练芯片由 Broadcom 协同设计,双方合约一路签到 2031 年;推理芯片则由台湾的联发科(MediaTek)承接;Google 还在跟 Marvell 洽谈第三家设计伙伴。真正把芯片造出来的,是台积电的先进制程,第八代 TPU 锁定 2nm,预计 2027 年底量产。
内存这一块更微妙。TPU 需要大量的 HBM(高带宽内存),据业界报道,三星近期供应 Google TPU 的 HBM 比重偏高,但这是产业消息、不是三家内存厂的官方数字,确切分配 Google 从未公开。先进封装(CoWoS)的需求也跟着暴增,同样卡在台积电的产能上。
把这些串起来看,Google 确实比那些只能外购 GPU 的对手更有掌控力,但它没有真正跳出全球供应链。台积电的产能、HBM 的供给、先进封装的瓶颈,全是当前业界抢破头的环节,也全在美国出口管制的范围内。整条链怎么运作,可以看 AI 硬件供应链一条龙。
连对手都来租它的芯片
TPU 的实力,从一个有点吊诡的地方看得最清楚:Google 的对手也在用它的芯片。
Anthropic 签下了 Google 史上最大的 TPU 采购协议,规模上看百万颗等级;市场也传出 Meta 在跟 Google 洽谈大笔 TPU 部署。最有戏的是 Anthropic 这条线,Google 一边砸重金投资它、一边把算力租给它,三角关系相当复杂,这部分我们在 Google 为什么投资对手 Anthropic 里专门拆过。
对手愿意把训练下一代模型这种要紧事交给 TPU,本身就是对它性价比的一张背书。
芯片要电,电从哪来
芯片只是故事的一半,另一半是电。这么大规模的 AI 运算,吃电量惊人,能源于是变成 Google 的另一条战线。
它的押注分两路。一路是核能:Google 跟 Kairos Power 签了协议,计划在 2030 到 2035 年间部署最高 500 MW 的小型模块化反应堆(SMR)来供电,第一座目标 2030 年上线。另一路是可再生能源:它在德州签下 1 GW 的太阳能购电协议,在多个美国电力市场另签了逾 1 GW 的合约,还在 2026 年初花 47.5 亿美元收购了清洁能源与数据中心基础设施公司 Intersect Power,目的就是把电力来源先绑住,免得扩张卡在没电可用。
能源这条线会跟着数据中心一起长,是看 Google AI 布局时容易被忽略、却越来越关键的一块。
还没摊开的部分
这个主题有不少数字停在「业界报道」阶段,这里诚实标出来:
- HBM 供应商的确切比重:三星近期供应比重偏高的说法来自产业消息与韩国媒体,三家内存厂都没出面确认,确切分配未公开。
- TPU 占台积电产能的比例:有联发科订单的推估,但 Google 自己占台积电多少先进制程与封装产能,官方从未披露。
- Ironwood 的制程节点:业界指向台积电 3nm,但 Google 官方没有公布。
- TPU 与 Nvidia 的内部采购比例:Alphabet 财报没有把自用 TPU 与外购 GPU 的金额分开披露。
这些都还没有官方定论,看到再精确的单一数字,都值得多留一个问号。
小企鹅的观察
把 TPU 这张牌拉远看,它的价值不在「最便宜」,而在「最有掌控力」。
当别人为了抢 Nvidia 的货而焦虑、为了采购价而头痛时,Google 手上有一条自己能调度的芯片线,这在算力即国力的当下,是很硬的底气。但这条护城河有它清楚的边界:它最省的是自用的大规模算力,不是对外卖的每一度;而且它的水源,依然是那条从台积电、HBM 到先进封装的全球供应链。Google 比谁都更接近「芯片自主」,却还没有人能真正做到。