每次 NVIDIA 開發表會,新聞就冒出一堆名字:B200、GB200、GB300、NVL72、Rubin。聽起來都很猛,但它們到底是不同的東西,還是同一個東西的不同講法?

這篇就把 Blackwell 世代一次講清楚。先把「GPU、超級晶片、整櫃系統」這三個層級分開,再看規格差在哪、出貨到哪,以及下一代 Rubin 和台灣代工廠的角色。這是 AI 硬體供應鏈一條龍 第 1 關「AI 晶片」的深入版。


先分清楚:GPU、超級晶片、整櫃,是三個層級

新聞最容易把人搞混的,就是把三個層級的東西混在一起講。先把它們拆開:

  • B200 / B300:單顆 GPU,是最基本的運算晶片。
  • GB200 / GB300:一顆 Grace CPU 加上兩顆 GPU,綁成一顆「超級晶片(superchip)」。
  • GB200 / GB300 NVL72:把 36 顆 Grace CPU 和 72 顆 GPU,用高速連結串成一整櫃,當成一台超級電腦來操作。

所以你看到 GB300 NVL72,講的是一整櫃 72 顆 GPU 的系統;看到 B300,講的是裡面那一顆 GPU。記住這個由小到大的層級,後面的數字就不會亂。


Blackwell 是什麼?為什麼這麼強

Blackwell 是 NVIDIA 在 2024 年推出、2025 到 2026 年大量出貨的 AI 晶片架構,接在前一代 Hopper(H100/H200)之後。

它最關鍵的設計,是把兩顆大運算晶粒(die)縫成一顆 GPU。受製程限制,單一晶粒能做多大有上限,於是 NVIDIA 用一條每秒 10 TB 的超高速連結(NV-HBI),把兩顆晶粒接成「看起來像一顆」的 GPU,整顆塞進約 2080 億個電晶體,製造交給台積電的 4NP 製程。

算力上,Blackwell 主打一種叫 NVFP4 的超低精度數字格式(可以先理解成:用更省的方式表示數字,換取每秒更多次運算),把 AI 推論的吞吐量一口氣拉高。一句話:Blackwell 是「一顆當兩顆用」的旗艦 AI GPU。


核心數據快照

下面把 Blackwell 世代的關鍵規格放在一起。先補三個詞:HBM 是 GPU 旁邊的高速記憶體、PFLOPS 是每秒能做多少次浮點運算、CoWoS 是把 GPU 和 HBM 封在一起的先進封裝。數字以 NVIDIA 公布為準。

產品層級關鍵規格狀態
B200GPU192GB HBM3E、頻寬 8 TB/s、NVFP4 約 10 PFLOPS、功耗約 1200W出貨中
B300(Blackwell Ultra)GPU288GB HBM3E、頻寬 8 TB/s、NVFP4 約 15 PFLOPS、功耗約 1400W出貨中
GB200 NVL72整櫃(72 GPU+36 Grace)NVFP4 約 720 PFLOPS、13.4TB HBM3E、整櫃約 120kW 級出貨中
GB300 NVL72整櫃(72 Ultra+36 Grace)NVFP4 約 1,080 PFLOPS、20TB HBM3E、整櫃約 120kW 級部署中
Vera Rubin NVL72下一代整櫃單顆 Rubin 288GB HBM4/22 TB/s、整櫃 NVFP4 推論約 3,600 PFLOPS2026 下半年(規格初步)

(表中 Blackwell 的 NVFP4 為密集 dense 值;NVIDIA 行銷常引用的稀疏 sparse 值約為兩倍。整櫃功耗依供電與散熱配置而變;Rubin 整櫃標的是推論口徑,與 Blackwell 的密集值不可直接相比。)


B200 到 B300:同一架構再推一階

2025 年推出、下半年起陸續商用部署的 B300,官方代號 Blackwell Ultra,是同一個架構的強化版。

最有感的兩個升級:記憶體從 192GB 加到 288GB HBM3E,多了五成,能裝下更大的模型;低精度(NVFP4)的密集算力也多了約五成。代價是功耗從約 1200 瓦升到約 1400 瓦。整櫃的 GB300 NVL72 因此把記憶體從 13.4TB 拉到 20TB,更適合跑超大模型的推論。對雲端業者來說,這是「同一條產線、規格往上跳一階」的順勢升級,不必整套架構重來。


出貨到哪了?

Blackwell 不是 PPT 規格,已經實際在跑。

NVIDIA 官方把 Blackwell 標示為「full production」,HGX B200、B300 都在出貨中。整櫃的 GB300 NVL72 也已落地:雲端業者 CoreWeave 在 2025 年中率先商用部署,微軟 Azure 更在 2025 年 10 月為 OpenAI 建起一座由數千顆 GB300 GPU 組成的生產級叢集。換句話說,2026 年的 AI 算力擴張,主力仍是 Blackwell 與 Blackwell Ultra。

產能瓶頸還是老地方:要出多少 Blackwell,受限於台積電的 CoWoS 先進封裝和 HBM 記憶體供給,這兩關前面的單篇有拆過。


下一代 Rubin:已公布,但別急著說它取代 Blackwell

NVIDIA 已正式公布下一代平台 Vera Rubin,晶片本身也已進入量產(full production)。整櫃的 Vera Rubin NVL72,由 72 顆 Rubin GPU 加 36 顆 Vera CPU 組成;單顆 Rubin 改用新一代 HBM4 記憶體(288GB、頻寬 22 TB/s),整櫃的 NVFP4 推論算力上看每秒約 3,600 PFLOPS,比 Blackwell 又往上跳一大階。

但這裡要踩一下煞車。產品頁的規格仍標成「初步、可能調整」,官方目標是 2026 下半年由 AWS、Google Cloud、微軟等雲端業者開始部署。研調機構也估計,2026 年 NVIDIA 高階 GPU 出貨仍以 Blackwell 為大宗(占比約從六成升到七成),Rubin 還有供應鏈調校與時程風險,其中 HBM4 的驗證與供應是最關鍵的變數。所以務實的看法是:2026 年是 Blackwell 的主場,Rubin 是排隊中的下一棒,不是立刻接班。


台灣在這關的角色

晶片設計在 NVIDIA、製造在台積電,那把整櫃系統「組起來、能量產出貨」的,主要就是台灣。

鴻海(Foxconn)已公開展示 Vera Rubin NVL72 的整機系統;供應鏈報導點名廣達、緯創與緯穎、英業達等台系 ODM/EMS 參與 GB200/GB300 整櫃系統的代工,也提到 NVIDIA 為搶產能、預訂了部分台廠的伺服器廠房到 2026 年。換句話說,台灣不只做晶圓和封裝,連「一整櫃 AI 超級電腦」的組裝出貨,也是全球關鍵基地。這裡只做產業地圖,不對個股做任何投資判斷。


這一關的重點

看完 Blackwell,先記住那個由小到大的層級:B200/B300 是 GPU,GB200/GB300 是超級晶片,NVL72 是整櫃 72 顆 GPU 的系統。

技術上,Blackwell 用「兩顆晶粒縫成一顆」加上 NVFP4 低精度算力衝高吞吐;B300(Blackwell Ultra)再把記憶體和算力各往上推約五成。2026 年的主力是 Blackwell,已大量出貨、雲端實際部署;Rubin 是已公布的下一棒,目標下半年登場,但規格仍是初步,HBM4 和整櫃供應鏈是最大變數。

想知道餵資料給這些 GPU 的 HBM、把晶片綁起來的 CoWoS,可以看 HBM 是什麼CoWoS 是什麼;想看整條鏈八關怎麼串,回到 供應鏈總覽