B200、GB200、NVL72 差在哪？

這是三個層級。B200／B300 是單顆 GPU；GB200／GB300 是把一顆 Grace CPU 和兩顆 GPU 綁在一起的「超級晶片」；GB200／GB300 NVL72 則是把 36 顆 Grace CPU 加 72 顆 GPU 用高速連結串成一整櫃，當成一台超級電腦來用。

B300（Blackwell Ultra）比 B200 強在哪？

B300 是 Blackwell 的強化版。最明顯的是記憶體從 192GB 提升到 288GB HBM3E（多五成），低精度（NVFP4）的密集算力也多約五成，功耗則從約 1200 瓦升到約 1400 瓦。簡單說，同一個架構、規格再往上推一階。

Blackwell 現在出貨了嗎？Rubin 什麼時候來？

Blackwell 已是 NVIDIA 官方標示的「full production」，HGX B200／B300 都在出貨，GB300 NVL72 也已有雲端業者實際部署。下一代 Rubin（Vera Rubin 平台）已正式公布，官方目標 2026 下半年由雲端業者開始部署，但規格仍標示為初步、可能調整。

台灣在 Blackwell 供應鏈扮演什麼角色？

台灣是整櫃 AI 系統的主要代工基地。鴻海（Foxconn）、廣達、緯創／緯穎、英業達等台系 ODM／EMS 負責把 NVIDIA 的參考設計做成可量產出貨的 GB200／GB300／Rubin NVL 系統。這是產業角色描述，不構成投資建議。

Blackwell 是什麼？B200、GB200、GB300、NVL72 到 Rubin 一篇看懂

Q: Blackwell 是什麼？

Blackwell 是 NVIDIA 在 2024 年推出、2025-2026 年大量出貨的 AI 晶片架構。它用台積電 4NP 製程，把兩顆大運算晶粒（die）用每秒 10 TB 的超高速連結縫成一顆 GPU，等於一顆裡面有兩顆，專門衝 AI 訓練與推論的算力。

每次 NVIDIA 開發表會，新聞就冒出一堆名字：B200、GB200、GB300、NVL72、Rubin。聽起來都很猛，但它們到底是不同的東西，還是同一個東西的不同講法？

這篇就把 Blackwell 世代一次講清楚。先把「GPU、超級晶片、整櫃系統」這三個層級分開，再看規格差在哪、出貨到哪，以及下一代 Rubin 和台灣代工廠的角色。這是 AI 硬體供應鏈一條龍第 1 關「AI 晶片」的深入版。

先分清楚：GPU、超級晶片、整櫃，是三個層級

新聞最容易把人搞混的，就是把三個層級的東西混在一起講。先把它們拆開：

B200 / B300：單顆 GPU，是最基本的運算晶片。
GB200 / GB300：一顆 Grace CPU 加上兩顆 GPU，綁成一顆「超級晶片（superchip）」。
GB200 / GB300 NVL72：把 36 顆 Grace CPU 和 72 顆 GPU，用高速連結串成一整櫃，當成一台超級電腦來操作。

所以你看到 GB300 NVL72，講的是一整櫃 72 顆 GPU 的系統；看到 B300，講的是裡面那一顆 GPU。記住這個由小到大的層級，後面的數字就不會亂。

Blackwell 是什麼？為什麼這麼強

Blackwell 是 NVIDIA 在 2024 年推出、2025 到 2026 年大量出貨的 AI 晶片架構，接在前一代 Hopper（H100／H200）之後。

它最關鍵的設計，是把兩顆大運算晶粒（die）縫成一顆 GPU。受製程限制，單一晶粒能做多大有上限，於是 NVIDIA 用一條每秒 10 TB 的超高速連結（NV-HBI），把兩顆晶粒接成「看起來像一顆」的 GPU，整顆塞進約 2080 億個電晶體，製造交給台積電的 4NP 製程。

算力上，Blackwell 主打一種叫 NVFP4 的超低精度數字格式（可以先理解成：用更省的方式表示數字，換取每秒更多次運算），把 AI 推論的吞吐量一口氣拉高。一句話：Blackwell 是「一顆當兩顆用」的旗艦 AI GPU。

核心數據快照

下面把 Blackwell 世代的關鍵規格放在一起。先補三個詞：HBM 是 GPU 旁邊的高速記憶體、PFLOPS 是每秒能做多少次浮點運算、CoWoS 是把 GPU 和 HBM 封在一起的先進封裝。數字以 NVIDIA 公布為準。

產品	層級	關鍵規格	狀態
B200	GPU	192GB HBM3E、頻寬 8 TB/s、NVFP4 約 10 PFLOPS、功耗約 1200W	出貨中
B300（Blackwell Ultra）	GPU	288GB HBM3E、頻寬 8 TB/s、NVFP4 約 15 PFLOPS、功耗約 1400W	出貨中
GB200 NVL72	整櫃（72 GPU＋36 Grace）	NVFP4 約 720 PFLOPS、13.4TB HBM3E、整櫃約 120kW 級	出貨中
GB300 NVL72	整櫃（72 Ultra＋36 Grace）	NVFP4 約 1,080 PFLOPS、20TB HBM3E、整櫃約 120kW 級	部署中
Vera Rubin NVL72	下一代整櫃	單顆 Rubin 288GB HBM4／22 TB/s、整櫃 NVFP4 推論約 3,600 PFLOPS	2026 下半年（規格初步）

（表中 Blackwell 的 NVFP4 為密集 dense 值；NVIDIA 行銷常引用的稀疏 sparse 值約為兩倍。整櫃功耗依供電與散熱配置而變；Rubin 整櫃標的是推論口徑，與 Blackwell 的密集值不可直接相比。）

B200 到 B300：同一架構再推一階

2025 年推出、下半年起陸續商用部署的 B300，官方代號 Blackwell Ultra，是同一個架構的強化版。

最有感的兩個升級：記憶體從 192GB 加到 288GB HBM3E，多了五成，能裝下更大的模型；低精度（NVFP4）的密集算力也多了約五成。代價是功耗從約 1200 瓦升到約 1400 瓦。整櫃的 GB300 NVL72 因此把記憶體從 13.4TB 拉到 20TB，更適合跑超大模型的推論。對雲端業者來說，這是「同一條產線、規格往上跳一階」的順勢升級，不必整套架構重來。

出貨到哪了？

Blackwell 不是 PPT 規格，已經實際在跑。

NVIDIA 官方把 Blackwell 標示為「full production」，HGX B200、B300 都在出貨中。整櫃的 GB300 NVL72 也已落地：雲端業者 CoreWeave 在 2025 年中率先商用部署，微軟 Azure 更在 2025 年 10 月為 OpenAI 建起一座由數千顆 GB300 GPU 組成的生產級叢集。換句話說，2026 年的 AI 算力擴張，主力仍是 Blackwell 與 Blackwell Ultra。

產能瓶頸還是老地方：要出多少 Blackwell，受限於台積電的 CoWoS 先進封裝和 HBM 記憶體供給，這兩關前面的單篇有拆過。

下一代 Rubin：已公布，但別急著說它取代 Blackwell

NVIDIA 已正式公布下一代平台 Vera Rubin，晶片本身也已進入量產（full production）。整櫃的 Vera Rubin NVL72，由 72 顆 Rubin GPU 加 36 顆 Vera CPU 組成；單顆 Rubin 改用新一代 HBM4 記憶體（288GB、頻寬 22 TB/s），整櫃的 NVFP4 推論算力上看每秒約 3,600 PFLOPS，比 Blackwell 又往上跳一大階。

但這裡要踩一下煞車。產品頁的規格仍標成「初步、可能調整」，官方目標是 2026 下半年由 AWS、Google Cloud、微軟等雲端業者開始部署。研調機構也估計，2026 年 NVIDIA 高階 GPU 出貨仍以 Blackwell 為大宗（占比約從六成升到七成），Rubin 還有供應鏈調校與時程風險，其中 HBM4 的驗證與供應是最關鍵的變數。所以務實的看法是：2026 年是 Blackwell 的主場，Rubin 是排隊中的下一棒，不是立刻接班。

台灣在這關的角色

晶片設計在 NVIDIA、製造在台積電，那把整櫃系統「組起來、能量產出貨」的，主要就是台灣。

鴻海（Foxconn）已公開展示 Vera Rubin NVL72 的整機系統；供應鏈報導點名廣達、緯創與緯穎、英業達等台系 ODM／EMS 參與 GB200／GB300 整櫃系統的代工，也提到 NVIDIA 為搶產能、預訂了部分台廠的伺服器廠房到 2026 年。換句話說，台灣不只做晶圓和封裝，連「一整櫃 AI 超級電腦」的組裝出貨，也是全球關鍵基地。這裡只做產業地圖，不對個股做任何投資判斷。

這一關的重點

看完 Blackwell，先記住那個由小到大的層級：B200／B300 是 GPU，GB200／GB300 是超級晶片，NVL72 是整櫃 72 顆 GPU 的系統。

技術上，Blackwell 用「兩顆晶粒縫成一顆」加上 NVFP4 低精度算力衝高吞吐；B300（Blackwell Ultra）再把記憶體和算力各往上推約五成。2026 年的主力是 Blackwell，已大量出貨、雲端實際部署；Rubin 是已公布的下一棒，目標下半年登場，但規格仍是初步，HBM4 和整櫃供應鏈是最大變數。

想知道餵資料給這些 GPU 的 HBM、把晶片綁起來的 CoWoS，可以看 HBM 是什麼與 CoWoS 是什麼；想看整條鏈八關怎麼串，回到供應鏈總覽。