NVIDIA が発表会を開くたびに、ニュースには名前がずらりと並ぶ:B200、GB200、GB300、NVL72、Rubin。どれもすごそうに聞こえるが、これらは別々のものなのか、それとも同じものの別の呼び方なのか?
この記事では、Blackwell 世代を一気に整理する。まず「GPU、スーパーチップ、ラック規模システム」という3つの階層を分け、続いてスペックの違い、どこまで出荷されているか、そして次世代 Rubin と台湾の受託製造メーカーの役割を見る。これは AI ハードウェアサプライチェーン総まとめ の第1関「AI チップ」の深掘り版だ。
まず整理する:GPU、スーパーチップ、ラックは3つの階層
ニュースが最も人を混乱させるのは、この3つの階層を一緒くたに語ってしまう点だ。まずは分けて見よう:
- B200 / B300:単体の GPU、最も基本となる演算チップ。
- GB200 / GB300:Grace CPU 1基に GPU 2基を組み合わせ、1つの「スーパーチップ(superchip)」に束ねたもの。
- GB200 / GB300 NVL72:Grace CPU 36基と GPU 72基を高速リンクで1ラックまるごとに連ね、1台のスーパーコンピュータとして動かすもの。
だから GB300 NVL72 と言えば 72 基の GPU を積んだ1ラックのシステムを、B300 と言えばその中の1基の GPU を指す。この小から大への階層を覚えておけば、あとの数字で迷わない。
Blackwell とは何か?なぜこれほど強いのか
Blackwell は NVIDIA が2024年に投入し、2025年から2026年にかけて大量出荷した AI チップアーキテクチャで、前世代の Hopper(H100/H200)を継ぐものだ。
その最も重要な設計は、2つの大きな演算ダイ(die)を縫い合わせて1基の GPU にする点にある。プロセスの制約から、単一のダイをどこまで大きくできるかには上限があるので、NVIDIA は毎秒10 TB の超高速リンク(NV-HBI)で2つのダイを「1基に見える」GPU へつなぎ、合計で約2,080億個のトランジスタを1基に詰め込み、製造は TSMC の 4NP プロセスに委ねている。
演算面では、Blackwell は NVFP4 という超低精度の数値フォーマットを前面に出し(より節約した形で数値を表し、その代わりに毎秒の演算回数を増やす、と理解しておけばよい)、AI 推論のスループットを一気に引き上げる。ひとことで言えば、Blackwell は「1基を2基ぶん使う」フラッグシップ AI GPU だ。
コアデータのスナップショット
以下に Blackwell 世代の主要スペックをまとめておく。まず3つの言葉を補っておこう:HBM は GPU のすぐ隣にある高速メモリ、PFLOPS は毎秒できる浮動小数点演算の回数、CoWoS は GPU と HBM を一緒に封止する先端パッケージングだ。数字は NVIDIA の公表値による。
| 製品 | 階層 | 主要スペック | 状態 |
|---|---|---|---|
| B200 | GPU | 192GB HBM3E、帯域 8 TB/s、NVFP4 約 10 PFLOPS、消費電力 約 1200W | 出荷中 |
| B300(Blackwell Ultra) | GPU | 288GB HBM3E、帯域 8 TB/s、NVFP4 約 15 PFLOPS、消費電力 約 1400W | 出荷中 |
| GB200 NVL72 | ラック(72 GPU+36 Grace) | NVFP4 約 720 PFLOPS、13.4TB HBM3E、ラック 約 120kW 級 | 出荷中 |
| GB300 NVL72 | ラック(72 Ultra+36 Grace) | NVFP4 約 1,080 PFLOPS、20TB HBM3E、ラック 約 120kW 級 | 展開中 |
| Vera Rubin NVL72 | 次世代ラック | Rubin 単体 288GB HBM4/22 TB/s、ラック NVFP4 推論 約 3,600 PFLOPS | 2026 下半期(規格初期) |
(表中の Blackwell の NVFP4 は密〔dense〕の値で、NVIDIA のマーケティングがよく引く疎〔sparse〕の値はおよそ2倍。ラックの消費電力は給電・冷却の構成で変わる。Rubin のラックは推論口径の値で、Blackwell の密の値とは直接比較できない。)
B200 から B300 へ:同じアーキテクチャをもう一段
2025年に投入され、下半期から順次商用展開される B300 は、公式コードネーム Blackwell Ultra、同じアーキテクチャの強化版だ。
最も体感できる2つのアップグレード:メモリが 192GB から 288GB HBM3E へ5割増え、より大きなモデルを載せられる;低精度(NVFP4)の密演算性能も約5割増。代償として消費電力は約1,200ワットから約1,400ワットへ上がる。ラック規模の GB300 NVL72 はこれにより、メモリを 13.4TB から 20TB へ引き上げ、超大規模モデルの推論に向く。クラウド事業者にとって、これは「同じ生産ラインでスペックを一段上げる」順当なアップグレードで、アーキテクチャをまるごとやり直す必要はない。
どこまで出荷されたのか?
Blackwell は PPT のスペックではなく、すでに実際に動いている。
NVIDIA は公式に Blackwell を「full production」と表記し、HGX B200、B300 はいずれも出荷中だ。ラック規模の GB300 NVL72 もすでに着地している:クラウド事業者の CoreWeave が2025年中頃にいち早く商用展開し、Microsoft Azure はさらに2025年10月、OpenAI 向けに数千基の GB300 GPU で構成する生産級クラスターを立ち上げた。言い換えれば、2026年の AI 演算拡張は、主力がなお Blackwell と Blackwell Ultra だ。
生産能力のボトルネックは相変わらず同じ場所だ:Blackwell をどれだけ出せるかは、TSMC の CoWoS 先端パッケージングと HBM メモリの供給に左右される。この2つの関門は、前の単発記事ですでに分解している。
次世代 Rubin:すでに発表、でも Blackwell を取って代わると急がない
NVIDIA はすでに次世代プラットフォーム Vera Rubin を正式に発表し、チップそのものも量産(full production)に入っている。ラック規模の Vera Rubin NVL72 は、72 基の Rubin GPU と 36 基の Vera CPU で構成される;Rubin 単体は新世代の HBM4 メモリ(288GB、帯域 22 TB/s)に切り替わり、ラックの NVFP4 推論性能は毎秒約3,600 PFLOPS に達し、Blackwell からまた一段大きく跳ね上がる。
だがここでブレーキを踏んでおきたい。製品ページのスペックはなお「初期・変更ありうる」と表記され、公式の目標は2026年下半期に AWS、Google Cloud、Microsoft などのクラウド事業者が展開を始めることだ。調査会社も、2026年の NVIDIA 高階 GPU 出荷はなお Blackwell が大宗(比率は約6割から7割へ上昇)と見積もり、Rubin にはまだサプライチェーンの調整と日程のリスクがあり、なかでも HBM4 の検証と供給が最も重要な変数だとする。だから実際的な見方はこうだ:2026年は Blackwell の主場で、Rubin は列に並んだ次の一棒であって、すぐに引き継ぐわけではない。
この関での台湾の役割
チップ設計は NVIDIA、製造は TSMC。では、ラック規模システムを「組み上げ、量産・出荷できる形にする」のは、主に台湾だ。
鴻海(Foxconn)はすでに Vera Rubin NVL72 の実機システムを公開展示している;サプライチェーン報道は、廣達(Quanta)、緯創と緯穎(Wistron/Wiwynn)、英業達(Inventec)といった台湾系 ODM/EMS が GB200/GB300 ラック規模システムの受託製造に参画していると名指しし、NVIDIA が生産能力を確保するため、一部の台湾メーカーのサーバー工場を2026年まで予約したとも伝える。言い換えれば、台湾はウェハと封止を担うだけでなく、「AI スーパーコンピュータ1ラックまるごと」の組み立て・出荷でも、世界の鍵となる拠点だ。ここでは産業の地図を描くだけで、個別銘柄について投資判断は一切しない。
この関の要点
Blackwell を見終えたら、まずあの小から大への階層を覚えておきたい:B200/B300 は GPU、GB200/GB300 はスーパーチップ、NVL72 は GPU 72 基を積んだ1ラックのシステムだ。
技術面では、Blackwell は「2つのダイを縫い合わせて1基に」加え NVFP4 の低精度演算でスループットを押し上げる;B300(Blackwell Ultra)はさらにメモリと演算性能をそれぞれ約5割引き上げる。2026年の主力は Blackwell で、すでに大量出荷され、クラウドで実際に展開されている;Rubin は発表済みの次の一棒で、下半期の登場を目標とするが、スペックはなお初期で、HBM4 とラック規模のサプライチェーンが最大の変数だ。
これらの GPU にデータを送り込む HBM や、チップを束ねる CoWoS について知りたいなら、HBM とは と CoWoS とは を参照;チェーン全8関がどうつながるかは、サプライチェーン総まとめ に戻ってほしい。