AI のニュースを見るたび、「どこそこの会社がまた数万基の GPU を買った」と耳にする。なぜ GPU で、より高級そうな CPU ではないのか。このチップにはいったいどんな魔力があって、世界じゅうの AI 企業が我先にと欲しがるのか。
この記事では GPU を噛み砕く。まずそれが何か、CPU とどう違うかを見て、次になぜ AI はそれでなければならないのか、市場を誰が主導するのか、そして H100 から GB300 までの世代がどう違うのかを語る。これは AI ハードウェアサプライチェーン総まとめ の第1関「AI チップ」の入門版だ。
GPU とは何か?
GPU の正式名称は Graphics Processing Unit、グラフィックス処理装置だ。もともとはゲームや 3D 描画のために設計されたもので、構造の単純な小さな演算コアを大量に持ち、数千・数万の似た計算を同時に処理できるのが特徴だ。
この「人数で押す」特性が、のちに AI を走らせるのに非常に向くと分かった。ニューラルネットワークの学習は、本質的には問題を無数の小さな行列演算に分け、いっせいに計算することだからだ。GPU はちょうどこういう場面のために生まれたようなものだ。
たとえるなら:CPU は高等数学を解く教授で、一度に1問の難題に集中する;GPU は足し算引き算しかできない千人の小学生で、一人ずつ小さな一片を受け持ち、いっせいに計算するほうがかえって速い。そして AI が計算すべきは、まさに数億の単純な問題が同時に押し寄せる場面だ。
コアデータのスナップショット
以下のいくつかの数字で、この GPU の関の規模感をつかんでほしい。シェア系の数字は多くが調査機関や政策機関の推計なので、見るときは規模感だけ押さえればよい。
| テーマ | 数値 | 時点/性質 |
|---|---|---|
| NVIDIA の AI 用 GPU シェア | 約8割以上(クラウドの自社開発 ASIC は別計算、数え方で変動) | 2025-2026、調査/政策機関の推計 |
| NVIDIA データセンター年間売上 | FY2026 で約 1,937 億ドル | NVIDIA 公式決算 |
| 旗艦 GPU のメモリ:H200 / B300 | H200 約 141GB HBM3e;B300 約 288GB HBM3e | 2024-2025、公式仕様 |
| GB300 NVL72 ラック | Blackwell Ultra GPU 72 基、GPU メモリ 20TB | 2026、公式仕様 |
| 次世代 Vera Rubin | 2026 年下半期からパートナーが供給する計画 | 公式ロードマップ/前瞻 |
GPU と CPU はどう違うのか
両者の最大の違いは「コアの数と分業」にある。
CPU はコア数こそ少ないが、一つひとつが強く、何でもこなせる。大量のキャッシュと分岐制御を備え、一歩ずつ、その都度判断しながら進める仕事——OS、データベース、プログラムのロジックなど——を得意とする。GPU は逆に、チップを小さめのコアで埋め尽くし、「多くのことを同時にこなす」総スループットを追う。行列演算、画像処理、科学シミュレーション、ディープラーニングに向く。
1台の AI サーバーの中では、この2種類のチップは実のところ分業し協力している:CPU はデータの差配、プログラムとネットワークの管理を担い、GPU はモデルで最も重い演算を担う。だから両者は、それぞれの役割を果たすパートナーの関係だ。
なぜ AI は GPU でなければならないのか
鍵は「並列」のひと言だ。
AI モデルの学習と推論は、根っこのところでは膨大な行列・ベクトル演算を同時に進めることだ。GPU の中には、とりわけ重要な2種類のコアがある:1つは CUDA Core で、汎用の小さな計算ユニットを大量に備え、一般的な並列演算を担う;もう1つは Tensor Core で、AI が最もよく使う行列乗算の高速化に特化し、FP16、FP8、FP4 といった低精度フォーマット(少ないビット数で速い演算と引き換える)にも対応する。AI の計算力の多くは、この種の演算に費やされる。
そのかたわらには、高速の HBM(High Bandwidth Memory、広帯域メモリ)を添える必要がある。モデルの重みとデータを十分に速く供給し、演算コアがデータ待ちで遊ばないようにするためだ。このメモリをもっと知りたければ、HBM の関 を見てほしい。
AI GPU 市場:誰が供給しているのか
この関は NVIDIA に高度に集中している。
調査機関と政策機関の推計によれば、NVIDIA は AI 用 GPU 市場の約8割以上を占める;クラウド大手が自社開発した ASIC も「AI アクセラレータ」に含めて数えると、数え方は変わる。その堀はチップだけでなく、CUDA というソフトウェアのエコシステムにもある:開発者が書いたプログラムはみなその上で動き、一式まるごと他社へ移すコストは高い。AMD は Instinct MI シリーズ(MI350 は 288GB HBM3E を搭載)で後を追う;Google、AWS、Microsoft などのクラウド大手は自社開発 ASIC の道を行き、自前のクラウドの中でコストを抑え、差別化を図る(この筋は ASIC の関 を参照)。
念のため言っておくと、シェアと売上は新製品、決算、数え方によって変動する。ここで描いているのは産業の構図であって、個別銘柄の評価ではない。
主流 AI GPU 世代の一覧
ここ数年の主力世代を並べて見よう:
| 世代/製品 | 位置づけ | メモリ |
|---|---|---|
| H100(Hopper) | 前世代の学習/推論の主力 | 80-94GB HBM |
| H200(Hopper) | Hopper のメモリ増強版 | 約 141GB HBM3e |
| B200(Blackwell) | 新世代の主力 | 約 180-192GB HBM3e(SKU による) |
| B300(Blackwell Ultra) | メモリをさらに増量 | 約 288GB HBM3e |
| GB200/GB300 | Grace CPU + Blackwell GPU のスーパーチップ/プラットフォーム | GB300 NVL72 ラックは GPU 72 基、メモリ 20TB |
| Vera Rubin | 次世代ロードマップ(2026 年下半期から) | HBM4 |
押さえるべき2つのトレンドがある:1つはメモリがどんどん大きくなり、帯域がどんどん広がること;もう1つは「単体のチップ」から「ラック単位のシステム」へと進み、数十基の GPU を高速相互接続で束ね、1台のスーパーコンピューターにすることだ。旗艦世代の詳細を見たいなら、続けて Blackwell の関 を読んでほしい。
この関における台湾の役割
GPU のアーキテクチャ設計は台湾ではない(NVIDIA がアメリカで設計する)が、実体としての製造は台湾に大きく頼る。NVIDIA の Blackwell は TSMC がカスタムした 4NP プロセスで生産され、さらに CoWoS などの 先端パッケージング で GPU と HBM を結びつけ、最後に台湾系メーカー(鴻海、廣達、緯創など)がラック単位の AI サーバーへ組み上げる。言い換えれば、1基の GPU がシリコンから使えるシステムになるまでの道のりの大半は、台湾をぐるりと回る。
この関の要点
GPU を見終えたら、まずその本領を覚えておこう:並列演算だ。大量の小さなコアがいっせいに動き出すのが、ちょうど AI の「大量の単純な演算をいっせいにこなす」食欲に合う。これが、AI がそれでなければならない理由だ。
この関は NVIDIA が主導し、その堀はチップに CUDA ソフトウェアのエコシステムを重ねたもの;AMD とクラウドの自社開発 ASIC が後を追う。そして1基ごとの GPU の背後には、TSMC のプロセス、先端パッケージング、台湾のサーバー組み立てがつながっている。GPU を理解することは、AI ハードウェアのサプライチェーン全体を読み解く入場券を手にすることに等しい。
メモリがどうデータを供給するかを見たいなら HBM;旗艦世代の仕様を見たいなら Blackwell;クラウドの自社開発チップを見たいなら ASIC;チェーン全8関を振り返りたいなら サプライチェーン総まとめ に戻ってほしい。