GPU とは？なぜ AI 計算の主力なのか、CPU とは何が違うのか

1ページで GPU を理解する：なぜ AI の学習には、より汎用的な CPU ではなく大量の GPU を使うのか？GPU と CPU の違い、CUDA と Tensor Core が何をしているのか、NVIDIA がなぜ8割以上の市場を握るのか、そして H100 から GB300 までの AI GPU 世代がどう違うのかを噛み砕く。

5/27 · Penna

GPU のイメージ：暖色の光の下に置かれた大型 AI アクセラレータチップ1基を、密な演算コアの紋様が取り囲む

TL;DR

GPU は「大量の似た計算を同時にこなす」ために作られたチップだ。AI の学習と推論の核心は膨大な行列演算で、それがちょうど GPU の並列処理に向くため、AI はほぼ GPU の上で動く。CPU は1問ずつ精密に解く教授、GPU は千人がいっせいに足し算引き算をする生徒のようなものだ。NVIDIA は GPU に CUDA ソフトウェアのエコシステムを重ね、AI アクセラレータ市場の約8割以上を握り、AMD やクラウド大手の自社開発チップが後を追う。
「GPU は何をしているのか、なぜ AI はそれを使うのか、CPU とどう違うのか」を理解したい入門者と、長期で動向を追う読者。
GPU の本領は並列演算で、それがちょうど AI の食欲に合う。この AI GPU の関は NVIDIA が主導し、その堀はチップだけでなく、開発者を縛る CUDA のエコシステムにある。GPU を理解することは、AI ハードウェアのサプライチェーン全体を読み解く出発点だ。本記事は産業知識を扱うだけで、投資助言を構成しない。

AI のニュースを見るたび、「どこそこの会社がまた数万基の GPU を買った」と耳にする。なぜ GPU で、より高級そうな CPU ではないのか。このチップにはいったいどんな魔力があって、世界じゅうの AI 企業が我先にと欲しがるのか。

この記事では GPU を噛み砕く。まずそれが何か、CPU とどう違うかを見て、次になぜ AI はそれでなければならないのか、市場を誰が主導するのか、そして H100 から GB300 までの世代がどう違うのかを語る。これは AI ハードウェアサプライチェーン総まとめの第1関「AI チップ」の入門版だ。

GPU とは何か？

GPU の正式名称は Graphics Processing Unit、グラフィックス処理装置だ。もともとはゲームや 3D 描画のために設計されたもので、構造の単純な小さな演算コアを大量に持ち、数千・数万の似た計算を同時に処理できるのが特徴だ。

この「人数で押す」特性が、のちに AI を走らせるのに非常に向くと分かった。ニューラルネットワークの学習は、本質的には問題を無数の小さな行列演算に分け、いっせいに計算することだからだ。GPU はちょうどこういう場面のために生まれたようなものだ。

たとえるなら：CPU は高等数学を解く教授で、一度に1問の難題に集中する；GPU は足し算引き算しかできない千人の小学生で、一人ずつ小さな一片を受け持ち、いっせいに計算するほうがかえって速い。そして AI が計算すべきは、まさに数億の単純な問題が同時に押し寄せる場面だ。

コアデータのスナップショット

以下のいくつかの数字で、この GPU の関の規模感をつかんでほしい。シェア系の数字は多くが調査機関や政策機関の推計なので、見るときは規模感だけ押さえればよい。

テーマ	数値	時点／性質
NVIDIA の AI 用 GPU シェア	約8割以上（クラウドの自社開発 ASIC は別計算、数え方で変動）	2025-2026、調査／政策機関の推計
NVIDIA データセンター年間売上	FY2026 で約 1,937 億ドル	NVIDIA 公式決算
旗艦 GPU のメモリ：H200 / B300	H200 約 141GB HBM3e；B300 約 288GB HBM3e	2024-2025、公式仕様
GB300 NVL72 ラック	Blackwell Ultra GPU 72 基、GPU メモリ 20TB	2026、公式仕様
次世代 Vera Rubin	2026 年下半期からパートナーが供給する計画	公式ロードマップ／前瞻

GPU と CPU はどう違うのか

両者の最大の違いは「コアの数と分業」にある。

CPU はコア数こそ少ないが、一つひとつが強く、何でもこなせる。大量のキャッシュと分岐制御を備え、一歩ずつ、その都度判断しながら進める仕事——OS、データベース、プログラムのロジックなど——を得意とする。GPU は逆に、チップを小さめのコアで埋め尽くし、「多くのことを同時にこなす」総スループットを追う。行列演算、画像処理、科学シミュレーション、ディープラーニングに向く。

1台の AI サーバーの中では、この2種類のチップは実のところ分業し協力している：CPU はデータの差配、プログラムとネットワークの管理を担い、GPU はモデルで最も重い演算を担う。だから両者は、それぞれの役割を果たすパートナーの関係だ。

なぜ AI は GPU でなければならないのか

鍵は「並列」のひと言だ。

AI モデルの学習と推論は、根っこのところでは膨大な行列・ベクトル演算を同時に進めることだ。GPU の中には、とりわけ重要な2種類のコアがある：1つは CUDA Core で、汎用の小さな計算ユニットを大量に備え、一般的な並列演算を担う；もう1つは Tensor Core で、AI が最もよく使う行列乗算の高速化に特化し、FP16、FP8、FP4 といった低精度フォーマット（少ないビット数で速い演算と引き換える）にも対応する。AI の計算力の多くは、この種の演算に費やされる。

そのかたわらには、高速の HBM（High Bandwidth Memory、広帯域メモリ）を添える必要がある。モデルの重みとデータを十分に速く供給し、演算コアがデータ待ちで遊ばないようにするためだ。このメモリをもっと知りたければ、HBM の関を見てほしい。

AI GPU 市場：誰が供給しているのか

この関は NVIDIA に高度に集中している。

調査機関と政策機関の推計によれば、NVIDIA は AI 用 GPU 市場の約8割以上を占める；クラウド大手が自社開発した ASIC も「AI アクセラレータ」に含めて数えると、数え方は変わる。その堀はチップだけでなく、CUDA というソフトウェアのエコシステムにもある：開発者が書いたプログラムはみなその上で動き、一式まるごと他社へ移すコストは高い。AMD は Instinct MI シリーズ（MI350 は 288GB HBM3E を搭載）で後を追う；Google、AWS、Microsoft などのクラウド大手は自社開発 ASIC の道を行き、自前のクラウドの中でコストを抑え、差別化を図る（この筋は ASIC の関を参照）。

念のため言っておくと、シェアと売上は新製品、決算、数え方によって変動する。ここで描いているのは産業の構図であって、個別銘柄の評価ではない。

主流 AI GPU 世代の一覧

ここ数年の主力世代を並べて見よう：

世代／製品	位置づけ	メモリ
H100（Hopper）	前世代の学習／推論の主力	80-94GB HBM
H200（Hopper）	Hopper のメモリ増強版	約 141GB HBM3e
B200（Blackwell）	新世代の主力	約 180-192GB HBM3e（SKU による）
B300（Blackwell Ultra）	メモリをさらに増量	約 288GB HBM3e
GB200／GB300	Grace CPU + Blackwell GPU のスーパーチップ／プラットフォーム	GB300 NVL72 ラックは GPU 72 基、メモリ 20TB
Vera Rubin	次世代ロードマップ（2026 年下半期から）	HBM4

押さえるべき2つのトレンドがある：1つはメモリがどんどん大きくなり、帯域がどんどん広がること；もう1つは「単体のチップ」から「ラック単位のシステム」へと進み、数十基の GPU を高速相互接続で束ね、1台のスーパーコンピューターにすることだ。旗艦世代の詳細を見たいなら、続けて Blackwell の関を読んでほしい。

この関における台湾の役割

GPU のアーキテクチャ設計は台湾ではない（NVIDIA がアメリカで設計する）が、実体としての製造は台湾に大きく頼る。NVIDIA の Blackwell は TSMC がカスタムした 4NP プロセスで生産され、さらに CoWoS などの先端パッケージングで GPU と HBM を結びつけ、最後に台湾系メーカー（鴻海、廣達、緯創など）がラック単位の AI サーバーへ組み上げる。言い換えれば、1基の GPU がシリコンから使えるシステムになるまでの道のりの大半は、台湾をぐるりと回る。

この関の要点

GPU を見終えたら、まずその本領を覚えておこう：並列演算だ。大量の小さなコアがいっせいに動き出すのが、ちょうど AI の「大量の単純な演算をいっせいにこなす」食欲に合う。これが、AI がそれでなければならない理由だ。

この関は NVIDIA が主導し、その堀はチップに CUDA ソフトウェアのエコシステムを重ねたもの；AMD とクラウドの自社開発 ASIC が後を追う。そして1基ごとの GPU の背後には、TSMC のプロセス、先端パッケージング、台湾のサーバー組み立てがつながっている。GPU を理解することは、AI ハードウェアのサプライチェーン全体を読み解く入場券を手にすることに等しい。

メモリがどうデータを供給するかを見たいなら HBM；旗艦世代の仕様を見たいなら Blackwell；クラウドの自社開発チップを見たいなら ASIC；チェーン全8関を振り返りたいならサプライチェーン総まとめに戻ってほしい。

FAQ

GPU とは何ですか？CPU とどう違うのですか？

GPU（Graphics Processing Unit、グラフィックス処理装置）はもともとゲームの描画用に設計され、小さな演算コアを大量に持ち、数千・数万の似た計算を同時に処理できるのが特徴だ。CPU（中央処理装置）はコア数こそ少ないが一つひとつが強力で、一歩ずつ判断を要する仕事を得意とする。たとえるなら：CPU は高等数学を解く教授で、一度に1問を解く；GPU は足し算引き算しかできない千人の小学生で、人数がものをいう。AI の計算はちょうど大量の単純な計算を同時にこなすので、GPU のほうがはるかに速い。

AI はなぜ GPU を使わなければならないのですか？

AI の学習と推論の本質が、数億にのぼる行列・ベクトル演算を同時に進めることだからだ。この「大量で、似ていて、同時にこなせる」性質こそ、ちょうど GPU の強みにあたる。GPU の中の Tensor Core は、AI でよく使う行列演算（FP16、FP8、FP4 などの低精度フォーマット）の高速化に特化している。CPU でも走らせられるが、速度は何桁も遅くなる。

CUDA とは何ですか？なぜ皆 NVIDIA から乗り換えられないのですか？

CUDA は NVIDIA のソフトウェア開発環境一式で、プログラミング言語、コンパイラ、加速ライブラリ（cuDNN、NCCL など）、そして深く統合された PyTorch、TensorFlow のエコシステムを含む。皆が書いた AI のプログラムはほぼ CUDA の上で動いており、他社のチップに移すには書き直しと再最適化が必要で、コストが高い。このソフトウェアのエコシステムこそ、チップそのもの以上に NVIDIA を替えがたくしている堀だ。

H100、B200、GB300 といった AI GPU は何が違うのですか？

ひとことで言えば世代と仕様の違いだ。H100、H200 は Hopper 世代で、H200 は 141GB の HBM3e を積む；B200、B300 はより新しい Blackwell 世代で、B300 は 288GB の HBM3e を積む。GB200、GB300 は Grace CPU と Blackwell GPU を一つにした Superchip（スーパーチップ）にし、それを組んでシステムにする。たとえば GB300 NVL72 はラック1基に 72 基の GPU を収める。世代が新しいほど、メモリは大きく、帯域は広く、ラック単位の統合度は高くなる。

GPU はすべて NVIDIA が作っているのですか？

設計面では NVIDIA が主役で（AI アクセラレータ市場の約8割以上、数え方によって8〜9割と見られる）、AMD の Instinct MI シリーズが追い、Google、AWS、Microsoft などのクラウド大手は自社で ASIC（TPU、Trainium など）を開発して併存させている。製造面ではほぼすべてが TSMC の先端プロセスに頼り、そこから CoWoS などの先端パッケージングと台湾でのサーバー組み立てを経て、ようやく使えるシステムになる。

免責事項と利益相反の開示

この記事は一般的な情報提供および教育目的のみのものであり、投資、法律、税務、その他の専門的助言ではありません。市場や規制は随時変わる可能性があり、本文の情報は執筆時点の状況を反映しています。

Penchan は登録された証券投資助言業者ではありません。本文で言及する証券、暗号資産、金融商品は情報整理を目的としたもので、売買推奨ではありません。投資判断はご自身で行い、リスクをご負担ください。

この記事の一部または全部は AI（Penna）の支援を受けて作成されています。割合は記事ごとに異なります。誤りや漏れが含まれる可能性があり、投資または金融助言ではありません。一次情報をご確認ください。

筆者は本文で言及する一部資産を保有している可能性があります。保有状況は随時変わる可能性があり、記事ごとに更新されるとは限りません。

詳しくは当サイトの法的通知と開示およびプライバシーポリシーをご覧ください。