ニュースに出てくる「AI チップ」は、あるときは NVIDIA の GPU、あるときは Google の TPU、またあるときはスマホの中の何かのプロセッサを指す。いったいどれが本当の AI チップなのか。じつは答えは、どれもそうだ、というものだ。
この記事では AI チップを噛み砕く。まずなぜそれが単一のチップではなく「一家」なのかを見て、次に GPU、ASIC、TPU、NPU、FPGA がそれぞれ何で、どう違うかを分解し、最後に学習と推論、クラウドと端末側の違いを語る。これは AI ハードウェアサプライチェーン総まとめ の第1関「AI チップ」の入門総覧版だ。
AI チップとは何か?
AI チップ(AI アクセラレータとも)は「AI ワークロード向けに最適化されたハードウェア」の総称で、何種類ものチップを含む。
なぜ専用のチップが要るのか。AI の演算には特徴があるからだ:大量の行列乗算、テンソル演算(テンソルは行列の延長と考えればよく、モデルが処理する大量の数字の表だ)、低精度の計算、しかもこれらの演算は同時に進められる。一般的な CPU はこうした大規模な並列演算が得意ではない。そこで業界は、この種の演算を専門に加速する各種のチップを作り、総称して AI チップと呼ぶ。
一家と考えればよい:GPU、ASIC、TPU、NPU、FPGA はみなこの一家のメンバーで、それぞれ得意分野は違うが、すべて同じ目的のために生まれている。AI の演算を、速く、省エネに走らせることだ。
コアデータのスナップショット
以下の数字は、AI チップ市場の規模感をつかむのに役立つ。多くは調査会社の推計値だ。
| テーマ | 数値 | 時点/性質 |
|---|---|---|
| 世界の半導体売上 | 2026年は約1.32兆ドルと推計 | Gartner 予測 |
| AI 半導体の比率 | 2026年の半導体売上の約3割 | Gartner 予測 |
| NVIDIA AI チップ市場シェア | 約70% | TrendForce、2025 推計 |
| クラウド自社開発 ASIC vs GPU 成長率 | ASIC 約44.6%、GPU 約16.1% | TrendForce、2026 推計 |
| AI PC の比率 | 急速に普及;Gartner はメモリ値上がりにより50%普及点を2028年へ後ろ倒し | Gartner |
5種類の AI チップ、それぞれの役割
この一家のメンバーを並べて対照してみよう:
| 種類 | それは何か | 何に向くか |
|---|---|---|
| GPU | 汎用の並列プロセッサ、柔軟性が高く、エコシステム(CUDA)が成熟 | 大規模モデルの学習、クラウド推論、研究 |
| ASIC | 特定タスクに合わせて作ったカスタムチップ、効率が高く柔軟性は低い | クラウド大手の自社開発、特定ワークロード、コスト勝負 |
| TPU | Google が自社開発した ASIC、テンソル演算に特化 | Google Cloud、自社モデルと顧客ワークロード |
| NPU | スマホ、ノートPC、自動車に組み込む低消費電力の AI チップ | 端末側のリアルタイム AI、省電力、オフライン可能 |
| FPGA | 再構成可能(出荷後もハードウェアの論理を変えられる)、柔軟性と効率の折衷 | 低レイテンシ、産業用、プロトタイプ開発 |
GPU を深く知りたいなら GPU の関 を;クラウド大手がなぜ自社開発 ASIC を手がけるのかを知りたいなら ASIC の関 を見てほしい。
学習チップ vs 推論チップ
同じ AI チップでも、「学習」に使うか「推論」に使うかで、重視する点はだいぶ違う。
学習はモデルに膨大なデータから学ばせることで、生徒を一から教え込むようなものだ。極めて高い演算性能、とても大きなメモリ、チップ間の高速相互接続、そして長時間の安定した演算が要る。推論はモデルが学び終えて稼働した後、新しい入力に素早く答えを出すことで、生徒に試験を解かせるようなものだ。推論はレイテンシ(答えの速さ)、コスト、ワットあたり性能をより重視する。
同じチップで両方できる場合もある(GPU、TPU はどちらもそうだ)が、推論は使うたびにコストが発生し続けるため、市場には「推論優先」のチップ設計が増えている。
クラウド vs 端末側
AI チップをどこに置くかも、その姿を決める。
クラウド AI チップはデータセンターに置かれ、強みは演算性能の大きさ、スケーラビリティ、集中管理で、大規模モデルの学習と大量の API 推論に向くが、電力をよく食う。端末側 AI チップ(多くは NPU)はスマホ、ノートPC、自動車に置かれ、強みは低レイテンシ、プライバシー保護、オフライン可能、帯域の節約で、代償としてサイズと消費電力の制約を受ける。Microsoft の Copilot+ PC は NPU の演算性能が毎秒40兆回を超えることを要求している。
ひとことで言えば、クラウドは「力で押し切る」、端末側は「細かく切り詰める」だ。ますます多くの AI アプリが演算を切り分け、重いものはクラウドに、リアルタイムなものは端末側に置くようになる。
この関の要点
AI チップを見終えたら、まず最も大事な考え方を覚えておこう:それは「アクセラレータ一家」の総称であって、GPU だけを指すのではない。
GPU は汎用でエコシステムが成熟;ASIC(Google の TPU を含む)は特定タスクに合わせて作られ効率が高い;NPU は低消費電力で、スマホやノートPCに組み込まれる;FPGA は柔軟性と効率の折衷だ。2026年の構図は、NVIDIA の GPU がなおクラウドで主導し、クラウドの自社開発 ASIC と端末側の NPU がそれぞれ急成長している、というものだ。この分類を理解すれば、クラウド、スマホ、自動車の中の AI チップがなぜ別物に見えるのかが分かる。
GPU を深く見たいなら GPU を;クラウドの自社開発チップを見たいなら ASIC を;フラッグシップ GPU 世代を見たいなら Blackwell を;チェーン全8関に戻りたいなら サプライチェーン総まとめ に戻ってほしい。