AI ハードウェアの話をすれば、必ず一つの疑問に行き当たる:コンピューターにはとっくに CPU があるのに、なぜ AI を動かすのにわざわざ GPU を使うのか?

この記事では、CPU と GPU の違いを噛み砕いて整理し、それからなぜ大規模な AI 学習がほぼすべて GPU に頼るのかを見ていく。これは GPU の関 の対照・延長版であり、AI ハードウェアサプライチェーン総まとめ の入門の土台でもある。


一言でいう違い:質 vs 量

CPU(中央処理装置)と GPU(画像処理装置)の最も肝心な違いは、コアの「数」と「分業」にある。

CPU は数個から数十個の非常に強力なコアを持ち、複雑で多様なタスクを順番に一つずつ処理するのが得意だ。一方 GPU は数千の比較的単純なコアを持ち、大量の同種の演算を同時並列で処理するのが得意だ。一方は質、もう一方は量を取る。

たとえるなら:CPU は数人の博士課程の学生のようなもので、それぞれが非常に優秀で難問を解けるが、人数は少ない;GPU は数千人の小学生のようなもので、それぞれは簡単な加減乗除しかできないが、人数がとても多く、みんなで取りかかれば、「同じ種類の問題を数百万回計算する」ような仕事ではかえって驚くほど速い。


なぜ AI 学習に GPU を使うのか

鍵は AI 学習の「仕事の型」にある。

AI モデルを学習させるのは、底ではじつは膨大で反復的、しかも同時に進められる行列演算(大量の数字の乗加算)だ。この「同じ技を数百万回やる」仕事は、まさに GPU の数千のコアがそろって計算する強みに刺さる。GPU は一度に大きな塊を計算できるが、CPU の少数のコアは一バッチずつ順番に処理するしかなく、速度が数十倍かそれ以上に劣る。

言い換えれば、CPU が悪いのではなく、ただこの仕事の型が CPU の土俵に合っていないだけだ。AI の演算はちょうど GPU が最も好む形をしているので、大規模モデルの学習と推論は、ほぼすべて GPU(あるいはさらに専用のチップ)の上で走る。


CPU は取って代わられたのではなく、分業している

GPU が登場しても、CPU は退場していない。実際の AI システムは、両者が分業して協力している。

CPU は調整、フロー全体の制御、論理判断とデータ準備を担い、GPU は大量の並列演算を引き受ける。CPU はプロジェクトマネージャーのように、誰が何を、いつやるかを段取りする;GPU はラインに並ぶ大勢の作業員のように、任された同種の仕事を高速で片づける。どちらが欠けても、システム全体がうまく回らない。


GPU よりさらに専用:TPU と ASIC

GPU は並列演算が得意だが、それでもまだ「汎用的」で、いろいろな演算が走る。もっと省エネに、もっと速くしたい企業もあり、そこでさらに専用のチップが作られる。

TPU(Google のテンソル処理装置)と AI ASIC は、特定の AI 作業に合わせて作られたチップだ:その一点では GPU より効率的で、代償として汎用性は劣る。GPU とは取って代わる関係ではなく、共存し分業する関係だ。これらのチップがどう分かれるかを見たいなら、AI チップとは を読んでほしい。


この関の要点

CPU は質、GPU は量:CPU は少数の強力なコアで逐次・複雑なタスクを走らせ、GPU は大量の小さなコアで並列・同種の演算を走らせる。

AI 学習は並列化できる大量の行列乗算で、GPU は一度に大きな塊を計算できるが、CPU はゆっくり順番に並ばせるしかない。これが大規模な AI 学習が主に GPU や専用アクセラレータに頼る理由だ。そして実際のシステムでは、CPU が調整を、GPU が演算を担い、両者が分業して協力する。

GPU が AI サプライチェーンで果たす役割を見たいなら、GPU の関 を読んでほしい;さまざまな AI チップがどう分かれるかは、AI チップとはASIC とは を参照;チェーン全体を振り返りたいなら、AI ハードウェアサプライチェーン総まとめ に戻ってほしい。