新聞裡的「AI 晶片」有時指 NVIDIA 的 GPU、有時指 Google 的 TPU、有時又是手機裡的某個處理器。到底哪個才是 AI 晶片?其實答案是:它們都是。
這篇就把 AI 晶片講白。先看它為什麼是一個「家族」而不是單一種晶片,再拆解 GPU、ASIC、TPU、NPU、FPGA 各是什麼、差在哪,最後談訓練與推論、雲端與裝置端的不同。這是 AI 硬體供應鏈一條龍 第 1 關「AI 晶片」的入門總覽版。
AI 晶片是什麼?
AI 晶片(又稱 AI 加速器)是「為 AI 工作負載最佳化的硬體」的總稱,涵蓋好幾種晶片。
為什麼需要專門的晶片?因為 AI 的運算很有特色:大量的矩陣乘法、張量運算(張量可想成矩陣的延伸,是模型處理的大量數字表)、低精度計算,而且這些運算可以同時進行。一般 CPU 不擅長這種大規模平行運算,於是業界做出各種專門加速這類運算的晶片,統稱 AI 晶片。
可以把它想成一個家族:GPU、ASIC、TPU、NPU、FPGA 都是這個家族的成員,各有專長,但都為了同一件事而生,把 AI 的運算跑得又快又省。
核心數據快照
下面幾個數字幫你抓住 AI 晶片市場的量級。多為研調機構估計。
| 主題 | 數值 | 時點/性質 |
|---|---|---|
| 全球半導體營收 | 2026 年估約 1.32 兆美元 | Gartner 預估 |
| AI 半導體占比 | 約占 2026 半導體營收三成 | Gartner 預估 |
| NVIDIA AI 晶片市占 | 約 70% | TrendForce,2025 估計 |
| 雲端自研 ASIC vs GPU 成長率 | ASIC 約 44.6%、GPU 約 16.1% | TrendForce,2026 估計 |
| AI PC 占比 | 快速普及;Gartner 因記憶體漲價將 50% 滲透點下修至 2028 | Gartner |
五種 AI 晶片,各做什麼
把這個家族的成員攤開對照:
| 類型 | 它是什麼 | 適合用在哪 |
|---|---|---|
| GPU | 通用平行處理器,彈性大、生態(CUDA)成熟 | 大模型訓練、雲端推論、研究 |
| ASIC | 為特定任務量身打造的客製晶片,效率高、彈性低 | 雲端大廠自研、特定工作負載、衝成本 |
| TPU | Google 自研的 ASIC,專攻張量運算 | Google Cloud、自家模型與客戶工作負載 |
| NPU | 放進手機、筆電、汽車的低功耗 AI 晶片 | 裝置端即時 AI、省電、可離線 |
| FPGA | 可重新配置(出廠後仍能改硬體邏輯),彈性與效率的折衷 | 低延遲、工業、原型開發 |
想深入了解 GPU,看 GPU 那一關;想了解雲端大廠為何自研 ASIC,看 ASIC 那一關。
訓練晶片 vs 推論晶片
同樣是 AI 晶片,用在「訓練」還是「推論」,重點很不一樣。
訓練是讓模型從海量資料中學習,像把一個學生從頭教到會。這需要極高的算力、很大的記憶體、跨晶片高速互連,還要長時間穩定運算。推論是模型學成上線後,對新的輸入快速給出答案,像讓學生考試作答。推論更在意延遲(答得快不快)、成本與每瓦效能。
同一顆晶片可能兩者都能做(GPU、TPU 都是),但因為推論會隨每一次使用持續產生成本,市場上越來越多「推論優先」的晶片設計。
雲端 vs 裝置端
AI 晶片放在哪裡,也決定了它長什麼樣。
雲端 AI 晶片放在資料中心,優勢是算力大、可擴展、集中管理,適合大模型訓練與大量 API 推論,但很吃電。裝置端 AI 晶片(多為 NPU)放在手機、筆電、汽車裡,優勢是低延遲、保護隱私、可離線、省頻寬,代價是受限於體積與功耗。微軟的 Copilot+ PC 就要求 NPU 算力超過每秒 40 兆次運算。
簡單說:雲端走「大力出奇蹟」,裝置端走「精打細算」。越來越多 AI 應用會把運算切開,重的放雲端、即時的放裝置端。
這一關的重點
看完 AI 晶片,先記住最重要的觀念:它是一個「加速器家族」的總稱,不是只指 GPU。
GPU 通用、生態成熟;ASIC(含 Google TPU)為特定任務量身打造、效率高;NPU 走低功耗、被放進手機與筆電;FPGA 是彈性與效率的折衷。2026 年的格局是 NVIDIA GPU 仍主導雲端,雲端自研 ASIC 與裝置端 NPU 則各自快速成長。理解這個分類,就看得懂為什麼雲端、手機、汽車裡的 AI 晶片長得不一樣。
想深入看 GPU,讀 GPU;想看雲端自研晶片,讀 ASIC;想看旗艦 GPU 世代,讀 Blackwell;想回頭看整條鏈八關,回到 供應鏈總覽。