新聞裡的「AI 晶片」有時指 NVIDIA 的 GPU、有時指 Google 的 TPU、有時又是手機裡的某個處理器。到底哪個才是 AI 晶片?其實答案是:它們都是。

這篇就把 AI 晶片講白。先看它為什麼是一個「家族」而不是單一種晶片,再拆解 GPU、ASIC、TPU、NPU、FPGA 各是什麼、差在哪,最後談訓練與推論、雲端與裝置端的不同。這是 AI 硬體供應鏈一條龍 第 1 關「AI 晶片」的入門總覽版。


AI 晶片是什麼?

AI 晶片(又稱 AI 加速器)是「為 AI 工作負載最佳化的硬體」的總稱,涵蓋好幾種晶片。

為什麼需要專門的晶片?因為 AI 的運算很有特色:大量的矩陣乘法、張量運算(張量可想成矩陣的延伸,是模型處理的大量數字表)、低精度計算,而且這些運算可以同時進行。一般 CPU 不擅長這種大規模平行運算,於是業界做出各種專門加速這類運算的晶片,統稱 AI 晶片。

可以把它想成一個家族:GPU、ASIC、TPU、NPU、FPGA 都是這個家族的成員,各有專長,但都為了同一件事而生,把 AI 的運算跑得又快又省。


核心數據快照

下面幾個數字幫你抓住 AI 晶片市場的量級。多為研調機構估計。

主題數值時點/性質
全球半導體營收2026 年估約 1.32 兆美元Gartner 預估
AI 半導體占比約占 2026 半導體營收三成Gartner 預估
NVIDIA AI 晶片市占約 70%TrendForce,2025 估計
雲端自研 ASIC vs GPU 成長率ASIC 約 44.6%、GPU 約 16.1%TrendForce,2026 估計
AI PC 占比快速普及;Gartner 因記憶體漲價將 50% 滲透點下修至 2028Gartner

五種 AI 晶片,各做什麼

把這個家族的成員攤開對照:

類型它是什麼適合用在哪
GPU通用平行處理器,彈性大、生態(CUDA)成熟大模型訓練、雲端推論、研究
ASIC為特定任務量身打造的客製晶片,效率高、彈性低雲端大廠自研、特定工作負載、衝成本
TPUGoogle 自研的 ASIC,專攻張量運算Google Cloud、自家模型與客戶工作負載
NPU放進手機、筆電、汽車的低功耗 AI 晶片裝置端即時 AI、省電、可離線
FPGA可重新配置(出廠後仍能改硬體邏輯),彈性與效率的折衷低延遲、工業、原型開發

想深入了解 GPU,看 GPU 那一關;想了解雲端大廠為何自研 ASIC,看 ASIC 那一關


訓練晶片 vs 推論晶片

同樣是 AI 晶片,用在「訓練」還是「推論」,重點很不一樣。

訓練是讓模型從海量資料中學習,像把一個學生從頭教到會。這需要極高的算力、很大的記憶體、跨晶片高速互連,還要長時間穩定運算。推論是模型學成上線後,對新的輸入快速給出答案,像讓學生考試作答。推論更在意延遲(答得快不快)、成本與每瓦效能。

同一顆晶片可能兩者都能做(GPU、TPU 都是),但因為推論會隨每一次使用持續產生成本,市場上越來越多「推論優先」的晶片設計。


雲端 vs 裝置端

AI 晶片放在哪裡,也決定了它長什麼樣。

雲端 AI 晶片放在資料中心,優勢是算力大、可擴展、集中管理,適合大模型訓練與大量 API 推論,但很吃電。裝置端 AI 晶片(多為 NPU)放在手機、筆電、汽車裡,優勢是低延遲、保護隱私、可離線、省頻寬,代價是受限於體積與功耗。微軟的 Copilot+ PC 就要求 NPU 算力超過每秒 40 兆次運算。

簡單說:雲端走「大力出奇蹟」,裝置端走「精打細算」。越來越多 AI 應用會把運算切開,重的放雲端、即時的放裝置端。


這一關的重點

看完 AI 晶片,先記住最重要的觀念:它是一個「加速器家族」的總稱,不是只指 GPU。

GPU 通用、生態成熟;ASIC(含 Google TPU)為特定任務量身打造、效率高;NPU 走低功耗、被放進手機與筆電;FPGA 是彈性與效率的折衷。2026 年的格局是 NVIDIA GPU 仍主導雲端,雲端自研 ASIC 與裝置端 NPU 則各自快速成長。理解這個分類,就看得懂為什麼雲端、手機、汽車裡的 AI 晶片長得不一樣。

想深入看 GPU,讀 GPU;想看雲端自研晶片,讀 ASIC;想看旗艦 GPU 世代,讀 Blackwell;想回頭看整條鏈八關,回到 供應鏈總覽