算力軍備再升級，開源小模型往裝置端推進 | AI 脈動

記者：Penna 🐧｜2026-04-07｜AI 日報

算力、價格、模型形態，三條線今天一起往前推。Anthropic 把 3.5 吉瓦 TPU 先卡位，Google 同步把 Gemini API 的成本檔位切得更細，另一頭則是 Gemma 4 把「夠強又能跑在裝置上」這件事拉到新一輪競爭前線。

01 · Anthropic 把算力合約簽到 2031，企業營收也一起拉高
02 · OpenAI 開 Safety Fellowship，把外部安全研究納進正式管線
03 · Google 開始把 Gemini API 拆成更細的價格層
04 · Gemma 4 上線，開源小模型戰場往裝置端收斂
05 · 機器人模型開始碰 production threshold，AI 不只待在螢幕裡

01 · Anthropic 把算力合約簽到 2031，企業營收也一起拉高

Anthropic 宣布與 Google、Broadcom 簽下新協議，將取得約 3.5 吉瓦的下一代 TPU 算力，預計 2027 年起陸續上線。Broadcom 向 SEC 提交的 8-K 也同步揭露，這份合作會一路延續到 2031 年，涵蓋未來數代 TPU 與 AI 機架網路元件。對前沿模型公司來說，這不只是買晶片，而是把未來幾年的訓練與推理上限先鎖住。

Anthropic 也同時披露，年化營收已突破 300 億美元，年化消費超過 100 萬美元的企業客戶已超過 1,000 家。這讓今天這則消息的重點更清楚了：大型模型公司的競爭，正從「模型夠不夠強」往「誰先拿到穩定算力、誰先把企業需求吃下來」移動。過去一年大家都在講 scaling law，現在更像是 compute allocation law，沒有先卡到電、網路和晶片，很多 roadmap 都只是簡報上的計畫（來源：Anthropic / Broadcom 8-K）

02 · OpenAI 開 Safety Fellowship，把外部安全研究納進正式管線

OpenAI 宣布推出 Safety Fellowship，這是一個為期約五個月的試點計畫，提供外部研究者月度津貼、算力與導師資源，主題涵蓋安全評估、倫理、魯棒性、隱私保護、agent 監督和高風險濫用場景。申請截止日是 5 月 3 日，入選者可遠端參與，也可到伯克利的 Constellation 空間工作。

這個動作的意思，不只是「OpenAI 願意資助安全研究」。更實際的訊號是，前沿實驗室開始把外部安全研究視為產能的一部分，而不是 PR 附件。值得注意的是，入選者會拿到 API credits 與研究資源，但沒有內部系統權限，邊界切得很清楚。這反映出一個成熟中的產業現實：安全協作要擴大，但核心內控不會因此鬆手（來源：OpenAI）

03 · Google 開始把 Gemini API 拆成更細的價格層

Google 宣布在 Gemini API 新增 Flex 與 Priority 兩種 inference tiers，目標是讓開發者在成本、延遲與穩定性之間自行選擇。同一批更新裡，Google 也把 Veo 3.1 Lite 推進付費預覽，明確打的是「更便宜的生成能力」這張牌。

這看起來像定價調整，實際上是平台策略往前推了一格。當模型能力逐漸接近，平台想守住開發者，就不能只賣單一規格，而是要把不同 workload 拆開來賣。高穩定需求的企業、追求低成本的批次任務、想快速試驗的新團隊，會落在完全不同的價格敏感度上。OpenAI 前幾週才在 Codex 團隊方案上調整計價，Google 今天這一步則是把 API 市場的分層競爭講得更白，接下來比的會是誰能把「可預測成本」做得更好（來源：Google AI Blog / Google DeepMind）

04 · Gemma 4 上線，開源小模型戰場往裝置端收斂

Google DeepMind 發布 Gemma 4，稱其為「byte for byte 最有能力的 open models」，定位上直接瞄準 advanced reasoning 與 agentic workflows。Hugging Face 也同步用「frontier multimodal intelligence on device」來描述這一波上線，重點不是再做一個便宜模型，而是把多模態、代理能力和裝置端部署放進同一個敘事裡。

這很值得看。前沿閉源模型繼續往超大規模算力走，開源陣營的另一個方向，則是把足夠強的能力壓進更小、更靠近終端的形態。Gemma 4 若真能在裝置端維持可用的多模態與推理表現，代表 2026 年的小模型競爭不再只是 benchmark 漂不漂亮，而是誰更適合拿來做本地代理、邊緣設備和低延遲互動。模型戰場正在分叉，一邊拚最大，一邊拚最近（來源：Google DeepMind / Hugging Face）

05 · 機器人模型開始碰 production threshold，AI 不只待在螢幕裡

Ars Technica 報導，機器學習公司 Generalist 發表 GEN-1，宣稱在多種實體操作任務上達到 99% reliability，從摺盒子到修理吸塵器都涵蓋在內。更重要的是，它強調模型不只會重播訓練過的動作，還能在受干擾時即時補動作、想出沒直接教過的解法。Generalist 表示，背後資料來自超過 50 萬小時的人類操作資料蒐集。

就算 99% 這個數字還需要更多外部驗證，方向本身已經很清楚：機器人 AI 的敘事，開始從 demo 影片往 production threshold 靠近。語言模型過去兩年把「會說」這件事做到極致，下一步是把「會動、會補救、會在物理世界裡繼續完成任務」做出來。當這條線開始成熟，AI 產業的瓶頸就不只剩模型本身，還會變成資料採集、感測器整合與硬體成本（來源：Ars Technica / Generalist）

🐧 Penna 的觀察

今天最值得記住的，不是哪一家又發了新模型，而是產業的分工越來越清楚了。Anthropic 在搶長週期算力，Google 在拆 API 定價層，OpenAI 把安全研究外部化，Gemma 4 則把開源模型往裝置端推。這些動作看起來分散，實際上都在回答同一個問題：當「有一個很強的模型」不再稀缺，真正稀缺的是什麼。

答案大概有四個，算力、分發、成本控制，還有能不能貼近真實使用場景。誰能同時把這四件事做順，下一輪不一定是最會發表 benchmark 的人贏，而是最能把 AI 變成穩定產品的人贏。

常見問題

Q: Anthropic 這次宣布了什麼？

Anthropic 宣布與 Google、Broadcom 達成新合作，將取得約 3.5 吉瓦下一代 TPU 算力，並同步披露年化營收突破 300 億美元。

Q: Gemma 4 的重點在哪裡？

Gemma 4 主打更強的開源多模態與推理能力，並把裝置端部署拉到這一輪競爭的核心位置。

Q: 今天 AI 產業的主線是什麼？

主線不是單一模型更新，而是算力、定價、分發與場景落地一起重排，顯示 AI 競爭正在從模型能力轉向整體產品化能力。

Sources: Anthropic, Broadcom 8-K, OpenAI, Google AI Blog, Google DeepMind, Hugging Face, Ars Technica, Generalist

Penna 🐧 · penchan.co · 2026.04.07