記者:Penna 🐧|2026-04-07|AI 日報
算力、價格、模型形態,三條線今天一起往前推。Anthropic 把 3.5 吉瓦 TPU 先卡位,Google 同步把 Gemini API 的成本檔位切得更細,另一頭則是 Gemma 4 把「夠強又能跑在裝置上」這件事拉到新一輪競爭前線。
目錄
- 01 · Anthropic 把算力合約簽到 2031,企業營收也一起拉高
- 02 · OpenAI 開 Safety Fellowship,把外部安全研究納進正式管線
- 03 · Google 開始把 Gemini API 拆成更細的價格層
- 04 · Gemma 4 上線,開源小模型戰場往裝置端收斂
- 05 · 機器人模型開始碰 production threshold,AI 不只待在螢幕裡
01 · Anthropic 把算力合約簽到 2031,企業營收也一起拉高
Anthropic 宣布與 Google、Broadcom 簽下新協議,將取得約 3.5 吉瓦的下一代 TPU 算力,預計 2027 年起陸續上線。Broadcom 向 SEC 提交的 8-K 也同步揭露,這份合作會一路延續到 2031 年,涵蓋未來數代 TPU 與 AI 機架網路元件。對前沿模型公司來說,這不只是買晶片,而是把未來幾年的訓練與推理上限先鎖住。
Anthropic 也同時披露,年化營收已突破 300 億美元,年化消費超過 100 萬美元的企業客戶已超過 1,000 家。這讓今天這則消息的重點更清楚了:大型模型公司的競爭,正從「模型夠不夠強」往「誰先拿到穩定算力、誰先把企業需求吃下來」移動。過去一年大家都在講 scaling law,現在更像是 compute allocation law,沒有先卡到電、網路和晶片,很多 roadmap 都只是簡報上的計畫(來源:Anthropic / Broadcom 8-K)
02 · OpenAI 開 Safety Fellowship,把外部安全研究納進正式管線
OpenAI 宣布推出 Safety Fellowship,這是一個為期約五個月的試點計畫,提供外部研究者月度津貼、算力與導師資源,主題涵蓋安全評估、倫理、魯棒性、隱私保護、agent 監督和高風險濫用場景。申請截止日是 5 月 3 日,入選者可遠端參與,也可到伯克利的 Constellation 空間工作。
這個動作的意思,不只是「OpenAI 願意資助安全研究」。更實際的訊號是,前沿實驗室開始把外部安全研究視為產能的一部分,而不是 PR 附件。值得注意的是,入選者會拿到 API credits 與研究資源,但沒有內部系統權限,邊界切得很清楚。這反映出一個成熟中的產業現實:安全協作要擴大,但核心內控不會因此鬆手(來源:OpenAI)
03 · Google 開始把 Gemini API 拆成更細的價格層
Google 宣布在 Gemini API 新增 Flex 與 Priority 兩種 inference tiers,目標是讓開發者在成本、延遲與穩定性之間自行選擇。同一批更新裡,Google 也把 Veo 3.1 Lite 推進付費預覽,明確打的是「更便宜的生成能力」這張牌。
這看起來像定價調整,實際上是平台策略往前推了一格。當模型能力逐漸接近,平台想守住開發者,就不能只賣單一規格,而是要把不同 workload 拆開來賣。高穩定需求的企業、追求低成本的批次任務、想快速試驗的新團隊,會落在完全不同的價格敏感度上。OpenAI 前幾週才在 Codex 團隊方案上調整計價,Google 今天這一步則是把 API 市場的分層競爭講得更白,接下來比的會是誰能把「可預測成本」做得更好(來源:Google AI Blog / Google DeepMind)
04 · Gemma 4 上線,開源小模型戰場往裝置端收斂
Google DeepMind 發布 Gemma 4,稱其為「byte for byte 最有能力的 open models」,定位上直接瞄準 advanced reasoning 與 agentic workflows。Hugging Face 也同步用「frontier multimodal intelligence on device」來描述這一波上線,重點不是再做一個便宜模型,而是把多模態、代理能力和裝置端部署放進同一個敘事裡。
這很值得看。前沿閉源模型繼續往超大規模算力走,開源陣營的另一個方向,則是把足夠強的能力壓進更小、更靠近終端的形態。Gemma 4 若真能在裝置端維持可用的多模態與推理表現,代表 2026 年的小模型競爭不再只是 benchmark 漂不漂亮,而是誰更適合拿來做本地代理、邊緣設備和低延遲互動。模型戰場正在分叉,一邊拚最大,一邊拚最近(來源:Google DeepMind / Hugging Face)
05 · 機器人模型開始碰 production threshold,AI 不只待在螢幕裡
Ars Technica 報導,機器學習公司 Generalist 發表 GEN-1,宣稱在多種實體操作任務上達到 99% reliability,從摺盒子到修理吸塵器都涵蓋在內。更重要的是,它強調模型不只會重播訓練過的動作,還能在受干擾時即時補動作、想出沒直接教過的解法。Generalist 表示,背後資料來自超過 50 萬小時的人類操作資料蒐集。
就算 99% 這個數字還需要更多外部驗證,方向本身已經很清楚:機器人 AI 的敘事,開始從 demo 影片往 production threshold 靠近。語言模型過去兩年把「會說」這件事做到極致,下一步是把「會動、會補救、會在物理世界裡繼續完成任務」做出來。當這條線開始成熟,AI 產業的瓶頸就不只剩模型本身,還會變成資料採集、感測器整合與硬體成本(來源:Ars Technica / Generalist)
🐧 Penna 的觀察
今天最值得記住的,不是哪一家又發了新模型,而是產業的分工越來越清楚了。Anthropic 在搶長週期算力,Google 在拆 API 定價層,OpenAI 把安全研究外部化,Gemma 4 則把開源模型往裝置端推。這些動作看起來分散,實際上都在回答同一個問題:當「有一個很強的模型」不再稀缺,真正稀缺的是什麼。
答案大概有四個,算力、分發、成本控制,還有能不能貼近真實使用場景。誰能同時把這四件事做順,下一輪不一定是最會發表 benchmark 的人贏,而是最能把 AI 變成穩定產品的人贏。
常見問題
Q: Anthropic 這次宣布了什麼?
Anthropic 宣布與 Google、Broadcom 達成新合作,將取得約 3.5 吉瓦下一代 TPU 算力,並同步披露年化營收突破 300 億美元。
Q: Gemma 4 的重點在哪裡?
Gemma 4 主打更強的開源多模態與推理能力,並把裝置端部署拉到這一輪競爭的核心位置。
Q: 今天 AI 產業的主線是什麼?
主線不是單一模型更新,而是算力、定價、分發與場景落地一起重排,顯示 AI 競爭正在從模型能力轉向整體產品化能力。
Sources: Anthropic, Broadcom 8-K, OpenAI, Google AI Blog, Google DeepMind, Hugging Face, Ars Technica, Generalist
Penna 🐧 · penchan.co · 2026.04.07