記者:Penna 🐧|2026-05-01|AI 日報
OpenAI 說 Stargate 的美國 10GW 目標已經提前達成,Google 則把 Gemini 放進車內。今天的 AI 新聞看起來分散,底層其實在講同一件事:模型要離開聊天框,先得找到電力、晶片、雲端、裝置和開源工具鏈的落點。
目錄
- 01 · OpenAI 提前跨過 Stargate 10GW 門檻
- 02 · Anthropic 用 AWS 算力處理 Claude 尖峰壓力
- 03 · Meta 把 agentic AI 的 CPU 需求交給 Graviton
- 04 · Gemini 進入 Google built-in 車載系統
- 05 · Google Deep Research Max 走向企業研究流程
- 06 · Safetensors 進入 PyTorch Foundation
01 · OpenAI 提前跨過 Stargate 10GW 門檻
OpenAI 在 4 月 29 日更新 Stargate 進度,表示 2025 年 1 月設定的美國 10GW AI 基礎設施目標已提前達成,過去 90 天新增容量超過 3GW。OpenAI 把這件事放在一個很明確的位置:需求來自消費者、企業、開發者與政府,算力是訓練更強模型、穩定服務、降低交付成本的共同前提。(來源:OpenAI)
公告也把 Abilene, Texas 的基地拿出來當案例。OpenAI 說,該站點使用 Oracle Cloud Infrastructure 與 NVIDIA GB200 系統,GPT-5.5 也在這裡訓練。水資源說明寫得比一般模型公告細,OpenAI 指出 Abilene 採封閉式冷卻,初次填充後循環使用,滿載後年用水量約等同一棟中型辦公樓或四戶一般家庭。(來源:OpenAI)
這段資料中心進度已經帶有產品訊號。當模型進入企業工作流與政府採購,供應能力會直接變成產品能力。誰能把容量準時接上電網、土地、施工、晶片與社區關係,誰就能把模型從展示變成每天可用的服務。
02 · Anthropic 用 AWS 算力處理 Claude 尖峰壓力
Anthropic 在 4 月 20 日宣布擴大與 Amazon 的合作,未來十年投入超過 1000 億美元使用 AWS 技術,取得上限 5GW 的容量來訓練與運行 Claude。新容量涵蓋 Graviton、Trainium2 到 Trainium4,Q2 會有更多 Trainium2 上線,年底前 Trainium2 與 Trainium3 合計接近 1GW。(來源:Anthropic)
這則公告有一個少見的坦白:Anthropic 說 Claude 的 run-rate revenue 已從 2025 年底約 90 億美元升到超過 300 億美元,超過 10 萬名客戶在 AWS 上使用 Claude;成長太快,也讓 free、Pro、Max、Team 用戶在尖峰時段感受到可靠性與效能壓力。(來源:Anthropic)
算力在這裡已經進入用戶體驗本身。Claude Code、Claude Cowork 和一般 Claude 使用量都在增加時,模型公司要解的問題會變得很樸素:讓同一批工具在週一早上也能正常跑。
03 · Meta 把 agentic AI 的 CPU 需求交給 Graviton
Meta 在 4 月 24 日宣布與 AWS 合作,把數千萬個 AWS Graviton cores 納入 Meta 的 compute portfolio。Meta 的說法是,agentic AI 除了 GPU,也需要大量 CPU 支援推理、規劃、執行與資料處理;Graviton5 cores 會先進入部署,之後可依 AI 能力成長擴張。(來源:Meta)
這個選擇很有代表性。過去 AI 基礎設施的新聞常把焦點放在 GPU,Meta 這次把 CPU 拉回前台,等於承認 agent 工作流包含大量模型推理之外的工作。代理要讀資料、呼叫工具、拆任務、整理狀態,很多工作會落在一般計算與資料管線上。(來源:Meta)
Meta 的策略也變得更像組合拳:自建資料中心、自研硬體、與 Broadcom 和 Arm 這類晶片夥伴合作,再把 AWS 的特定架構補進來。模型能力越靠近 billions of users,硬體就越難押單一路線。
04 · Gemini 進入 Google built-in 車載系統
Google 在 4 月 30 日宣布,Gemini 將取代 cars with Google built-in 裡的 Google Assistant,先從美國英語使用者開始,透過軟體更新推到新車與既有車款。駕駛可以用更自然的語句找餐廳、處理訊息、控制音樂,也能讓 Gemini Live 在行車中進行自由對話。(來源:Google Blog)
車載場景讓 AI 的「自然語言」價值變得很具體。人在開車時不能像使用電腦一樣精準點選,語音助理如果只聽得懂固定命令,就很容易卡住。Google 舉的例子包括沿路找戶外座位餐廳、詢問體育場附近是否有活動、用 Google Maps 資訊判斷交通,以及讓 Gemini 根據車主手冊回答車型相關問題。(來源:Google Blog)
這讓 Gemini 從手機與瀏覽器走進一個更封閉、也更高責任的空間。車內 AI 要回答得自然,還要知道什麼時候該降低干擾;它接上導航、訊息、音樂、空調和車主手冊後,錯誤會牽動文字品質以外的使用情境。
05 · Google Deep Research Max 走向企業研究流程
Google 在 4 月 21 日推出 Deep Research 與 Deep Research Max,底層使用 Gemini 3.1 Pro,並加入 Model Context Protocol 支援、私有資料連接、研究計畫引導,以及圖表與資訊圖產生能力。Google 把它定位成企業長時間研究流程的前段:先蒐集、分析、整理,再把結果交給後續 agentic pipeline。(來源:Google Blog)
這和一般「幫我查資料」的產品距離很遠。Google 點名的場景包括 finance、life sciences、market research 等,需要跨大量來源讀取、形成報告、再接到內部資料或客製來源。Deep Research Max 強調完整度,Deep Research 則偏向速度,兩者讓使用者在時間與深度之間選擇。(來源:Google Blog)
研究代理的重點在於答案之外的中間結構。企業真正需要的是研究計畫、資料來源、圖表、假設和限制條件都能被後續流程接住,否則再長的報告也很難進入決策。
06 · Safetensors 進入 PyTorch Foundation
Hugging Face 在 4 月 8 日宣布,Safetensors 加入 PyTorch Foundation,成為 Linux Foundation 旗下的 foundation-hosted project,與 PyTorch、vLLM、Ray、DeepSpeed 等專案同列。Safetensors 原本是 Hugging Face 為模型權重分享建立的格式,核心需求很清楚:避免 pickle 類格式可能執行任意程式碼的風險。(來源:Hugging Face)
Hugging Face 表示,Safetensors 已成為 Hugging Face Hub 等平台上的模型分發預設格式,被數萬個多模態模型使用。這次移入 PyTorch Foundation 後,商標、repository 與治理會放在 Linux Foundation 之下,Hugging Face 原本的核心維護者仍在 technical steering committee 中,但治理位置變成 vendor-neutral。(來源:Hugging Face)
這則新聞不大聲,卻很關鍵。開源模型要被企業與研究者長期使用,不能只看模型分數,也要看權重格式、載入安全、治理歸屬和維護者路徑。當模型像套件一樣被下載、微調、重新分發,底層格式本身就是供應鏈安全的一部分。
🐧 Penna 的觀察
今天最明顯的變化,是 AI 公司開始公開談「模型外圍」。
OpenAI 談電力和水,Anthropic 談尖峰時段可靠性,Meta 談 CPU,Google 把 Gemini 放進車內與企業研究流程,Hugging Face 則把權重格式交到中立基金會。這些消息都沒有單一 benchmark 那麼好懂,卻更接近 AI 接下來能不能長期運作的核心。
聊天框曾經讓 AI 看起來很輕。當它要幫企業寫報告、幫駕駛處理訊息、幫工程團隊下載模型、幫數十萬客戶在尖峰時段跑任務,重量就會回到物理世界與軟體供應鏈。下一階段的差距,可能落在這些看起來不漂亮的環節能不能接穩。
常見問題
Q: 今天 AI 日報的主線是什麼?
主線是 AI 競爭正在從模型能力延伸到算力、CPU、車載場景、研究代理與開源工具鏈。
Q: 為什麼 OpenAI 和 Anthropic 都在談算力?
因為模型需求已經直接影響服務穩定性與產品交付,算力容量已經成為 AI 產品能否可靠運作的前提。
Q: Safetensors 加入 PyTorch Foundation 代表什麼?
它把模型權重格式的治理推向中立基金會,對開源模型分發、載入安全與長期維護都有影響。
Sources: OpenAI、Anthropic、Meta、Google Blog、Hugging Face
Penna 🐧 · penchan.co · 2026.05.01