Anthropic 這兩天把 Claude 的瓶頸講得很直白:使用量上限背後,其實是電力、晶片和資料中心。OpenAI 同步把語音、資安和 Codex 控制面往外攤開,Google 與 Mistral 則把同一個問題推到搜尋入口、長任務 API 和開放模型效率上。

目錄

  • 01 · Anthropic 用 SpaceX 算力換 Claude 使用量上限
  • 02 · Claude 金融 agents 進入 Excel、PowerPoint 和受控資料源
  • 03 · OpenAI 把語音 API 往即時代理推進
  • 04 · GPT-5.5-Cyber 把資安能力改成分級授權
  • 05 · Codex 安全文件把 coding agent 變成可稽核工作流
  • 06 · Google 修 AI 搜尋的連結問題,AlphaEvolve 走向科學與電網
  • 07 · Mistral Small 4 把開放模型效率拉回企業部署

01 · Anthropic 用 SpaceX 算力換 Claude 使用量上限

Anthropic 5 月 6 日宣布與 SpaceX 達成算力合作,將使用 Colossus 1 資料中心的全部算力容量。公司稱,這筆合作會在一個月內帶來超過 300 MW 的新增容量,約等於 22 萬張以上 NVIDIA GPU,並直接支援 Claude Pro、Claude Max、Claude Code 和 API 的用量提升。(來源:Anthropic)

使用者看到的是上限變寬:Claude Code 的五小時 rate limit 對 Pro、Max、Team 和 seat-based Enterprise 方案加倍,Pro 和 Max 的尖峰時段限制也被移除。底層其實是供應鏈重新排列。Anthropic 同一篇公告把 SpaceX、Amazon、Google、Broadcom、Microsoft、NVIDIA 和 Fluidstack 放在同一張算力地圖上,說明 Claude 已經從單一雲端產品,變成跨硬體、跨地區、跨供應商的推理與訓練系統。(來源:Anthropic)

這則新聞的重點不在「又多買 GPU」。Claude Code 這類長時間 agent 產品會把用量波峰拉長,企業 API 也需要更穩的吞吐量。當模型能力進入日常工作流,產品體驗就會被資料中心交付速度綁住。

02 · Claude 金融 agents 進入 Excel、PowerPoint 和受控資料源

Anthropic 5 月 5 日發布金融服務 agents,提供十個 ready-to-run 模板,涵蓋 pitchbook、KYC 檔案、月結、估值檢查、財務模型、會議準備和財報審閱。這些模板會以 Claude Cowork、Claude Code plugin 和 Claude Managed Agents cookbook 的形式提供,目標是讓金融團隊在數天內把 Claude 放進真實流程,而不是從空白 agent 架構開始。(來源:Anthropic)

這組產品真正指向的是 office workflow。Claude add-ins 會讓模型跨 Excel、PowerPoint、Word 和 Outlook 工作;Anthropic 寫到,Excel 裡開始的模型不必在 PowerPoint 裡重新說明一次。金融 agents 也會接上 FactSet、S&P Capital IQ、MSCI、PitchBook、Morningstar、LSEG、Daloopa,以及企業內部資料倉儲與 CRM,並透過 governed access controls 管理資料邊界。(來源:Anthropic)

金融業是 agent 商品化的壓力測試場。輸出可以快,但不能缺稽核;模型可以幫忙跑長任務,但使用者仍要審閱、迭代和批准。Anthropic 把這些流程包成模板,代表 agent 競爭已經從「能做什麼」移到「能不能符合一個受監管團隊的工作方式」。

03 · OpenAI 把語音 API 往即時代理推進

OpenAI 5 月 7 日在 API 發布三個新語音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。官方描述很清楚,這一代 voice stack 追求的不只是 turn-taking 變快,還要讓語音代理理解使用者意思、保留上下文、在對話中使用工具,並在任務變更時接住新的要求。(來源:OpenAI)

GPT-Realtime-2 被定位為具備 GPT-5 級推理能力的語音模型;GPT-Realtime-Translate 支援 70 多種輸入語言轉成 13 種輸出語言;GPT-Realtime-Whisper 則處理低延遲 streaming speech-to-text。OpenAI 舉的場景包括 Zillow 語音找房、旅遊 app 主動告知轉機路線,以及客服流程中的即時協助。(來源:OpenAI)

這讓語音介面從「把文字念出來」轉向「人在移動時仍能操作軟體」。真正的門檻會落在三件事:工具呼叫是否可靠、延遲是否穩定、以及模型能否在口語打斷與修正裡維持任務狀態。語音代理如果做不好,只會比表單更煩;做得好,很多軟體流程會先從手機螢幕移到耳機裡。

04 · GPT-5.5-Cyber 把資安能力改成分級授權

OpenAI 同一天也公布 GPT-5.5-Cyber limited preview,對象是負責保護關鍵基礎設施的防禦者。文章把 access 分成三層:一般 GPT-5.5、帶 Trusted Access for Cyber 的 GPT-5.5,以及限制更嚴、行為更開放的 GPT-5.5-Cyber。(來源:OpenAI)

Trusted Access for Cyber 的設計重點是身分與信任框架。通過驗證的防禦者,在漏洞識別、惡意程式分析、binary reverse engineering、偵測工程和 patch validation 等授權任務上會遇到較少分類器拒絕;但憑證竊取、隱匿、持久化、惡意程式部署或攻擊第三方系統仍會被擋。OpenAI 也要求高權限使用者在 2026 年 6 月 1 日起啟用抗 phishing 的帳號安全保護,或由組織透過 SSO 作出等效聲明。(來源:OpenAI)

這裡有一個更大的產業訊號:高能力模型的安全不是單純開或關。OpenAI 正在把模型能力、使用者身分、任務類型和帳號安全綁在一起,形成一套分級授權制度。資安團隊會喜歡這種彈性,監管者也會問同一件事:誰拿到更高權限、做了什麼、出了事能不能追到責任鏈。

05 · Codex 安全文件把 coding agent 變成可稽核工作流

OpenAI 5 月 8 日發布〈Running Codex safely at OpenAI〉,說明內部如何管理 coding agent。文件列出 sandbox、approval policy、network policy、managed configuration、identity、credential storage、rules 和 OpenTelemetry logs,核心目標是讓 Codex 能在低風險工作中順暢行動,高風險行動則必須停下來要求審查。(來源:OpenAI)

這份文件最有意思的地方,是它把 coding agent 當成企業安全系統的一部分,而不是單純的開發工具。OpenAI 寫到,Codex logs 可包含使用者 prompt、工具 approval decisions、tool execution results、MCP server usage,以及 network proxy allow 或 deny events;安全團隊可以把這些 agent-native logs 接到 SIEM 和 compliance logging systems,用來理解 agent 為什麼做出某個動作。(來源:OpenAI)

coding agent 進入企業後,會改程式只是入場券,更難的是管理邊界。人類工程師留下的是 git commit、CI log 和 terminal history;agent 留下的還要包含它收到什麼指令、選了什麼工具、哪一步被擋、哪一步被批准。這會變成 enterprise agent 的基本配備。

06 · Google 修 AI 搜尋的連結問題,AlphaEvolve 走向科學與電網

Google 5 月 6 日宣布 AI Mode 和 AI Overviews 的連結呈現更新,包含 AI 回答末端的延伸閱讀、訂閱來源標籤、公開討論與社群觀點 preview、回答文字旁的 inline links,以及桌面版 hover 預覽。Google 的說法是,這些更新要讓使用者更容易回到原始網站與可信來源。(來源:Google Blog)

這對出版者很敏感。AI 搜尋的核心爭議一直是:回答變完整後,使用者還會不會點進原站?Google 這次把「訂閱來源」和「更多 inline links」放在更新主軸,等於承認 AI answer 必須改善導流與來源可見度,否則搜尋和內容供給方的張力會越拉越大。(來源:Google Blog)

Google DeepMind 另一條線則是 AlphaEvolve。5 月 7 日的更新列出多個落地案例:在 genomics 中協助 DeepConsensus 降低 30% variant detection errors;在電網 AC Optimal Power Flow 問題中,把訓練後 GNN 找到 feasible solutions 的比例從 14% 提高到 88% 以上;在自然災害風險預測中,跨 20 類災害的整體 accuracy 提升 5%。(來源:Google DeepMind)

搜尋連結和 AlphaEvolve 看似是兩件事,放在同一天的 AI 版圖裡卻很搭。前者處理 AI 如何重新分配網路流量,後者處理 AI 如何直接改寫科學與工程流程。Google 的 AI 戰線一端在入口,一端在基礎研究,中間要靠開發者工具和雲端產品接起來。

07 · Mistral Small 4 把開放模型效率拉回企業部署

Mistral 發布 Small 4,主打把 reasoning、multimodal 和 agentic coding 合成一個開放模型。官方列出的架構是 128 experts、每個 token 啟用 4 個 experts、119B total parameters、6B active parameters,支援 256k context window,並提供可調整的 reasoning_effort。(來源:Mistral AI)

效能敘事也很務實。Mistral 稱,Small 4 在 latency-optimized setup 下端到端 completion time 降低 40%,在 throughput-optimized setup 下 requests per second 是 Small 3 的 3 倍;部署門檻則寫成 4x NVIDIA HGX H100、2x HGX H200 或 1x DGX B200 的等級。模型以 Apache 2.0 釋出,並在 vLLM、llama.cpp、SGLang、Transformers 和 NVIDIA NIM 上提供支援。(來源:Mistral AI)

開放模型競爭正在少一點口號,多一點部署數學。企業真正要算的是每秒吞吐、延遲、輸出長度、硬體門檻和治理方式。Small 4 把三種能力收進同一個模型,意圖降低選型複雜度;但它也把問題丟回給使用者:開放模型如果要進正式系統,就得像閉源 API 一樣交代成本、穩定性和責任邊界。

🐧 Penna 的觀察

今天的 AI 新聞主線很像一張 enterprise checklist:有沒有算力、有沒有資料權限、有沒有即時介面、有沒有資安授權、有沒有 audit trail,有沒有可部署的開放替代品。

模型能力仍然重要,但本週的訊號顯示,真正稀缺的東西正在往周邊移動。Anthropic 缺的是容量,金融 agents 缺的是治理與資料連接;OpenAI 的語音與資安產品缺的是權限分層,Codex 缺的是稽核語言;Google 要修的是 AI answer 和網站流量之間的信任;Mistral 則要證明開放模型能用更低成本進企業。

這些都不是 demo 場上最亮的部分。可是一旦 AI 進入日常工作,亮點會很快被帳單、權限、紀錄和責任取代。2026 年的 agent 競爭,會越來越像系統工程,而不是單次模型發布。


Sources: Anthropic: Higher usage limits for Claude and a compute deal with SpaceXAnthropic: Agents for financial servicesOpenAI: Advancing voice intelligence with new models in the APIOpenAI: Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-CyberOpenAI: Running Codex safely at OpenAIGoogle Blog: 5 new ways to explore the web with generative AI in SearchGoogle DeepMind: AlphaEvolveMistral AI: Introducing Mistral Small 4

Penna 🐧 · penchan.co · 2026.05.11