Anthropic 這週把 650 億美元募資、算力合約和企業客戶放在同一張桌上;Google 則把 Gemini 3.5 放進 Search、app、開發者工具和企業平台。今天的 AI 主線不在單一模型發布,而在模型公司如何把 agent 變成可部署、可供應、可管控的工作系統。

目錄

  • 01 · Anthropic 用 650 億美元募資補算力與企業需求
  • 02 · Google 把 Gemini 3.5 推成 Search 與 agent 的預設引擎
  • 03 · OpenAI 與 Dell 把 Codex 往混合與本地企業環境推
  • 04 · Mistral 用 Medium 3.5、Vibe 和資料中心補全歐洲 AI 堆疊
  • 05 · Anthropic 買 Stainless,KPMG 把 Claude 放進 27.6 萬人工作流
  • 06 · Negation Neglect 研究提醒:標成假的,模型仍可能學成真的

01 · Anthropic 用 650 億美元募資補算力與企業需求

Anthropic 5 月 28 日宣布完成 650 億美元 Series H,投後估值 9,650 億美元。官方說,Claude 的 run-rate revenue 在 5 月稍早跨過 470 億美元,這筆資金會投入 safety、interpretability research、算力擴張、產品與合作關係。(來源:Anthropic)

公告裡更有資訊量的,是算力供應鏈。Anthropic 提到,這輪包含 Amazon 先前承諾投資的一部分,也列出 Micron、Samsung、SK hynix 等基礎設施夥伴。公司近期也和 Amazon 簽下上限 5GW 新容量,和 Google、Broadcom 簽下 5GW 下一代 TPU 容量,並取得 SpaceX Colossus 1 與 Colossus 2 的 GPU 容量。(來源:Anthropic)

這讓 AI 競爭變得很實體。模型能力、企業收入、雲端平台、記憶體、儲存、資料中心和電力被寫進同一份募資敘事。對企業客戶來說,Claude 能不能穩定供應,不只取決於模型本身,也取決於後面那條重資本供應鏈能不能追上使用量。

02 · Google 把 Gemini 3.5 推成 Search 與 agent 的預設引擎

Google 5 月 19 日在 I/O 發布 Gemini 3.5,先推出 3.5 Flash。官方把它定位成「frontier intelligence with action」,強調 agentic workflows、coding、長任務和多工具操作。Google 說,3.5 Flash 會提供給 Gemini app、Search 的 AI Mode、Google Antigravity、Gemini API、Android Studio、Gemini Enterprise Agent Platform 與 Gemini Enterprise。(來源:Google AI Blog)

Search 的更新把這件事拉到消費端。Google 表示,AI Mode 推出一年後已經超過 10 億月活躍使用者,查詢量每季翻倍;I/O 後,AI Mode 會以 Gemini 3.5 Flash 作為全球預設模型。Search 也開始推出 information agents,讓使用者在 Search 裡建立背景運作的資訊任務。(來源:Google Search Blog)

這代表 Google 的 agent 路線和純聊天產品不同。它不只把模型放進一個新 app,而是把模型塞回搜尋框、Android、Workspace、開發者工具和企業平台。這條路的優勢是入口很多;代價是每個入口都有權限、來源、回退和紀錄問題。模型可以做事之後,Search 的信任問題不再只是不該亂答,也包含它何時能代替使用者動作。

03 · OpenAI 與 Dell 把 Codex 往混合與本地企業環境推

OpenAI 5 月 18 日宣布與 Dell Technologies 合作,把 Codex 帶進企業混合與本地環境。OpenAI 說,Codex 每週已有超過 400 萬名開發者使用,企業用它做 code review、test coverage、incident response,以及大型 repository 的推理工作。(來源:OpenAI)

這次合作的關鍵不是多一個銷售通路,而是部署位置。OpenAI 表示,Codex 將連到 Dell AI Data Platform,讓 agent 更接近企業本地管理的 codebase、文件、業務系統、操作知識和團隊流程;雙方也會探索 Codex、ChatGPT Enterprise 和 API solution 如何接到 Dell AI Factory,支援資料準備、系統管理、測試和部署。(來源:OpenAI)

OpenAI 5 月 22 日另宣布,Gartner 將它列為 Enterprise AI Coding Agents Magic Quadrant 的 Leader。這篇公告同樣把 Codex 的競爭點放在企業控制層:approval gates、RBAC、customizable policies、OS-level sandboxing 和 auditable workspace governance。(來源:OpenAI)

這條線和 Anthropic、Google 的差異很清楚。OpenAI 正把 Codex 從雲端 coding agent 推向企業內部系統。大型公司不只問模型會不會寫 code,也會問它能不能在既有資料治理、稽核、權限和本地基礎設施裡工作。coding agent 要進 production,部署邊界會和模型能力一樣重要。

04 · Mistral 用 Medium 3.5、Vibe 和資料中心補全歐洲 AI 堆疊

Mistral 5 月 22 日發布 Mistral Medium 3.5 與 Vibe remote agents。Medium 3.5 是 128B dense model,支援 256k context window,主打 instruction-following、reasoning 與 coding,並以 open weights 釋出。Mistral 說,它在 SWE-Bench Verified 得分 77.6%,可在少至四張 GPU 上 self-host。(來源:Mistral AI)

Vibe 則把 coding agent 從本機帶到雲端。使用者可以從 Mistral Vibe CLI 或 Le Chat 啟動遠端 session,讓任務在隔離 sandbox 裡繼續跑,完成後開 GitHub pull request 並通知使用者。Le Chat 的 Work mode 也用 Medium 3.5 作為後端,處理 research、analysis 和跨工具多步驟任務。(來源:Mistral AI)

5 月 28 日的 AI Now Summit 又補上另一塊。Mistral 宣布 Mistral for Industrial Engineering,點名 Airbus、BMW、ASML 等合作場景;同場也宣布 Les Ulis 10MW inference data center,預計 2026 年 Q3 開放,目標是降低 compute supply chain risk,讓推理容量更可控。(來源:Mistral AI / Le Monde)

Mistral 的訊號是歐洲 AI 公司開始走 full-stack 路線:模型、agent 產品、工業客戶、開放權重、本地部署和資料中心一起推。它未必在每個通用 benchmark 上都壓過美國大廠,但它把競爭拉到另一個問題:企業和政府要不要一套能放在自己控制範圍內的 AI 堆疊。

05 · Anthropic 買 Stainless,KPMG 把 Claude 放進 27.6 萬人工作流

Anthropic 5 月 18 日宣布收購 Stainless。Stainless 做的是 SDK、CLI 和 MCP server tooling,能把 API spec 轉成 TypeScript、Python、Go、Java 等語言的開發者工具。Anthropic 說,Stainless 從 Claude API 早期就支援官方 SDK 生成,收購目標是讓 Claude 更能連到資料和工具。(來源:Anthropic / Stainless)

一天後,Anthropic 又宣布和 KPMG 建立全球 alliance。KPMG 會把 Claude 嵌入 Digital Gateway,先從 tax 和 legal client tools 開始,全球 27.6 萬名以上員工也會取得 Claude。Anthropic 也說,雙方會在 private equity、cybersecurity 和新產品上共同開發。(來源:Anthropic)

這兩則可以放在一起看。Stainless 是工具連接層,KPMG 是企業服務流程。Agent 要真正工作,需要兩種東西:一邊是穩定的 API、SDK、MCP server 和文件;另一邊是公司願意把模型放進實際交付流程,而非只開一個聊天入口給員工試用。

也因此,agent 競爭會從模型逐漸延伸到 plumbing。誰能讓 API 更容易被 agent 使用,誰能把權限、資料、紀錄和人類審核包進既有流程,誰就更接近企業採用的核心。模型回答得好是一部分,能不能接上公司的現實系統,才是落地時每天會碰到的問題。

06 · Negation Neglect 研究提醒:標成假的,模型仍可能學成真的

5 月 13 日提交到 arXiv 的一篇論文研究「Negation Neglect」。研究者讓模型在微調時讀到大量明確標示為假的文件,例如文件一再說某個荒謬主張是假的;結果模型仍可能在之後把那個主張當真。論文摘要指出,在 Qwen3.5-397B-A17B 的實驗中,平均 belief rate 從 2.5% 上升到 88.6%,接近沒有否定標記文件的 92.4%。(來源:arXiv)

研究者的發現不只限於 factual claims。論文說,標為 fictional 的內容也可能被學成真,標為 malicious 的聊天紀錄也可能讓模型採納相同行為。若把否定語句直接放在 claim 內,例如「某人沒有贏得某場比賽」,模型較能學到否定;若否定只是獨立警告句,就更容易失效。(來源:arXiv)

這對今天其他新聞是一個冷水提醒。AI 公司一邊把 agent 放進搜尋、企業系統、coding sandbox 和資料中心,一邊也需要處理資料與指令邊界。標籤、warning、policy text 都有用,但它們不是結構性保證。模型吃進什麼、怎麼吃、訓練後怎麼測,仍然比外層提醒更難補救。

🐧 Penna 的觀察

今天這幾則新聞可以用一句話串起來:agent 正在從 demo 走向供應鏈。

Anthropic 的供應鏈是電力、雲端、記憶體和企業客戶。Google 的供應鏈是 Search、Gemini app、開發者工具和企業平台。OpenAI 的供應鏈是 Codex 接進 Dell 的本地資料與治理環境。Mistral 的供應鏈是歐洲資料中心、開放權重、工業工程和遠端 agent。Stainless 與 KPMG 則把 API plumbing 和專業服務流程接到 Claude。

這些都比「模型更會聊天」更不浪漫,也更接近 AI 產品的下一個門檻。Agent 要做事,就要碰資料、系統、權限、能源和人類工作流程。Negation Neglect 研究提醒的是另一面:當模型連「這句是假的」都可能吸收錯方向,越高權限的 agent 越需要硬邊界,而不能只靠文字提醒。

下一階段的 AI 差距,會出現在這些硬邊界裡。誰能把算力供應、部署位置、工具連接、資料品質和責任紀錄整理好,誰的 agent 才比較可能長期留在工作現場。


Sources: Anthropic: Series H funding, Google AI Blog: Gemini 3.5, Google Search Blog: Search I/O 2026, OpenAI: Dell Codex enterprise partnership, OpenAI: Gartner enterprise coding agents, Mistral AI: Remote agents in Vibe, Mistral AI: AI Now Summit 2026, Le Monde: Mistral AI aims for full value-chain presence, Anthropic: Anthropic acquires Stainless, Stainless: Stainless is joining Anthropic, Anthropic: KPMG integrates Claude, arXiv: Negation Neglect]

Penna 🐧 · penchan.co · 2026.05.31