今天 AI 日報的主線是什麼？

主線是 AI agent 從產品 demo 走向企業部署、工具鏈、安全基建與組織流程，治理和稽核開始和模型能力同等重要。

BadHost 漏洞為什麼會出現在 AI 日報裡？

因為許多 agent 系統依賴 FastAPI、Starlette、MCP server、vLLM 或 LiteLLM；底層 Web framework 的漏洞會直接影響 agent 能否安全接觸資料與憑證。

Google 和 OpenAI 這次的差異是什麼？

Google 把 Gemini 3.5 放進 Search、Workspace、Antigravity、Gemini Omni 與 Project Genie 等入口；OpenAI 則把 Codex 推向企業 hybrid / on-prem 部署，同時補上內容來源標記。

Agent 進企業，Gemini I/O 與 BadHost 警訊 | AI 脈動

Google I/O 把 Gemini 3.5、Antigravity 2.0、Gemini Omni 和 Project Genie 一口氣推到前台；OpenAI 這邊則把 Codex、企業部署和內容來源標記接在一起。今天的 AI 新聞很像一張壓力測試圖：agent 開始進企業、進工具鏈、進創作流程，安全和治理也被迫跟上。

01 · Google I/O 把 Gemini 3.5 推向 agent 操作層
02 · OpenAI Codex 企業化，內容來源標記同步補位
03 · BadHost 漏洞提醒：agent 基建也是攻擊面
04 · Hugging Face 與 IBM 把 agent 評測拉回整套系統
05 · Nemotron Diffusion 嘗試改寫文字生成節奏
06 · MIT TR 指出 enterprise agentic AI 需要組織重設

01 · Google I/O 把 Gemini 3.5 推向 agent 操作層

Google 在 I/O 2026 把 Gemini 3.5 放在「能行動」的位置，從問答延伸到操作。官方整理列出 Gemini 3.5、Gemini Omni、Antigravity 2.0、Project Genie 與 Workspace 更新；其中 Gemini 3.5 的定位是 frontier intelligence with action，Antigravity 2.0 則把 coding agent、桌面 app、CLI 與自訂 workflow SDK 放進同一套開發者介面。（來源：Google / Google DeepMind）

這裡的重點是入口正在變厚。Gemini 從聊天視窗延伸到 Search、Workspace、開發工具和創作工具。Project Genie 接上 Street View 後，可以用真實地點作為生成世界的底稿；Gemini Omni 則把多模態創作推向影片生成與編輯。對 Google 來說，模型能力正在被拆成一組可操作的產品表面。

對使用者來說，差異會出現在工作流裡。搜尋結果可能變成互動介面，開發工具可以同時跑多個 agent，創作工具會直接讀懂文字、圖片、影片和地點。這讓 Google 的 AI 競爭從「哪個模型回答較好」轉向「哪個入口能把模型接到更多日常任務」。

02 · OpenAI Codex 企業化，內容來源標記同步補位

OpenAI 5 月中下旬連續推了幾個企業訊號。公司宣布與 Dell Technologies 合作，把 Codex 帶到 hybrid 與 on-premises 企業環境；接著又提到 Gartner 2026 Enterprise AI Coding Agents 魔力象限，把 Codex 放在企業 coding agent 的脈絡裡。官方說法裡，Codex 正從程式輔助延伸到更廣的 enterprise workflow。（來源：OpenAI）

企業部署的關鍵不在 demo，而在資料邊界。很多公司願意測 coding agent，卻不一定願意把完整 repo、內部文件、客戶資料和營運系統全部丟進外部雲端。Dell 這類 hybrid / on-prem 路線的意義，是讓 agent 更靠近企業既有環境，也讓 IT 團隊能用熟悉的權限、網路和硬體管理方式控管它。

OpenAI 同週也宣布內容來源標記進展：透過 C2PA conformance、與 Google 合作的 SynthID 圖像浮水印，以及面向公眾的圖像驗證工具 preview，讓外部工具更容易辨識 OpenAI 生成內容。（來源：OpenAI）這兩條線放在一起看，OpenAI 一邊把 agent 推進企業工作，一邊補上內容可追溯性。agent 可以做更多事後，平台需要回答能力、來源、責任和稽核。

03 · BadHost 漏洞提醒：agent 基建也是攻擊面

Ars Technica 5 月 26 日報導，Starlette / FastAPI 生態出現 BadHost 漏洞，編號 CVE-2026-48710。BadHost 官方說明稱，受影響的是 Starlette 1.0.1 以前版本的 host-header authentication bypass，牽涉 FastAPI、vLLM、LiteLLM、MCP servers 和多種 AI agent framework。（來源：Ars Technica / BadHost）

這則新聞重要，原因是它把 agent 安全從 prompt injection 拉回 Web 基建。很多 AI agent 會透過 MCP server 存取資料庫、email、calendar、文件系統或第三方服務；這些 server 往往保存 credential，也可能接在內部工具和模型推理服務前面。當底層 ASGI framework 出現繞過問題，攻擊面會直接落在服務本身，而非只停在模型回覆。

白話說，agent 系統包含模型、prompt、Web server、middleware、auth、reverse proxy、tool server、secret store 和 logging。BadHost 的提醒很直接：企業若把 agent 接進真實資料，修補依賴、隔離網路、檢查 Host header、防火牆規則和 credential scope 都會變成 AI 專案的一部分。

04 · Hugging Face 與 IBM 把 agent 評測拉回整套系統

Hugging Face 5 月 25 日發布 agent glossary，整理 model scaffolding、harness、agent、context engineering、policy、tool use、skills、sub-agents 等詞。它的價值不在詞彙本身，而在拆開容易混在一起的層：模型負責產生下一步，harness 負責工具呼叫和循環，scaffold 決定模型看見什麼、怎麼記錄、怎麼停止。（來源：Hugging Face）

這對採購和開發都很實際。企業比較 Codex、Claude Code、Cursor、Antigravity 或內部 agent framework 時，常會把底層模型、上下文策略、工具權限、錯誤恢復和成本混在同一個名字裡。真正影響結果的，往往是這些系統層選擇。

IBM Research 也在 Hugging Face 推出 Open Agent Leaderboard，把評估對象放在完整 agent system，而非單一模型。這個方向和 agent glossary 接得上：如果兩套系統用同一個模型，但工具選擇、記憶、規劃和 retry 策略不同，可靠度與成本可能差很多。（來源：Hugging Face / IBM Research）

05 · Nemotron Diffusion 嘗試改寫文字生成節奏

NVIDIA 團隊在 Hugging Face 發布 Nemotron-Labs Diffusion language models，主張用 diffusion language model 路線改善文字生成。傳統 LLM 多半是 autoregressive，一次生成一個 token；Nemotron-Labs Diffusion 則嘗試一次生成多個 token，再反覆修正，讓模型能利用 GPU 平行計算，也能回頭修改已生成內容。（來源：Hugging Face / NVIDIA）

這條路線追求的東西超過速度。文字生成若只能一個 token 接一個 token，延遲會直接卡住互動式應用，尤其是 coding、agent tool call、長文件整理和即時助理。Diffusion language model 的思路是把「寫完再修」放進模型生成過程，讓速度和修正能力同時成為設計目標。

這還不代表主流 LLM 路線被取代。比較準確的讀法是，AI 產業開始認真處理推理成本和延遲瓶頸。當 agent 要在背景跑很多步、一次叫多個工具、反覆產生和驗證內容，token-by-token 的成本會被放大。模型架構本身開始成為產品體驗的一部分。

06 · MIT TR 指出 enterprise agentic AI 需要組織重設

MIT Technology Review Insights 5 月 26 日文章把 enterprise agentic AI 的問題放到組織設計。文中引用調查指出，85% 組織希望三年內走向 agentic，但 76% 認為現有 operations 和 infrastructure 無法支撐；文章也提到，agent 若只是被貼到既有人類流程上，很容易變成局部補丁。（來源：MIT Technology Review）

這個觀點補上了今天幾則技術新聞的另一面。Google、OpenAI、Hugging Face、NVIDIA 都在推工具、模型、評測或部署方式，但企業真正卡住的地方通常是流程：誰批准 agent 能碰哪個系統，任務失敗後誰接手，輸出品質怎麼驗，工具呼叫紀錄留多久，哪一段工作該由人保留判斷權。

Agentic AI 若要進企業，影響會超過軟體採購清單。客戶服務、HR、sales、工程和財務流程都可能被拆成「可自動執行」、「需要人批准」、「必須人工判斷」三層。這也是今天新聞的共同底色：agent 能做事後，組織要釐清什麼叫完成、什麼叫負責。

🐧 Penna 的觀察

今天六則新聞看起來分散，其實都在講同一個工程問題：AI agent 正在從模型能力，變成有邊界、有權限、有成本、有紀錄的系統。

Google 和 OpenAI 的競爭焦點，是誰能把 agent 放進更多入口。Hugging Face 和 IBM 則提醒，agent 這個名字背後是一整套 scaffold、harness、工具和評測。BadHost 把這件事講得更硬：只要 agent 有 server、有 credential、有 middleware，它就要遵守一般基建安全規則。NVIDIA 的 diffusion language model 和 MIT TR 的組織設計文章，則分別指向兩個常被忽略的成本：推理延遲與公司流程。

AI 產業下一階段的門檻，不會只出現在 benchmark 分數。真正難的是把模型接進現實環境後，仍然能說清楚它讀了什麼、做了什麼、花了多少成本、誰批准、誰驗收，以及出事時從哪裡切斷。

Sources: Google: 100 things we announced at I/O 2026、Google: Gemini 3.5: frontier intelligence with action、Google DeepMind: Introducing Gemini Omni、Google DeepMind: Introducing Google Antigravity 2.0、Google DeepMind: Simulate real-world places with Project Genie and Street View、OpenAI: OpenAI and Dell Technologies partner to bring Codex to hybrid and on-premises enterprise environments、OpenAI: OpenAI named a Leader in enterprise coding agents by Gartner、OpenAI: Advancing content provenance for a safer, more transparent AI ecosystem、Ars Technica: Millions of AI agents imperiled by critical vulnerability in open source package、BadHost: CVE-2026-48710 Starlette Host-Header Auth Bypass、Hugging Face: Harness, Scaffold, and the AI Agent Terms Worth Getting Right、Hugging Face / IBM Research: The Open Agent Leaderboard、Hugging Face / NVIDIA: Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models、MIT Technology Review: Rethinking organizational design in the age of agentic AI]

Penna 🐧 · penchan.co · 2026.05.27