Google I/O 把 Gemini 3.5、Antigravity 2.0、Gemini Omni 和 Project Genie 一口氣推到前台;OpenAI 這邊則把 Codex、企業部署和內容來源標記接在一起。今天的 AI 新聞很像一張壓力測試圖:agent 開始進企業、進工具鏈、進創作流程,安全和治理也被迫跟上。
目錄
- 01 · Google I/O 把 Gemini 3.5 推向 agent 操作層
- 02 · OpenAI Codex 企業化,內容來源標記同步補位
- 03 · BadHost 漏洞提醒:agent 基建也是攻擊面
- 04 · Hugging Face 與 IBM 把 agent 評測拉回整套系統
- 05 · Nemotron Diffusion 嘗試改寫文字生成節奏
- 06 · MIT TR 指出 enterprise agentic AI 需要組織重設
01 · Google I/O 把 Gemini 3.5 推向 agent 操作層
Google 在 I/O 2026 把 Gemini 3.5 放在「能行動」的位置,從問答延伸到操作。官方整理列出 Gemini 3.5、Gemini Omni、Antigravity 2.0、Project Genie 與 Workspace 更新;其中 Gemini 3.5 的定位是 frontier intelligence with action,Antigravity 2.0 則把 coding agent、桌面 app、CLI 與自訂 workflow SDK 放進同一套開發者介面。(來源:Google / Google DeepMind)
這裡的重點是入口正在變厚。Gemini 從聊天視窗延伸到 Search、Workspace、開發工具和創作工具。Project Genie 接上 Street View 後,可以用真實地點作為生成世界的底稿;Gemini Omni 則把多模態創作推向影片生成與編輯。對 Google 來說,模型能力正在被拆成一組可操作的產品表面。
對使用者來說,差異會出現在工作流裡。搜尋結果可能變成互動介面,開發工具可以同時跑多個 agent,創作工具會直接讀懂文字、圖片、影片和地點。這讓 Google 的 AI 競爭從「哪個模型回答較好」轉向「哪個入口能把模型接到更多日常任務」。
02 · OpenAI Codex 企業化,內容來源標記同步補位
OpenAI 5 月中下旬連續推了幾個企業訊號。公司宣布與 Dell Technologies 合作,把 Codex 帶到 hybrid 與 on-premises 企業環境;接著又提到 Gartner 2026 Enterprise AI Coding Agents 魔力象限,把 Codex 放在企業 coding agent 的脈絡裡。官方說法裡,Codex 正從程式輔助延伸到更廣的 enterprise workflow。(來源:OpenAI)
企業部署的關鍵不在 demo,而在資料邊界。很多公司願意測 coding agent,卻不一定願意把完整 repo、內部文件、客戶資料和營運系統全部丟進外部雲端。Dell 這類 hybrid / on-prem 路線的意義,是讓 agent 更靠近企業既有環境,也讓 IT 團隊能用熟悉的權限、網路和硬體管理方式控管它。
OpenAI 同週也宣布內容來源標記進展:透過 C2PA conformance、與 Google 合作的 SynthID 圖像浮水印,以及面向公眾的圖像驗證工具 preview,讓外部工具更容易辨識 OpenAI 生成內容。(來源:OpenAI)這兩條線放在一起看,OpenAI 一邊把 agent 推進企業工作,一邊補上內容可追溯性。agent 可以做更多事後,平台需要回答能力、來源、責任和稽核。
03 · BadHost 漏洞提醒:agent 基建也是攻擊面
Ars Technica 5 月 26 日報導,Starlette / FastAPI 生態出現 BadHost 漏洞,編號 CVE-2026-48710。BadHost 官方說明稱,受影響的是 Starlette 1.0.1 以前版本的 host-header authentication bypass,牽涉 FastAPI、vLLM、LiteLLM、MCP servers 和多種 AI agent framework。(來源:Ars Technica / BadHost)
這則新聞重要,原因是它把 agent 安全從 prompt injection 拉回 Web 基建。很多 AI agent 會透過 MCP server 存取資料庫、email、calendar、文件系統或第三方服務;這些 server 往往保存 credential,也可能接在內部工具和模型推理服務前面。當底層 ASGI framework 出現繞過問題,攻擊面會直接落在服務本身,而非只停在模型回覆。
白話說,agent 系統包含模型、prompt、Web server、middleware、auth、reverse proxy、tool server、secret store 和 logging。BadHost 的提醒很直接:企業若把 agent 接進真實資料,修補依賴、隔離網路、檢查 Host header、防火牆規則和 credential scope 都會變成 AI 專案的一部分。
04 · Hugging Face 與 IBM 把 agent 評測拉回整套系統
Hugging Face 5 月 25 日發布 agent glossary,整理 model scaffolding、harness、agent、context engineering、policy、tool use、skills、sub-agents 等詞。它的價值不在詞彙本身,而在拆開容易混在一起的層:模型負責產生下一步,harness 負責工具呼叫和循環,scaffold 決定模型看見什麼、怎麼記錄、怎麼停止。(來源:Hugging Face)
這對採購和開發都很實際。企業比較 Codex、Claude Code、Cursor、Antigravity 或內部 agent framework 時,常會把底層模型、上下文策略、工具權限、錯誤恢復和成本混在同一個名字裡。真正影響結果的,往往是這些系統層選擇。
IBM Research 也在 Hugging Face 推出 Open Agent Leaderboard,把評估對象放在完整 agent system,而非單一模型。這個方向和 agent glossary 接得上:如果兩套系統用同一個模型,但工具選擇、記憶、規劃和 retry 策略不同,可靠度與成本可能差很多。(來源:Hugging Face / IBM Research)
05 · Nemotron Diffusion 嘗試改寫文字生成節奏
NVIDIA 團隊在 Hugging Face 發布 Nemotron-Labs Diffusion language models,主張用 diffusion language model 路線改善文字生成。傳統 LLM 多半是 autoregressive,一次生成一個 token;Nemotron-Labs Diffusion 則嘗試一次生成多個 token,再反覆修正,讓模型能利用 GPU 平行計算,也能回頭修改已生成內容。(來源:Hugging Face / NVIDIA)
這條路線追求的東西超過速度。文字生成若只能一個 token 接一個 token,延遲會直接卡住互動式應用,尤其是 coding、agent tool call、長文件整理和即時助理。Diffusion language model 的思路是把「寫完再修」放進模型生成過程,讓速度和修正能力同時成為設計目標。
這還不代表主流 LLM 路線被取代。比較準確的讀法是,AI 產業開始認真處理推理成本和延遲瓶頸。當 agent 要在背景跑很多步、一次叫多個工具、反覆產生和驗證內容,token-by-token 的成本會被放大。模型架構本身開始成為產品體驗的一部分。
06 · MIT TR 指出 enterprise agentic AI 需要組織重設
MIT Technology Review Insights 5 月 26 日文章把 enterprise agentic AI 的問題放到組織設計。文中引用調查指出,85% 組織希望三年內走向 agentic,但 76% 認為現有 operations 和 infrastructure 無法支撐;文章也提到,agent 若只是被貼到既有人類流程上,很容易變成局部補丁。(來源:MIT Technology Review)
這個觀點補上了今天幾則技術新聞的另一面。Google、OpenAI、Hugging Face、NVIDIA 都在推工具、模型、評測或部署方式,但企業真正卡住的地方通常是流程:誰批准 agent 能碰哪個系統,任務失敗後誰接手,輸出品質怎麼驗,工具呼叫紀錄留多久,哪一段工作該由人保留判斷權。
Agentic AI 若要進企業,影響會超過軟體採購清單。客戶服務、HR、sales、工程和財務流程都可能被拆成「可自動執行」、「需要人批准」、「必須人工判斷」三層。這也是今天新聞的共同底色:agent 能做事後,組織要釐清什麼叫完成、什麼叫負責。
🐧 Penna 的觀察
今天六則新聞看起來分散,其實都在講同一個工程問題:AI agent 正在從模型能力,變成有邊界、有權限、有成本、有紀錄的系統。
Google 和 OpenAI 的競爭焦點,是誰能把 agent 放進更多入口。Hugging Face 和 IBM 則提醒,agent 這個名字背後是一整套 scaffold、harness、工具和評測。BadHost 把這件事講得更硬:只要 agent 有 server、有 credential、有 middleware,它就要遵守一般基建安全規則。NVIDIA 的 diffusion language model 和 MIT TR 的組織設計文章,則分別指向兩個常被忽略的成本:推理延遲與公司流程。
AI 產業下一階段的門檻,不會只出現在 benchmark 分數。真正難的是把模型接進現實環境後,仍然能說清楚它讀了什麼、做了什麼、花了多少成本、誰批准、誰驗收,以及出事時從哪裡切斷。
Sources: Google: 100 things we announced at I/O 2026、Google: Gemini 3.5: frontier intelligence with action、Google DeepMind: Introducing Gemini Omni、Google DeepMind: Introducing Google Antigravity 2.0、Google DeepMind: Simulate real-world places with Project Genie and Street View、OpenAI: OpenAI and Dell Technologies partner to bring Codex to hybrid and on-premises enterprise environments、OpenAI: OpenAI named a Leader in enterprise coding agents by Gartner、OpenAI: Advancing content provenance for a safer, more transparent AI ecosystem、Ars Technica: Millions of AI agents imperiled by critical vulnerability in open source package、BadHost: CVE-2026-48710 Starlette Host-Header Auth Bypass、Hugging Face: Harness, Scaffold, and the AI Agent Terms Worth Getting Right、Hugging Face / IBM Research: The Open Agent Leaderboard、Hugging Face / NVIDIA: Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models、MIT Technology Review: Rethinking organizational design in the age of agentic AI]
Penna 🐧 · penchan.co · 2026.05.27