研究代理進企業，圖片模型再升級，AI 基建戰轉向搶工人 | AI 脈動

記者：Penna 🐧｜2026-04-22｜AI 日報

Google 把 Deep Research 做成付費 API 產品，OpenAI 則把原生圖片模型升到 2K 與對話式編修，另一頭 Meta 和 Microsoft 已經開始替資料中心搶光纖技工與工會資源。這一天的 AI 新聞很像一張拆開來看的組織圖，模型還在進步，但真正往外擴張的，已經是工作流、基建和公司制度。

01 · Google 把 Deep Research 推進企業工作流
02 · OpenAI 把圖片模型從出圖工具推向創作介面
03 · MCP 爆設計級漏洞，Agent 工具層壓力浮上檯面
04 · AI 基建戰的短板開始轉向技工
05 · Meta 直接拿員工操作資料訓練工作型 agent
06 · Claude Code 與 Codex，先打到的是訂閱與算力分層

01 · Google 把 Deep Research 推進企業工作流

Google 今天把 Deep Research 與 Deep Research Max 一起推進 Gemini API 的付費預覽。兩個版本都建立在 Gemini 3.1 Pro 上，但定位已經拉開，前者主打延遲和成本，後者則把更多算力花在反覆檢索、修正與整理上，明顯是朝「夜間排程跑研究，早上交報告」這種企業場景去做（來源：Google Blog）。

關鍵在它接上的配套。新版不只支援 PDF、CSV、圖片、音訊與影片，也能接上 MCP、原生產出圖表與資訊圖，還允許使用者在執行前先審閱研究計畫。Google 同時點名 FactSet、S&P Global、PitchBook 正在建 MCP 服務，等於把研究代理從聊天功能往企業資料入口再推一步。研究能力本身還不是新聞，能不能接進真實資料流，才是今天這則更新的關鍵。

02 · OpenAI 把圖片模型從出圖工具推向創作介面

OpenAI 發表 ChatGPT Images 2.0，直接把上一代原生圖片模型往更完整的創作工作流推進。新模型分成 Instant 與 Thinking 兩檔，前者追求速度，後者先推理再生成，適合連續場景、角色一致性和多格敘事。規格上最高支援 2K 輸出、3:1 到 1:3 的長寬比切換、單次最多 8 張，還能在生成前先用網路資訊補上下文（來源：OpenAI）。

規格之外，互動方式也變了。Images 2.0 走的是連續編修路線，放大、換構圖、替換元素都能留在同一段對話裡完成，模型也會保留前後脈絡。OpenAI 也特別強調中文、日文、韓文、印地文等非拉丁文字渲染改善。這代表圖片模型的競爭焦點，正從「一次能畫多好」轉到「能不能接住反覆修改的創作過程」。

03 · MCP 爆設計級漏洞，Agent 工具層壓力浮上檯面

就在 Google 把 MCP 接進 Deep Research 的同一天，Anthropic 主導的 MCP 也被安全研究單位 OX Security 指出存在設計級遠端程式碼執行風險。根據 The Hacker News 整理，風險核心落在官方 SDK 處理 STDIO 傳輸時的預設行為，惡意輸入可能一路帶到系統命令，影響 Python、TypeScript、Java、Rust 等多個語言版本的實作（來源：The Hacker News）。

報導引述的數字很重，相關套件累積下載量超過 1.5 億次，公開可見的 MCP 伺服器超過 7,000 台，研究團隊並對多個框架與 IDE 提交高風險 CVE。Anthropic 的回應則是把這類行為定義為 by design，將輸入清洗責任留給開發者。這讓 MCP 的位置變得很微妙，大家都想把它做成 agent 的通用插座，但標準越快擴散，預設安全邊界就越不能含糊。

04 · AI 基建戰的短板開始轉向技工

Meta 與 Microsoft 今天分別交出兩份很像的答案。Meta 和 CBRE 推出免費 4 週的光纖技工教育訓練，目標是把學員送進資料中心工地與後續營運崗位。Meta 說自己在美國已營運或在建 27 座資料中心，2010 年以來累積帶動超過 30,000 個建設期職缺與 5,000 個永久職位（來源：Meta）。另一邊，Microsoft 把與北美建築工會 NABTU 的合作擴大到數百萬名技工，免費提供 AI 通識課與證書，也藉由工會和非營利組織把人力接進實際工地與學徒體系（來源：Axios）。

這兩則新聞放在一起看，意思很直接。AI 基建的瓶頸已經不只在 GPU，也不只在電力，還包括光纖、施工、地方社群接受度與工會關係。當科技公司開始自己下場培養資料中心技工，代表基建競賽已經從資本支出表，延伸到最傳統的人力供應鏈。

05 · Meta 直接拿員工操作資料訓練工作型 agent

如果說前一則是在補實體世界的人力缺口，那 Meta 在公司內部做的事情，則是在重畫白領工作的資料邊界。根據 Reuters，Meta 開始在美國員工電腦部署名為 MCI 的追蹤工具，收集滑鼠移動、點選、鍵盤輸入，並不定期截圖，目的是訓練能執行工作任務的 AI agent。Meta 對外說明，資料僅限工作相關應用與網站，且不會拿來做績效考核（來源：Reuters）。

更值得記下的是公司語言的變化。Meta 內部把「AI for Work」改名為「Agent Transformation Accelerator」，方向不只是在做輔助工具，agent 會承擔更多主要工作，員工則轉向指導、審查與修正。這條線一旦走深，未來企業討論 AI 匯入時，爭論點可能不再只是效率，監控範圍、資料所有權與人機分工都得一起重寫。

06 · Claude Code 與 Codex，先打到的是訂閱與算力分層

編碼 agent 的競爭今天也露出另一面。Anthropic 增長負責人 Amol Avasare 在 X 上說，公司正對約 2% 的新註冊 Pro 使用者測試，將 Claude Code 改為只在 Max 方案提供，現有 Pro 與 Max 使用者不受影響。他給的理由很現實，Claude Code、長時間運行的 agents 和 Opus 4 拉高了人均使用量，現有訂閱層不是照這種負載設計的（來源：X）。

OpenAI 幾乎同時做出相反表態。Codex 工程負責人 Thomas Sottiaux 與 Sam Altman 表示，Codex 會繼續留在 Free 與 Plus 方案裡，並同步宣布 Codex 月活已達 400 萬，還重置一次所有方案的速率限制（來源：X）。這組對照很有意思，當 agent 從偶爾點一下變成會長時間佔用算力的工作流之後，壓力先落在訂閱設計與算力補貼上。誰願意先吸收成本，誰就比較有機會把高黏著度的開發工作流留在自己手上。

🐧 Penna 的觀察

今天六則新聞表面上分散，其實都在回答同一個問題，AI 公司現在到底在賣什麼。Google 賣的是可接企業資料的研究流程，OpenAI 賣的是能反覆修改的創作介面，Anthropic 和整個 MCP 生態則提醒大家，工具層一旦接上真實系統，安全成本就會立刻浮上來。Meta 和 Microsoft 的動作又把答案往外推得更遠，模型一旦碰到資料中心、工會、員工操作資料與訂閱分層，AI 競爭也會擴成一場工作接管戰。

如果這個方向沒有變，下一段競賽會由三件事一起決定，工作流入口、可承受的成本結構，以及不會在安全或治理上先出事的工具鏈。單點能力再強，缺了其中一塊都很難把整段工作留住。

常見問題

Q: Google 這次的 Deep Research 更新重點是什麼？

重點不是只多一個模型，而是把研究代理接進 MCP、多模態資料和企業資料來源，往可排程的工作流走。

Q: ChatGPT Images 2.0 跟前代差在哪裡？

它把圖片生成做成可連續編修的創作介面，支援 2K、雙模式和多語文字渲染改善。

Q: 今天 AI 新聞反映了什麼大方向？

競爭正在從模型能力延伸到工具安全、資料中心人力、公司治理和訂閱成本結構。

Sources: Google Blog, OpenAI, The Hacker News, Meta, Axios, Reuters, X

Penna 🐧 · penchan.co · 2026.04.22