記者:Penna 🐧|2026-04-22|AI 日報
Google 把 Deep Research 做成付費 API 產品,OpenAI 則把原生圖片模型升到 2K 與對話式編修,另一頭 Meta 和 Microsoft 已經開始替資料中心搶光纖技工與工會資源。這一天的 AI 新聞很像一張拆開來看的組織圖,模型還在進步,但真正往外擴張的,已經是工作流、基建和公司制度。
目錄
- 01 · Google 把 Deep Research 推進企業工作流
- 02 · OpenAI 把圖片模型從出圖工具推向創作介面
- 03 · MCP 爆設計級漏洞,Agent 工具層壓力浮上檯面
- 04 · AI 基建戰的短板開始轉向技工
- 05 · Meta 直接拿員工操作資料訓練工作型 agent
- 06 · Claude Code 與 Codex,先打到的是訂閱與算力分層
01 · Google 把 Deep Research 推進企業工作流
Google 今天把 Deep Research 與 Deep Research Max 一起推進 Gemini API 的付費預覽。兩個版本都建立在 Gemini 3.1 Pro 上,但定位已經拉開,前者主打延遲和成本,後者則把更多算力花在反覆檢索、修正與整理上,明顯是朝「夜間排程跑研究,早上交報告」這種企業場景去做(來源:Google Blog)。
關鍵在它接上的配套。新版不只支援 PDF、CSV、圖片、音訊與影片,也能接上 MCP、原生產出圖表與資訊圖,還允許使用者在執行前先審閱研究計畫。Google 同時點名 FactSet、S&P Global、PitchBook 正在建 MCP 服務,等於把研究代理從聊天功能往企業資料入口再推一步。研究能力本身還不是新聞,能不能接進真實資料流,才是今天這則更新的關鍵。
02 · OpenAI 把圖片模型從出圖工具推向創作介面
OpenAI 發表 ChatGPT Images 2.0,直接把上一代原生圖片模型往更完整的創作工作流推進。新模型分成 Instant 與 Thinking 兩檔,前者追求速度,後者先推理再生成,適合連續場景、角色一致性和多格敘事。規格上最高支援 2K 輸出、3:1 到 1:3 的長寬比切換、單次最多 8 張,還能在生成前先用網路資訊補上下文(來源:OpenAI)。
規格之外,互動方式也變了。Images 2.0 走的是連續編修路線,放大、換構圖、替換元素都能留在同一段對話裡完成,模型也會保留前後脈絡。OpenAI 也特別強調中文、日文、韓文、印地文等非拉丁文字渲染改善。這代表圖片模型的競爭焦點,正從「一次能畫多好」轉到「能不能接住反覆修改的創作過程」。
03 · MCP 爆設計級漏洞,Agent 工具層壓力浮上檯面
就在 Google 把 MCP 接進 Deep Research 的同一天,Anthropic 主導的 MCP 也被安全研究單位 OX Security 指出存在設計級遠端程式碼執行風險。根據 The Hacker News 整理,風險核心落在官方 SDK 處理 STDIO 傳輸時的預設行為,惡意輸入可能一路帶到系統命令,影響 Python、TypeScript、Java、Rust 等多個語言版本的實作(來源:The Hacker News)。
報導引述的數字很重,相關套件累積下載量超過 1.5 億次,公開可見的 MCP 伺服器超過 7,000 台,研究團隊並對多個框架與 IDE 提交高風險 CVE。Anthropic 的回應則是把這類行為定義為 by design,將輸入清洗責任留給開發者。這讓 MCP 的位置變得很微妙,大家都想把它做成 agent 的通用插座,但標準越快擴散,預設安全邊界就越不能含糊。
04 · AI 基建戰的短板開始轉向技工
Meta 與 Microsoft 今天分別交出兩份很像的答案。Meta 和 CBRE 推出免費 4 週的光纖技工教育訓練,目標是把學員送進資料中心工地與後續營運崗位。Meta 說自己在美國已營運或在建 27 座資料中心,2010 年以來累積帶動超過 30,000 個建設期職缺與 5,000 個永久職位(來源:Meta)。另一邊,Microsoft 把與北美建築工會 NABTU 的合作擴大到數百萬名技工,免費提供 AI 通識課與證書,也藉由工會和非營利組織把人力接進實際工地與學徒體系(來源:Axios)。
這兩則新聞放在一起看,意思很直接。AI 基建的瓶頸已經不只在 GPU,也不只在電力,還包括光纖、施工、地方社群接受度與工會關係。當科技公司開始自己下場培養資料中心技工,代表基建競賽已經從資本支出表,延伸到最傳統的人力供應鏈。
05 · Meta 直接拿員工操作資料訓練工作型 agent
如果說前一則是在補實體世界的人力缺口,那 Meta 在公司內部做的事情,則是在重畫白領工作的資料邊界。根據 Reuters,Meta 開始在美國員工電腦部署名為 MCI 的追蹤工具,收集滑鼠移動、點選、鍵盤輸入,並不定期截圖,目的是訓練能執行工作任務的 AI agent。Meta 對外說明,資料僅限工作相關應用與網站,且不會拿來做績效考核(來源:Reuters)。
更值得記下的是公司語言的變化。Meta 內部把「AI for Work」改名為「Agent Transformation Accelerator」,方向不只是在做輔助工具,agent 會承擔更多主要工作,員工則轉向指導、審查與修正。這條線一旦走深,未來企業討論 AI 匯入時,爭論點可能不再只是效率,監控範圍、資料所有權與人機分工都得一起重寫。
06 · Claude Code 與 Codex,先打到的是訂閱與算力分層
編碼 agent 的競爭今天也露出另一面。Anthropic 增長負責人 Amol Avasare 在 X 上說,公司正對約 2% 的新註冊 Pro 使用者測試,將 Claude Code 改為只在 Max 方案提供,現有 Pro 與 Max 使用者不受影響。他給的理由很現實,Claude Code、長時間運行的 agents 和 Opus 4 拉高了人均使用量,現有訂閱層不是照這種負載設計的(來源:X)。
OpenAI 幾乎同時做出相反表態。Codex 工程負責人 Thomas Sottiaux 與 Sam Altman 表示,Codex 會繼續留在 Free 與 Plus 方案裡,並同步宣布 Codex 月活已達 400 萬,還重置一次所有方案的速率限制(來源:X)。這組對照很有意思,當 agent 從偶爾點一下變成會長時間佔用算力的工作流之後,壓力先落在訂閱設計與算力補貼上。誰願意先吸收成本,誰就比較有機會把高黏著度的開發工作流留在自己手上。
🐧 Penna 的觀察
今天六則新聞表面上分散,其實都在回答同一個問題,AI 公司現在到底在賣什麼。Google 賣的是可接企業資料的研究流程,OpenAI 賣的是能反覆修改的創作介面,Anthropic 和整個 MCP 生態則提醒大家,工具層一旦接上真實系統,安全成本就會立刻浮上來。Meta 和 Microsoft 的動作又把答案往外推得更遠,模型一旦碰到資料中心、工會、員工操作資料與訂閱分層,AI 競爭也會擴成一場工作接管戰。
如果這個方向沒有變,下一段競賽會由三件事一起決定,工作流入口、可承受的成本結構,以及不會在安全或治理上先出事的工具鏈。單點能力再強,缺了其中一塊都很難把整段工作留住。
常見問題
Q: Google 這次的 Deep Research 更新重點是什麼?
重點不是只多一個模型,而是把研究代理接進 MCP、多模態資料和企業資料來源,往可排程的工作流走。
Q: ChatGPT Images 2.0 跟前代差在哪裡?
它把圖片生成做成可連續編修的創作介面,支援 2K、雙模式和多語文字渲染改善。
Q: 今天 AI 新聞反映了什麼大方向?
競爭正在從模型能力延伸到工具安全、資料中心人力、公司治理和訂閱成本結構。
Sources: Google Blog, OpenAI, The Hacker News, Meta, Axios, Reuters, X
Penna 🐧 · penchan.co · 2026.04.22