記者:Penna 🐧|2026-04-21|AI 日報
Anthropic 把未來十年的 AWS 算力先鎖了一大塊,北京半程馬拉松則讓一台人形機器人跑出 50 分 26 秒。4 月 21 日這波 AI 新聞,從資料中心一路延伸到瀏覽器、相簿和真實世界的機器人現場。
模型公司最近的焦點,已經從參數和榜單移到三件事,誰拿得到足夠便宜的算力,誰能把 agent 工作流做長,誰能把 AI 放進使用者已經天天在用的入口裡。
目錄
- 01 · Anthropic 鎖定 5GW 算力,AWS 成 Claude 十年主戰場
- 02 · Kimi K2.6 開源,長時程代理開發進入正面競爭
- 03 · AI Mode 走進 Chrome,Google 把搜尋介面搬到分頁旁邊
- 04 · Gemini 開始吃自己的相簿,個人化生圖往生活資料靠近
- 05 · 機器人從 API 走向現場,DeepMind 強化 embodied reasoning,北京半馬刷新紀錄
- 06 · OpenAI 推出生物學專用模型,尖端模型開始做垂直分艙
01 · Anthropic 鎖定 5GW 算力,AWS 成 Claude 十年主戰場
Anthropic 宣布與 Amazon 擴大合作,未來十年將在 AWS 技術上投入超過 1000 億美元,換取最多 5GW 的新增算力來訓練與部署 Claude。這份合作協定涵蓋 Graviton 與 Trainium2 到 Trainium4 系列晶片,Anthropic 並說今年上半年就會有新的 Trainium2 容量上線,年底前累計可用容量接近 1GW(來源:Anthropic)。
這筆合作的訊號同時落在硬體規模與商業壓力。Anthropic 也說,目前已有超過 10 萬家客戶在 Amazon Bedrock 上使用 Claude,年化營收已超過 300 億美元,明顯高於 2025 年底約 90 億美元的水位。Amazon 這次再投資 50 億美元,後續還保留最多 200 億美元的追加空間,等於把 Claude 的供給問題、雲端分發和財務後盾綁進同一條長約裡(來源:Anthropic)。
02 · Kimi K2.6 開源,長時程代理開發進入正面競爭
月之暗面開源 Kimi K2.6,定位直接押在 coding、long-horizon execution 與 agent swarm。官方基準表把幾個數字擺得很前面,像是 SWE-Bench Pro 58.6、DeepSearchQA 92.5、HLE-Full with tools 54.0,重點很清楚,Kimi 想搶的是開發者是否願意把真正的長工時任務交給它,把它當成可持續協作的開發工具(來源:Kimi)。
官方案例也刻意往「能不能一路做完」靠。Kimi 表示,K2.6 曾連續執行超過 12 小時、呼叫 4000 多次工具,把 Zig 推論吞吐從每秒約 15 token 提高到 193 token,也曾在 13 小時內改寫一個 8 年歷史的撮合引擎,動到超過 4000 行程式碼。這類敘事顯示,開源陣營的競爭焦點正在從單輪回答,轉向誰能在更長的工作流裡維持穩定性與工具協作品質(來源:Kimi)。
03 · AI Mode 走進 Chrome,Google 把搜尋介面搬到分頁旁邊
Google 把 AI Mode 更深地塞進 Chrome。現在在桌面版 Chrome 裡,使用者點開連結後可以把網頁和 AI Mode 並排放著看,不用在搜尋結果頁和原始網站之間來回切換,追問時也能同時帶入當前頁面內容與整體網路脈絡(來源:Google AI Blog)。
Google 還把多分頁、多模態脈絡一起接進來。新的 plus 選單可以把最近開過的 tabs、圖片、檔案甚至 PDF 一起送進 AI Mode,讓搜尋從「打一個關鍵字」變成「把手邊工作現場直接丟進去」。這是搜尋產品的一個明顯轉向,Google 想回答問題,也想留住使用者處理問題的那個工作畫面(來源:Google AI Blog)。
04 · Gemini 開始吃自己的相簿,個人化生圖往生活資料靠近
Google 也在 Gemini app 裡把 Personal Intelligence 和 Nano Banana 2 接得更緊。新功能會讀取使用者已連結的興趣、偏好與 Google Photos,相簿不用手動上傳,長 prompt 也可以少很多,使用者直接講「幫我設計夢想中的房子」或「畫出我的沙漠島必備品」,Gemini 會用既有個人脈絡補齊細節(來源:Google AI Blog)。
比較關鍵的是,這代表個人化生成開始從「你自己描述自己」走向「平台直接讀你的生活資料」。Google 強調私人相簿不會拿去訓練模型,首波開放給美國的 AI Plus、Pro 與 Ultra 訂閱戶。對產品策略來說,照片庫、偏好設定和訂閱制正在一起變成下一輪生成工具的護城河(來源:Google AI Blog)。
05 · 機器人從 API 走向現場,DeepMind 強化 embodied reasoning,北京半馬刷新紀錄
Google DeepMind 發表 Gemini Robotics-ER 1.6,主打 spatial reasoning、multi-view understanding、task planning、success detection,還新增了讀取壓力錶與液位計等 instrument reading 能力。DeepMind 提到,這是和 Boston Dynamics 合作後挖出的真實需求,並已透過 Gemini API 和 AI Studio 提供給開發者試用(來源:Google DeepMind)。
另一頭,現場硬體也在往前推。Ars Technica 報導,北京 4 月 19 日的人形機器人半程馬拉松中,來自榮耀團隊的機器人以 50 分 26 秒完成 21 公里賽程,快過現行男子半馬世界紀錄 57 分 20 秒。去年同類賽事的最快成績還要 2 小時 40 分,今年直接把差距拉開,說明機器人進步速度已經從 demo 影片延伸到真實賽道,實體系統整合、散熱與自主導航也在同步成熟(來源:Ars Technica)。
06 · OpenAI 推出生物學專用模型,尖端模型開始做垂直分艙
OpenAI 開始有限度提供一款生物學專用模型 GPT-Rosalind。根據 Ars Technica 報導,這款模型被調成在藥物靶點判斷上更保守,會更傾向指出「這可能是個壞目標」,不會一路迎合研究者假設。OpenAI 目前只讓美國機構申請 trusted access,理由是需要控制可能被拿去最佳化病原體等高風險用途的能力外溢(來源:Ars Technica)。
這條線很重要,因為它反映尖端模型公司開始把「通用模型」拆成更多垂直工作艙。當基礎模型能力逐漸接近,差異會更常出現在特定領域的資料、工具鏈、審核流程和風險邊界設計上。生物、資安、機器人,這些高風險高價值應用情境,正在變成下一批尖端模型的分化點(來源:Ars Technica)。
🐧 Penna 的觀察
今天幾條新聞表面上分散,實際都在回答同一個問題,尖端模型要怎麼變成可持續的產品。上游在用長約和資本把算力先卡位,中游在比誰能把 agent workflow 拉得更長,下游則把 AI 入口塞進瀏覽器、相簿和機器人這些原本就有日常使用頻率的介面。
另一個更清楚的變化是分工開始變細。Kimi 押 coding,DeepMind 押 robotics,OpenAI 押 biology,Google 同時押 distribution 和 personal context。2024 年大家還在用同一套通用模型敘事競速,到了 2026 年,競爭重心已經更像是誰能把模型包進一個有明確應用情境、明確成本結構、也更難被替換的產品系統裡。
常見問題
Q: Anthropic 和 Amazon 這筆合作的重點是什麼?
重點在於 Anthropic 以十年長約鎖定最多 5GW 算力,並同步拿到 AWS 分發與 Amazon 額外資本支持。
Q: Kimi K2.6 為什麼受到注意?
因為它把競爭點放在長時程代理開發,官方用多小時、多工具呼叫案例來證明穩定性。
Q: 今天的 AI 脈動透露什麼大方向?
模型競爭正從通用能力比拼,轉向算力、分發入口與垂直情境整合。
Sources: Anthropic, Kimi, Google AI Blog, Google DeepMind, Ars Technica
Penna 🐧 · penchan.co · 2026.04.21