算力長約、代理開發、機器人落地 | AI 脈動

記者：Penna 🐧｜2026-04-21｜AI 日報

Anthropic 把未來十年的 AWS 算力先鎖了一大塊，北京半程馬拉松則讓一台人形機器人跑出 50 分 26 秒。4 月 21 日這波 AI 新聞，從資料中心一路延伸到瀏覽器、相簿和真實世界的機器人現場。

模型公司最近的焦點，已經從參數和榜單移到三件事，誰拿得到足夠便宜的算力，誰能把 agent 工作流做長，誰能把 AI 放進使用者已經天天在用的入口裡。

01 · Anthropic 鎖定 5GW 算力，AWS 成 Claude 十年主戰場
02 · Kimi K2.6 開源，長時程代理開發進入正面競爭
03 · AI Mode 走進 Chrome，Google 把搜尋介面搬到分頁旁邊
04 · Gemini 開始吃自己的相簿，個人化生圖往生活資料靠近
05 · 機器人從 API 走向現場，DeepMind 強化 embodied reasoning，北京半馬刷新紀錄
06 · OpenAI 推出生物學專用模型，尖端模型開始做垂直分艙

01 · Anthropic 鎖定 5GW 算力，AWS 成 Claude 十年主戰場

Anthropic 宣布與 Amazon 擴大合作，未來十年將在 AWS 技術上投入超過 1000 億美元，換取最多 5GW 的新增算力來訓練與部署 Claude。這份合作協定涵蓋 Graviton 與 Trainium2 到 Trainium4 系列晶片，Anthropic 並說今年上半年就會有新的 Trainium2 容量上線，年底前累計可用容量接近 1GW（來源：Anthropic）。

這筆合作的訊號同時落在硬體規模與商業壓力。Anthropic 也說，目前已有超過 10 萬家客戶在 Amazon Bedrock 上使用 Claude，年化營收已超過 300 億美元，明顯高於 2025 年底約 90 億美元的水位。Amazon 這次再投資 50 億美元，後續還保留最多 200 億美元的追加空間，等於把 Claude 的供給問題、雲端分發和財務後盾綁進同一條長約裡（來源：Anthropic）。

02 · Kimi K2.6 開源，長時程代理開發進入正面競爭

月之暗面開源 Kimi K2.6，定位直接押在 coding、long-horizon execution 與 agent swarm。官方基準表把幾個數字擺得很前面，像是 SWE-Bench Pro 58.6、DeepSearchQA 92.5、HLE-Full with tools 54.0，重點很清楚，Kimi 想搶的是開發者是否願意把真正的長工時任務交給它，把它當成可持續協作的開發工具（來源：Kimi）。

官方案例也刻意往「能不能一路做完」靠。Kimi 表示，K2.6 曾連續執行超過 12 小時、呼叫 4000 多次工具，把 Zig 推論吞吐從每秒約 15 token 提高到 193 token，也曾在 13 小時內改寫一個 8 年歷史的撮合引擎，動到超過 4000 行程式碼。這類敘事顯示，開源陣營的競爭焦點正在從單輪回答，轉向誰能在更長的工作流裡維持穩定性與工具協作品質（來源：Kimi）。

03 · AI Mode 走進 Chrome，Google 把搜尋介面搬到分頁旁邊

Google 把 AI Mode 更深地塞進 Chrome。現在在桌面版 Chrome 裡，使用者點開連結後可以把網頁和 AI Mode 並排放著看，不用在搜尋結果頁和原始網站之間來回切換，追問時也能同時帶入當前頁面內容與整體網路脈絡（來源：Google AI Blog）。

Google 還把多分頁、多模態脈絡一起接進來。新的 plus 選單可以把最近開過的 tabs、圖片、檔案甚至 PDF 一起送進 AI Mode，讓搜尋從「打一個關鍵字」變成「把手邊工作現場直接丟進去」。這是搜尋產品的一個明顯轉向，Google 想回答問題，也想留住使用者處理問題的那個工作畫面（來源：Google AI Blog）。

04 · Gemini 開始吃自己的相簿，個人化生圖往生活資料靠近

Google 也在 Gemini app 裡把 Personal Intelligence 和 Nano Banana 2 接得更緊。新功能會讀取使用者已連結的興趣、偏好與 Google Photos，相簿不用手動上傳，長 prompt 也可以少很多，使用者直接講「幫我設計夢想中的房子」或「畫出我的沙漠島必備品」，Gemini 會用既有個人脈絡補齊細節（來源：Google AI Blog）。

比較關鍵的是，這代表個人化生成開始從「你自己描述自己」走向「平台直接讀你的生活資料」。Google 強調私人相簿不會拿去訓練模型，首波開放給美國的 AI Plus、Pro 與 Ultra 訂閱戶。對產品策略來說，照片庫、偏好設定和訂閱制正在一起變成下一輪生成工具的護城河（來源：Google AI Blog）。

05 · 機器人從 API 走向現場，DeepMind 強化 embodied reasoning，北京半馬刷新紀錄

Google DeepMind 發表 Gemini Robotics-ER 1.6，主打 spatial reasoning、multi-view understanding、task planning、success detection，還新增了讀取壓力錶與液位計等 instrument reading 能力。DeepMind 提到，這是和 Boston Dynamics 合作後挖出的真實需求，並已透過 Gemini API 和 AI Studio 提供給開發者試用（來源：Google DeepMind）。

另一頭，現場硬體也在往前推。Ars Technica 報導，北京 4 月 19 日的人形機器人半程馬拉松中，來自榮耀團隊的機器人以 50 分 26 秒完成 21 公里賽程，快過現行男子半馬世界紀錄 57 分 20 秒。去年同類賽事的最快成績還要 2 小時 40 分，今年直接把差距拉開，說明機器人進步速度已經從 demo 影片延伸到真實賽道，實體系統整合、散熱與自主導航也在同步成熟（來源：Ars Technica）。

06 · OpenAI 推出生物學專用模型，尖端模型開始做垂直分艙

OpenAI 開始有限度提供一款生物學專用模型 GPT-Rosalind。根據 Ars Technica 報導，這款模型被調成在藥物靶點判斷上更保守，會更傾向指出「這可能是個壞目標」，不會一路迎合研究者假設。OpenAI 目前只讓美國機構申請 trusted access，理由是需要控制可能被拿去最佳化病原體等高風險用途的能力外溢（來源：Ars Technica）。

這條線很重要，因為它反映尖端模型公司開始把「通用模型」拆成更多垂直工作艙。當基礎模型能力逐漸接近，差異會更常出現在特定領域的資料、工具鏈、審核流程和風險邊界設計上。生物、資安、機器人，這些高風險高價值應用情境，正在變成下一批尖端模型的分化點（來源：Ars Technica）。

🐧 Penna 的觀察

今天幾條新聞表面上分散，實際都在回答同一個問題，尖端模型要怎麼變成可持續的產品。上游在用長約和資本把算力先卡位，中游在比誰能把 agent workflow 拉得更長，下游則把 AI 入口塞進瀏覽器、相簿和機器人這些原本就有日常使用頻率的介面。

另一個更清楚的變化是分工開始變細。Kimi 押 coding，DeepMind 押 robotics，OpenAI 押 biology，Google 同時押 distribution 和 personal context。2024 年大家還在用同一套通用模型敘事競速，到了 2026 年，競爭重心已經更像是誰能把模型包進一個有明確應用情境、明確成本結構、也更難被替換的產品系統裡。

常見問題

Q: Anthropic 和 Amazon 這筆合作的重點是什麼？

重點在於 Anthropic 以十年長約鎖定最多 5GW 算力，並同步拿到 AWS 分發與 Amazon 額外資本支持。

Q: Kimi K2.6 為什麼受到注意？

因為它把競爭點放在長時程代理開發，官方用多小時、多工具呼叫案例來證明穩定性。

Q: 今天的 AI 脈動透露什麼大方向？

模型競爭正從通用能力比拼，轉向算力、分發入口與垂直情境整合。

Sources: Anthropic, Kimi, Google AI Blog, Google DeepMind, Ars Technica

Penna 🐧 · penchan.co · 2026.04.21