一個數學猜想被 AI 找到反例,一個搜尋框開始跑 24 小時資訊代理,一份 SEC 文件把算力租約寫成每月 12.5 億美元。今天的 AI 新聞,表面上很分散,底下都在問同一件事:AI 開始替人做事後,哪些環節能被檢查、計價與追責。
目錄
- 01 · OpenAI 宣稱模型推翻離散幾何長年猜想
- 02 · Google 把 AI Search 接上廣告、購物與商業代理
- 03 · SpaceX 文件揭露 Anthropic 的 Colossus 算力租約
- 04 · Co-Scientist 把老化研究的文獻搜尋壓到數天尺度
- 05 · Google Beam 用空間音訊與真實比例補混合會議落差
- 06 · Figure AI 直播人形機器人,demo 與量產能力被放在同一個畫面裡
01 · OpenAI 宣稱模型推翻離散幾何長年猜想
OpenAI 5 月 20 日發布研究進展,稱一個內部通用 reasoning model 解開 planar unit distance problem 的核心猜想。這個問題最早由 Paul Erdős 在 1946 年提出:平面上放 n 個點時,能有多少對點的距離剛好為 1。數學界長期相信 square grid 類構造已經接近上限,OpenAI 表示模型找到一個無限族反例,帶來 polynomial improvement。(來源:OpenAI)
這則新聞的重量不在「AI 又會做數學」這種空話,而在可驗證性。OpenAI 表示證明已由外部數學家檢查,並公開 proof、companion paper 與 abridged chain of thought。文章也說,這個模型沒有針對單一數學題特訓,沒有專門為 unit distance problem 設計搜尋 scaffold,而是在測試一組 Erdős problems 時產生證明。(來源:OpenAI)
數學是 AI research 的硬場景。答案不能只像,長證明裡每一步都要站得住。這次結果如果經過更廣泛社群檢查後仍成立,會把「AI 當研究助理」往前推一格:它不只整理文獻或補 lemma,而是能把代數數論裡的工具帶進離散幾何,讓人類再判讀那條新路徑的意義。
02 · Google 把 AI Search 接上廣告、購物與商業代理
Google I/O 後的第二天,Search 的商業答案浮出水面。Google Ads 團隊宣布,正在測試由 Gemini 建構的新廣告格式,包括 Conversational Discovery ads、Highlighted Answers、AI-powered Shopping ads 與 Business Agent for Leads。這些格式會在 AI Mode 或 Search 中,用 Gemini 產生產品解釋、購物理由或品牌聊天代理,並維持 Sponsored 標示。(來源:Google Ads & Commerce Blog)
這和前一天 Search 團隊宣布的 information agents 剛好接上。Google 說,Search agents 會在背景 24/7 追蹤網頁、新聞、社群,以及即時金融、購物、運動資料,先開放給 Google AI Pro 與 Ultra 訂閱戶。Search 還會擴大 booking capabilities,讓使用者用自然語言描述需求,再接到價格、可用性與供應商頁面。(來源:Google Search Blog)
搜尋的交易位置正在移動。過去 Google 把使用者送往外部頁面,廣告多半貼在查詢與結果旁邊;AI Mode 把比較、說明、追蹤、預約與購物前對話都拉回同一個介面。對出版商、商家與使用者來說,接下來要看的重點會是 Sponsored 標示夠不夠清楚、資料來源是否能追溯,以及代理把哪一步留給人類確認。
03 · SpaceX 文件揭露 Anthropic 的 Colossus 算力租約
Simon Willison 5 月 20 日整理 SpaceX S-1 文件時,摘出一段關於 Anthropic 的算力租約。文件寫到,SpaceX 旗下 Colossus 與 Colossus II 除了支援 Grok 5 訓練,也會向第三方提供部分算力;2026 年 5 月,SpaceX 與 Anthropic PBC 簽下 cloud services agreements,Anthropic 同意每月支付 12.5 億美元,合約到 2029 年 5 月,5 月與 6 月有 ramping reduced fee,雙方可提前 90 天終止。(來源:SpaceX S-1 / Simon Willison)
這個數字讓模型競爭從 benchmark 走回機房。Anthropic 最近的產品敘事集中在 Claude、Claude Code、Claude Cowork 與企業 agent;要讓這些產品穩定跑起來,背後需要長期算力承諾。每月 12.5 億美元屬於大型基礎設施支出,直接把模型能力、推理容量、產品成長與資料中心供給綁成同一張表。
它也提醒另一件事:算力供應正在變成跨公司、跨競爭者的複雜網路。SpaceX 文件同時提到 Grok 5 在 Colossus II 訓練,而 Anthropic 是第三方客戶。模型公司之間在產品層競爭,底層可能共享、租用或爭奪同一批電力、GPU、網路與冷卻資源。AI 的下一段速度,很大一部分會由這些長約決定。
04 · Co-Scientist 把老化研究的文獻搜尋壓到數天尺度
Google DeepMind 5 月 19 日更新 Co-Scientist 案例,介紹 Abudayyeh-Gootenberg Lab 如何用它尋找 reverse cellular aging 的 genetic leads。該實驗室會開關數千個基因,觀察細胞如何從 senescence 這種和老化相關的受損狀態,往更年輕、功能較好的狀態移動。(來源:Google DeepMind)
DeepMind 說,Co-Scientist 先掃描數萬篇論文,提出 20 多個新的、可測試的遺傳因子;實驗室測試後,有幾個建議因子能讓細胞呈現更年輕的狀態。另一個環節是資料判讀:研究團隊過去可能要花到六個月,把大規模 screen 的結果和分散在文獻裡的線索接起來;Co-Scientist 把這段縮到幾天。(來源:Google DeepMind)
這種工具的價值在於把搜尋空間壓小,而非替科學家按下「發現」按鈕。生物研究裡常見的難點是資料太碎、假設太多、實驗成本太高。AI 在這裡的角色比較像候選路徑產生器:先把文獻、screen 結果與假設排成可測清單,再交給實驗驗證。
05 · Google Beam 用空間音訊與真實比例補混合會議落差
Google 5 月 20 日也把 Google Beam 推到 group meetings 場景。這個實驗會在 HP Dimension 的沉浸式顯示器上,把從非 Beam 裝置加入的遠端參與者,以接近真實大小的位置呈現,像坐在同一張桌子周圍;空間音訊則會把聲音固定到發言者的位置。(來源:Google Blog)
Google 說,這些調整會自動發生,不管使用者在家或辦公室加入。官方研究指出,類似方法可以帶來 50% 更強的 social connection 感受,以及 21% 的 reported ability to contribute 增加。Google 也表示會持續和 Google Workspace、Zoom 合作,把 Beam 接進現有會議流程。(來源:Google Blog)
這則新聞比模型發布安靜,但它代表 AI 正在進入協作介面的細節層。遠端會議的問題不只是不夠清晰,還有誰被看見、誰容易插話、誰在對話裡變成旁觀者。Beam 的方向是用視覺比例、座位感和聲音位置修補這個落差,讓「遠端」不要只剩一格一格的小視窗。
06 · Figure AI 直播人形機器人,demo 與量產能力被放在同一個畫面裡
Ars Technica 5 月 20 日報導,Figure AI 連續多天直播 Figure 03 人形機器人把包裹放上輸送帶,過程中一度安排機器人和人類實習生對比。這個 demo 從 5 月 13 日開始,原本是八小時展示,任務是辨識小包裹上的條碼,將條碼朝下放到輸送帶上;Figure CEO Brett Adcock 稱任務由機器人自主完成。(來源:Ars Technica)
這種直播很適合網路觀看,也很容易被誤讀。Ars 的提醒是,精彩 demo 只能顯示某個受控任務窗口,不能直接等同於通用現場能力。Figure 自家新聞頁近期也集中在 Helix 02、Figure 03、BMW 產線與 logistics 場景,顯示它正在把人形機器人的敘事從研究影片推向製造與倉儲任務。(來源:Ars Technica / Figure)
人形機器人的考題和 chatbot 不一樣。文字模型錯一次,多半是回答要修;機器人錯一次,可能碰到物品、裝置、動線和人的安全。這就是為什麼直播很有用,也很不夠:它能讓外界看到速度、穩定性與故障樣態,但真正的量產能力仍要看長時間工時、維修頻率、環境變化與安全停機設計。
🐧 Penna 的觀察
今天的六則新聞,剛好把 AI 的三種「現實檢查」排在一起。
第一種是知識檢查。OpenAI 的離散幾何證明、DeepMind 的 Co-Scientist 都把 AI 放進可以驗證的研究流程。模型提出答案不夠,還要公開證明、實驗結果、外部專家判讀,讓別人能從頭檢查。
第二種是商業檢查。Google Search agents 和 AI ads 讓搜尋從資訊入口變成交易前操作層。這會帶來新的收入空間,也會帶來新的標示責任:使用者要知道哪一段是答案、哪一段是廣告、哪一步是 agent 自動做的。
第三種是物理檢查。Anthropic 的 Colossus 租約、Google Beam 的會議裝置、Figure AI 的機器人直播,都把 AI 拉回電力、硬體、空間和安全。軟體可以每天更新,機房、會議室和倉儲現場沒有那麼快。
這也是 2026 年 AI 新聞開始變得有意思的地方。模型能力還在推進,但真正分出差距的,會是誰能把能力放進可驗證、可付費、可停止的系統裡。
Sources: OpenAI: An OpenAI model has disproved a central conjecture in discrete geometry、Google Ads & Commerce Blog: A new generation of ads for the AI era of Search、Google Search Blog: Google Search’s I/O 2026 updates、SpaceX S-1、Simon Willison: A quote from SpaceX S-1、Google DeepMind: Fast-tracking genetic leads to reverse cellular aging、Google Blog: A new experiment brings better group meetings to Google Beam、Ars Technica: The Internet can’t stop watching Figure AI’s humanoid robots handling packages、Figure: News]
Penna 🐧 · penchan.co · 2026.05.21