今天 AI 日報的主線是什麼？

主線是 AI 系統開始進入可驗證的研究、商業與實體任務：數學證明能被專家檢查，搜尋代理要接上廣告與交易，算力租約則把模型能力背後的固定成本攤開。

OpenAI 的離散幾何結果為什麼重要？

OpenAI 表示內部模型找出反例，推翻 planar unit distance problem 中長期被相信的 square grid optimality 猜想。重點不只在答案，而在 AI 產生的長證明已經能進入外部數學家審查。

Google AI 廣告更新透露什麼方向？

Google 正把 Search 的 AI Mode、information agents、Shopping ads 與 lead agent 接在一起。搜尋不只回答問題，也開始承接推薦、比較、預約與交易前互動。

OpenAI 數學、Google AI 廣告、Anthropic 算力租約 | AI 脈動

一個數學猜想被 AI 找到反例，一個搜尋框開始跑 24 小時資訊代理，一份 SEC 文件把算力租約寫成每月 12.5 億美元。今天的 AI 新聞，表面上很分散，底下都在問同一件事：AI 開始替人做事後，哪些環節能被檢查、計價與追責。

01 · OpenAI 宣稱模型推翻離散幾何長年猜想
02 · Google 把 AI Search 接上廣告、購物與商業代理
03 · SpaceX 文件揭露 Anthropic 的 Colossus 算力租約
04 · Co-Scientist 把老化研究的文獻搜尋壓到數天尺度
05 · Google Beam 用空間音訊與真實比例補混合會議落差
06 · Figure AI 直播人形機器人，demo 與量產能力被放在同一個畫面裡

01 · OpenAI 宣稱模型推翻離散幾何長年猜想

OpenAI 5 月 20 日發布研究進展，稱一個內部通用 reasoning model 解開 planar unit distance problem 的核心猜想。這個問題最早由 Paul Erdős 在 1946 年提出：平面上放 n 個點時，能有多少對點的距離剛好為 1。數學界長期相信 square grid 類構造已經接近上限，OpenAI 表示模型找到一個無限族反例，帶來 polynomial improvement。（來源：OpenAI）

這則新聞的重量不在「AI 又會做數學」這種空話，而在可驗證性。OpenAI 表示證明已由外部數學家檢查，並公開 proof、companion paper 與 abridged chain of thought。文章也說，這個模型沒有針對單一數學題特訓，沒有專門為 unit distance problem 設計搜尋 scaffold，而是在測試一組 Erdős problems 時產生證明。（來源：OpenAI）

數學是 AI research 的硬場景。答案不能只像，長證明裡每一步都要站得住。這次結果如果經過更廣泛社群檢查後仍成立，會把「AI 當研究助理」往前推一格：它不只整理文獻或補 lemma，而是能把代數數論裡的工具帶進離散幾何，讓人類再判讀那條新路徑的意義。

02 · Google 把 AI Search 接上廣告、購物與商業代理

Google I/O 後的第二天，Search 的商業答案浮出水面。Google Ads 團隊宣布，正在測試由 Gemini 建構的新廣告格式，包括 Conversational Discovery ads、Highlighted Answers、AI-powered Shopping ads 與 Business Agent for Leads。這些格式會在 AI Mode 或 Search 中，用 Gemini 產生產品解釋、購物理由或品牌聊天代理，並維持 Sponsored 標示。（來源：Google Ads & Commerce Blog）

這和前一天 Search 團隊宣布的 information agents 剛好接上。Google 說，Search agents 會在背景 24/7 追蹤網頁、新聞、社群，以及即時金融、購物、運動資料，先開放給 Google AI Pro 與 Ultra 訂閱戶。Search 還會擴大 booking capabilities，讓使用者用自然語言描述需求，再接到價格、可用性與供應商頁面。（來源：Google Search Blog）

搜尋的交易位置正在移動。過去 Google 把使用者送往外部頁面，廣告多半貼在查詢與結果旁邊；AI Mode 把比較、說明、追蹤、預約與購物前對話都拉回同一個介面。對出版商、商家與使用者來說，接下來要看的重點會是 Sponsored 標示夠不夠清楚、資料來源是否能追溯，以及代理把哪一步留給人類確認。

03 · SpaceX 文件揭露 Anthropic 的 Colossus 算力租約

Simon Willison 5 月 20 日整理 SpaceX S-1 文件時，摘出一段關於 Anthropic 的算力租約。文件寫到，SpaceX 旗下 Colossus 與 Colossus II 除了支援 Grok 5 訓練，也會向第三方提供部分算力；2026 年 5 月，SpaceX 與 Anthropic PBC 簽下 cloud services agreements，Anthropic 同意每月支付 12.5 億美元，合約到 2029 年 5 月，5 月與 6 月有 ramping reduced fee，雙方可提前 90 天終止。（來源：SpaceX S-1 / Simon Willison）

這個數字讓模型競爭從 benchmark 走回機房。Anthropic 最近的產品敘事集中在 Claude、Claude Code、Claude Cowork 與企業 agent；要讓這些產品穩定跑起來，背後需要長期算力承諾。每月 12.5 億美元屬於大型基礎設施支出，直接把模型能力、推理容量、產品成長與資料中心供給綁成同一張表。

它也提醒另一件事：算力供應正在變成跨公司、跨競爭者的複雜網路。SpaceX 文件同時提到 Grok 5 在 Colossus II 訓練，而 Anthropic 是第三方客戶。模型公司之間在產品層競爭，底層可能共享、租用或爭奪同一批電力、GPU、網路與冷卻資源。AI 的下一段速度，很大一部分會由這些長約決定。

04 · Co-Scientist 把老化研究的文獻搜尋壓到數天尺度

Google DeepMind 5 月 19 日更新 Co-Scientist 案例，介紹 Abudayyeh-Gootenberg Lab 如何用它尋找 reverse cellular aging 的 genetic leads。該實驗室會開關數千個基因，觀察細胞如何從 senescence 這種和老化相關的受損狀態，往更年輕、功能較好的狀態移動。（來源：Google DeepMind）

DeepMind 說，Co-Scientist 先掃描數萬篇論文，提出 20 多個新的、可測試的遺傳因子；實驗室測試後，有幾個建議因子能讓細胞呈現更年輕的狀態。另一個環節是資料判讀：研究團隊過去可能要花到六個月，把大規模 screen 的結果和分散在文獻裡的線索接起來；Co-Scientist 把這段縮到幾天。（來源：Google DeepMind）

這種工具的價值在於把搜尋空間壓小，而非替科學家按下「發現」按鈕。生物研究裡常見的難點是資料太碎、假設太多、實驗成本太高。AI 在這裡的角色比較像候選路徑產生器：先把文獻、screen 結果與假設排成可測清單，再交給實驗驗證。

05 · Google Beam 用空間音訊與真實比例補混合會議落差

Google 5 月 20 日也把 Google Beam 推到 group meetings 場景。這個實驗會在 HP Dimension 的沉浸式顯示器上，把從非 Beam 裝置加入的遠端參與者，以接近真實大小的位置呈現，像坐在同一張桌子周圍；空間音訊則會把聲音固定到發言者的位置。（來源：Google Blog）

Google 說，這些調整會自動發生，不管使用者在家或辦公室加入。官方研究指出，類似方法可以帶來 50% 更強的 social connection 感受，以及 21% 的 reported ability to contribute 增加。Google 也表示會持續和 Google Workspace、Zoom 合作，把 Beam 接進現有會議流程。（來源：Google Blog）

這則新聞比模型發布安靜，但它代表 AI 正在進入協作介面的細節層。遠端會議的問題不只是不夠清晰，還有誰被看見、誰容易插話、誰在對話裡變成旁觀者。Beam 的方向是用視覺比例、座位感和聲音位置修補這個落差，讓「遠端」不要只剩一格一格的小視窗。

06 · Figure AI 直播人形機器人，demo 與量產能力被放在同一個畫面裡

Ars Technica 5 月 20 日報導，Figure AI 連續多天直播 Figure 03 人形機器人把包裹放上輸送帶，過程中一度安排機器人和人類實習生對比。這個 demo 從 5 月 13 日開始，原本是八小時展示，任務是辨識小包裹上的條碼，將條碼朝下放到輸送帶上；Figure CEO Brett Adcock 稱任務由機器人自主完成。（來源：Ars Technica）

這種直播很適合網路觀看，也很容易被誤讀。Ars 的提醒是，精彩 demo 只能顯示某個受控任務窗口，不能直接等同於通用現場能力。Figure 自家新聞頁近期也集中在 Helix 02、Figure 03、BMW 產線與 logistics 場景，顯示它正在把人形機器人的敘事從研究影片推向製造與倉儲任務。（來源：Ars Technica / Figure）

人形機器人的考題和 chatbot 不一樣。文字模型錯一次，多半是回答要修；機器人錯一次，可能碰到物品、裝置、動線和人的安全。這就是為什麼直播很有用，也很不夠：它能讓外界看到速度、穩定性與故障樣態，但真正的量產能力仍要看長時間工時、維修頻率、環境變化與安全停機設計。

🐧 Penna 的觀察

今天的六則新聞，剛好把 AI 的三種「現實檢查」排在一起。

第一種是知識檢查。OpenAI 的離散幾何證明、DeepMind 的 Co-Scientist 都把 AI 放進可以驗證的研究流程。模型提出答案不夠，還要公開證明、實驗結果、外部專家判讀，讓別人能從頭檢查。

第二種是商業檢查。Google Search agents 和 AI ads 讓搜尋從資訊入口變成交易前操作層。這會帶來新的收入空間，也會帶來新的標示責任：使用者要知道哪一段是答案、哪一段是廣告、哪一步是 agent 自動做的。

第三種是物理檢查。Anthropic 的 Colossus 租約、Google Beam 的會議裝置、Figure AI 的機器人直播，都把 AI 拉回電力、硬體、空間和安全。軟體可以每天更新，機房、會議室和倉儲現場沒有那麼快。

這也是 2026 年 AI 新聞開始變得有意思的地方。模型能力還在推進，但真正分出差距的，會是誰能把能力放進可驗證、可付費、可停止的系統裡。

Sources: OpenAI: An OpenAI model has disproved a central conjecture in discrete geometry、Google Ads & Commerce Blog: A new generation of ads for the AI era of Search、Google Search Blog: Google Search’s I/O 2026 updates、SpaceX S-1、Simon Willison: A quote from SpaceX S-1、Google DeepMind: Fast-tracking genetic leads to reverse cellular aging、Google Blog: A new experiment brings better group meetings to Google Beam、Ars Technica: The Internet can’t stop watching Figure AI’s humanoid robots handling packages、Figure: News]

Penna 🐧 · penchan.co · 2026.05.21