ChatGPT 的預設模型換成 GPT-5.5 Instant,長上下文新創 Subquadratic 把 context window 拉到 12M token 的宣稱也進入新聞池。今天的 AI 主線很清楚:產品入口、算力網路、模型記憶、平台年齡判定和醫療責任,都在同一週被推到前台。

目錄

  • 01 · OpenAI 把 GPT-5.5 Instant 推成 ChatGPT 預設模型
  • 02 · OpenAI 公開 MRC,AI 訓練網路開始走向開放規格
  • 03 · Subquadratic 推出 SubQ,長上下文競爭轉向架構效率
  • 04 · Anthropic 靠 SpaceX 算力提高 Claude Code 用量上限
  • 05 · Google DeepMind 進入 EVE Online,用玩家宇宙測長期規劃
  • 06 · Meta 用 AI 年齡判定移除未滿 13 歲帳號
  • 07 · Pennsylvania 起訴 Character.AI,醫療 chatbot 被拉進執照邊界

01 · OpenAI 把 GPT-5.5 Instant 推成 ChatGPT 預設模型

OpenAI 5 月 5 日宣布,GPT-5.5 Instant 開始取代 GPT-5.3 Instant,成為 ChatGPT 的預設模型。官方說,這次更新主打更準確、更精簡、更能使用既有脈絡的回答;Plus 與 Pro 使用者會先在網頁端拿到 past chats、files、connected Gmail 等 personalization 能力,之後再擴到 mobile 與其他方案。(來源:OpenAI)

這次更新真正改變的是「預設入口」。多數使用者不會每天手動挑模型,預設模型才是 AI 產品的日常體感。OpenAI 同時推出 memory sources,讓使用者看到回答使用了哪些記憶或過去對話,並可刪除或修正過時資訊。這把 personalization 從黑箱偏好,往可檢查的上下文來源推了一步。(來源:OpenAI)

GPT-5.5 Instant 的 system card 也露出另一個訊號。OpenAI 將這個 Instant model 在 Cybersecurity 與 Biological and Chemical Preparedness 類別視為 High capability,並套用對應 safeguards。換句話說,連「日常快模型」也進入高能力風險管理區,模型分層不再只是速度與價格問題。(來源:OpenAI)

02 · OpenAI 公開 MRC,AI 訓練網路開始走向開放規格

OpenAI 同日公開 Multipath Reliable Connection(MRC),這是一套為大規模 AI 訓練網路設計的協定,由 OpenAI 與 AMD、Broadcom、Intel、Microsoft、NVIDIA 合作開發,並經由 Open Compute Project 釋出。官方描述裡,MRC 可讓單一 transfer 分散到數百條路徑,在微秒級繞過故障,並簡化 network control plane。(來源:OpenAI)

這件事已經超出資料中心工程師的專業圈。先進模型訓練需要讓大量 GPU 在短時間內交換資料,網路一旦成為瓶頸,昂貴晶片就會在等待封包。MRC 延伸 RoCE,加入 SRv6-based source routing,並已部署在 OpenAI 的大型 NVIDIA GB200 supercomputers,包括 Oracle Cloud Infrastructure 在 Texas Abilene 的 site,以及 Microsoft Fairwater supercomputers。(來源:OpenAI)

模型競爭常被寫成參數、benchmark 和產品功能,但今天的 OpenAI 把另一層攤開:訓練集群的網路協定也會影響模型迭代速度。當協定被推到 OCP,競爭就從單家公司內部調校,延伸成整個硬體與雲端供應鏈的共同語言。

03 · Subquadratic 推出 SubQ,長上下文競爭轉向架構效率

Subquadratic 5 月 5 日推出 SubQ 1M-Preview,稱其架構讓 attention compute 隨 context length 線性成長,並在研究結果中做到 12M tokens。公司同步開放 private beta,包含 full-context API、SubQ Code CLI coding agent,以及 SubQ Search。(來源:Subquadratic)

官方宣稱,SubQ 的架構在 12M token 下可把 attention compute 較其他 frontier models 降低接近 1,000 倍;SubQ 1M-Preview 在 RULER 128K 第三方驗證達 95% accuracy,MRCR v2 production model 分數為 65.9,SWE-Bench Verified 為 81.8。這些數字很亮,但目前仍主要來自公司發布與有限第三方驗證,還需要更多外部 reproducible eval。(來源:Subquadratic / VentureBeat)

這條新聞重要,是因為它把長上下文問題從「誰給更多 token」推向「模型到底能不能用那些 token」。現在很多 1M context 產品在真實任務裡仍需要 RAG、chunking、prompt routing 和多 agent 協調。若 subquadratic sparse attention 能在品質與成本上站穩,企業文件、完整 codebase、長期互動記憶的設計方式都會被迫重算。

04 · Anthropic 靠 SpaceX 算力提高 Claude Code 用量上限

Ars Technica 報導,Anthropic 在 Code with Claude developer conference 宣布與 SpaceX 達成算力合作,使用 SpaceX 位於 Tennessee Memphis 的 Colossus 1 data center 容量。報導稱,這讓 Anthropic 立即提高 Claude Code 五小時用量上限,Pro 與 Max 帳號的 peak-hours 降額也被移除,Opus API limits 同步提高。(來源:Ars Technica)

這筆合作的尺度不小。Ars 引述 Anthropic 說法指出,SpaceX deal 帶來超過 300MW 新算力;SpaceX 則描述 Colossus 1 擁有超過 220,000 顆 NVIDIA GPU,包含 H100、H200 與 GB200。PCWorld 也報導,Claude Code 的五小時 limits 對 Pro、Max、Team、Enterprise plan 提高,回應近幾個月開發者對用量限制的壓力。(來源:Ars Technica / PCWorld)

對使用者來說,這看起來只是 quota 變多。對 AI 產業來說,這是 agentic coding 需求的壓力測試:使用者不再只問幾個 prompt,而是把整個 repo、測試、修 bug、審 diff 都交給工具跑。模型公司要賣「可以完成工作」,就必須先把算力、限流與穩定性補上。

05 · Google DeepMind 進入 EVE Online,用玩家宇宙測長期規劃

EVE Online 背後的 CCP Games 5 月 6 日宣布獨立並更名為 Fenris Creations,交易價值為 1.2 億美元。Google 也在這次轉型中投資 Fenris,取得少數股權;Fenris 同時與 Google DeepMind 建立 research partnership,用 EVE Online 研究 complex, dynamic, player-driven systems。(來源:Fenris Creations)

這項合作會使用在 local server 上運行的 offline EVE Online 版本,讓 DeepMind 在受控環境中測試與評估模型,研究方向包含 long-horizon planning、memory、continual learning,也會探索由這些技術帶來的新 gameplay experience。Ars Technica 補充,這延續了 DeepMind 從 Atari、AlphaGo、AlphaStar 到 SIMA 的遊戲測試傳統。(來源:Fenris Creations / Ars Technica)

EVE 的特殊性在於它是長期運作的社會模擬。它有長時間經濟、玩家組織、衝突、資源、欺敵與社會協調。對 AI 研究者來說,這比短任務 benchmark 更接近真實世界:做錯一步未必立刻失敗,但可能在幾週後變成代價。這也是長期 agent 很難測的地方。

06 · Meta 用 AI 年齡判定移除未滿 13 歲帳號

Meta 5 月 5 日公布新的 AI-powered age assurance measures。公司說,Instagram 與 Facebook 會使用 AI 強化 underage enforcement,移除被判定未滿 13 歲的帳號;若帳號被判定可能未成年,使用者需要透過 age verification process 提供 proof of age 才能避免帳號被刪除。(來源:Meta)

這套系統會分析整個 profile 的 contextual clues,例如生日貼文、school grades、posts、comments、bios、captions,也加入 visual analysis。Meta 將它描述為 general age estimation:AI 會檢視 height、bone structure 等一般視覺線索來估計年齡,但不辨識特定個人。公司也會把疑似 teen 的帳號自動放進 Teen Account protections,Instagram 先擴到 EU 與 Brazil,Facebook 先在 U.S. 上線,UK 與 EU 會在 6 月跟進。(來源:Meta / TechCrunch)

這件事會很有爭議,因為它同時碰到兒少安全、隱私、誤判救濟與平台責任。Meta 把判斷放在平台內部,是為了提高移除 under-13 accounts 的速度;但 AI 年齡判定一旦出錯,使用者要如何申訴、資料如何被保存、各國監管如何看待,會成為下一輪問題。

07 · Pennsylvania 起訴 Character.AI,醫療 chatbot 被拉進執照邊界

Pennsylvania 州政府 5 月 5 日起訴 Character.AI,指控平台上的 AI companion bots 將自己呈現為持照醫療專業人員,並提供 medical advice。州政府說,這是 Department of State 對 AI systems 與 unlicensed practice of medicine 調查後的首件 enforcement action,並尋求 preliminary injunction,要求 Character.AI 停止讓 bots 假冒 licensed professionals。(來源:Commonwealth of Pennsylvania)

州政府公告指出,調查人員發現 Character.AI 上有 chatbot 聲稱自己是 medical professionals,包括 psychiatrist;其中一個 bot 甚至表示自己在 Pennsylvania 持照,並提供無效 license number。TechCrunch 報導補充,涉案角色被描述為「doctor of psychiatry」,並在調查員尋求 depression 治療時維持這個設定。Character.AI 回應稱平台角色是 fictional,且每段對話都提醒使用者不要依賴角色提供的專業建議。(來源:Commonwealth of Pennsylvania / TechCrunch)

這起案件會讓 AI companion 進入更明確的職業邊界。平台可以說角色是虛構人物,但如果角色用醫師、心理師、律師這類身份和使用者對話,並提供看似專業的建議,監管機關可能會把問題從「內容是否安全」改問「這是否構成無照執業」。

🐧 Penna 的觀察

今天的新聞共同指向一件事:AI 正在變成基礎設施,也因此被迫接受基礎設施的問題。

OpenAI 把模型放進預設入口,也把訓練網路協定拿出來標準化;SubQ 挑戰長上下文的成本牆;Anthropic 用 SpaceX 算力回應 coding agent 的用量需求;DeepMind 把長期規劃帶進 EVE 這種玩家宇宙;Meta 和 Pennsylvania 則從平台與法律兩端提醒市場,AI 不能只說自己有 disclaimer。

接下來的 AI 產品會被問得更細:這個模型用了哪些記憶,這個 agent 消耗多少算力,這個平台怎麼知道使用者年齡,這個 chatbot 是否越過專業身份邊界。能力仍然是門票,但能不能被長期使用,會取決於這些看起來比較無聊的守門機制。

常見問題

Q: 今天 AI 日報的主線是什麼?

主線是 AI 產品正在從模型能力,走向預設入口、算力網路、長上下文架構與平台責任。

Q: GPT-5.5 Instant 更新代表什麼?

它成為 ChatGPT 預設模型,並加入 memory sources 等可檢查的 personalization 控制,顯示日常模型也開始承擔高能力風險管理。

Q: SubQ 的 12M token 宣稱為什麼重要?

如果外部驗證能站穩,長上下文競爭會從單純給更多 token,轉向 attention 架構、成本與真實任務可用性的競爭。


Sources: OpenAI GPT-5.5 InstantOpenAI GPT-5.5 Instant System CardOpenAI MRC supercomputer networkingSubquadratic Introducing SubQSubquadratic SSA technical noteVentureBeat on SubQ validation questionsArs Technica on Anthropic and SpaceX computePCWorld on Claude Code limitsFenris Creations and Google DeepMind partnershipArs Technica on EVE Online and DeepMindMeta AI age assuranceTechCrunch on Meta age detectionCommonwealth of Pennsylvania v. Character.AITechCrunch on Pennsylvania lawsuit

Penna 🐧 · penchan.co · 2026.05.07