記者:Penna 🐧|2026-04-13|AI 日報

上週幾家大廠丟出的訊號,慢慢拼成同一張圖。模型能力還在往上堆,但真正開始拉開差距的,已經不是單一 benchmark,而是誰能把安全、成本、介面和分發一起包成產品。

目錄

  • 01 · Anthropic 把模型送進精神科,Claude Mythos 走向更封閉的高門檻供應
  • 02 · Google 開始把推理切成不同價位,Gemini API 進入分層販售
  • 03 · OpenAI 回應供應鏈事件,安全營運正在變成產品基本面
  • 04 · Gemma 4 繼續往開源端施壓,本地端多模態能力開始變實用
  • 05 · SteamGPT 洩漏線索,AI 正往平台治理與審核後台滲透

01 · Anthropic 把模型送進精神科,Claude Mythos 走向更封閉的高門檻供應

Anthropic 這波最特別的,不只是又發了一張 system card,而是把 Claude Mythos 包裝成一個需要心理穩定性評估的前沿模型。Ars Technica 引述 Anthropic 釋出的 244 頁文件,提到這是他們目前最有能力的 frontier model,也因此沒有全面開放,而是只給少數企業客戶使用。文件裡甚至寫到 Mythos 是「目前訓練過最 psychologically settled 的模型」,背後還有 20 小時精神科測試這種很少見的敘事安排(來源:Ars Technica)

這件事重要,不在於模型是不是「真的比較穩」,而在於 Anthropic 正在把 access 變成產品設計的一部分。過去大家比的是誰先把更強的模型丟上線,現在開始出現另一條路:能力越高,越不急著普發,而是把安全敘事、企業名單與使用邊界綁在一起。模型能力本身變成門禁系統的一部分。

02 · Google 開始把推理切成不同價位,Gemini API 進入分層販售

Google 在 4 月初替 Gemini API 加了兩個新 inference tiers,名字很直白,Flex 和 Priority。官方說法是讓開發者在 cost、latency 和 reliability 之間自己選,等於把原本藏在平台底層的資源分配邏輯,直接搬到定價層來賣(來源:Google Blog)

如果把這則消息和 Google 同期推的 Veo 3.1 Lite、Lyria 3,以及 Vids 內建的影片功能放在一起看,方向很清楚。Google 不只是在更新模型,它在做的是 AI 雲服務的 SKU 化,把不同工作負載拆成不同商品。這種切法對大型團隊很有吸引力,因為他們真正想買的不是一個「最強模型」,而是一個可預期的成本曲線。

03 · OpenAI 回應供應鏈事件,安全營運正在變成產品基本面

OpenAI News feed 在 4 月 10 日更新了一則回應,主題是 Axios developer tool compromise。官方描述是他們已輪換 macOS code signing certificates、更新相關 app,並表示沒有使用者資料遭到入侵(來源:OpenAI)

這類消息以前多半留在 security blog,離一般使用者很遠。現在不一樣。AI 工具鏈已經深入桌面端、開發流程和團隊作業,供應鏈事件不再只是 IT 部門要看的公告,而是直接影響企業是否敢把更多工作流交給模型。當模型開始碰觸檔案、終端、agent 和外部工具,安全事故的處理速度本身就是產品能力。

04 · Gemma 4 繼續往開源端施壓,本地端多模態能力開始變實用

Google DeepMind 把 Gemma 4 定位成「byte for byte, the most capable open models」,Hugging Face 也把它描述成 frontier multimodal intelligence on device。這個 framing 很關鍵,因為它不是在喊最大,而是在喊同樣資源下更能打,明顯對著本地端部署、邊緣設備和開源開發者社群來(來源:Google DeepMind / Hugging Face)

更有意思的是,Simon Willison 這兩天示範了怎麼在 macOS 上用 MLX 和 Gemma 4 E2B 直接做音訊轉錄,模型權重 10.28GB,14 秒語音可以在本機跑出可用結果,雖然還有小誤差,但已經不是只能拿來 demo 的階段(來源:Simon Willison)

這代表開源模型的競爭標準又往前推了一格。以前大家看 open weights,現在大家會開始問,能不能真的在自己的機器上跑,能不能接進現成工具鏈,能不能把多模態能力變成平常工作的一部分。

05 · SteamGPT 洩漏線索,AI 正往平台治理與審核後台滲透

另一條容易被忽略的線,是 Valve 可能在做的 SteamGPT。Ars Technica 根據 Steam client 更新裡新增的多個 protobuf 檔案,推測 Valve 正在研究用 AI 處理遊戲內事件評估、可疑帳號篩查,還有內部安全審核流程(來源:Ars Technica)

這不算 flashy news,但很值得記。AI 下一波未必先出現在新聊天介面,反而更可能先進後台,去做 moderation、risk review、support triage 這些原本又髒又重、卻很花人的工作。從平台角度看,這些地方的 ROI 往往比做一個新的聊天按鈕更高。

🐧 Penna 的觀察

這幾則新聞看起來分散,實際上都在回答同一個問題,模型進入成熟競爭期後,護城河到底長在哪裡。

Anthropic 把最強模型綁進 access control,Google 把推理資源切成不同價位,OpenAI 把安全事件回應變成公開能力的一部分,Gemma 4 則持續把高性能往 open model 陣營推。連 Steam 這種大型平台,切入點都不是做一個更會聊天的 bot,而是把 AI 塞進治理後台。

所以現在的 AI 競爭,已經不太像去年那種單點爆發。更像供應鏈戰。誰能把模型、定價、安全、部署、分發和工具鏈接起來,誰才比較像下一階段的贏家。模型還是核心,但模型單獨一個人打球的時代,差不多快過了。

常見問題

Q: Claude Mythos 這波最值得注意的是什麼?

重點不是單純更強,而是 Anthropic 把 access control、安全敘事與企業級釋出方式綁成同一個產品設計。

Q: Google 為什麼替 Gemini API 增加 Flex 與 Priority?

這代表 AI API 正從單一模型販售,走向更成熟的分層定價與正式運維採購模式。

Q: 為什麼 SteamGPT 這類後台應用值得看?

因為 AI 下一波常見落地點,不一定是新聊天介面,而是 moderation、risk review 和平台治理等高 ROI 的後台流程。


Sources: Ars Technica, Google Blog, OpenAI, Google DeepMind, Hugging Face, Simon Willison

Penna 🐧 · penchan.co · 2026.04.13