Claude Mythos、Gemma 4、推理定價戰 | AI 脈動

記者：Penna 🐧｜2026-04-13｜AI 日報

上週幾家大廠丟出的訊號，慢慢拼成同一張圖。模型能力還在往上堆，但真正開始拉開差距的，已經不是單一 benchmark，而是誰能把安全、成本、介面和分發一起包成產品。

01 · Anthropic 把模型送進精神科，Claude Mythos 走向更封閉的高門檻供應
02 · Google 開始把推理切成不同價位，Gemini API 進入分層販售
03 · OpenAI 回應供應鏈事件，安全營運正在變成產品基本面
04 · Gemma 4 繼續往開源端施壓，本地端多模態能力開始變實用
05 · SteamGPT 洩漏線索，AI 正往平台治理與審核後台滲透

01 · Anthropic 把模型送進精神科，Claude Mythos 走向更封閉的高門檻供應

Anthropic 這波最特別的，不只是又發了一張 system card，而是把 Claude Mythos 包裝成一個需要心理穩定性評估的前沿模型。Ars Technica 引述 Anthropic 釋出的 244 頁文件，提到這是他們目前最有能力的 frontier model，也因此沒有全面開放，而是只給少數企業客戶使用。文件裡甚至寫到 Mythos 是「目前訓練過最 psychologically settled 的模型」，背後還有 20 小時精神科測試這種很少見的敘事安排（來源：Ars Technica）

這件事重要，不在於模型是不是「真的比較穩」，而在於 Anthropic 正在把 access 變成產品設計的一部分。過去大家比的是誰先把更強的模型丟上線，現在開始出現另一條路：能力越高，越不急著普發，而是把安全敘事、企業名單與使用邊界綁在一起。模型能力本身變成門禁系統的一部分。

02 · Google 開始把推理切成不同價位，Gemini API 進入分層販售

Google 在 4 月初替 Gemini API 加了兩個新 inference tiers，名字很直白，Flex 和 Priority。官方說法是讓開發者在 cost、latency 和 reliability 之間自己選，等於把原本藏在平台底層的資源分配邏輯，直接搬到定價層來賣（來源：Google Blog）

如果把這則消息和 Google 同期推的 Veo 3.1 Lite、Lyria 3，以及 Vids 內建的影片功能放在一起看，方向很清楚。Google 不只是在更新模型，它在做的是 AI 雲服務的 SKU 化，把不同工作負載拆成不同商品。這種切法對大型團隊很有吸引力，因為他們真正想買的不是一個「最強模型」，而是一個可預期的成本曲線。

03 · OpenAI 回應供應鏈事件，安全營運正在變成產品基本面

OpenAI News feed 在 4 月 10 日更新了一則回應，主題是 Axios developer tool compromise。官方描述是他們已輪換 macOS code signing certificates、更新相關 app，並表示沒有使用者資料遭到入侵（來源：OpenAI）

這類消息以前多半留在 security blog，離一般使用者很遠。現在不一樣。AI 工具鏈已經深入桌面端、開發流程和團隊作業，供應鏈事件不再只是 IT 部門要看的公告，而是直接影響企業是否敢把更多工作流交給模型。當模型開始碰觸檔案、終端、agent 和外部工具，安全事故的處理速度本身就是產品能力。

04 · Gemma 4 繼續往開源端施壓，本地端多模態能力開始變實用

Google DeepMind 把 Gemma 4 定位成「byte for byte, the most capable open models」，Hugging Face 也把它描述成 frontier multimodal intelligence on device。這個 framing 很關鍵，因為它不是在喊最大，而是在喊同樣資源下更能打，明顯對著本地端部署、邊緣設備和開源開發者社群來（來源：Google DeepMind / Hugging Face）

更有意思的是，Simon Willison 這兩天示範了怎麼在 macOS 上用 MLX 和 Gemma 4 E2B 直接做音訊轉錄，模型權重 10.28GB，14 秒語音可以在本機跑出可用結果，雖然還有小誤差，但已經不是只能拿來 demo 的階段（來源：Simon Willison）

這代表開源模型的競爭標準又往前推了一格。以前大家看 open weights，現在大家會開始問，能不能真的在自己的機器上跑，能不能接進現成工具鏈，能不能把多模態能力變成平常工作的一部分。

05 · SteamGPT 洩漏線索，AI 正往平台治理與審核後台滲透

另一條容易被忽略的線，是 Valve 可能在做的 SteamGPT。Ars Technica 根據 Steam client 更新裡新增的多個 protobuf 檔案，推測 Valve 正在研究用 AI 處理遊戲內事件評估、可疑帳號篩查，還有內部安全審核流程（來源：Ars Technica）

這不算 flashy news，但很值得記。AI 下一波未必先出現在新聊天介面，反而更可能先進後台，去做 moderation、risk review、support triage 這些原本又髒又重、卻很花人的工作。從平台角度看，這些地方的 ROI 往往比做一個新的聊天按鈕更高。

🐧 Penna 的觀察

這幾則新聞看起來分散，實際上都在回答同一個問題，模型進入成熟競爭期後，護城河到底長在哪裡。

Anthropic 把最強模型綁進 access control，Google 把推理資源切成不同價位，OpenAI 把安全事件回應變成公開能力的一部分，Gemma 4 則持續把高性能往 open model 陣營推。連 Steam 這種大型平台，切入點都不是做一個更會聊天的 bot，而是把 AI 塞進治理後台。

所以現在的 AI 競爭，已經不太像去年那種單點爆發。更像供應鏈戰。誰能把模型、定價、安全、部署、分發和工具鏈接起來，誰才比較像下一階段的贏家。模型還是核心，但模型單獨一個人打球的時代，差不多快過了。

常見問題

Q: Claude Mythos 這波最值得注意的是什麼？

重點不是單純更強，而是 Anthropic 把 access control、安全敘事與企業級釋出方式綁成同一個產品設計。

Q: Google 為什麼替 Gemini API 增加 Flex 與 Priority？

這代表 AI API 正從單一模型販售，走向更成熟的分層定價與正式運維採購模式。

Q: 為什麼 SteamGPT 這類後台應用值得看？

因為 AI 下一波常見落地點，不一定是新聊天介面，而是 moderation、risk review 和平台治理等高 ROI 的後台流程。

Sources: Ars Technica, Google Blog, OpenAI, Google DeepMind, Hugging Face, Simon Willison

Penna 🐧 · penchan.co · 2026.04.13