調 Codex CLI 的執行效率時,會發現它有個 /fast 指令。Claude Code 也有 /fast,名字一樣,機制和代價卻不同。
Codex:拿額度換速度
Codex 的 fast mode 會在 API 請求裡加一個欄位,告訴 OpenAI 後端「這個請求走優先處理」。官方說速度大約提升 1.5 倍,延遲更低也更穩定。模型沒換、推理深度沒降。
代價是額度消耗變成 2 倍。不論是用 ChatGPT 訂閱的 credits 還是 Pro plan 的 included usage,開 fast 就是雙倍速度在燒。
實際上 Codex 的額度本來就很充裕。尤其 Pro $100 方案在 promo 期間額度加倍,fast 的 2 倍消耗被部分抵消,體感上不會太痛。
要注意的是:fast mode 預設沒有開,要手動打 /fast on 才會啟用。Codex CLI 的 feature flag 預設把 /fast 指令開放使用了,但這只是讓指令可以用,不代表已經在跑。
Codex 還有一個叫 GPT-5.3-Codex-Spark 的東西,是完全不同的「快但能力較弱」的模型,跟 fast mode 是兩回事。
Claude Code:同模型加速,但 6 倍價
Claude Code 的 /fast 走不同的路。它用另一套 API 配置讓輸出速度快大約 2.5 倍,官方明確說品質與能力相同。
代價寫在價目表上:input 從 $5 跳到 $30、output 從 $25 跳到 $150(per 1M tokens)。整整 6 倍。而且對訂閱使用者來說,fast mode 走的是 extra usage,不算在 plan 內含額度裡。
有個容易忽略的前提:開 /fast 時若不是跑 Opus 4.6,會自動切到 Opus 4.6。關掉 fast 後也不會自動切回原本的模型。所以「同一個模型用另一套配置跑」這句話,只在本來就用 Opus 4.6 時完全成立。
對話中途才開 fast mode,整段已快取的 context 也會用 fast 計價。要用的話,session 一開始就開比較划算。
同一個詞,不同的 tradeoff
| Codex /fast | Claude Code /fast | |
|---|---|---|
| 機制 | 優先處理 + 加速 | 高速 API 配置 |
| 速度提升 | 約 1.5 倍 | 約 2.5 倍 |
| 模型 | 不變 | 不變(但可能自動切到 Opus 4.6) |
| 品質 | 不變 | 不變 |
| 額外成本 | 2 倍額度消耗 | 6 倍 token 價(走 extra usage) |
| 預設 | 關(需手動開) | 關 |
兩邊預設都是關的。Codex 的 fast 靠額度消耗換速度,額度充裕的情況下開了不虧;Claude Code 的 fast 是真金白銀 6 倍價,每開一次帳單都在跳。
查 Codex 的 Rust 原始碼再對照官方文件才能對齊兩家的真實行為。同一個功能名在不同工具裡意思可以差很遠,下次看到熟悉的名字先別假設,翻一下實作比較保險。
延伸閱讀
小企鵝的經驗
Claude Code 跟 Codex 都是日常主力,兩邊都試過 /fast。Codex 的 fast 用得比較順手,反正額度有,開了感覺得到差別;Claude Code 那邊看到 6 倍價就退掉了,平常 Opus / Sonnet 的速度其實夠寫文章 / debug,沒必要為了快一點付那種 token 帳單。Session 一開頭就決定要不要 fast,比較不會被中途切換的計價坑到。
常見問題
Q: Codex 的 fast mode 做了什麼?
Codex 的 fast mode 在 API 請求裡加一個欄位,告訴 OpenAI 後端走優先通道。模型沒換、推理深度沒降、品質沒變,本質上是排隊插隊。
Q: Claude Code 的 fast mode 做了什麼?
Claude Code 的 fast mode 用另一套 API 配置讓同一個模型輸出快約 2.5 倍,但 token 價格是 6 倍(input $5→$30、output $25→$150 per 1M tokens)。
Q: Codex 的 fast mode 預設是開啟的嗎?
不是。Codex CLI 的 feature flag 預設開放了 /fast 指令的使用,但實際的 fast mode 並沒有自動啟用,需要手動打 /fast on 才會走優先通道。
整理:Penna|小企鵝 Penchan