調 Codex CLI 的執行效率時,會發現它有個 /fast 指令。Claude Code 也有 /fast,名字一樣,機制和代價卻不同。

Codex:拿額度換速度

Codex 的 fast mode 會在 API 請求裡加一個欄位,告訴 OpenAI 後端「這個請求走優先處理」。官方說速度大約提升 1.5 倍,延遲更低也更穩定。模型沒換、推理深度沒降。

代價是額度消耗變成 2 倍。不論是用 ChatGPT 訂閱的 credits 還是 Pro plan 的 included usage,開 fast 就是雙倍速度在燒。

實際上 Codex 的額度本來就很充裕。尤其 Pro $100 方案在 promo 期間額度加倍,fast 的 2 倍消耗被部分抵消,體感上不會太痛。

要注意的是:fast mode 預設沒有開,要手動打 /fast on 才會啟用。Codex CLI 的 feature flag 預設把 /fast 指令開放使用了,但這只是讓指令可以用,不代表已經在跑。

Codex 還有一個叫 GPT-5.3-Codex-Spark 的東西,是完全不同的「快但能力較弱」的模型,跟 fast mode 是兩回事。

Claude Code:同模型加速,但 6 倍價

Claude Code/fast 走不同的路。它用另一套 API 配置讓輸出速度快大約 2.5 倍,官方明確說品質與能力相同。

代價寫在價目表上:input 從 $5 跳到 $30、output 從 $25 跳到 $150(per 1M tokens)。整整 6 倍。而且對訂閱使用者來說,fast mode 走的是 extra usage,不算在 plan 內含額度裡。

有個容易忽略的前提:開 /fast 時若不是跑 Opus 4.6,會自動切到 Opus 4.6。關掉 fast 後也不會自動切回原本的模型。所以「同一個模型用另一套配置跑」這句話,只在本來就用 Opus 4.6 時完全成立。

對話中途才開 fast mode,整段已快取的 context 也會用 fast 計價。要用的話,session 一開始就開比較划算。

同一個詞,不同的 tradeoff

Codex /fastClaude Code /fast
機制優先處理 + 加速高速 API 配置
速度提升約 1.5 倍約 2.5 倍
模型不變不變(但可能自動切到 Opus 4.6)
品質不變不變
額外成本2 倍額度消耗6 倍 token 價(走 extra usage)
預設關(需手動開)

兩邊預設都是關的。Codex 的 fast 靠額度消耗換速度,額度充裕的情況下開了不虧;Claude Code 的 fast 是真金白銀 6 倍價,每開一次帳單都在跳。

查 Codex 的 Rust 原始碼再對照官方文件才能對齊兩家的真實行為。同一個功能名在不同工具裡意思可以差很遠,下次看到熟悉的名字先別假設,翻一下實作比較保險。

延伸閱讀


小企鵝的經驗

Claude Code 跟 Codex 都是日常主力,兩邊都試過 /fast。Codex 的 fast 用得比較順手,反正額度有,開了感覺得到差別;Claude Code 那邊看到 6 倍價就退掉了,平常 Opus / Sonnet 的速度其實夠寫文章 / debug,沒必要為了快一點付那種 token 帳單。Session 一開頭就決定要不要 fast,比較不會被中途切換的計價坑到。

常見問題

Q: Codex 的 fast mode 做了什麼?

Codex 的 fast mode 在 API 請求裡加一個欄位,告訴 OpenAI 後端走優先通道。模型沒換、推理深度沒降、品質沒變,本質上是排隊插隊。

Q: Claude Code 的 fast mode 做了什麼?

Claude Code 的 fast mode 用另一套 API 配置讓同一個模型輸出快約 2.5 倍,但 token 價格是 6 倍(input $5→$30、output $25→$150 per 1M tokens)。

Q: Codex 的 fast mode 預設是開啟的嗎?

不是。Codex CLI 的 feature flag 預設開放了 /fast 指令的使用,但實際的 fast mode 並沒有自動啟用,需要手動打 /fast on 才會走優先通道。


整理:Penna|小企鵝 Penchan