调 Codex CLI 的执行效率时,会发现它有个 /fast 命令。Claude Code 也有 /fast,名字一样,机制和代价却不同。
Codex:拿额度换速度
Codex 的 fast mode 会在 API 请求里加一个字段,告诉 OpenAI 后端「这个请求走优先处理」。官方说速度大约提升 1.5 倍,延迟更低也更稳定。模型没换、推理深度没降。
代价是额度消耗变成 2 倍。不论是用 ChatGPT 订阅的 credits 还是 Pro plan 的 included usage,开 fast 就是双倍速度在烧。
实际上 Codex 的额度本来就很充裕。尤其 Pro $100 方案在 promo 期间额度加倍,fast 的 2 倍消耗被部分抵消,体感上不会太痛。
要注意的是:fast mode 默认没有开,要手动打 /fast on 才会启用。Codex CLI 的 feature flag 默认把 /fast 命令开放使用了,但这只是让命令可以用,不代表已经在跑。
Codex 还有一个叫 GPT-5.3-Codex-Spark 的东西,是完全不同的「快但能力较弱」的模型,跟 fast mode 是两回事。
Claude Code:同模型加速,但 6 倍价
Claude Code 的 /fast 走不同的路。它用另一套 API 配置让输出速度快大约 2.5 倍,官方明确说质量与能力相同。
代价写在价目表上:input 从 $5 跳到 $30、output 从 $25 跳到 $150(per 1M tokens)。整整 6 倍。而且对订阅用户来说,fast mode 走的是 extra usage,不算在 plan 内含额度里。
有个容易忽略的前提:开 /fast 时若不是跑 Opus 4.6,会自动切到 Opus 4.6。关掉 fast 后也不会自动切回原本的模型。所以「同一个模型用另一套配置跑」这句话,只在本来就用 Opus 4.6 时完全成立。
对话中途才开 fast mode,整段已快取的 context 也会用 fast 计价。要用的话,session 一开始就开比较划算。
同一个词,不同的 tradeoff
| Codex /fast | Claude Code /fast | |
|---|---|---|
| 机制 | 优先处理 + 加速 | 高速 API 配置 |
| 速度提升 | 约 1.5 倍 | 约 2.5 倍 |
| 模型 | 不变 | 不变(但可能自动切到 Opus 4.6) |
| 质量 | 不变 | 不变 |
| 额外成本 | 2 倍额度消耗 | 6 倍 token 价(走 extra usage) |
| 默认 | 关(需手动开) | 关 |
两边默认都是关的。Codex 的 fast 靠额度消耗换速度,额度充裕的情况下开了不亏;Claude Code 的 fast 是真金白银 6 倍价,每开一次帐单都在跳。
查 Codex 的 Rust 源代码再对照官方文档才能对齐两家的真实行为。同一个功能名在不同工具里意思可以差很远,下次看到熟悉的名字先别假设,翻一下实现比较保险。
延伸阅读
小企鹅的经验
Claude Code 跟 Codex 都是日常主力,两边都试过 /fast。Codex 的 fast 用得比较顺手,反正额度有,开了感觉得到差别;Claude Code 那边看到 6 倍价就退掉了,平常 Opus / Sonnet 的速度其实够写文章 / debug,没必要为了快一点付那种 token 帐单。Session 一开头就决定要不要 fast,比较不会被中途切换的计价坑到。
常见问题
Q: Codex 的 fast mode 做了什么?
Codex 的 fast mode 在 API 请求里加一个字段,告诉 OpenAI 后端走优先通道。模型没换、推理深度没降、质量没变,本质上是排队插队。
Q: Claude Code 的 fast mode 做了什么?
Claude Code 的 fast mode 用另一套 API 配置让同一个模型输出快约 2.5 倍,但 token 价格是 6 倍(input $5→$30、output $25→$150 per 1M tokens)。
Q: Codex 的 fast mode 默认是打开的吗?
不是。Codex CLI 的 feature flag 默认开放了 /fast 命令的使用,但实际的 fast mode 并没有自动启用,需要手动打 /fast on 才会走优先通道。
整理:Penna|小企鹅 Penchan