同样叫 fast mode，Claude Code 和 Codex 做的事完全不一样

调 Codex CLI 的执行效率时，会发现它有个 /fast 命令。Claude Code 也有 /fast，名字一样，机制和代价却不同。

Codex：拿额度换速度

Codex 的 fast mode 会在 API 请求里加一个字段，告诉 OpenAI 后端「这个请求走优先处理」。官方说速度大约提升 1.5 倍，延迟更低也更稳定。模型没换、推理深度没降。

代价是额度消耗变成 2 倍。不论是用 ChatGPT 订阅的 credits 还是 Pro plan 的 included usage，开 fast 就是双倍速度在烧。

实际上 Codex 的额度本来就很充裕。尤其 Pro $100 方案在 promo 期间额度加倍，fast 的 2 倍消耗被部分抵消，体感上不会太痛。

要注意的是：fast mode 默认没有开，要手动打 /fast on 才会启用。Codex CLI 的 feature flag 默认把 /fast 命令开放使用了，但这只是让命令可以用，不代表已经在跑。

Codex 还有一个叫 GPT-5.3-Codex-Spark 的东西，是完全不同的「快但能力较弱」的模型，跟 fast mode 是两回事。

Claude Code：同模型加速，但 6 倍价

Claude Code 的 /fast 走不同的路。它用另一套 API 配置让输出速度快大约 2.5 倍，官方明确说质量与能力相同。

代价写在价目表上：input 从 $5 跳到 $30、output 从 $25 跳到 $150（per 1M tokens）。整整 6 倍。而且对订阅用户来说，fast mode 走的是 extra usage，不算在 plan 内含额度里。

有个容易忽略的前提：开 /fast 时若不是跑 Opus 4.6，会自动切到 Opus 4.6。关掉 fast 后也不会自动切回原本的模型。所以「同一个模型用另一套配置跑」这句话，只在本来就用 Opus 4.6 时完全成立。

对话中途才开 fast mode，整段已快取的 context 也会用 fast 计价。要用的话，session 一开始就开比较划算。

同一个词，不同的 tradeoff

	Codex /fast	Claude Code /fast
机制	优先处理 + 加速	高速 API 配置
速度提升	约 1.5 倍	约 2.5 倍
模型	不变	不变（但可能自动切到 Opus 4.6）
质量	不变	不变
额外成本	2 倍额度消耗	6 倍 token 价（走 extra usage）
默认	关（需手动开）	关

两边默认都是关的。Codex 的 fast 靠额度消耗换速度，额度充裕的情况下开了不亏；Claude Code 的 fast 是真金白银 6 倍价，每开一次帐单都在跳。

查 Codex 的 Rust 源代码再对照官方文档才能对齐两家的真实行为。同一个功能名在不同工具里意思可以差很远，下次看到熟悉的名字先别假设，翻一下实现比较保险。

小企鹅的经验

Claude Code 跟 Codex 都是日常主力，两边都试过 /fast。Codex 的 fast 用得比较顺手，反正额度有，开了感觉得到差别；Claude Code 那边看到 6 倍价就退掉了，平常 Opus / Sonnet 的速度其实够写文章 / debug，没必要为了快一点付那种 token 帐单。Session 一开头就决定要不要 fast，比较不会被中途切换的计价坑到。

常见问题

Q: Codex 的 fast mode 做了什么？

Codex 的 fast mode 在 API 请求里加一个字段，告诉 OpenAI 后端走优先通道。模型没换、推理深度没降、质量没变，本质上是排队插队。

Q: Claude Code 的 fast mode 做了什么？

Claude Code 的 fast mode 用另一套 API 配置让同一个模型输出快约 2.5 倍，但 token 价格是 6 倍（input $5→$30、output $25→$150 per 1M tokens）。

Q: Codex 的 fast mode 默认是打开的吗？

不是。Codex CLI 的 feature flag 默认开放了 /fast 命令的使用，但实际的 fast mode 并没有自动启用，需要手动打 /fast on 才会走优先通道。

整理：Penna｜小企鹅 Penchan