「全部用 Opus」和「全部用 Sonnet」都不是最佳解,混着用才是正解。
先讲版本:Anthropic 已在 2026 年 5 月 28 日公开介绍 Opus 4.8。所以这篇比较会以「Opus 4.8 vs Sonnet 4.6」来看;但你账号当下实际可切到哪个型号,还是以 Claude 界面或 Claude Code 的 /model 显示为准。
能力差异
推理能力
Opus 4.8 跟 Sonnet 4.6 差距最明显的就是推理。Anthropic 官方对 Opus 4.8 的描述也很直接:它在复杂 coding 和 agentic task 上比 4.7 更强,也更不容易让自己写出的程序缺陷没被标示。
复杂的逻辑推理、多步骤分析、需要同时考虑多个因素的决策,Opus 的差距特别明显。例如要在几百行代码里找隐蔽的 race condition、竞态条件、权限漏洞,Opus 找得比较深,Sonnet 容易只抓到表层。
指示遵循
长 prompt 与规则密集的任务上,Opus 的服从度明显高一截。同样一份风格指南(避用词列表、语气设置、结构要求),Opus 的初稿要修改的幅度通常比 Sonnet 少很多。
速度
Sonnet 快很多。体感大概是 Opus 的 2-3 倍。
问一个简单问题,Sonnet 通常 2-3 秒就回完,Opus 可能要 5-8 秒。对话量大的时候,这个差距会明显感受到。
长文维持
写长文时两者的差距最大。
Sonnet 写到 2000 字左右,风格容易开始漂移,会慢慢回到它的默认语气。Opus 写到 3000 字以上还能维持设置的风格。
长文写作(博客、newsletter、报告)一律走 Opus 是常见选择。

比较表
| 比较项目 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|
| 推理能力 | 顶尖,长链推理稳定 | 中上,性能接近前代 Opus |
| 速度 | 慢 | 快(体感 2-3 倍) |
| 指示遵循 | 极好 | 好 |
| 长文质量 | 3000 字以上仍稳定 | 2000 字后容易漂移 |
| 成本(API) | 高 | 低 |
| 中文质量 | 顶尖 | 好 |
| 适合场景 | 策略、分析、长文、安全审查 | 日常、coding、批次、Agent 执行 |


使用场景推荐
用 Opus 的场景
长文写作:超过 1500 字的文章,Opus 的质量差距很明显。
复杂分析:技术架构评估、安全审计、多面向的比较分析。Opus 能同时考虑更多因素,结论更站得住。
策略规划:需要权衡利弊、做取舍判断的场景。Opus 给的建议比 Sonnet 细腻。
审计和 review:让 Opus 审 Sonnet 的输出。Sonnet 先做、Opus 检查的这个组合,质量平均比单跑任一模型稳。
用 Sonnet 的场景
日常问答:查语法、写程序。用 Opus 是杀鸡用牛刀,会想太多。
代码撰写:一般的 function、API endpoint、CRUD 操作,Sonnet 写出来的质量跟 Opus 差不多。
格式转换:JSON 转 CSV、Markdown 转 HTML 这种机械性操作,Sonnet 速度快又稳。
批次处理:需要跑 20 个相似任务的时候,Sonnet 的速度优势让总时间差很多。


API 定价
API 的价格差距不小,具体数字以 Anthropic 官方 pricing 页面 为准。
API 用户若把所有东西都丢 Opus 跑,帐单会跳得很快。分清楚哪些任务需要 Opus 的质量、哪些 Sonnet 就够用,帐单可以砍掉很多。
订阅方案:Pro $20/月、Max 5x $100/月、Max 20x $200/月。Pro 以上都能用 Opus,差在用量上限。Max 5x 的用量是 Pro 的 5 倍,Max 20x 是 20 倍。主要在网页版切模型用的人不需要管 API 定价,直接按需求选模型即可。

多 agent 分工策略
把 Opus 和 Sonnet 放进同一个 agent 系统,常见的分工是:
- Opus 当策略层:判断、审查、长文写作、架构设计
- Sonnet 当执行层:跑机械任务、写 code、批次处理、格式转换
具体的工作分配:
- 写文章初稿 → Opus
- 修改格式、调整排版 → Sonnet
- 代码 review → Opus
- 写 code → Sonnet(Opus 只做架构讨论)
- 摘要和翻译 → Sonnet
- 安全审计 → Opus
这套分工跑久了会发现好处:Opus 的 context window 保留给真正需要它的任务,不会被日常琐事占掉。Sonnet 跑得快,整体吞吐量明显提升。

Sonnet 做完的事如果没有经过 Opus 审,偶尔会有质量问题溜出去。对外发布的内容让 Opus 过一眼是稳妥做法,速度慢一点但质量有保障。

小企鹅的经验
小企鹅的多 agent 工作流就是 Opus + Sonnet + Codex 的组合,再加上其他角色(数据、自动化、媒体)分支出去。实际分工接近上面讲的:策略和审查丢 Opus、执行和批次丢 Sonnet、写 code 走 Codex 系列;对外发布的内容让 Opus 收尾把关。多 agent 架构的细节可以看 OpenClaw 多 Agent 架构。
建这套系统最痛的环节是记忆与文件结构:怎么让不同 agent 在切换之间维持上下文、避免重工,比挑模型更烧精神。整理好核心文件、把规则写精简,让文件结构自己当记忆,是目前小企鹅觉得最有用的诀窍。
延伸阅读
常见问题
Q: Opus 比 Sonnet 好多少?
要看任务。复杂推理、长文写作、细致的指示遵循 Opus 明显胜出;简单问答、格式转换、基本 coding 两者差距不大。不是所有任务都需要 Opus 的火力。
Q: Opus 可以免费用吗?
依账号、地区和流量,免费版通常不含 Opus;Opus 4.8 需要 Pro($20/月)或 Max($100/月起),也可通过 API 使用。
Q: API 调用 Opus 和 Sonnet 的价格差多少?
Opus 的 API 价格比 Sonnet 高数倍。具体数字以 Anthropic 官方 pricing 页面为准。订阅用户(Pro $20/月起)不需要管 API 定价,直接在界面切模型即可。
Q: 可以让 Opus 和 Sonnet 搭配使用吗?
可以,也建议这样做。需要深度思考的任务交 Opus,机械性的任务交 Sonnet。Claude Code 里可以设置不同 agent 用不同模型。
Q: 写程序该用 Opus 还是 Sonnet?
一般的 coding 用 Sonnet 就够。架构设计、复杂的 debug、需要理解大量上下文的重构,用 Opus 比较好。常见分法是:写 code 用 Sonnet,review code 用 Opus。
整理:Penna|小企鹅 Penchan