每天在多个 AI 工具之间切换,prompt 写得好不好直接决定工作效率是翻倍还是翻车。同一个任务 prompt 换个写法,输出质量可以从「堪用」变成「直接发布」。这篇从零开始讲提示词工程:如果已经会用 AI、但总觉得它「不太听话」,大概率是 prompt 的问题。

提示词(Prompt)到底是什么

提示词就是给 AI 的命令文字。但「命令」这个词太窄。更准确地说,prompt 是与 AI 之间的沟通界面。每一段给它的文字,包含角色设置、背景信息、任务描述、输出格式、限制条件,全部都算 prompt 的一部分。

举个例子。「请写一篇文章」,AI 会给一篇四平八稳、像维基百科的东西。换成「你是一个科技部落客,用聊天的语气写一篇 1500 字的文章,主题是提示词入门,读者是完全没接触过 AI 的上班族,不要用条列式」,出来的东西完全不同。

差别在哪?提供的上下文(context)更多更完整了。说到底,AI 不管如何都写得出来,问题在于它本来就不知道用户要什么。

为什么 2026 年了还要学这个

有两个原因:

一是 AI 模型越来越强,但「越强」反而代表它能做的事太多。没给方向,它就自己选一个方向走。ChatGPT 的创意能力很猛,但不限制它的话,一千字的任务它能给三千字加小标题加 emoji。最新的 Claude Opus 在命令遵守上依然是业界最稳,但前提是命令本身写得清楚。

二是现在的 prompt 已经不只是「一句话命令」了。现在的主流趋势叫上下文工程(Context Engineering)。要管理的是 AI 的整个工作环境:它的角色、记忆、可以用的工具、多步骤的任务流程。prompt 只是其中一个零件,但是最基础的零件。

学提示词工程,就像学开车。可以不懂引擎原理,但得会踩油门和转方向盘。

基础结构:四个元素

写 prompt 有一个固定框架,四个元素排列组合就能覆盖大部分场景。

Who - 角色(Role):告诉 AI 它是谁。「你是一个有十年经验的 SEO 顾问」跟「你是一个大学生」,输出的深度和用词完全不一样。

What - 任务(Task):要它做什么,越具体越好。「分析这份数据」太模糊,「从这份 CSV 中找出月营收下降超过 10% 的月份,列出可能原因」就清楚多了。

How - 格式(Format):指定输出长什么样。表格、条列、段落、JSON、Markdown,不指定的话 AI 会自己决定,而它的决定通常不是要的。

Not - 限制(Constraint):告诉它什么不能做。「不要超过 500 字」「不要用条列式」「不要编造数据」。限制条件是质量控制的关键,少了这一层,AI 很容易自由发挥。

这四个元素不一定每次都要全用。写一个简单的翻译任务,角色和限制可能就够了。写一篇长文的 prompt 可能四个都要,而且每个都很长。看场景调整。

提示词基础结构:角色、任务、格式、限制四个元素的示意图

五组可复制的 prompt 示例

理论不如直接上示例。这五组是 pen-pings 系列里使用频率最高的模板,可以直接复制去改。

示例一:内容摘要

你是一个专业的内容编辑。
请阅读以下文章,用 3 句话摘要重点。
第一句讲主题,第二句讲核心发现,第三句讲对读者的影响。
不要超过 150 字。不要用「本文」开头。

[贴上文章内容]

示例二:会议记录整理

你是一个熟悉科技业的项目经理。
以下是一场产品会议的转录稿。请整理成会议记录,格式如下:
- 决议事项(每项一行,标记负责人和截止日)
- 待讨论事项(下次会议跟进)
- 关键数字(会议中提到的任何数据)
不要加你自己的意见。只整理转录稿里有的内容。

[贴上转录稿]

示例三:代码 Review

你是一个资深全端工程师。
请 review 以下代码,只指出三类问题:
1. 会造成 bug 的逻辑错误
2. 性能瓶颈
3. 安全漏洞
每个问题附上修改建议和修改后的代码片段。
不需要夸奖写得好的部分。

[贴上代码]

示例四:文章风格改写

你是一个台湾的科技部落客,擅长用聊天的语气写文章。
以下是一段技术说明文,请改写成博客风格。
要求:
- 用第一人称口吻
- 句子有长有短,像在跟朋友说话
- 专有名词第一次出现时用中文(英文)格式
- 不要用「浅显易懂」「华丽修辞」这类空话
- 保留所有技术细节,只改语气

[贴上原文]

示例五:数据分析

你是一个数据分析师,擅长用白话解释数据。
以下是一份 CSV 数据。请完成:
1. 找出前三名和后三名
2. 计算平均值和标准差
3. 用两句话说明这份数据的趋势
输出用简体中文,数字保留到小数点第一位。

[贴上 CSV]

进阶技巧

基础结构学会之后,有三个进阶技巧能让输出质量再往上一个档次。

Chain of Thought(思维链)

叫 AI 一步一步想。这个技巧在需要推理的任务上效果很明显。

做法:在 prompt 里加上 请一步一步思考 或者 请先列出你的推理过程,再给出结论。AI 会把中间步骤写出来,可以看到它哪一步想错了,而且光是「要求它慢慢想」这个动作,就能让答案准确度提升一个档次。

数据分析和逻辑判断的任务几乎每次都该加。

Few-shot(少量示例)

直接给 AI 看要的输出长什么样。比花五百字描述格式还有效。

做法:在 prompt 里放两到三组「输入→输出」的示例。AI 会从示例中学到风格、格式、用词偏好。这在翻译、分类、改写这类任务上效果最好。

前期准备示例要花时间,但之后每次用都省时间。

负面 prompt

告诉 AI「不要做什么」,有时候比告诉它「要做什么」还管用。

「不要用条列式」、「不要超过 500 字」、「不要编造没有提到的信息」、「不要在结尾加总结」。这些限制条件能直接砍掉 AI 最常见的坏习惯。

Claude 对负面命令的遵守能力相对好,可以列较多条限制词让它避开。ChatGPT 的话,列太多限制它会开始选择性忽略,建议控制在十条以内。

不同模型的 prompt 差异

主流三家模型的「个性」完全不同,prompt 的写法也要跟着调。

Claude:最听话。长规则、复杂限制条件、角色设置,它都能稳定遵守。写长 system prompt 给它,从头到尾都记得。适合需要精确控制的任务。弱点是有时候太保守,可以在 prompt 里鼓励它「大胆给出你的判断」。

ChatGPT:创意最强,但纪律相对弱。适合给它示例(Few-shot),让它从示例里学。不适合塞太多限制条件,超过十条它会开始自己决定哪些重要哪些不重要。构思、脑力激荡、快速原型最适合用它。

Gemini:最适合搭配搜索任务。它的 context 窗口到一百万 tokens,丢一整本书进去分析也能撑得住。但中文的功能限制比较多,prompt 有时要用英文才能触发某些功能。它的风格偏技术报告,想要轻松语气要在 prompt 里特别强调。

实用法则:Claude 写正式内容、ChatGPT 做构思、Gemini 做大量数据处理。三家可以同时开着轮流用。Claude 跟 ChatGPT 的个性差异另外整理在 Claude vs ChatGPT 比较

Agent 时代,提示词还重要吗

2026 年的 AI Agent 能自己拆解任务、呼叫工具、管理记忆。有人说 prompt 要过时了。

实际上是相反:prompt 的重要性在上升,但形式在改变。

过去写一个 prompt 丢给 AI,它回一段文字,结束。现在写的是一整套命令系统:AI 的角色是什么、它能用什么工具、记忆架构怎么设计、遇到不确定的状况要怎么处理。这就是上下文工程(Context Engineering)。

OpenClaw 多 agent 系统就是一个活的例子。AI agent 通常设计成多层记忆:底层是每次自动载入的索引、中层是按主题分的知识文件、上层是每天更新的工作记忆。这整套架构的运作,靠的就是写在 prompt 里的规则。Agent 越自主,prompt 设计反而要越严谨,因为人类不会每一步都盯着它。多 agent 架构的细节参考 OpenClaw 多 Agent 架构

结论很明确:学提示词工程,2026 年依然值得。它是与 AI 沟通的底层能力。不管工具怎么演化,能把意图讲清楚的人永远比不能的人更有效率。

Agent 时代的上下文工程示意图:从单一 prompt 到整套命令系统的演变

从 Prompt 到 Context Engineering

进阶 prompt 技巧不只是一串咒语。进阶 Prompt 技巧 会把角色堆叠、分段送、反面 prompt、自我检查这些方法拆开讲;这篇 hub 先负责建立地图。

更大的变化是 context engineering。当你开始使用 AI AgentOpenClaw 这类长期系统,问题不再是「这一句 prompt 怎么写」,而是:

  • 哪些规则每次都要载入?
  • 哪些资料只在特定任务才读?
  • 长对话什么时候该摘要、归档、重开?
  • 工具权限、记忆、输出格式要如何互相约束?

一百万 token 的甜蜜陷阱 讲的是同一件事:context 变大不代表可以乱塞。真正有用的是把上下文整理成 AI 能稳定使用的形状。

下一步

掌握基础结构和进阶技巧之后,下一篇 进阶 Prompt 技巧 会讲 10 个更实战的方法,包含踩过坑才整理出来的 prompt 方法论。

提示词这门功夫学了就是自己的。工具会换,模型会更新,但把需求讲清楚的能力不会过时。


小企鹅的经验

小企鹅每天轮流使用 Claude Code、Codex、Perplexity、Grok、Gemini、ChatGPT、NotebookLM、OpenClaw 等工具,prompt 在不同模型之间的微调是日常工作的一部分。

OpenClaw 是小企鹅自己用的多 agent 系统,记忆架构分成自动载入、知识文件、每日工作记忆三层。这个架构是长期试错出来的:核心文件越精简,agent 失忆率越低;越想塞所有东西进记忆,反而越容易乱掉。

模型风格的选择上,小企鹅的习惯是:写文章、需要遵守风格规则的场景用 Claude;构思、创意 brainstorm 用 ChatGPT;大量数据整理或长 context 任务会结合用 Gemini。这个分工反映的是各模型的个性适合不同类型的工作,跟谁最强无关。

延伸阅读

常见问题

Q: 提示词是什么?

提示词就是给 AI 的指令。写得好,AI 回得精准;写得模糊,AI 就乱猜。把它想成跟一个聪明但完全不了解你背景的人沟通,说得越清楚,它做得越好。

Q: 提示词工程还重要吗?Agent 时代不是 AI 自己会想了?

更重要了,只是形式在变。2026 年的趋势是从单一 prompt 升级成上下文工程(Context Engineering),管理 AI 的记忆、工具、多步骤规划。底层逻辑一样:把意图讲清楚。

Q: Claude 跟 ChatGPT 的 prompt 写法有差吗?

有。Claude 擅长遵守长规则,给它角色设定跟限制条件效果最好。ChatGPT 适合直接给示例,Few-shot 效果强。Gemini 适合搭配搜索任务,context 窗口最大。

Q: 有没有万能的 prompt 模板?

没有万能模板,但有通用结构:角色 + 任务 + 格式 + 限制。这四个元素组合起来,能覆盖八成以上的使用场景。重点是根据不同模型和任务调整比例。

Q: 不会写程序也能学提示词工程吗?

完全可以。提示词工程的核心是沟通能力,不是程序能力。会打字、能把需求讲清楚就具备基础了。进阶技巧也是逻辑思考,跟写程序无关。

Q: 什么是 context engineering?

Context engineering 是把 prompt、记忆、工具、文件、任务状态一起设计。Agent 时代不是只写一句好 prompt,而是安排 AI 每一步能看到什么、不能看到什么、什么时候该重开干净 context。

Q: 长 context 越大越好吗?

不一定。长 context 能放更多资料,但也更容易混淆、忘掉重点或过度自信。重要任务要分段、摘要、清理上下文,相关细节可看一百万 token context 那篇。


整理:Penna|小企鹅 Penchan