AI Agent 不是一個更會聊天的 ChatGPT
ChatGPT 的形態是「你問、它答」。Agent 的形態是「給它目標 → 它自己拆步驟 → 用工具執行 → 看結果 → 修正」。兩者的差別在於有沒有把 AI 接到行動(不是模型誰強)。
三個核心:工具、記憶、決策
工具(tools)
呼叫 API、讀檔、寫資料庫、發訊息、調閱外部系統。沒有工具的 AI 只能聊天。
記憶(memory)
跨對話 / 跨任務的上下文。模型本身有 context window,但「上週跟你聊過什麼」、「這個專案的偏好」要靠檔案、向量庫、結構化記憶層來保留。
決策迴圈(decision loop)
Agent 自己迭代:規劃(plan)→ 執行(act)→ 觀察(observe)→ 調整(adjust)。一次性回答不算。穩定的 agent 系統會額外設計:
- 每輪預算(避免無限迴圈)
- 失敗備援(fallback)路徑
- 可觀察的中間狀態
聊天機器人、自動化、Agent 怎麼分
| 類別 | 行為 | 例子 |
|---|---|---|
| 聊天機器人 (Chatbot) | 一問一答,沒記憶 / 沒工具 | 客服 FAQ、ChatGPT 單次對話 |
| 自動化 (Automation) | 預先寫好的固定流程,無語言判斷 | n8n schedule、cron 腳本 |
| Agent | 接收目標 → 自主拆步驟 → 動工具 | Claude Code subagent、OpenClaw |
| 混合型 (Hybrid) | 自動化觸發 → Agent 執行某段 | n8n schedule + AI step |
很多被宣傳成「AI Agent」的產品其實是聊天機器人或自動化。看清楚定位再決定要不要付這個錢。
真實例子:客服、報告、寫程式、社群海巡
① 客服檢索問答(RAG)Agent
- 工具:知識庫檢索、CRM 查詢、工單建立
- 記憶:客戶歷史對話、處理紀錄
- 決策:能答就答;查不到就交人工
收益:第一線分流,把人類客服留給真正需要判斷的個案。
② 自動週報 agent
- 工具:Slack / GitHub / Sheets API
- 記憶:上週寫了什麼、本週新增哪些任務
- 決策:把同主題合併、把重要的上推、把次要的收摺
收益:把固定的例行回報工作壓縮,主管審閱時間減少。
③ 寫程式的 Agent(Coding Agent)
- 工具:讀 / 寫 / 執行專案(repo)裡的程式碼、跑測試、跟 GitHub 互動
- 記憶:CLAUDE.md / 專案規範 / 上下文
- 決策:子 Agent(subagent)分配(審查 / 除錯 / 寫文件)
收益:整個專案範圍的改動、批次重構(refactor)、跨檔稽核(audit)比一個一個檔案改快很多。
④ Threads 海巡 Agent
- 工具:Threads / X 抓文、關鍵字過濾、回覆草稿
- 記憶:已看過的帖子、自己關注的話題
- 決策:照關鍵字 + 互動量挑值得回的帖,回覆先草稿給人類核准
收益:把每天滑社群找潛在客戶 / 對話切入點的時間,從一小時壓到五分鐘看通知。
一般人先不要追求全自動
「24 小時自動跑」很吸引人,但落地時最常見的踩坑是:
- 權限給太大:agent 一旦能動真錢、真資料,出錯成本暴增。
- 記憶設計沒做:第二天被「上次說好的事」記不得。
- 失敗通知缺席:agent 跑壞三天才被發現。
更穩的起點:先做半自動 → 人工審核把關 → 跑穩了再放權限。
Dify / Coze:no-code agent builder 的定位
| 工具 | 形態 | 重點 |
|---|---|---|
| Dify | 開源 + cloud(Free / Pro $59/月 / Team $159/月) | RAG 工作流、agentic workflow、prototype 友好 |
| Coze | bytedance 系 SaaS | 低門檻 bot/plugin builder、範本多 |
適合:產品原型、客服 RAG、想先驗 idea 再決定要不要 code。
注意:
- Dify Free 是 sandbox(200 message credits、1 member、5 apps),不是 production tier。
- Coze 的 plan / quota 細節在國際與中國版本之間有差,落實前以官方頁為準。
- 任何 cloud 平台都要先確認「你的資料會送到哪、留多久、會不會被拿去訓練」。
Claude Code / OpenClaw 風格:coding agent 與多 agent 架構
| 形態 | 重點 |
|---|---|
| Claude Code | terminal-first agent、subagent 各有獨立 context、slash / MCP commands、hooks |
| 自建多 agent 系統,如 OpenClaw、Hermes | 不同模型分工、共用記憶層、權限隔離 |
適合:repo-wide 任務、自動化排程、需要把不同任務交給不同模型 / 不同 context 的場景。
代價:要自己設計記憶結構、權限邊界、失敗恢復;不是裝完就用。
自建框架:LangGraph、CrewAI 的代價
要程式級控制 → 走 LangGraph(graph-based agent flow)或 CrewAI(multi-agent orchestration)。優點是邏輯透明、可版控;代價是要自己處理:
- 記憶持久化
- tool registry 與權限
- 失敗 retry 與 incident 處理
- 觀測 / log / cost tracking
不適合作為「先玩玩看」的入口,比較適合已知要做哪種 agent system 的工程團隊。
記憶為什麼最容易壞
agent 的記憶系統最常壞掉,原因有三:
- 沒分層:所有資訊塞同一個 context,到一個量就互相干擾。
- 沒摘要:過去對話原文一直被帶進新對話,token 成本與雜訊雙增。
- 沒生命週期:什麼資訊該過期、該歸檔、該 promote 到核心檔,沒設計。
設計可以從這個原型開始:
- 索引層(≤ 1000 行):每次都載入,存 agent 自身身分、當前任務、檔案位置。
- 主題層(按需):每個專案 / 主題一份檔,agent 接到任務時分次讀取(lazy load)。
- 工作記憶(每日 / 每週):日誌型採取添加、事件流方式加入。
把這三層分開,比「給 agent 更大 context window」更實用。
權限與安全比 prompt 更重要
agent 設計的真正風險不在 prompt 寫得好不好,而在:
- 它能不能寫 / 刪 / 對外送 / 動錢
- 它該不該這樣做
- 出錯後怎麼回滾
實作上幾條紅線:
- 動到錢、刪資料、發送對外通訊:一律保留人工審核閘。
- 機密資料用最小權限;不要把全帳號 admin 的 token 丟給 agent。
- 所有 tool call 都寫 audit log;可回放、可審計。
- 危險操作有 dry-run 模式。
新手從哪一種低風險 agent 開始
| 起步建議 | 原因 |
|---|---|
| 單機助手 | 不對外、不寫資料、失敗代價低 |
| 內部 FAQ 機器人 | 工作流標準、可複審 |
| 自動摘要週報 | 失敗代價低、可肉眼驗 |
| 客戶第一線可隨時改由人接手 | 半自動,不交給 agent 直接決策 |
避免起步時就做:自動發訊息、自動下單、跨部門資料寫入、未經人類核准的對外發布。
結論
Agent 的價值不在「更聰明的對話」,而在「能把對話接到行動」。但行動必須有邊界:記憶、權限、失敗恢復是核心設計,不是文末附錄。先選好走哪條路(Dify / Coze / Claude Code / 自建框架),把第一條低風險工作流做出來,再來談規模化。
小企鵝的經驗
OpenClaw 是小企鵝目前在跑的多 agent 系統:Opus 做策略 / 寫作判斷、Sonnet 做機械任務、Codex 做 coding、再加排程腳本串起來。實際做下來,最麻煩的真的是記憶:跑沒幾天 agent 就會「忘記上次的決定」,根因是記憶層沒設計好(不是模型不夠強)。後來把核心檔做到精簡且分層才止血。
對「一般上班族能不能自己搭 AI Agent」的看法:能!但建議從成熟的最佳化架構與 self-healing 設計起步,不要一開始就追求 24 小時全自動。
延伸閱讀
常見問題
Q: AI Agent 跟 ChatGPT 有什麼不同?
ChatGPT 是聊天介面,你問它答;AI Agent 多了「使用工具、保留跨對話狀態、自己拆步驟完成目標」三件事。一個是顧問,一個是執行者。
Q: 完全不會寫程式,能搭 AI Agent 嗎?
可以。Dify、Coze 提供拖拉介面就能跑出 agent。但記憶設計、多 agent 協作、權限治理仍需要設計判斷,到了一個門檻會碰到底層機制。
Q: AI Agent 的記憶怎麼處理?
穩的做法是讓記憶分層:索引層(每次自動載入)、主題層(按需讀取)、工作記憶(每天更新)。把每份檔案保持簡潔比拼命塞 context 重要。記憶不是自動的,是設計出來的。
Q: 2026 年該選哪個 AI Agent 工具?
看技術背景與場景。會寫 code、想最大彈性 → Claude Code;快速做產品原型 → Dify;零門檻試玩 → Coze;現有自動化想加 AI → n8n + AI node。
Q: AI Agent 免費嗎?
Coze 國際版有免費額度;Dify 有 Free 與開源自架版;Claude Code 走訂閱或 API 計費,實際以 Anthropic 官方為準;自建框架免費但要自付 API 與伺服器費用。
Q: AI Agent 安全嗎?資料會外洩嗎?
看部署方式。雲端平台會經第三方伺服器;Claude Code 跑本機但對話送到 API;自架 Dify 或自建框架資料完全在自己環境。任何 agent 都應有人工審核閘與 audit log。
Q: 多個 AI Agent 可以協作嗎?
可以。Claude Code 支援 subagent;自建框架可用 CrewAI 或 LangGraph。Dify、Coze 在多 agent 協作上的能力較有限。
Q: AI Agent 2026 年有什麼新發展?
幾條主軸:模型長 context 與工具呼叫穩定度提升;Claude Code、OpenClaw 這類 coding / gateway 型 agent 工具成熟;多 agent 框架(CrewAI / LangGraph)走向成熟;企業 PoC 進入規模化導入階段。
整理:Penna|小企鵝 Penchan