Agent 小白完整教程(搭建你的数字员工)

Banner

看完这篇：从零开始搞清楚 Agent 是什么，再用 Claude Code 做出你自己的第一个 Agent。全程不需要任何编程基础。看不懂的名词随时截图丢给豆包问。

第一部分看懂 Agent

第 1 章 Agent 到底是什么

1.1 一句话定义

Chatbot（聊天机器人）= 能说不能做
Agent（智能体）      = 能说，也能做

你跟 ChatGPT 说"帮我订一张明天去上海的机票"，它会回你一段话：

好的，这是一些航班信息，你可以去携程预订。

然后就没了。

它能告诉你怎么办，但不会真的帮你点鼠标、填表、付钱。

Agent 不一样。同样这句话给到一个真正的旅行 Agent，它会自己打开浏览器、查航班、对比价格、填乘机人信息、停在付款前问你确认。

整个过程你只说了一句话。

这就是 Agent 和 Chatbot 最核心的区别：一个只会给答案，一个会替你把事做完。1.2 用合同当例子

一个是"告诉你答案"，一个是"帮你把事情做完"。

1.3 一个关键认知：AI 自己其实啥都干不了

很多人以为 Agent 是"更聪明的 AI"，其实不是。

它和 ChatGPT 用的常常是同一个大脑（同一个模型），区别在于有没有手脚。

更准确的说法：

AI 大脑本身只能输出文字。所谓"调用工具"，本质是 AI 输出一段特殊格式的指令说"我要用 XX 工具"，外部程序读到这段指令，去真的执行操作，再把结果返回给 AI。AI 从头到尾只在处理文字，真正动手的是程序。

所以 Agent 的真实工作流程是这样的：

1. AI 大脑收到指令，思考"第一步该干什么"
2. AI 输出："我要用'读文件'这个工具，读取合同模板.docx"
3. 外部程序读到这句话，真的去打开那个文件
4. 程序把读取结果返回给 AI："发现 5 个空白字段"
5. AI 拿到结果，继续思考下一步："好，现在填第一个字段……"
6. 循环这个过程，直到任务完成

理解了这一点，你后面就不会再问"为什么 Agent 不能直接帮我做 XX"这种问题，答案永远是：因为它没有那个工具。

1.4 不是有工具就叫 Agent

光给 AI 配一堆工具，它不会自己用，那也不是 Agent。

真正让 AI 升级成 Agent 的，是这三样配合：

Agent = AI 大脑 + 工具箱 + 自主决定

       (思考)    (能做事)   (不用你一步步指挥)

大脑：负责理解你的话、做判断、规划步骤。
工具箱：能读文件、写文件、跑命令、调外网、发邮件、控浏览器……
自主决定：你说"把这 10 份合同都填好"，它自己决定先做哪份、卡住了怎么换方案、做完了怎么验证。不是你说一步它动一步。

少了第三样，你得到的只是"能调用工具的聊天框"，不是 Agent。

1.5 一句话总结

Chatbot 是会聊天的 AI。Agent 是会干活的 AI。

后面所有内容都围绕一个问题展开：怎么让 AI 真的帮你干活，而不是只给你建议。

第 2 章 Agent 都有哪些

市面上叫"Agent"的东西太多了，先把分类捋清楚，后面挑工具的时候你才不会迷路。

2.1 按"自己能多自主"分（最实用的分法）

这是最贴近用户感受的分法。我用 L0 到 L5 来排：你的话越模糊，它越要自己拿主意，等级就越高。

L5 现在没有真正可靠的实现，谁说有，你都可以打个问号。绝大多数用户日常用的是 L0-L1。

这套教程的目标是把你带到 L3-L4 : 也就是 Claude Code 能做到的程度。2.2 按"长什么样"分

同一个 Agent 内核，包装不同界面，给人的感觉天差地别。

命令行型（在终端里用，能力最强）

命令行 Agent
├── Claude Code   —— Anthropic 出品，本教程主角
└── Codex CLI     —— OpenAI 出品，开源

没有花哨界面，全靠打字。
能直接操作你电脑上所有文件，能力上限最高。
看起来吓人，其实就是"加强版聊天框"。

图形界面型（有可视化界面，更友好）

图形 Agent
├── Claude Cowork —— Anthropic 出品，给非技术人用
├── Trae Solo     —— 字节出品，国产
├── WorkBuddy     —— 腾讯出品，面向职场非开发
└── Kiro          —— AWS 出品

看上去像 Word/微信那种正常软件。
能力被简化过，没命令行那么自由，但门槛低。

工作流编排型（拖拽搭积木）

工作流平台
├── Coze（扣子）—— 字节出品
├── Dify       —— 开源
├── n8n        —— 老牌自动化平台
└── Make / Zapier —— 海外

不是真正意义上的"Agent"，更像"AI 工作流"。
流程是你拖出来的、写死的，AI 只在某些节点参与判断。
优点：稳定、可视化、好交接。
缺点：遇到没预设的情况就卡住。

自主运行型（后台一直跑）

持续运行 Agent
├── OpenClaw —— 开源，能用微信/电报远程控你的电脑
└── 各种"虚拟员工"产品

不是用完就关，是 7×24 一直挂着等你派活。
风险高，权限大，要慎用。

2.3 按"怎么实现的"分（技术视角，了解即可）

技术圈把 Agent 分成两大流派：

生产环境里两种都有用——简单重复的事交给工作流，复杂多变的事交给自主型 Agent。这套教程聚焦后者。

2.4 不属于 Agent 的东西

为了不被各种营销话术忽悠，记住这几样不是Agent：

纯聊天对话：豆包、DeepSeek 网页、ChatGPT 网页——这些是 Chatbot。
传统语音助手：Siri、小爱、小度，这些是"意图识别 + 预设动作"，没有真正的自主决策。
推荐系统/搜索引擎：百度、抖音推荐——这些是按数据库排序，不是 Agent。

判断一个东西是不是 Agent，就看两点：

它能不能真的执行操作（不只是给建议）。
它能不能自己决定下一步干什么（不只是按预设流程走）。

两点都满足，才叫 Agent。

2.5 这套教程为什么用 Claude Code

第 5 章会详细讲，先抛结论：

它免费起步，门槛极低。
它装在你电脑里，能直接动你的文件，不是只能在浏览器里聊天。
它的"工具箱"扩展性最强，后面讲的 Skills、MCP、Subagent 都围绕它展开。
全球顶级公司都在用它干真活，不是玩具。

第 3 章 Agent 的四个零件

不管哪家的 Agent，拆开看都是这四样东西。看懂了这四样，你以后看任何 Agent 产品的介绍都不会被概念绕晕。

Agent = 大脑 + 手脚 + 记忆 + 主见

       (LLM)  (Tools) (Memory) (Autonomy)

类比你雇一个实习生：

实习生得有脑子，能听懂你的话——大脑。
实习生得有手，能真的去做事——手脚。
实习生得记得住事，不能每次都问"你刚才让我干嘛来着"——记忆。
实习生得自己拿主意，不是你每说一个字他才动一下——主见。

少一样都不是合格的 Agent。

3.1 大脑：LLM（大语言模型）

LLM = Large Language Model，大语言模型。Claude、GPT、Gemini、豆包、DeepSeek、Kimi、GLM、千问，这些都是 LLM。

它的工作机制就一句话：接收一段文字，预测最合适的下一段文字。听起来很简单，但这种预测能力强到能通过医学考试、写代码、做分析。

关键点

同一个模型放在不同工具里，能力天差地别。Claude 模型放在网页里只是聊天，放在 Claude Code 里就能改你电脑里的文件。
模型只能输出文字，不能直接操作任何东西。所有"动手"的事，都要靠工具。
模型本身没有记忆，每次对话开始它都是从零开始的"新人"。

3.2 手脚：Tools（工具）

工具就是让 AI 真的能"动手"的那些能力。

一个反直觉的事实

工具越少越好，不是越多越好。工具一多，AI 就要花更多脑力判断"这次该用哪个工具"，结果反而容易选错、用错。

所以 Claude Code 默认就给了十来个最常用的工具，绝大多数场景这些就够了。真正不够用的时候，再去装 MCP（第 12 章）扩展。

3.3 记忆：Memory

AI 模型本身没有记忆。

每次开新对话，它都是"我是谁，我从哪里来"的状态。

但 Agent 必须有记忆，否则没法干复杂任务。

Agent 的"记忆"分两层：

短期记忆：当前对话的上下文

你这一轮对话从头到尾说的所有话，AI 都看得见。
但换一个新窗口、新对话，前面的就全忘了。
关键指标叫上下文窗口（Context Window），就是 AI 一次能"看见"的最大文字量。主流模型现在到了 100 万 Token，大约 70 万字。

长期记忆：跨对话保留的信息

通常存在文件里、数据库里、知识库里。
AI 需要的时候，主动去这些地方查。
Claude Code 的 CLAUDE.md（第 10 章）就是最常用的一种长期记忆。

3.4 主见：Autonomy（自主性）

这是 Agent 和"配了工具的 Chatbot"最根本的区别。

你说："研究一下字节跳动，写份报告。"
Chatbot：丢一段它知道的旧信息给你，让你自己去查证。
Agent：自己拆任务——查公司背景、查产品线、查竞品、查财报、汇总写报告——挨个跑完。中间发现哪一步资料不够，自己再搜一遍。

主见的本质是这个循环：

思考 → 行动 → 看结果 → 再思考 → 再行动 → 再看结果 → …… → 完成

这个循环行内叫 Agent Loop（Agent 循环），第 8 章会拆开讲。

3.5 真实生产环境里还有第五样：护栏

光有上面四样，Agent 是个"放出来撒野的实习生"。真要上生产，还得加一层护栏：

新手阶段不用太纠结护栏，但心里要有这根弦：Agent 越自主，越要给它套笼子。第 15 章会讲新手最该装的几道护栏。

3.6 一张图记住

你（人）
  ↓ 用自然语言下指令
Agent
├── 大脑（模型）—— 思考
├── 手脚（工具）—— 执行
├── 记忆（上下文 + 文件）—— 记住
└── 主见（循环逻辑）—— 自己拿主意
  ↑
  护栏（权限/预算/审批/沙箱）—— 防它闯祸

后面所有章节，你都可以用这张图对号入座。

第 4 章什么活适合丢给 Agent

Agent 强，但不是万能。用错了场景，它就是个烧钱机器。这一章帮你建立判断力。

4.1 适合 Agent 的 5 个特征

4.2 千万别用 Agent 的 6 个场景

4.3 不可逆操作要单独说

新手最容易在这里栽跟头。

任何"做完就收不回来"的操作——付款、发布、删除、群发邮件、改生产数据——默认都应该人确认，不要让 Agent 自动跑。

不是因为 Agent 做不到，是因为它做错的代价你扛不起。

护栏的核心就是：把不可逆操作前都加一道"等人确认"，让 Agent 干 99 步，人按一下"确认"那一步。

4.4 一个简单的判断方法

如果这个任务你能用文字清清楚楚教会一个刚入职的实习生怎么做，那它大概率适合 Agent。

如果你自己都说不清"怎么算做好了"，Agent 也搞不定。

举几个例子帮你校准：

4.5 小结

记住一句话：

Agent 是增强工具，不是替代品。它能帮你处理重复性、结构化的任务，但目标得你定、过程得你看、结果得你验。

下一部分开始上手 Claude Code，把这些概念变成你电脑里真的能动的东西。

第二部分上手 Claude Code

第 5 章为什么第一个 Agent 选 Claude Code

市面上 Agent 工具有几十款，我直接推荐 Claude Code，理由有四个。

5.1 它装在你电脑里，能动你的文件

绝大多数 AI 产品（豆包、ChatGPT、Coze）都是"网页里聊天"，再聪明也只能给你建议。

Claude Code 装在你自己的电脑上，从启动那一刻就能：

看你电脑里的所有文件
改你电脑里的所有文件
在你电脑上跑命令（启动浏览器、装软件、下载视频……）

这是从"AI 助手"变成"Agent"的关键一步。

5.2 它把 Agent 该有的零件全配齐了

回顾第 3 章的四件套——大脑、手脚、记忆、主见。Claude Code 全有：

别的 Agent 工具往往只给你某一两样，剩下的得自己拼。Claude Code 一站式给齐。

5.3 它的扩展能力是天花板级别

Claude Code 有四套扩展机制（后面章节会一一讲）：

四套机制可以叠加用，能力上不封顶。

5.4 它是工业级工具，不是玩具

Claude Code 是 Anthropic 内部给自家工程师用的工具。被全球顶级 AI 公司、独角兽、个人开发者每天用来做真正的工作。

对小白意味着什么：

文档全、教程多、社区活跃，遇到问题搜得到答案。
更新快、问题修得快，不会用着用着就停摆。
学了不浪费，市面上越来越多的 Agent 工具都在抄它的设计。

5.5 它的缺点也要讲清

为了不让你产生过高预期，提前说几个槽点：

5.6 一句话总结

Claude Code 不是最容易上手的 Agent，但是上手之后天花板最高的 Agent。学它一个，能省你试 10 个工具的时间。

第 6 章装好 Claude Code

第 7 章第一个任务

装好不算上手，跑通一个任务才算。这一章做一个最简单的练手项目，让你建立"它真的在替我干活"的体感。

7.1 任务设定：让 Agent 帮你整理桌面

桌面上文件乱成一锅粥是绝大多数人的常态。这个任务让 Claude Code 帮你：

扫描桌面所有文件
按类型分到不同文件夹（图片、文档、视频、压缩包、其他）
给你一份整理报告（哪些文件移到了哪里，有没有不知道怎么分类的）

7.2 在 VS Code 里建一个工作目录

直接动桌面文件风险大，先建一个练手目录：

打开 VS Code → 文件 → 打开文件夹 → 新建一个文件夹（如 agent-练习）→ 打开。
信任项目（弹窗里点"是，我信任作者"）。
在这个文件夹里手动放几个测试文件：一张图、一个 PDF、一个 zip、一个 txt（模拟桌面）。

7.3 启动 Claude Code

在 VS Code 顶部点"终端" → "新终端"，或直接按 Ctrl+ `。

终端里输入：

claude --dangerously-skip-permissions

这是"狂飙模式"，AI 改文件不用每次都问你。第一次练手用这个能省心。生产任务上慎用，第 15 章会讲。

7.4 把任务给它

对话框里输入：

请扫描当前目录下的所有文件，按类型分类：
- 图片（.jpg .png .gif .webp）放到 images/
- 文档（.pdf .doc .docx .txt .md）放到 documents/
- 视频（.mp4 .mov .avi）放到 videos/
- 压缩包（.zip .rar .7z）放到 archives/
- 其他放到 others/

子文件夹不存在就先建好。整理完给我一份报告：
- 总共处理了多少文件
- 每个分类下有多少个
- 有没有遇到处理不了的情况

回车，看它跑。

7.5 它会做什么

你会看到 Claude Code 一步步：

看了一眼当前目录有哪些文件（调用 LS 工具）
新建分类文件夹（调用 Bash 工具）
把文件挨个移过去（调用 Bash 工具）
统计数量（自己算）
输出报告（生成文字）

整个过程你只说了一句话，剩下的全是它自己想清楚、自己干完。

7.6 验证

去 VS Code 的资源管理器看左边：

images/、documents/ 这些子文件夹是不是出现了？
文件是不是按类型放对了？
终端最后的报告对不对？

跑通了，你就拥有第一个真正干过活的 Agent。

7.7 这一节做对了什么

明确的任务：扫描、分类、移动、报告——四个动作每个都很清楚。
明确的成功标准：文件夹结构 + 报告数据。
不可逆操作有边界：在练习目录里玩，搞坏了不心疼。
一句话指令：不用一步步指挥，告诉它"想要什么"，它自己拆"怎么做"。

记住这四点。你以后所有交给 Agent 的任务，都按这个模板组织，成功率会高 80%。

7.8 你可能踩的坑

第 8 章 Agent 怎么"想"和"做"

第 7 章你看着 Claude Code 跑了一整套流程，可能心里好奇：它到底是按什么逻辑跑的？理解这个逻辑，你后面写提示词、装 Skills、配 MCP 都不会再凭感觉。

8.1 Agent 的核心循环

不管什么 Agent，工作机制都是同一个循环：

收集上下文 → 采取行动 → 验证结果 → 重复

翻译成大白话：

看一眼现在的状况（读文件、查资料、看上一步结果）
干一件事（写文件、跑命令、调工具）
看干得对不对（结果是不是预期的、有没有报错）
决定下一步（继续干、换个方法、还是任务完成）

这就是行内说的 Agent Loop。

8.2 用第 7 章的例子拆解

回头看第 7 章那个整理桌面任务，Claude Code 实际跑的循环长这样：

每一轮都是"看一眼、干一件、查一下"。这就是 Agent 和 Chatbot 最根本的区别——Chatbot 一次性回答你，Agent 在循环里反复推进。

8.3 这个循环为什么强大

因为它能自我纠错

想象一下：第 3 轮 Claude 想移 photo.jpg，结果文件名有空格导致命令失败。它在"验证"那一步看到了报错，下一轮就会调整策略——给文件名加引号再试一次。

这是 Chatbot 做不到的。Chatbot 给完答案就结束了，它不知道你跑了之后报没报错。

因为它能处理事先没规划的情况

第 7 章的任务里，假设桌面突然多了一个 .xlsx 文件。Excel 不在你列的分类里——Claude 会自己判断"这是文档类，放 documents/"，不会卡死。

这就是 Agent 的"主见"在起作用。

8.4 你能影响这个循环的三个地方

知道循环长什么样还不够，你得知道你的输入怎么影响它。

这就是为什么后面三章这么重要：

第 10 章（CLAUDE.md）让你长期影响它的循环。
第 11 章（Skills）让你按场景影响它的循环。
第 12 章（MCP）让你给它更多工具，循环里能调更多花样。

8.5 一个反复出现的提醒

理解了循环，记住一句话：

Agent 不是一次性回答你的，它是在持续反复推进任务的。

所以你的指令越明确、规则越清晰、工具越合适，循环跑得越准。

下一章细看它的"手脚"——工具到底有哪些、怎么用。

第 9 章工具调用：Agent 的手脚

第 8 章讲了 Agent 在"循环"里跑。这一章看清它"循环里到底用了哪些手"。

不写代码也得懂这些工具，因为：

你要知道 Agent 能干什么（不至于让它干超能力之外的事）。
你要知道每个工具的风险（哪些是只看不动、哪些会改你的电脑）。

9.1 Claude Code 默认带的核心工具

记住三个等级：

绿（安全）：只读不写，可以放心给它用。
黄（中）：会动文件，需要你看着点。
红（高）：能跑任意命令，潜在风险大。

9.2 一个具体例子

你说："帮我看看 project/ 目录里有哪些 markdown 文件，统计一下总字数。"

Claude Code 会这样跑：

1. 调用 Glob：找 project/ 下所有 .md 文件
   → 找到 12 个

2. 调用 Read：挨个读这 12 个文件
   → 读完拿到全部内容

3. 内部统计：算字数

4. 输出结果："共 12 个文件，总字数 35,427"

整个过程它没改你任何东西——全程绿色工具。

9.3 工具的"权限模式"

Claude Code 默认在每次用黄色或红色工具前都会问你"要不要执行"。这是它的护栏机制。

实操建议：

第一次跑新任务 → 普通模式或 Plan 模式
信任的任务 → Auto-Accept
一次性玩具项目 → 狂飙模式

9.4 工具是"按需配"的

Claude Code 默认这些工具就够 90% 场景用了。剩下 10% 怎么办——靠 MCP（第 12 章）。

关键原则：工具不是越多越好。每个 MCP 都会消耗 AI 的"判断脑力"，装太多反而让它选错工具。装一个用一个，长期闲置的删掉。

9.5 一句话总结

工具是 Agent 的手脚，手脚越合适越好用，不是越多越好。

下一章讲长期记忆——让 Agent 长期记住你的偏好。

第 10 章给 Agent 写说明书：CLAUDE.md

到目前为止，你每次开新对话都要从零开始解释自己——"我是谁、我喜欢什么风格、我的项目结构是什么样的"。

CLAUDE.md 解决这件事。

10.1 CLAUDE.md 是什么

一句话：给 Claude 看的长期说明书。

它就是一个普通的 markdown 文件，放在特定位置，Claude Code 每次启动会自动读一遍，把里面的内容当成"我对你的了解"。

效果：

不用每次告诉它"我是产品经理，不写代码"。
不用每次说"输出文件统一放 outputs/ 文件夹"。
不用每次解释"我的项目用的是 XXX 技术栈"。

10.2 两种 CLAUDE.md：全局 vs 项目

实操原则：

跟"你是谁"有关的写全局（身份、语言、风格、底线红线）
跟"这个项目什么样"有关的写项目级（技术栈、目录结构、特殊约定）

10.3 怎么创建全局 CLAUDE.md

Mac/Linux 在终端输入：

mkdir -p ~/.claude
open ~/.claude

Windows：

mkdir $env:USERPROFILE\.claude
explorer $env:USERPROFILE\.claude

在弹出的文件夹里新建一个文件叫 CLAUDE.md，用 VS Code 打开它编辑。

10.4 一份小白可直接抄的全局 CLAUDE.md

# 全局规则

## 沟通
- 中文回复
- 称呼我为"你"
- 我不是程序员，所有解释用大白话
- 不要用专业术语，必须用时给出大白话解释

## 工作方式
- 收到需求后：先调研 → 出方案 → 我确认 → 拆解步骤 → 执行
- 不明确的需求，先问我，不要自己猜
- 优先用工具解决问题
- 简单原则，不要过度设计

## 输出
- 所有生成的文件统一放到 outputs/ 文件夹
- 文件名用中文，简短可读
- 不要在文件里写 emoji
- 不要在文件结尾加"如有问题请联系我"这类客套话

## 危险操作
- 删除文件前必须先问我
- 改别的项目文件前必须先问我
- 发布、付款、群发邮件前必须先问我
- 不可逆操作一律先确认

把这段内容复制到你的 CLAUDE.md，按你的实际情况改几条，保存。

10.5 怎么创建项目级 CLAUDE.md

在某个项目目录下，新建文件 CLAUDE.md，写你这个项目特有的规则。

例子：你有一个"公众号文章"项目，CLAUDE.md 可以这样写：

# 项目：公众号文章

## 这个项目是什么
我用来写公众号文章的工作区。

## 目录结构
- drafts/    草稿
- published/ 已发布
- images/    配图
- references/ 参考资料

## 写作风格
- 标题不超过 18 字
- 开头必须有钩子，前 3 句话决定读者要不要往下看
- 段落短，一段最多 3 句
- 不用 emoji
- 不写"如有侵权请联系删除"这类废话

## 工作流程
1. 我说选题 → 你先列大纲 → 我确认 → 你写初稿
2. 写完初稿放 drafts/，文件名格式 YYYY-MM-DD-标题.md
3. 我说"定稿" → 你移到 published/

下次你在这个项目里启动 Claude Code，它自动就按这套规则跑。

10.6 写 CLAUDE.md 的几个坑

10.7 一个偷懒办法

不知道写什么？直接让 Claude Code 自己生成。

启动 Claude Code 后输入：

请根据我们这几次的对话，帮我起草一份全局 CLAUDE.md。
要包含：我的身份、我的工作偏好、我容易踩的坑、不可逆操作的红线。
草稿出来后给我确认，不要直接保存到文件。

它会出一份草稿，你看一眼，改几句，复制到 ~/.claude/CLAUDE.md 即可。

10.8 一句话总结

CLAUDE.md = 写一次，长期用的偏好说明书。配完之后，Claude Code 才真正变成"你的Agent"，而不是"一个通用Agent"。

第 11 章 Skills：给 Agent 装专业技能包

第三部分进阶玩法

第 12 章 MCP：让 Agent 连上外面的世界

MCP 让 Agent 能力指数级扩展。但每装一个，都是给 Agent 多开一道权限。装之前问自己：这权限给它，我真的放心吗？---

第 13 章 Subagent：让 Agent 雇 Agent

到目前为止，你的 Claude Code 是"一个人在干活"。第 13 章告诉你它怎么"雇人"。

13.1 为什么需要 Subagent

想象一个复杂任务："帮我分析过去 30 天我的公众号数据，找出最受欢迎的内容方向，再给我 5 个新选题。"

如果一个 Agent 从头到尾干：

上下文会塞满 30 天的数据
跑到一半可能"忘了"最初的目标
出错了不好定位是哪一步出的问题

更好的做法：主 Agent 拆任务，每一步派给一个"子 Agent"独立干：

主 Agent（总指挥）
├── 子 Agent 1：拉过去 30 天数据
├── 子 Agent 2：按主题分类、统计阅读量
├── 子 Agent 3：找出 Top 10 文章的共同特征
└── 子 Agent 4：基于这些特征出 5 个新选题

每个子 Agent 只关心自己那一小块，跑完结果给主 Agent。

这就是 Subagent（子 Agent）。

13.2 Subagent 的好处

13.3 怎么用 Subagent

Claude Code 内置了 Subagent 机制，你不需要自己写代码。

方式 1：让主 Agent 自己派活

直接说：

这个任务很复杂，请用 subagent 并行处理：
- subagent 1 负责 A
- subagent 2 负责 B
- subagent 3 负责 C
全部跑完后汇总给我。

Claude Code 会自己开几个子 Agent，并行跑，最后给你汇总报告。

方式 2：预定义专门的 Subagent

在 ~/.claude/agents/ 目录下建一个 markdown 文件，定义一个"专门干某件事"的子 Agent。

例子：建一个文件数据分析师.md：

---
name: 数据分析师
description: 专门处理数据统计、趋势分析、报表生成。当任务涉及大量数据
             处理时调用。
---

你是一个数据分析师。

工作流程：
1. 先看数据结构，搞清楚有哪些字段
2. 用脚本做统计，不要手动算
3. 输出结构化报告：核心发现 + 数据明细
4. 不要瞎下结论，只说数据能支持的判断

之后任何任务里需要数据分析，主 Agent 会自动把这部分派给"数据分析师"子 Agent。

13.4 Subagent 用得好的关键

13.5 一个反直觉的事

不是所有任务都该用 Subagent。

简单任务用 Subagent，反而会变慢、变贵——拆任务、传上下文、汇总结果这些步骤本身有开销。

判断标准：

任务能并行跑的 → 适合 Subagent
任务需要专家视角的 → 适合预定义 Subagent
简单的线性任务 → 主 Agent 自己干就好

13.6 一句话总结

Subagent 是从"一个人干"升级到"团队作战"。复杂任务用它，简单任务别用它。

第 14 章记忆与上下文

很多新手用着用着会问："为什么 Claude Code 这一轮还记得我说的话，开个新窗口就忘了？"

这一章把"AI 的记忆"讲清楚。

14.1 三种"记忆"

绝大多数小白困惑的是前两个。

14.2 短期记忆：上下文窗口

关键概念：

上下文（Context）：当前对话里所有内容（你的输入 + AI 的输出 + 工具调用结果）。
上下文窗口（Context Window）：AI 一次能"看见"的最大文字量。
Token：AI 理解文字的最小单位。1 个中文字约 1-2 个 Token，1 个英文单词约 1 个 Token。

主流模型 2026 年的窗口规格：

上下文"用完了"会怎样

不会爆炸，但会出现：

AI 开始"忘"前面说过的话
输出质量下降
进入"压缩模式"自动总结前面内容

实操建议：一个窗口聊一件事。切话题就开新窗口。

14.3 跨会话记忆：靠文件

模型本身不会把你聊的内容存下来。所以跨会话的"记忆"得靠文件：

关键原则：所有重要的信息都要落到文件。光在对话里说，关掉窗口就没了。

14.4 上下文管理的三个反直觉技巧

技巧 1：不要一上来就把 100 个文件全塞进来

很多新手以为给 Agent 看的资料越多越好。错。

资料一多，AI 要花脑力去判断"哪个跟当前任务相关"，反而容易选错。精选 3-5 个核心文件，效果比塞 100 个好。

技巧 2：定期 /compact 清理

聊了一阵之后，对话窗口会塞很多无用细节（试错过程、跑挂的尝试）。

输入 /compact，Claude Code 会自动把对话压缩成关键摘要，保留核心结论，丢掉过程垃圾。继续聊不影响。

技巧 3：复杂任务用 Plan 模式

第 9 章提过的 Plan 模式（Shift + Tab 按两次）：让 Claude 先把方案规划好给你看，确认后再动手。

好处：

规划阶段消耗的上下文少
你能提前发现问题
真正执行时已经有清晰的路线图

14.5 一个常见误解

"AI 没记住我之前讲的话"≠ "AI 笨"。

它就不会记。每次开新窗口都是新的开始。这是机制，不是 bug。

解决方案永远是同一个：把重要信息落到 CLAUDE.md 或项目文件里。

第 15 章避坑清单

最后一章，把新手最容易踩的雷一次说清。每一条都附"怎么防"。

15.1 注意点：烧 Token 烧到肉疼

怎么烧的

一个窗口聊了几小时不清理
跑大任务忘了关，跑了一整夜
用最贵的模型干简单的事

怎么防

15.2 注意点：Agent 跑飞了，改坏文件

怎么坏的

用了狂飙模式
工作目录设错了，Agent 改了不该改的项目
提示词没说清楚边界，Agent 自由发挥

怎么防

15.3 注意点：装了一堆 Skill / MCP，Agent 反而变笨

为什么

每个 Skill / MCP 都要消耗 AI 的"判断脑力"。装太多，AI 要花更多算力决定"这次该用哪个"，结果用错的概率反而上升。

怎么防

写在最后

Agent 不是魔法，是工具。

它能不能帮你省时间、做出东西、变现，全看你怎么给它配套：你的偏好、你的 SOP、你的工具、你的判断。

动起手来，搭建你自己的第一个agent，用来替代你每天重复的事情。

Agent 小白完整教程(搭建你的数字员工)

Agent 小白完整教程(搭建你的数字员工)

第一部分看懂 Agent

第 1 章 Agent 到底是什么

第 2 章 Agent 都有哪些

第 3 章 Agent 的四个零件

第 4 章什么活适合丢给 Agent

第二部分上手 Claude Code

第 5 章为什么第一个 Agent 选 Claude Code

第 6 章装好 Claude Code

第 7 章第一个任务

第 8 章 Agent 怎么"想"和"做"

第 9 章工具调用：Agent 的手脚

第 10 章给 Agent 写说明书：CLAUDE.md

第 11 章 Skills：给 Agent 装专业技能包

第三部分进阶玩法

第 12 章 MCP：让 Agent 连上外面的世界

第 13 章 Subagent：让 Agent 雇 Agent

第 14 章记忆与上下文

第 15 章避坑清单

写在最后

You May Also Like

CATALOG

Agent 小白完整教程(搭建你的数字员工)

第一部分 看懂 Agent

第 1 章 Agent 到底是什么

第 2 章 Agent 都有哪些

第 3 章 Agent 的四个零件

第 4 章 什么活适合丢给 Agent

第二部分 上手 Claude Code

第 5 章 为什么第一个 Agent 选 Claude Code

第 6 章 装好 Claude Code

第 7 章 第一个任务

第 8 章 Agent 怎么"想"和"做"

第 9 章 工具调用：Agent 的手脚

第 10 章 给 Agent 写说明书：CLAUDE.md

第 11 章 Skills：给 Agent 装专业技能包

第三部分 进阶玩法

第 12 章 MCP：让 Agent 连上外面的世界

第 13 章 Subagent：让 Agent 雇 Agent

第 14 章 记忆与上下文

第 15 章 避坑清单

写在最后

You May Also Like

CATALOG

Related Posts

第一部分看懂 Agent

第 4 章什么活适合丢给 Agent

第二部分上手 Claude Code

第 5 章为什么第一个 Agent 选 Claude Code

第 6 章装好 Claude Code

第 7 章第一个任务

第 9 章工具调用：Agent 的手脚

第 10 章给 Agent 写说明书：CLAUDE.md

第三部分进阶玩法

第 14 章记忆与上下文

第 15 章避坑清单