Agent 小白完整教程(搭建你的数字员工)

看完这篇:从零开始搞清楚 Agent 是什么,再用 Claude Code 做出你自己的第一个 Agent。全程不需要任何编程基础。看不懂的名词随时截图丢给豆包问。
第一部分 看懂 Agent
第 1 章 Agent 到底是什么
1.1 一句话定义
Chatbot(聊天机器人)= 能说不能做
Agent(智能体) = 能说,也能做
你跟 ChatGPT 说"帮我订一张明天去上海的机票",它会回你一段话:
好的,这是一些航班信息,你可以去携程预订。
然后就没了。
它能告诉你怎么办,但不会真的帮你点鼠标、填表、付钱。
Agent 不一样。同样这句话给到一个真正的旅行 Agent,它会自己打开浏览器、查航班、对比价格、填乘机人信息、停在付款前问你确认。
整个过程你只说了一句话。
这就是 Agent 和 Chatbot 最核心的区别:一个只会给答案,一个会替你把事做完。1.2 用合同当例子
一个是"告诉你答案",一个是"帮你把事情做完"。
1.3 一个关键认知:AI 自己其实啥都干不了
很多人以为 Agent 是"更聪明的 AI",其实不是。
它和 ChatGPT 用的常常是同一个大脑(同一个模型),区别在于有没有手脚。
更准确的说法:
AI 大脑本身只能输出文字。所谓"调用工具",本质是 AI 输出一段特殊格式的指令说"我要用 XX 工具",外部程序读到这段指令,去真的执行操作,再把结果返回给 AI。AI 从头到尾只在处理文字,真正动手的是程序。
所以 Agent 的真实工作流程是这样的:
1. AI 大脑收到指令,思考"第一步该干什么"
2. AI 输出:"我要用'读文件'这个工具,读取合同模板.docx"
3. 外部程序读到这句话,真的去打开那个文件
4. 程序把读取结果返回给 AI:"发现 5 个空白字段"
5. AI 拿到结果,继续思考下一步:"好,现在填第一个字段……"
6. 循环这个过程,直到任务完成
理解了这一点,你后面就不会再问"为什么 Agent 不能直接帮我做 XX"这种问题,答案永远是:因为它没有那个工具。
1.4 不是有工具就叫 Agent
光给 AI 配一堆工具,它不会自己用,那也不是 Agent。
真正让 AI 升级成 Agent 的,是这三样配合:
Agent = AI 大脑 + 工具箱 + 自主决定
(思考) (能做事) (不用你一步步指挥)
- 大脑:负责理解你的话、做判断、规划步骤。
- 工具箱:能读文件、写文件、跑命令、调外网、发邮件、控浏览器……
- 自主决定:你说"把这 10 份合同都填好",它自己决定先做哪份、卡住了怎么换方案、做完了怎么验证。不是你说一步它动一步。
少了第三样,你得到的只是"能调用工具的聊天框",不是 Agent。
1.5 一句话总结
Chatbot 是会聊天的 AI。Agent 是会干活的 AI。
后面所有内容都围绕一个问题展开:怎么让 AI 真的帮你干活,而不是只给你建议。
第 2 章 Agent 都有哪些
市面上叫"Agent"的东西太多了,先把分类捋清楚,后面挑工具的时候你才不会迷路。
2.1 按"自己能多自主"分(最实用的分法)
这是最贴近用户感受的分法。 我用 L0 到 L5 来排:你的话越模糊,它越要自己拿主意,等级就越高。
L5 现在没有真正可靠的实现,谁说有,你都可以打个问号。绝大多数用户日常用的是 L0-L1。
这套教程的目标是把你带到 L3-L4 : 也就是 Claude Code 能做到的程度。2.2 按"长什么样"分
同一个 Agent 内核,包装不同界面,给人的感觉天差地别。
命令行型(在终端里用,能力最强)
命令行 Agent
├── Claude Code —— Anthropic 出品,本教程主角
└── Codex CLI —— OpenAI 出品,开源
- 没有花哨界面,全靠打字。
- 能直接操作你电脑上所有文件,能力上限最高。
- 看起来吓人,其实就是"加强版聊天框"。
图形界面型(有可视化界面,更友好)
图形 Agent
├── Claude Cowork —— Anthropic 出品,给非技术人用
├── Trae Solo —— 字节出品,国产
├── WorkBuddy —— 腾讯出品,面向职场非开发
└── Kiro —— AWS 出品
- 看上去像 Word/微信那种正常软件。
- 能力被简化过,没命令行那么自由,但门槛低。
工作流编排型(拖拽搭积木)
工作流平台
├── Coze(扣子)—— 字节出品
├── Dify —— 开源
├── n8n —— 老牌自动化平台
└── Make / Zapier —— 海外
- 不是真正意义上的"Agent",更像"AI 工作流"。
- 流程是你拖出来的、写死的,AI 只在某些节点参与判断。
- 优点:稳定、可视化、好交接。
- 缺点:遇到没预设的情况就卡住。
自主运行型(后台一直跑)
持续运行 Agent
├── OpenClaw —— 开源,能用微信/电报远程控你的电脑
└── 各种"虚拟员工"产品
- 不是用完就关,是 7×24 一直挂着等你派活。
- 风险高,权限大,要慎用。
2.3 按"怎么实现的"分(技术视角,了解即可)
技术圈把 Agent 分成两大流派:
生产环境里两种都有用——简单重复的事交给工作流,复杂多变的事交给自主型 Agent。 这套教程聚焦后者。
2.4 不属于 Agent 的东西
为了不被各种营销话术忽悠,记住这几样不是Agent:
- 纯聊天对话:豆包、DeepSeek 网页、ChatGPT 网页——这些是 Chatbot。
- 传统语音助手:Siri、小爱、小度,这些是"意图识别 + 预设动作",没有真正的自主决策。
- 推荐系统/搜索引擎:百度、抖音推荐——这些是按数据库排序,不是 Agent。
判断一个东西是不是 Agent,就看两点:
- 它能不能真的执行操作(不只是给建议)。
- 它能不能自己决定下一步干什么(不只是按预设流程走)。
两点都满足,才叫 Agent。
2.5 这套教程为什么用 Claude Code
第 5 章会详细讲,先抛结论:
- 它免费起步,门槛极低。
- 它装在你电脑里,能直接动你的文件,不是只能在浏览器里聊天。
- 它的"工具箱"扩展性最强,后面讲的 Skills、MCP、Subagent 都围绕它展开。
- 全球顶级公司都在用它干真活,不是玩具。
第 3 章 Agent 的四个零件
不管哪家的 Agent,拆开看都是这四样东西。看懂了这四样,你以后看任何 Agent 产品的介绍都不会被概念绕晕。
Agent = 大脑 + 手脚 + 记忆 + 主见
(LLM) (Tools) (Memory) (Autonomy)
类比你雇一个实习生:
- 实习生得有脑子,能听懂你的话——大脑。
- 实习生得有手,能真的去做事——手脚。
- 实习生得记得住事,不能每次都问"你刚才让我干嘛来着"——记忆。
- 实习生得自己拿主意,不是你每说一个字他才动一下——主见。
少一样都不是合格的 Agent。
3.1 大脑:LLM(大语言模型)
LLM = Large Language Model,大语言模型。Claude、GPT、Gemini、豆包、DeepSeek、Kimi、GLM、千问,这些都是 LLM。
它的工作机制就一句话:接收一段文字,预测最合适的下一段文字。听起来很简单,但这种预测能力强到能通过医学考试、写代码、做分析。
关键点
- 同一个模型放在不同工具里,能力天差地别。Claude 模型放在网页里只是聊天,放在 Claude Code 里就能改你电脑里的文件。
- 模型只能输出文字,不能直接操作任何东西。所有"动手"的事,都要靠工具。
- 模型本身没有记忆,每次对话开始它都是从零开始的"新人"。
3.2 手脚:Tools(工具)
工具就是让 AI 真的能"动手"的那些能力。
一个反直觉的事实
工具越少越好,不是越多越好。工具一多,AI 就要花更多脑力判断"这次该用哪个工具",结果反而容易选错、用错。
所以 Claude Code 默认就给了十来个最常用的工具,绝大多数场景这些就够了。真正不够用的时候,再去装 MCP(第 12 章)扩展。
3.3 记忆:Memory
AI 模型本身没有记忆。
每次开新对话,它都是"我是谁,我从哪里来"的状态。
但 Agent 必须有记忆,否则没法干复杂任务。
Agent 的"记忆"分两层:
短期记忆:当前对话的上下文
- 你这一轮对话从头到尾说的所有话,AI 都看得见。
- 但换一个新窗口、新对话,前面的就全忘了。
- 关键指标叫上下文窗口(Context Window),就是 AI 一次能"看见"的最大文字量。主流模型现在到了 100 万 Token,大约 70 万字。
长期记忆:跨对话保留的信息
- 通常存在文件里、数据库里、知识库里。
- AI 需要的时候,主动去这些地方查。
- Claude Code 的 CLAUDE.md(第 10 章)就是最常用的一种长期记忆。
3.4 主见:Autonomy(自主性)
这是 Agent 和"配了工具的 Chatbot"最根本的区别。
- 你说:"研究一下字节跳动,写份报告。"
- Chatbot:丢一段它知道的旧信息给你,让你自己去查证。
- Agent:自己拆任务——查公司背景、查产品线、查竞品、查财报、汇总写报告——挨个跑完。中间发现哪一步资料不够,自己再搜一遍。
主见的本质是这个循环:
思考 → 行动 → 看结果 → 再思考 → 再行动 → 再看结果 → …… → 完成
这个循环行内叫 Agent Loop(Agent 循环),第 8 章会拆开讲。
3.5 真实生产环境里还有第五样:护栏
光有上面四样,Agent 是个"放出来撒野的实习生"。真要上生产,还得加一层护栏:

新手阶段不用太纠结护栏,但心里要有这根弦:Agent 越自主,越要给它套笼子。第 15 章会讲新手最该装的几道护栏。
3.6 一张图记住
你(人)
↓ 用自然语言下指令
Agent
├── 大脑(模型)—— 思考
├── 手脚(工具)—— 执行
├── 记忆(上下文 + 文件)—— 记住
└── 主见(循环逻辑)—— 自己拿主意
↑
护栏(权限/预算/审批/沙箱)—— 防它闯祸
后面所有章节,你都可以用这张图对号入座。
第 4 章 什么活适合丢给 Agent
Agent 强,但不是万能。用错了场景,它就是个烧钱机器。这一章帮你建立判断力。
4.1 适合 Agent 的 5 个特征

4.2 千万别用 Agent 的 6 个场景

4.3 不可逆操作要单独说
新手最容易在这里栽跟头。
任何"做完就收不回来"的操作——付款、发布、删除、群发邮件、改生产数据——默认都应该人确认,不要让 Agent 自动跑。
不是因为 Agent 做不到,是因为它做错的代价你扛不起。
护栏的核心就是:把不可逆操作前都加一道"等人确认",让 Agent 干 99 步,人按一下"确认"那一步。
4.4 一个简单的判断方法
如果这个任务你能用文字清清楚楚教会一个刚入职的实习生怎么做,那它大概率适合 Agent。
如果你自己都说不清"怎么算做好了",Agent 也搞不定。
举几个例子帮你校准:

4.5 小结
记住一句话:
Agent 是增强工具,不是替代品。它能帮你处理重复性、结构化的任务,但目标得你定、过程得你看、结果得你验。
下一部分开始上手 Claude Code,把这些概念变成你电脑里真的能动的东西。
第二部分 上手 Claude Code
第 5 章 为什么第一个 Agent 选 Claude Code
市面上 Agent 工具有几十款,我直接推荐 Claude Code,理由有四个。
5.1 它装在你电脑里,能动你的文件
绝大多数 AI 产品(豆包、ChatGPT、Coze)都是"网页里聊天",再聪明也只能给你建议。
Claude Code 装在你自己的电脑上,从启动那一刻就能:
- 看你电脑里的所有文件
- 改你电脑里的所有文件
- 在你电脑上跑命令(启动浏览器、装软件、下载视频……)
这是从"AI 助手"变成"Agent"的关键一步。
5.2 它把 Agent 该有的零件全配齐了
回顾第 3 章的四件套——大脑、手脚、记忆、主见。Claude Code 全有:

别的 Agent 工具往往只给你某一两样,剩下的得自己拼。Claude Code 一站式给齐。
5.3 它的扩展能力是天花板级别
Claude Code 有四套扩展机制(后面章节会一一讲):

四套机制可以叠加用,能力上不封顶。
5.4 它是工业级工具,不是玩具
Claude Code 是 Anthropic 内部给自家工程师用的工具。被全球顶级 AI 公司、独角兽、个人开发者每天用来做真正的工作。
对小白意味着什么:
- 文档全、教程多、社区活跃,遇到问题搜得到答案。
- 更新快、问题修得快,不会用着用着就停摆。
- 学了不浪费,市面上越来越多的 Agent 工具都在抄它的设计。
5.5 它的缺点也要讲清
为了不让你产生过高预期,提前说几个槽点:

5.6 一句话总结
Claude Code 不是最容易上手的 Agent,但是上手之后天花板最高的 Agent。 学它一个,能省你试 10 个工具的时间。
第 6 章 装好 Claude Code
第 7 章 第一个任务
装好不算上手,跑通一个任务才算。这一章做一个最简单的练手项目,让你建立"它真的在替我干活"的体感。
7.1 任务设定:让 Agent 帮你整理桌面
桌面上文件乱成一锅粥是绝大多数人的常态。这个任务让 Claude Code 帮你:
- 扫描桌面所有文件
- 按类型分到不同文件夹(图片、文档、视频、压缩包、其他)
- 给你一份整理报告(哪些文件移到了哪里,有没有不知道怎么分类的)
7.2 在 VS Code 里建一个工作目录
直接动桌面文件风险大,先建一个练手目录:
- 打开 VS Code → 文件 → 打开文件夹 → 新建一个文件夹(如 agent-练习)→ 打开。
- 信任项目(弹窗里点"是,我信任作者")。
- 在这个文件夹里手动放几个测试文件:一张图、一个 PDF、一个 zip、一个 txt(模拟桌面)。
7.3 启动 Claude Code
在 VS Code 顶部点"终端" → "新终端",或直接按 Ctrl+ `。
终端里输入:
claude --dangerously-skip-permissions
这是"狂飙模式",AI 改文件不用每次都问你。第一次练手用这个能省心。生产任务上慎用,第 15 章会讲。
7.4 把任务给它
对话框里输入:
请扫描当前目录下的所有文件,按类型分类:
- 图片(.jpg .png .gif .webp)放到 images/
- 文档(.pdf .doc .docx .txt .md)放到 documents/
- 视频(.mp4 .mov .avi)放到 videos/
- 压缩包(.zip .rar .7z)放到 archives/
- 其他放到 others/
子文件夹不存在就先建好。整理完给我一份报告:
- 总共处理了多少文件
- 每个分类下有多少个
- 有没有遇到处理不了的情况
回车,看它跑。
7.5 它会做什么
你会看到 Claude Code 一步步:
- 看了一眼当前目录有哪些文件(调用 LS 工具)
- 新建分类文件夹(调用 Bash 工具)
- 把文件挨个移过去(调用 Bash 工具)
- 统计数量(自己算)
- 输出报告(生成文字)
整个过程你只说了一句话,剩下的全是它自己想清楚、自己干完。
7.6 验证
去 VS Code 的资源管理器看左边:
- images/、documents/ 这些子文件夹是不是出现了?
- 文件是不是按类型放对了?
- 终端最后的报告对不对?
跑通了,你就拥有第一个真正干过活的 Agent。
7.7 这一节做对了什么
- 明确的任务:扫描、分类、移动、报告——四个动作每个都很清楚。
- 明确的成功标准:文件夹结构 + 报告数据。
- 不可逆操作有边界:在练习目录里玩,搞坏了不心疼。
- 一句话指令:不用一步步指挥,告诉它"想要什么",它自己拆"怎么做"。
记住这四点。你以后所有交给 Agent 的任务,都按这个模板组织,成功率会高 80%。
7.8 你可能踩的坑

第 8 章 Agent 怎么"想"和"做"
第 7 章你看着 Claude Code 跑了一整套流程,可能心里好奇:它到底是按什么逻辑跑的?理解这个逻辑,你后面写提示词、装 Skills、配 MCP 都不会再凭感觉。
8.1 Agent 的核心循环
不管什么 Agent,工作机制都是同一个循环:
收集上下文 → 采取行动 → 验证结果 → 重复
翻译成大白话:
- 看一眼现在的状况(读文件、查资料、看上一步结果)
- 干一件事(写文件、跑命令、调工具)
- 看干得对不对(结果是不是预期的、有没有报错)
- 决定下一步(继续干、换个方法、还是任务完成)
这就是行内说的 Agent Loop。
8.2 用第 7 章的例子拆解
回头看第 7 章那个整理桌面任务,Claude Code 实际跑的循环长这样:

每一轮都是"看一眼、干一件、查一下"。这就是 Agent 和 Chatbot 最根本的区别——Chatbot 一次性回答你,Agent 在循环里反复推进。
8.3 这个循环为什么强大
因为它能自我纠错
想象一下:第 3 轮 Claude 想移 photo.jpg,结果文件名有空格导致命令失败。它在"验证"那一步看到了报错,下一轮就会调整策略——给文件名加引号再试一次。
这是 Chatbot 做不到的。Chatbot 给完答案就结束了,它不知道你跑了之后报没报错。
因为它能处理事先没规划的情况
第 7 章的任务里,假设桌面突然多了一个 .xlsx 文件。Excel 不在你列的分类里——Claude 会自己判断"这是文档类,放 documents/",不会卡死。
这就是 Agent 的"主见"在起作用。
8.4 你能影响这个循环的三个地方
知道循环长什么样还不够,你得知道你的输入怎么影响它。

这就是为什么后面三章这么重要:
- 第 10 章(CLAUDE.md)让你长期影响它的循环。
- 第 11 章(Skills)让你按场景影响它的循环。
- 第 12 章(MCP)让你给它更多工具,循环里能调更多花样。
8.5 一个反复出现的提醒
理解了循环,记住一句话:
Agent 不是一次性回答你的,它是在持续反复推进任务的。
所以你的指令越明确、规则越清晰、工具越合适,循环跑得越准。
下一章细看它的"手脚"——工具到底有哪些、怎么用。
第 9 章 工具调用:Agent 的手脚
第 8 章讲了 Agent 在"循环"里跑。这一章看清它"循环里到底用了哪些手"。
不写代码也得懂这些工具,因为:
- 你要知道 Agent 能干什么(不至于让它干超能力之外的事)。
- 你要知道每个工具的风险(哪些是只看不动、哪些会改你的电脑)。
9.1 Claude Code 默认带的核心工具

记住三个等级:
- 绿(安全):只读不写,可以放心给它用。
- 黄(中):会动文件,需要你看着点。
- 红(高):能跑任意命令,潜在风险大。
9.2 一个具体例子
你说:"帮我看看 project/ 目录里有哪些 markdown 文件,统计一下总字数。"
Claude Code 会这样跑:
1. 调用 Glob:找 project/ 下所有 .md 文件
→ 找到 12 个
2. 调用 Read:挨个读这 12 个文件
→ 读完拿到全部内容
3. 内部统计:算字数
4. 输出结果:"共 12 个文件,总字数 35,427"
整个过程它没改你任何东西——全程绿色工具。
9.3 工具的"权限模式"
Claude Code 默认在每次用黄色或红色工具前都会问你"要不要执行"。这是它的护栏机制。

实操建议:
- 第一次跑新任务 → 普通模式或 Plan 模式
- 信任的任务 → Auto-Accept
- 一次性玩具项目 → 狂飙模式
9.4 工具是"按需配"的
Claude Code 默认这些工具就够 90% 场景用了。剩下 10% 怎么办——靠 MCP(第 12 章)。

关键原则:工具不是越多越好。每个 MCP 都会消耗 AI 的"判断脑力",装太多反而让它选错工具。装一个用一个,长期闲置的删掉。
9.5 一句话总结
工具是 Agent 的手脚,手脚越合适越好用,不是越多越好。
下一章讲长期记忆——让 Agent 长期记住你的偏好。
第 10 章 给 Agent 写说明书:CLAUDE.md
到目前为止,你每次开新对话都要从零开始解释自己——"我是谁、我喜欢什么风格、我的项目结构是什么样的"。
CLAUDE.md 解决这件事。
10.1 CLAUDE.md 是什么
一句话:给 Claude 看的长期说明书。
它就是一个普通的 markdown 文件,放在特定位置,Claude Code 每次启动会自动读一遍,把里面的内容当成"我对你的了解"。
效果:
- 不用每次告诉它"我是产品经理,不写代码"。
- 不用每次说"输出文件统一放 outputs/ 文件夹"。
- 不用每次解释"我的项目用的是 XXX 技术栈"。
10.2 两种 CLAUDE.md:全局 vs 项目

实操原则:
- 跟"你是谁"有关的写全局(身份、语言、风格、底线红线)
- 跟"这个项目什么样"有关的写项目级(技术栈、目录结构、特殊约定)
10.3 怎么创建全局 CLAUDE.md
Mac/Linux 在终端输入:
mkdir -p ~/.claude
open ~/.claude
Windows:
mkdir $env:USERPROFILE\.claude
explorer $env:USERPROFILE\.claude
在弹出的文件夹里新建一个文件叫 CLAUDE.md,用 VS Code 打开它编辑。
10.4 一份小白可直接抄的全局 CLAUDE.md
# 全局规则
## 沟通
- 中文回复
- 称呼我为"你"
- 我不是程序员,所有解释用大白话
- 不要用专业术语,必须用时给出大白话解释
## 工作方式
- 收到需求后:先调研 → 出方案 → 我确认 → 拆解步骤 → 执行
- 不明确的需求,先问我,不要自己猜
- 优先用工具解决问题
- 简单原则,不要过度设计
## 输出
- 所有生成的文件统一放到 outputs/ 文件夹
- 文件名用中文,简短可读
- 不要在文件里写 emoji
- 不要在文件结尾加"如有问题请联系我"这类客套话
## 危险操作
- 删除文件前必须先问我
- 改别的项目文件前必须先问我
- 发布、付款、群发邮件前必须先问我
- 不可逆操作一律先确认
把这段内容复制到你的 CLAUDE.md,按你的实际情况改几条,保存。
10.5 怎么创建项目级 CLAUDE.md
在某个项目目录下,新建文件 CLAUDE.md,写你这个项目特有的规则。
例子:你有一个"公众号文章"项目,CLAUDE.md 可以这样写:
# 项目:公众号文章
## 这个项目是什么
我用来写公众号文章的工作区。
## 目录结构
- drafts/ 草稿
- published/ 已发布
- images/ 配图
- references/ 参考资料
## 写作风格
- 标题不超过 18 字
- 开头必须有钩子,前 3 句话决定读者要不要往下看
- 段落短,一段最多 3 句
- 不用 emoji
- 不写"如有侵权请联系删除"这类废话
## 工作流程
1. 我说选题 → 你先列大纲 → 我确认 → 你写初稿
2. 写完初稿放 drafts/,文件名格式 YYYY-MM-DD-标题.md
3. 我说"定稿" → 你移到 published/
下次你在这个项目里启动 Claude Code,它自动就按这套规则跑。
10.6 写 CLAUDE.md 的几个坑

10.7 一个偷懒办法
不知道写什么?直接让 Claude Code 自己生成。
启动 Claude Code 后输入:
请根据我们这几次的对话,帮我起草一份全局 CLAUDE.md。
要包含:我的身份、我的工作偏好、我容易踩的坑、不可逆操作的红线。
草稿出来后给我确认,不要直接保存到文件。
它会出一份草稿,你看一眼,改几句,复制到 ~/.claude/CLAUDE.md 即可。
10.8 一句话总结
CLAUDE.md = 写一次,长期用的偏好说明书。配完之后,Claude Code 才真正变成"你的Agent",而不是"一个通用Agent"。
第 11 章 Skills:给 Agent 装专业技能包
第三部分 进阶玩法
第 12 章 MCP:让 Agent 连上外面的世界
MCP 让 Agent 能力指数级扩展。但每装一个,都是给 Agent 多开一道权限。装之前问自己:这权限给它,我真的放心吗?---
第 13 章 Subagent:让 Agent 雇 Agent
到目前为止,你的 Claude Code 是"一个人在干活"。第 13 章告诉你它怎么"雇人"。
13.1 为什么需要 Subagent
想象一个复杂任务:"帮我分析过去 30 天我的公众号数据,找出最受欢迎的内容方向,再给我 5 个新选题。"
如果一个 Agent 从头到尾干:
- 上下文会塞满 30 天的数据
- 跑到一半可能"忘了"最初的目标
- 出错了不好定位是哪一步出的问题
更好的做法:主 Agent 拆任务,每一步派给一个"子 Agent"独立干:
主 Agent(总指挥)
├── 子 Agent 1:拉过去 30 天数据
├── 子 Agent 2:按主题分类、统计阅读量
├── 子 Agent 3:找出 Top 10 文章的共同特征
└── 子 Agent 4:基于这些特征出 5 个新选题
每个子 Agent 只关心自己那一小块,跑完结果给主 Agent。
这就是 Subagent(子 Agent)。
13.2 Subagent 的好处

13.3 怎么用 Subagent
Claude Code 内置了 Subagent 机制,你不需要自己写代码。
方式 1:让主 Agent 自己派活
直接说:
这个任务很复杂,请用 subagent 并行处理:
- subagent 1 负责 A
- subagent 2 负责 B
- subagent 3 负责 C
全部跑完后汇总给我。
Claude Code 会自己开几个子 Agent,并行跑,最后给你汇总报告。
方式 2:预定义专门的 Subagent
在 ~/.claude/agents/ 目录下建一个 markdown 文件,定义一个"专门干某件事"的子 Agent。
例子:建一个文件 数据分析师.md:
---
name: 数据分析师
description: 专门处理数据统计、趋势分析、报表生成。当任务涉及大量数据
处理时调用。
---
你是一个数据分析师。
工作流程:
1. 先看数据结构,搞清楚有哪些字段
2. 用脚本做统计,不要手动算
3. 输出结构化报告:核心发现 + 数据明细
4. 不要瞎下结论,只说数据能支持的判断
之后任何任务里需要数据分析,主 Agent 会自动把这部分派给"数据分析师"子 Agent。
13.4 Subagent 用得好的关键

13.5 一个反直觉的事
不是所有任务都该用 Subagent。
简单任务用 Subagent,反而会变慢、变贵——拆任务、传上下文、汇总结果这些步骤本身有开销。
判断标准:
- 任务能并行跑的 → 适合 Subagent
- 任务需要专家视角的 → 适合预定义 Subagent
- 简单的线性任务 → 主 Agent 自己干就好
13.6 一句话总结
Subagent 是从"一个人干"升级到"团队作战"。复杂任务用它,简单任务别用它。
第 14 章 记忆与上下文
很多新手用着用着会问:"为什么 Claude Code 这一轮还记得我说的话,开个新窗口就忘了?"
这一章把"AI 的记忆"讲清楚。
14.1 三种"记忆"

绝大多数小白困惑的是前两个。
14.2 短期记忆:上下文窗口
关键概念:
- 上下文(Context):当前对话里所有内容(你的输入 + AI 的输出 + 工具调用结果)。
- 上下文窗口(Context Window):AI 一次能"看见"的最大文字量。
- Token:AI 理解文字的最小单位。1 个中文字约 1-2 个 Token,1 个英文单词约 1 个 Token。
主流模型 2026 年的窗口规格:

上下文"用完了"会怎样
不会爆炸,但会出现:
- AI 开始"忘"前面说过的话
- 输出质量下降
- 进入"压缩模式"自动总结前面内容
实操建议:一个窗口聊一件事。切话题就开新窗口。
14.3 跨会话记忆:靠文件
模型本身不会把你聊的内容存下来。所以跨会话的"记忆"得靠文件:

关键原则:所有重要的信息都要落到文件。光在对话里说,关掉窗口就没了。
14.4 上下文管理的三个反直觉技巧
技巧 1:不要一上来就把 100 个文件全塞进来
很多新手以为给 Agent 看的资料越多越好。错。
资料一多,AI 要花脑力去判断"哪个跟当前任务相关",反而容易选错。精选 3-5 个核心文件,效果比塞 100 个好。
技巧 2:定期 /compact 清理
聊了一阵之后,对话窗口会塞很多无用细节(试错过程、跑挂的尝试)。
输入 /compact,Claude Code 会自动把对话压缩成关键摘要,保留核心结论,丢掉过程垃圾。继续聊不影响。
技巧 3:复杂任务用 Plan 模式
第 9 章提过的 Plan 模式(Shift + Tab 按两次):让 Claude 先把方案规划好给你看,确认后再动手。
好处:
- 规划阶段消耗的上下文少
- 你能提前发现问题
- 真正执行时已经有清晰的路线图
14.5 一个常见误解
"AI 没记住我之前讲的话"≠ "AI 笨"。
它就不会记。每次开新窗口都是新的开始。这是机制,不是 bug。
解决方案永远是同一个:把重要信息落到 CLAUDE.md 或项目文件里。
第 15 章 避坑清单
最后一章,把新手最容易踩的雷一次说清。每一条都附"怎么防"。
15.1 注意点:烧 Token 烧到肉疼
怎么烧的
- 一个窗口聊了几小时不清理
- 跑大任务忘了关,跑了一整夜
- 用最贵的模型干简单的事
怎么防

15.2 注意点:Agent 跑飞了,改坏文件
怎么坏的
- 用了狂飙模式
- 工作目录设错了,Agent 改了不该改的项目
- 提示词没说清楚边界,Agent 自由发挥
怎么防

15.3 注意点:装了一堆 Skill / MCP,Agent 反而变笨
为什么
每个 Skill / MCP 都要消耗 AI 的"判断脑力"。装太多,AI 要花更多算力决定"这次该用哪个",结果用错的概率反而上升。
怎么防

写在最后
Agent 不是魔法,是工具。
它能不能帮你省时间、做出东西、变现,全看你怎么给它配套:你的偏好、你的 SOP、你的工具、你的判断。
动起手来,搭建你自己的第一个agent,用来替代你每天重复的事情。

