loading image

AI 时代,如何用 Codex 打造个人学习系统

Posted by Enovace on June 25, 2026

AI 时代,如何用 Codex 打造个人学习系统

从“让 AI 回答问题”,到“让 AI 驱动能力成长”

AI 已经把获取知识的成本打到了很低。

过去想学习一个新领域,你可能要先找课程、买书、整理资料,再花很长时间搭一套知识框架。现在只要把问题丢给大模型,几分钟内就能得到概念解释、学习路径、案例拆解,甚至一份可以运行的项目代码。

但很多人很快会发现:信息变多了,学习并没有真的变稳。

你问了很多问题,却没有形成自己的知识体系;生成过好几份学习计划,却很难持续执行;看懂了 AI 的答案,换一个真实任务还是做不出来;收藏了大量提示词,下次开新对话又要重新介绍背景、目标、进度和卡点。

问题不在 AI 不够强,而在于我们仍然把 AI 当成一个“临时问答工具”。

一次对话可以解决一个局部问题,却无法天然管理长期目标、学习进度、能力变化、错误记录和项目成果。真正值得思考的问题,已经不再是“如何让 AI 给我制定一份学习计划”,而是:

如何把 AI 变成个人学习系统的长期执行引擎?

开源项目 Goal Learning OS提供了一个很有启发性的方向:以 Codex 为核心,把学习过程组织成一个本地仓库,把目标、知识地图、每日任务、练习、测试、错误、复盘和项目成果全部沉淀为可维护的文件。

这件事的关键不只是“让 AI 帮我学习”,而是把学习变成一个可以运行、检查、迭代的系统。

当学习进入仓库,目标不再是一句口号,任务不再是一段临时建议,错误不再被遗忘,项目也不再等到最后才开始。Codex 读取已有状态,继续推进下一步,更新文件,运行检查,帮助你把一次次零散对话变成持续积累的能力工程。


一、AI 时代真正稀缺的,不是知识,而是学习闭环

传统学习方式通常关注三个问题:学什么、看什么、记什么。

但真正能形成能力的学习系统,还必须回答另外一组问题:

今天为什么要学这个内容?学完以后要完成什么任务?如何证明自己真的掌握了?错误应该记录在哪里?什么时候重新测试?今天的学习如何进入最终项目?如果进度不符合预期,后续路线如何调整?

这些问题听起来不如“学习路线图”性感,却决定了学习能不能转化成能力。

一个完整的学习闭环,至少应该包含下面这条链路:

目标定义
→ 知识拆解
→ 任务执行
→ 主动练习
→ 产出成果
→ 测试验证
→ 错误记录
→ 路线调整
→ 项目交付

很多 AI 学习计划只覆盖了前两步:目标和内容。它会告诉你第一周学什么,第二周学什么,推荐哪些资料,看起来很完整。但学习真正断裂的地方,往往发生在后面:没有练习,没有验收,没有错误记录,没有复测,也没有项目承接。

于是你会产生一种错觉:我已经“学习”过这个主题了。

但当你需要独立完成一个真实任务,比如设计一个 Agent 工作流、写一个自动化脚本、搭一套市场研究提示词系统时,你会发现脑子里只有零散概念,没有可调用的方法。

有效的个人学习系统,必须覆盖整个闭环。它不只是告诉你“今天学什么”,还要明确今天必须完成什么,完成到什么程度才算通过,哪些错误需要再次训练,当前成果如何进入最终项目,下一步应该继续、补课还是降低难度。

这正是 Codex 相比普通对话式 AI 更适合承担的角色。

普通聊天机器人擅长解释问题,Codex 更适合维护状态。它可以读取文件,理解目录结构,修改内容,执行命令,运行测试,并基于已有记录继续工作。

也就是说,我们可以把“学习”本身当成一个长期项目来管理。


二、为什么是 Codex:学习需要一个能读写状态的执行引擎

如果只是问一个概念,任何大模型都能给出不错的回答。

但个人学习系统的核心不是单次回答,而是长期状态管理。

你今天学到了哪里?昨天哪里没完成?最近三次都错在什么地方?最终项目推进到了哪个模块?哪些概念需要三天后复测?当前计划是否已经超出每天 60 分钟的时间预算?

这些问题无法靠“记忆力很好的聊天窗口”稳定解决。更可靠的方式,是把学习状态写成文件,让 AI 每次都从文件中读取事实,而不是凭对话上下文猜测。

Codex 的优势就在这里。它可以直接进入本地项目环境:

读取文件
理解目录结构
修改学习记录
生成每日任务
维护错误日志
推进项目文档
运行检查脚本
根据已有状态继续工作

在这个模型下,学习系统可以拆成三层。

第一层是 Codex。它负责理解目标、读取状态、执行任务、更新文件和运行检查。

第二层是 AGENTS.md。它相当于学习系统的运行规则,告诉 Codex 每次进入仓库时应该怎么做,哪些文件必须更新,什么情况下需要测试,如何记录错误,哪些任务必须由学习者亲自完成。

第三层是 Learning Repository,也就是学习仓库。它保存目标、知识地图、路线、每日任务、练习、测试、错题、项目和最终成果。

这三层组合起来,AI 的角色就变了。

它不再只是一个回答问题的助手,而是一个围绕目标持续执行的学习操作系统。每次打开仓库,它都能看到你当前的进度、历史错误、未完成任务和项目状态,然后从第一个未完成步骤继续推进。

对知识工作者、创作者和开发者来说,这一点非常关键。因为你真正想要的不是“多知道一点”,而是“持续形成能交付的能力”。


三、把学习过程设计成一个仓库,而不是一份计划

一个成熟的个人学习系统,不应该只有一份 30 天计划。

计划只回答“未来想怎么做”,仓库回答的是“现在真实发生了什么”。

它既保存路线,也保存执行痕迹;既保存知识,也保存错误;既保存练习,也保存项目成果。你可以从下面这套结构开始:

learning-repo/
├── AGENTS.md
├── README.md
├── progress.md
│
├── 00_meta/
│   ├── intake.md
│   ├── assumptions.md
│   └── sources_policy.md
│
├── 01_maps/
│   ├── knowledge_map.md
│   ├── core_concepts.md
│   └── learning_dependencies.md
│
├── 02_roadmap/
│   ├── 30_day_plan.md
│   ├── weekly_milestones.md
│   └── final_project_plan.md
│
├── 03_daily_tasks/
│   ├── day_01.md
│   ├── day_02.md
│   └── ...
│
├── 04_glossary/
├── 05_exercises/
├── 06_mistakes/
├── 07_cases/
├── 08_tests/
├── 09_project/
└── 10_outputs/

这套结构不是为了制造管理负担,而是为了把学习中的关键变量显性化。

progress.md记录总体进度,避免每次重新描述背景。01_maps保存知识地图和概念依赖,防止学习变成资料堆积。02_roadmap管理阶段目标和里程碑。03_daily_tasks把每天的学习转化为可执行任务。05_exercises保存练习过程。06_mistakes记录错误和复测安排。09_project承接最终项目,确保学习不是停留在笔记层面。

真正重要的是,所有文件都能被 Codex 读取和更新。

这意味着学习者不用每次从零解释:“我之前学到了哪里,我的目标是什么,我有哪些基础,我最近卡在哪里。”这些信息已经在仓库里。Codex 要做的,是基于真实状态继续推进,而不是基于临时聊天重新生成一份看似完整的新计划。


四、一个好用的学习仓库,至少要有六个核心模块

  1. 目标模块:先定义能力结果,而不是学习内容

学习系统首先要明确的,不是“我要学什么”,而是“学完以后我能做什么”。

“学习提示词工程”是一个模糊目标,因为它无法判断完成状态。更好的目标应该是:

在 30 天内,能够独立设计、测试和优化一套用于市场研究的提示词工作流,并形成可复用模板。

这个目标包含时间、能力、场景和交付物。Codex 看到这样的目标,才有可能生成针对性的任务。

目标文件至少要记录七类信息:当前基础、学习目的、每天可投入时间、最终交付物、使用场景、主要限制条件和成功标准。

比如你要学习 AI Agent 设计,目标不应该写成“掌握 Agent”。更适合写成:

目标:30 天内完成一个个人任务拆解 Agent。
背景:会使用 ChatGPT,会一点 Python,没有做过完整 Agent 项目。
时间:每天 60 分钟。
交付物:一个可运行的最小项目、一份使用说明、一组测试用例。
成功标准:能输入一个复杂目标,输出可执行任务拆解,并能处理信息不足、任务冲突和失败回退。

目标越具体,系统越容易判断今天该做什么,也越容易判断你是否真的进步。

  1. 知识地图模块:先看清结构,再进入细节

新手学习一个陌生领域,最常见的问题不是学得太少,而是太早进入细节。

比如学习 Agent,很多人一上来就研究框架、插件、工具调用和各种论文名词。结果概念看了一堆,却不知道它们之间的关系,也不知道哪些内容现阶段可以暂时不学。

知识地图要解决的是范围和依赖问题。它需要回答:这个领域主要解决什么问题?有哪些核心模块?概念之间有什么依赖关系?入门阶段必须掌握什么?哪些内容可以先跳过?新手最容易在哪里误解?

以 Agent 学习为例,一个更合理的顺序可能是:

普通提示词
→ 多步骤工作流
→ 工具调用
→ 上下文管理
→ 状态与记忆
→ 输出检查
→ 失败回退
→ Agent 评估

这张地图的价值,不是让你学更多,而是让你少走弯路。它帮助你控制范围,理解依赖,避免一边学工具,一边缺基础,一边又被新概念带偏。

  1. 路线模块:把学习计划变成能力升级路线

一份有效的 30 天路线,不应该只是课程目录。

它应该围绕能力逐步升级。

一个典型节奏可以是:

第 1—7 天:建立全局理解,掌握基础概念
第 8—14 天:训练核心技能,完成单点练习
第 15—21 天:组合多个技能,推进真实项目
第 22—30 天:测试、修复、完善并交付项目

每天的任务也不应该只写“阅读某某资料”或“理解某某概念”。它至少要包含今日目标、学习内容、针对性练习、可检查输出、自我测试、项目推进和完成标准。

比如学习“提示词约束设计”,当天任务不能只是“阅读提示词约束相关内容”。更有效的任务应该是:找出三个存在歧义的提示词,为每个提示词增加输入、输出和约束,用正常、边缘和压力场景分别测试,比较修改前后的输出稳定性,把最佳版本保存到提示词库,并记录仍未解决的问题。

这时,学习结果不再是“我看懂了”,而是“我完成了一个经过测试的可复用成果”。

  1. 执行模块:每天从第一个未完成步骤继续

学习最容易失败的地方,不是没有计划,而是每天重新启动成本太高。

一旦你需要花十分钟回忆“我昨天做了什么、今天该从哪里开始、哪个文件要更新”,学习就很容易被打断。

基于 Codex 的执行模块,可以把启动成本降到很低。每天进入仓库后,让 Codex 先读取 progress.md和当天任务文件,识别第一个未完成步骤,然后按照固定节奏推进。

你可以使用类似这样的指令:

继续今天的学习。
请先读取 progress.md 和今天的任务文件,
识别第一个未完成步骤。
不要一次性给出全部答案。
按照“解释—练习—检查—记录”的顺序推进。
完成后更新:
1. progress.md
2. 今日任务文件
3. 练习记录
4. 错误记录
5. 项目进度

这里有一个关键点:不要让 AI 一次性把答案全部生成出来。

真正的学习,需要学习者先思考、先尝试、先犯错。Codex 可以解释,可以出题,可以检查,可以记录,但不能替你完成所有练习。否则你得到的是一套漂亮文件,不是自己的能力。

  1. 反馈模块:把错误变成下一轮训练的输入

学习系统的质量,主要取决于反馈机制,而不是计划本身。

一个错误不应该只记录成“我这里错了”。它至少要包含:错误是什么,发生在哪个任务,当时是如何理解的,正确理解是什么,根本原因是什么,需要如何重新练习,下一次复测时间是什么。

比如:

错误:
把 Agent 的“记忆”理解成保存全部历史对话。

原因:
没有区分工作记忆、长期记忆和外部状态。

修正:
重新绘制三类记忆的职责边界。

复测任务:
为客服 Agent 设计一套最小记忆结构。

复测时间:
两天后。

错误记录的意义,不是保存失败,而是为下一轮训练提供输入。

如果你连续几次都在同一个概念上出错,系统就应该降低难度、增加练习、调整解释方式,或者推迟后续任务。优秀的学习系统不会假装计划永远正确,而是根据真实表现动态调整路线。

  1. 项目模块:让每天的学习进入真实成果

学习项目不能等到最后几天才开始。

如果目标是学习 Agent 设计,最终项目可以是一个“个人任务拆解 Agent”。这个项目应该从第一周就进入学习过程。

第 1 周,你可以明确 Agent 的目标、适用场景和输入输出。第 2 周,设计任务拆解流程和提示词模板。第 3 周,加入工具、检查机制和失败回退。第 4 周,完成测试、文档和使用示例。

这样,每天的学习都会产生项目组件:一张知识地图,一个提示词模板,一组测试用例,一个工具定义,一个错误处理流程,一段可运行代码,或者一页项目文档。

最终项目不再是学习结束后的额外作业,而是整个学习过程自然长出来的结果。


五、给 Codex 设计六种运行模式

如果想让学习系统稳定运行,建议不要每次都用模糊指令和 Codex 对话,而是预设几种运行模式。

模式越清楚,Codex 越容易做对事。

BOOTSTRAP:初始化学习仓库

这是第一次创建学习系统时使用的模式。

Codex 需要分析学习目标,识别已有基础,建立知识地图,生成学习路线,创建项目计划,生成第一天任务,并写入运行规则。

示例指令:

我想在 30 天内掌握 AI Agent 的基础设计方法。
我的背景:会使用 ChatGPT,会一点 Python,但没有做过 Agent 项目。
每天可投入:60 分钟。
最终项目:完成一个个人任务拆解 Agent。

请创建一个本地学习仓库,
包括知识地图、30 天路线、每日任务、练习、测试、错误记录和最终项目。

DAILY_RUN:执行每日学习

这是最常用的模式。

Codex 读取当前状态,找到第一个未完成步骤,按照“解释—练习—检查—记录”的节奏推进。重点不是一次性生成大量内容,而是让学习者完成真实练习和输出。

STAGE_TEST:进行阶段测试

建议每 7 天进行一次阶段测试。

测试至少覆盖概念理解、实际应用、案例分析、项目推进和自我反思。测试完成后,Codex 需要给出评分,找出薄弱项,更新错误记录,生成补强任务,并调整下一阶段路线。

PROJECT_BUILD:推进最终项目

这个模式每次只推进一个可交付的小成果。

比如完成一个功能模块,增加一组测试,修改一个提示词,编写一页产品说明,修复一个错误,完善一段文档。

小步推进的好处是,项目不会变成最后几天的集中赶工。学习每天都在向交付物靠近。

REPLAN:根据真实情况重排路线

计划一定会被现实打断。

可能是时间变少,目标改变,也可能是某个主题比预期更难。这个时候不要重新生成一套全新计划,更不要删除已经完成的记录。

正确做法是保留历史,重新评估当前状态,压缩或调整未来任务,保留核心练习和项目输出,更新里程碑和完成标准。

比如每天学习时间从 60 分钟缩短到 30 分钟,可以减少阅读材料,但不应该删除练习、测试和复盘。真正产生能力的,往往正是这些部分。

EXPERT_ROOM:多视角处理复杂卡点

当你遇到复杂问题时,可以让 Codex 启动多角色分析。

比如你始终无法区分 Workflow 和 Agent,可以这样提问:

我仍然无法准确区分 Workflow 和 Agent。
请启动多角色分析:
1. 领域专家负责解释区别;
2. 苏格拉底教练通过提问检查我的理解;
3. 实战导师设计一个 20 分钟练习;
4. 项目负责人说明它们如何用于我的项目;
5. 审查者指出常见误区。

最后把结论写入知识库,
把错误理解写入 mistake_book.md。

这种模式的价值,是避免 AI 只给一个“看起来正确”的解释。复杂卡点往往不是知识点本身难,而是你的理解、场景、任务和判断标准混在了一起。多视角拆开后,问题更容易被定位。


六、把学习方法变成系统动作

很多学习建议都会提到费曼学习法、刻意练习、间隔重复和布鲁姆分类法。

这些方法本身没问题,问题是它们经常停留在口号层面。

真正有效的做法,是把方法翻译成 Codex 可以执行的任务。

费曼学习法,不要只写“理解这个概念”,而是让学习者完成一组动作:用自己的语言解释,找出含糊表达,补充一个案例,找出解释漏洞,再重新解释一次。

检索练习,不要先让 AI 给答案。应该让学习者在不查资料的情况下先回答,再由 Codex 对照、纠错、记录和安排复测。

间隔重复,不应该只是重新阅读笔记。系统可以根据错误记录,在一天后、三天后、七天后生成不同形式的测试。

布鲁姆能力层级,也可以直接进入任务设计:

记住:能够定义
理解:能够解释
应用:能够解决问题
分析:能够比较与诊断
评价:能够判断方案优劣
创造:能够用于自己的项目

普通概念至少应该达到“应用”,项目核心知识则应该达到“创造”。

例如你学习“Agent 的失败回退机制”,如果只是能解释概念,最多算理解。能为一个客服 Agent 设计失败回退流程,才算应用。能比较不同回退方案的成本和风险,才算分析和评价。能把它写进自己的项目并通过测试,才算创造。

学习方法只有转化成具体动作,才会真正改变学习结果。


七、为什么学习系统必须有自动化检查

大模型很擅长生成结构完整的内容。

但“看起来完整”不等于真实可用。

一个学习仓库可能有很漂亮的目录,却缺少关键文件;可能有 30 天任务,却有些天没有练习;可能每天都有学习内容,却没有明确输出;可能做了测试,却没有进入错题记录;可能写了最终项目计划,但项目直到最后几天才开始。

这些问题如果只靠 AI 自评,很容易被忽略。

所以应该尽量把质量标准转化为可执行检查。比如用脚本检查:目录和文件是否完整,每日任务是否包含目标、练习、输出和验收标准,每周是否存在阶段测试,项目是否从早期开始推进,每个错误是否有复测任务,学习时间是否超出预算,最终成果是否具备文档和使用示例。

背后的原则很简单:

不要只依赖 AI 判断自己的输出是否合格,要尽可能建立外部验证机制。

软件项目用测试保证代码质量,个人学习系统也可以用规则、检查表和脚本保证学习质量。

如果你用 Codex 学编程,这一点尤其自然。你不仅可以让它生成练习,还可以让它运行测试;不仅可以让它写项目文档,还可以让它检查目录结构;不仅可以让它总结错误,还可以让它根据错误生成复测任务。

学习开始具备工程属性之后,它就不再完全依赖热情和自律,而是依赖系统设计。


八、人与 AI 的正确分工

基于 Codex 的学习系统,不是让 AI 替代学习者,而是重新划分人与 AI 的职责。

Codex 更适合负责拆解目标、建立知识结构、生成针对性练习、维护文件和进度、汇总错误、调整学习路线、运行检查、整理项目文档。

学习者必须负责亲自完成练习,在看答案之前进行思考,判断 AI 输出是否可靠,提供真实场景和约束,做出关键决策,对最终成果承担责任,并形成自己的解释和方法。

最危险的学习方式,是让 AI 同时生成题目、生成答案、完成项目、编写总结,最后再把这些内容当作自己的学习成果。

那不是 AI 辅助学习,而是 AI 代替学习。

一个好的学习系统,应该提高学习者的思考密度,而不是减少学习者的参与。AI 可以把低价值的整理、调度、记录、检查工作自动化,把学习者从重复劳动中解放出来。但真正的理解、判断、取舍和创造,仍然必须发生在学习者身上。

否则仓库再完整,也只是 AI 生成的一堆文件。


九、从 30 天计划,升级为个人能力基础设施

一个真正有价值的学习系统,不应该在第 30 天结束。

第一个周期完成后,你可以继续进入新的能力阶段:

Cycle 1:理解基础知识,完成最小项目
Cycle 2:解决真实案例,提升项目复杂度
Cycle 3:封装个人 Skill 和标准工作流
Cycle 4:构建 Agent 或自动化系统
Cycle 5:形成作品集、产品或商业交付能力

每个周期都应该继承上一周期中的知识地图、错误记录、项目成果、测试结果、常用模板、未解决问题和能力评估。

随着时间积累,这个仓库会逐渐从一套学习计划,演化成个人能力基础设施。

它不只是记录你看过什么,而是反映你真正掌握了什么,能够完成哪些任务,在哪些地方反复出错,哪种训练方式对你最有效,已经积累了哪些可复用成果,下一阶段最值得学习什么。

过去的知识管理,主要管理笔记和资料。

AI 时代的个人学习系统,更应该管理目标、任务、实践、反馈、能力证据和项目成果。

这也是 Codex 这类工具最值得被重新理解的地方。它的价值不只是“帮我写代码”,而是让个人能力成长第一次可以像软件项目一样被组织、运行和迭代。


十、你可以从一个最小版本开始

如果你不想一开始就搭完整仓库,可以先做一个最小版本。

只需要五个文件:

AGENTS.md        # 学习系统运行规则
progress.md      # 当前进度和状态
knowledge_map.md # 知识地图
daily_task.md    # 今日任务
mistakes.md      # 错误与复测记录

然后给 Codex 一条启动指令:

请把这个仓库作为我的个人学习系统。
每次开始学习时,先读取 AGENTS.md、progress.md 和 daily_task.md。

你需要:
1. 找到第一个未完成任务;
2. 按“解释—练习—检查—记录”的节奏推进;
3. 不要直接替我完成练习;
4. 对我的回答进行检查和追问;
5. 把错误写入 mistakes.md;
6. 学习结束后更新 progress.md;
7. 如果发现计划不合理,提出调整建议,但不要删除历史记录。

这个最小版本已经能解决很多问题:不用每次重新介绍背景,不用手动整理错误,不用在一堆聊天记录里找进度,也不用担心学习计划和真实执行完全脱节。

等它跑顺之后,再逐步增加路线、练习、测试、项目和输出目录。

不要一开始就追求完美系统。先让它运行起来。


结语:不要只用 AI 获取答案,要用 AI 建设能力

AI 极大降低了获得答案的成本。

但获得答案不等于获得能力。

真正决定学习效果的,仍然是目标是否清晰,任务是否具体,练习是否充分,反馈是否及时,错误是否被重新训练,知识是否进入真实项目,成果是否经过测试和交付。

Codex 的价值,也不只是帮助人写代码。借助本地文件、项目规则、命令执行、测试机制和持续上下文,它可以成为个人学习系统的执行引擎。

在这套系统中,目标被写入仓库,任务被持续执行,练习产生真实输出,错误被长期记录,能力通过测试验证,知识进入实际项目,路线根据反馈调整,成果经过检查后交付。

学习由此不再依赖零散的热情和短期意志力,而开始成为一个可以设计、运行、验证和持续优化的工程系统。

AI 时代真正有竞争力的人,不一定是知道最多答案的人。

而是能够借助 AI,持续建立新能力,并把这些能力转化为真实成果的人。