loading image

别只会让 Codex 写文案:真正好用的是这些操作

Posted by Enovace on June 27, 2026

别只会让 Codex 写文案:真正好用的是这些操作

Banner

很多人第一次用 Codex,方式都差不多:

打开,输入一句“帮我改这个 bug”,然后等它输出代码。

这当然能用。但如果你只这样用 Codex,其实只用到了很浅的一层。

真正拉开差距的,不是你会不会写更复杂的提示词,而是你有没有把 Codex 当成一个“可配置的工作系统”:让它记住项目规则、复用你的工作流程、接入外部工具、自动 review、定时巡检,甚至把复杂任务拆给多个 agent 并行处理。

这篇不讲基础入门,讲一些大多数人还没认真用起来的 Codex 操作。

Codex 的真正门槛,不是会不会写提示词,而是你有没有把自己的工作方式沉淀给它。---

1. 用 AGENTS.md 给 Codex 写一份“项目说明书”

Image

很多人每次都在重复告诉 Codex:

这个项目怎么启动、测试怎么跑、代码风格是什么、哪些目录不要乱动、PR 描述怎么写。

其实这些内容不该每次重复说,而应该写进 AGENTS.md。

你可以把它理解成“给 AI agent 看的 README”。它不是写给人类新人看的长文档,而是告诉 Codex:在这个仓库里工作时,你应该遵守什么规则。

比如:

# AGENTS.md

- 修改代码前先阅读相关测试。
- 前端改动后运行 npm test。
- 不要修改 generated/ 目录。
- PR 描述需要包含变更摘要和验证方式。

这件事的价值非常大。

因为 Codex 最容易犯错的地方,往往不是“不会写代码”,而是“不知道这个项目的隐性约定”。你把约定写下来,它就少猜一点。

但这里有个反直觉点:

AGENTS.md 不是越长越好。

如果你把它写成一本百科全书,把所有边缘规则、历史包袱、个人偏好都塞进去,Codex 反而会被噪音干扰。

更好的写法是:

  • 写最常用的命令;
  • 写最容易踩坑的约束;
  • 写必须遵守的代码风格;
  • 写验证方式;
  • 写那些你已经提醒过 Codex 三次以上的问题。

不要把 AGENTS.md 当说明书仓库,要把它当项目里的操作护栏。---

2. 把重复提示词做成 Skills

Image

如果说 AGENTS.md 是项目说明书,那 Skills 就是“可复用工作流”。

很多人会反复对 Codex 说:

“按我的格式写发布说明。”

“帮我做一次安全 review。”

“把这篇文章改成公众号风格。”

“按我们团队规范生成 PR 描述。”

这些其实都适合沉淀成 Skill。

Skill 的好处是:它不只是保存一句提示词,而是可以包含说明文件、参考材料、脚本、模板。下次遇到类似任务,Codex 可以按这套流程执行。

举几个适合做成 Skill 的场景:

  • release note 生成;
  • 安全审查;
  • 前端视觉 QA;
  • 技术文档整理;
  • 长文润色;
  • 固定格式的周报/日报;
  • PR 描述和 changelog 生成。

提示词是一次性沟通,Skill 是把沟通产品化。如果你发现自己已经第三次对 Codex 说同一套要求,就该考虑把它做成 Skill。

这也是很多人用 Codex 的分水岭。

普通用法是每次临场描述。

高级用法是把自己反复做的事变成一个可调用的工作流。


3. MCP:让 Codex 接入外部工具

Image

MCP 是很多人听过但没真正用起来的东西。简单说,它是 Codex 连接外部世界的接口。

没有 MCP 时,Codex 主要依赖当前项目文件、你输入的上下文,以及它能调用的本地工具。

有了 MCP,它就可以接入 GitHub、Linear、Figma、数据库、内部文档、浏览器、知识库等外部系统。

你可以这样理解三者区别:

  • AGENTS.md 解决:这个项目里应该怎么做?
  • Skills 解决:这个重复流程应该怎么做?
  • MCP 解决:需要外部信息和外部动作怎么办?

比如你想让 Codex 查 GitHub issue、读 Linear 任务、看设计稿、查公司内部文档,MCP 就会变得很关键。

它不是噱头,而是把 Codex 从“代码助手”变成“工作台”的关键接口。

尤其是在团队环境里,MCP 的价值会更明显。

因为真实工作不是只发生在代码仓库里。需求在 Linear,讨论在 Slack,设计在 Figma,文档在 Notion,CI 在 GitHub,数据在数据库。

如果 Codex 只能读代码,它只能处理一部分问题。

如果 Codex 能接入这些系统,它就开始接近一个真正的工作流 agent。


4. Slash Commands:长任务里的救命按钮

Image

Codex 里有一批斜杠命令,很多人几乎没用过。

但它们在长任务里非常有用。

几个最值得记住的:

  • /compact:压缩长会话上下文,任务跑久了很有用。
  • /diff:查看 Codex 到底改了什么。
  • /review:只做代码审查,不直接修改文件。
  • /mention:明确把某个文件带进上下文。
  • /status:查看当前状态。
  • /permissions:调整权限。
  • /new:开启新会话。
  • /init:生成项目说明文件。

尤其是 /compact 和 /review。

很多长任务不是死在能力上,而是死在上下文越来越乱。

会用 /compact,相当于给 Codex 做中场整理。

会用 /review,相当于先让它当审稿人,再让它当执行者。

这也是我非常建议新手养成的习惯:

不要一上来就让 Codex 大改。

先让它读,先让它 review,先让它讲风险。

等你确认方向之后,再让它动手。


5. 让 Codex 看图,不只是读代码

Image

Codex 现在不只是读文字和代码,它也可以处理图片输入。

这对前端尤其有用。

你可以把截图、设计稿、报错弹窗、移动端页面发给它,然后让它判断:

  • 页面哪里溢出了?
  • 哪个组件和设计稿不一致?
  • 这个报错截图可能是什么原因?
  • 移动端为什么按钮被遮住?
  • 这张 UI 截图应该怎么还原?

这会改变前端协作方式。

以前你要描述:“右上角按钮在 390px 宽度下被挤到第二行,而且和标题重叠。”

现在可以直接丢图:

“照这个问题修。”

这不是小功能。

因为很多 UI 问题,用文字描述会变形。你说的“偏一点”“挤一点”“不对齐”,对 Codex 来说都很模糊。

但截图会把问题固定下来。

前端问题最怕凭空猜。让 Codex 看到画面,它就少了一半误判。---

6. 用 In-app Browser 让 Codex 边看页面边改

Image

如果你做前端,只让 Codex 读代码是不够的。

真正好用的是:让它打开页面、观察页面、截图、修改,再验证。

Codex App 的 In-app Browser 就是为这个场景准备的。

它可以在任务过程中打开浏览器预览页面,观察 UI 状态,发现布局问题,再继续改代码。

这样 Codex 不再只是“根据代码猜页面长什么样”,而是可以真的看见结果。

这类能力特别适合:

  • 修复移动端适配;
  • 对齐设计稿;
  • 检查按钮、弹窗、表单状态;
  • 调整视觉细节;
  • 修复页面重叠、溢出、空白;
  • 给前端页面做视觉回归检查。

前端问题最怕盲改。让 Codex 看见页面,很多问题会简单一半。很多人用 AI 写前端,最大的问题不是写不出来,而是写出来之后没人认真看。

有了浏览器能力,Codex 可以进入“看见问题、修改代码、再次验证”的循环。

这比单纯生成一段组件代码有用得多。


7. 先让 Codex Review,再让它动手

Image

很多人一上来就说:

“帮我重构这个模块。”

这其实很危险。

更稳的流程是:

  1. 先让 Codex review。
  2. 让它列出风险、坏味道、可能的回归点。
  3. 你确认方向。
  4. 再让它修改。

也就是先让它当审稿人,再让它当工程师。

这个习惯能显著降低“改太多”“改偏了”“把隐藏逻辑删掉”的风险。

在 GitHub 场景里,还可以通过 @codex review 让 Codex 对 PR 做代码审查。你也可以指定它重点关注安全风险、过期依赖、测试缺口、性能问题。

我非常建议把这个当成默认工作流:

先 review,再实现。

先找风险,再写代码。

先确认范围,再放手执行。

让 Codex 少犯错的办法,不是让它更自信,而是让它先进入审查模式。---

8. Automations:让 Codex 定时回来工作

Image

这是很多人完全不知道的能力。

Codex 不一定只能在你打开它时工作。它可以做 Automations,也就是定时任务。

比如:

  • 每天早上生成项目简报;
  • 每周扫描最近提交里的潜在 bug;
  • 每隔一段时间检查部署状态;
  • 定期 review 依赖升级风险;
  • 定时回来看某个长期任务有没有变化;
  • 每天汇总未合并 PR 和失败 CI。

这会把 Codex 从“即时问答工具”变成“后台巡检助手”。

你不一定每天都记得查项目状态,但可以让 Codex 每天回来帮你看一眼。

这个能力的想象空间很大。

因为很多工程问题不是一次性任务,而是持续性问题:

  • 有没有新失败的测试?
  • 有没有长时间没合并的 PR?
  • 最近依赖有没有安全风险?
  • 某个线上问题有没有复现?
  • 项目里哪些 TODO 已经拖太久?

以前这些事靠人记。

现在可以让 Codex 定期提醒。


9. Subagents:复杂任务不要只交给一个 Codex

有些任务天然很复杂。

比如你要重构一个支付模块,它可能涉及:

  • 业务调用链;
  • 测试覆盖;
  • 数据库变更;
  • 安全边界;
  • 前端展示;
  • 历史兼容逻辑。

这时候只让一个 Codex 从头查到尾,很容易上下文爆炸。

更好的方式是用 Subagents。

你可以让不同 agent 做不同的事:

  • 一个查调用链;
  • 一个查测试;
  • 一个查安全风险;
  • 一个查历史实现;
  • 主 agent 汇总结论并制定方案。

这有点像临时组了一个小型工程团队。

当然,Subagents 不适合所有任务。小改动没必要开多 agent。但复杂项目、跨模块重构、排查疑难 bug 时,它会很有用。

复杂任务不要只问“让 Codex 怎么做”,还要问“这件事该不该拆给多个 Codex 做”。这也是 agent 工作流真正有意思的地方。

它不是把一个人变得更强,而是让一个人能临时调度一组小型执行者。


10. 权限、Sandbox、Hooks:给 Codex 装护栏

Image

高阶使用 Codex,不是给它无限权限。

恰恰相反,是知道什么时候该给权限,什么时候该限制权限。

Codex 有权限和沙盒机制,你可以控制它能不能访问网络、能不能改文件、哪些命令需要审批。

更进一步,还可以通过 Hooks 在关键节点做检查,比如在执行命令前拦截高风险操作,在提交前强制跑测试。

这类配置一开始看起来“麻烦”,但它决定了你能不能放心把更大的任务交给 Codex。

一个成熟的 Codex 工作流,应该有三层边界:

  • 哪些事它可以直接做;
  • 哪些事它必须先问你;
  • 哪些事它永远不能做。

比如:

  • 读文件可以放开;
  • 改工作区代码可以允许;
  • 删除文件、重置 Git、访问外部网络要谨慎;
  • 生产环境操作必须拦住;
  • 涉及密钥、数据库、支付、用户隐私的操作要单独设规则。

真正成熟的用法,不是让 Codex 什么都能做,而是让它在正确边界里做更多事。---

11. IDE 插件:不要把 Codex 只关在终端里

Image

还有一个容易被忽略的点:Codex 不只有 CLI。

它可以在 App 里用,可以在命令行里用,也可以在 IDE 里用。

IDE 插件的好处是,它离你的编辑现场更近。

当你正在看某个文件、某个函数、某段报错时,直接在编辑器里叫 Codex,比切到另一个窗口重新描述上下文更自然。

适合 IDE 场景的任务:

  • 解释当前函数;
  • 给当前文件补测试;
  • 对当前 diff 做 review;
  • 重构选中代码;
  • 根据报错定位附近逻辑;
  • 在不离开编辑器的情况下推进小任务。

而 App 更适合长任务、规划、跨文件工作、浏览器验证和持续跟踪。

CLI 更适合本地工程流、脚本、权限明确的执行任务。

所以不要问“哪个 Codex 入口最好”。

更好的问题是:

这件事发生在哪个现场?

在编辑器里,就用 IDE。

在本地仓库里,就用 CLI。

要跨页面、跨任务、长期跟踪,就用 App。

Image

最后:Codex 的门槛不是提示词,而是沉淀

如果只把 Codex 当成聊天框,你会越来越依赖“临场描述”。

每次都要重新解释项目、重新说明规则、重新贴上下文、重新强调不要乱改。

但如果你把它当成工作系统,思路就变了:

  • 项目规则写进 AGENTS.md;
  • 重复流程做成 Skills;
  • 外部工具接进 MCP;
  • 长任务用 slash commands 管理;
  • 前端问题让它看图、看浏览器;
  • 大改动先 review,再执行;
  • 周期性任务交给 Automations;
  • 复杂任务拆给 Subagents;
  • 高风险操作用权限、Sandbox、Hooks 管住;
  • 不同任务放到 CLI、IDE、App 的不同现场里处理。

这时候 Codex 不再只是一个“更会写代码的聊天框”。

它更像一个可以被训练、被配置、被调度的开发工作台。

同样是 Codex,有的人只把它用成“更聪明的自动补全”。

有的人却已经把它用成了一个可协作、可复用、可长期运行的工程系统。

差距不在模型,而在工作流。

Codex 的真正门槛,不是会不会写提示词,而是你有没有把自己的工作方式沉淀给它。