什么!AI 编程费用砍掉 80%的5个步骤

很多人抱怨 AI 编程工具太贵。
但真正烧钱的地方,往往不是模型本身,而是上下文浪费。
你只是想改几十行代码,工具却把半个代码库都发给模型。
你只是想跑定时任务、改变量名、修一个字符,却还在用最贵的模型。
Agent 每次失败重试,又把完整历史和完整上下文重新发一遍。
这些都会让账单快速膨胀。
所以,AI 编程成本优化的重点,不是单纯找一个更便宜的模型,而是建立一套上下文纪律。

第一,先缩小上下文
不要一上来就把整个仓库交给模型。
先用 grep、ripgrep、错误日志、调用栈(就是报错的原文),把问题定位到具体文件、函数、代码片段。
然后只把任务真正需要的上下文发给模型。
上下文越干净,模型越容易判断。
上下文越混乱,模型越容易绕远路。
第二,稳定内容要缓存
像系统提示、项目规则、CLAUDE.md、代码库说明、常用约束,这些内容不会频繁变化。
它们不应该每次都重新计费发送。
如果模型平台支持 Prompt Caching,就应该把这些稳定前缀缓存起来。
这类内容很适合缓存:
- 系统提示
- 项目规则
- 代码库说明
- CLAUDE.md
- 常用工具说明
- 测试和部署命令
第三,不同任务用不同模型
不是所有任务都需要最强模型。
架构设计、安全审查、复杂调试,可以用最强模型。
日常实现、重构、代码 review,可以用性价比更高的主力模型。
lint、format、改 typo、变量重命名,不需要最强模型,最简单的任务用轻量模型就够了。
样板代码、自动补全、stub,甚至可以交给本地模型。
更合理的分层大概是这样:

第四,把重复流程沉淀成技能
如果一个 Agent 每次都要重新理解你的项目结构、编码规范、部署方式、测试命令,它就会不断重复消耗上下文。
更好的方式,是把这些重复规则写成 SKILL.md 或项目规则。
这样 Agent 每次可以直接调用,而不是重新学习。
比如:
- 项目怎么启动
- 测试怎么运行
- 文件放在哪里
- 什么命名不能改
- 哪些命令不能执行
- 完成任务后怎么验证
这些规则越稳定,Agent 每次浪费的上下文就越少。
第五,先分析工具调用,再优化 prompt
很多人一看到 AI 账单高,就开始改 prompt。
但真正应该先看的,是工具到底发了多少上下文。
比如:
- 调用了几次模型
- 每次发了多少 token
- 有没有重复发送同样内容
- 有没有把无关文件一起发出去
- 有没有让高价模型处理低价值任务
先 profiling,再优化 prompt。
不然 prompt 写得再漂亮,也可能只是让模型更优雅地浪费钱。
最后的结论
AI 编程的成本优化,不是找最便宜的模型。
而是建立上下文纪律。
只发送必要上下文。
缓存稳定上下文。
根据任务价值选择合适模型。
如果没有这套纪律,模型越强,Agent 越自动化,浪费也会越快放大。

