loading image

什么!AI 编程费用砍掉 80%的5个步骤

Posted by Enovace on May 19, 2026

什么!AI 编程费用砍掉 80%的5个步骤

Banner

很多人抱怨 AI 编程工具太贵。

但真正烧钱的地方,往往不是模型本身,而是上下文浪费。

你只是想改几十行代码,工具却把半个代码库都发给模型。

你只是想跑定时任务、改变量名、修一个字符,却还在用最贵的模型。

Agent 每次失败重试,又把完整历史和完整上下文重新发一遍。

这些都会让账单快速膨胀。

所以,AI 编程成本优化的重点,不是单纯找一个更便宜的模型,而是建立一套上下文纪律。

Image

第一,先缩小上下文

不要一上来就把整个仓库交给模型。

先用 grep、ripgrep、错误日志、调用栈(就是报错的原文),把问题定位到具体文件、函数、代码片段。

然后只把任务真正需要的上下文发给模型。

上下文越干净,模型越容易判断。

上下文越混乱,模型越容易绕远路。

第二,稳定内容要缓存

像系统提示、项目规则、CLAUDE.md、代码库说明、常用约束,这些内容不会频繁变化。

它们不应该每次都重新计费发送。

如果模型平台支持 Prompt Caching,就应该把这些稳定前缀缓存起来。

这类内容很适合缓存:

  • 系统提示
  • 项目规则
  • 代码库说明
  • CLAUDE.md
  • 常用工具说明
  • 测试和部署命令

第三,不同任务用不同模型

不是所有任务都需要最强模型。

架构设计、安全审查、复杂调试,可以用最强模型。

日常实现、重构、代码 review,可以用性价比更高的主力模型。

lint、format、改 typo、变量重命名,不需要最强模型,最简单的任务用轻量模型就够了。

样板代码、自动补全、stub,甚至可以交给本地模型。

更合理的分层大概是这样:

Image

第四,把重复流程沉淀成技能

如果一个 Agent 每次都要重新理解你的项目结构、编码规范、部署方式、测试命令,它就会不断重复消耗上下文。

更好的方式,是把这些重复规则写成 SKILL.md 或项目规则。

这样 Agent 每次可以直接调用,而不是重新学习。

比如:

  • 项目怎么启动
  • 测试怎么运行
  • 文件放在哪里
  • 什么命名不能改
  • 哪些命令不能执行
  • 完成任务后怎么验证

这些规则越稳定,Agent 每次浪费的上下文就越少。

第五,先分析工具调用,再优化 prompt

很多人一看到 AI 账单高,就开始改 prompt。

但真正应该先看的,是工具到底发了多少上下文。

比如:

  • 调用了几次模型
  • 每次发了多少 token
  • 有没有重复发送同样内容
  • 有没有把无关文件一起发出去
  • 有没有让高价模型处理低价值任务

先 profiling,再优化 prompt。

不然 prompt 写得再漂亮,也可能只是让模型更优雅地浪费钱。

最后的结论

AI 编程的成本优化,不是找最便宜的模型。

而是建立上下文纪律。

只发送必要上下文。

缓存稳定上下文。

根据任务价值选择合适模型。

如果没有这套纪律,模型越强,Agent 越自动化,浪费也会越快放大。