loading image

4 个月花完全年 AI 预算,AI Agent 为什么越用越贵?

Posted by Enovace on June 22, 2026

4 个月花完全年 AI 预算,AI Agent 为什么越用越贵?

Banner

95% 的工程师每月使用 AI 编程工具,超过 10% 的生产代码由 Agent 自主完成,结果 4 个月就花完了全年 AI 工具预算。到了 6 月,公司又给每名员工使用每种 Agent 工具设了每月 $1,500 的上限。

以上是Uber的数据,我自己最近用 Codex 和 Claude Code 跑任务,也发现额度掉得比想象中快。普通对话还好,一旦让 Agent 连续读文件、查资料,再来回修改几轮,Token 很快就下去了。

这也让我想认真算一次,Agent 到底省了多少人工,又增加了多少软件和复核成本,下面就拿核验 7 条 AI 新闻的任务举例。


Uber 为什么会在 4 个月内用完全年预算

Uber 在 5 月 6 日发布的第一季度材料里说,AI 工具提高了开发速度,公司每周可以部署数千次更新。Uber CTO 在 4 月披露年度 AI 工具预算已经耗尽;6 月 2 日,TechCrunch 又报道了 Claude Code、Cursor 等工具的月度使用上限。Uber 没有公开这笔预算的具体金额。

Agent 完成一项任务,可能会连续调用多次模型。它要读取文件、运行命令、检查结果,出错后再修改;任务范围越大,上下文也越长。员工用得更多,调用次数跟着增加,账单自然涨得快。


核算 Agent 成本,需要先分清固定成本和变动成本

包月订阅属于固定成本。多运行一次任务,通常不会立即增加 ChatGPT、Claude 或 Cursor 的月费;当使用量超过套餐额度,或者直接调用 API 时,才会产生可以归到单次任务上的变动成本。

如果使用 API,可以直接按照供应商账单计算:

AI 变动成本 = 输入 Token 费用 + 输出 Token 费用 + 缓存、工具与计算费用Agent 会连续调用模型,所以这里要统计整项任务产生的全部调用。包月工具没有单次账单时,可以先记录配额变化;做月度核算时,再按照任务使用量分摊月费,并注明它属于分摊成本。

人工成本也要算进去。个人可以使用自己的目标时薪,团队可以用员工总用工成本除以可工作小时:

人工成本 = 人工占用分钟数 ÷ 60 × 每小时人工成本任务完整成本 = 分摊固定成本 + AI 变动成本 + 人工成本 + 其他按次收费评估是否值得多运行一次任务时,可以看边际成本,也就是新增的 AI 费用和人工时间;评估整条工作流每个月是否划算,则要把订阅月费一起分摊进去。


以核验 7 条近期 AI 新闻为例,完整算一次成本

假设任务要求是:找到并核实 7 条最近 7 天的 AI 新闻,每条都要有发布日期、原始链接和可以引用的数据。下面使用演示数据,只用于说明算法。

如果全部由人工完成,预计需要 90 分钟。按照每小时 100 元的人工成本计算,总成本是 150 元。

改用 Agent 后,它先搜索出 10 条候选,独立运行 12 分钟;人工花 5 分钟写任务,25 分钟核验来源,又用 10 分钟修正错误,最终留下 7 条。假设模型与工具调用一共花费 8 元:

图像

在这组演示数据里,人工占用时间减少 55.6%,成本节省率约为 50.2%。Agent 独立运行的 12 分钟要计入交付时间,但没有占用人工;如果人必须守在旁边等待,这段时间也应该计入人工成本。

这个例子还有一个前提:两种方式交付的都是 7 条合格资料。只比较生成数量没有意义,最后能通过核验、进入交付的结果才应该参与计算。


把任务交给 Agent 前,先写清预算和停止条件

我会在任务说明里补上下面这些内容:

## 任务目标
[最终需要交付什么]

## 完成标准
[数量、格式、准确度,以及必须通过的检查]

## 预算上限
[最多运行时间、调用次数或费用]

## 停止条件
- 最多尝试 3 轮;
- 连续两轮没有新增有效结果,立即停止;
- 缺少可靠来源或需要扩大范围时,先等待确认。

## 完成后汇报
运行时间、模型调用次数、Token 与费用,以及仍需人工检查的内容。

最多 3 轮是我给演示任务设置的检查点,并非通用标准。高成本或高风险任务可以更早暂停,简单任务也可以根据实际情况放宽。


遇到这 3 种情况,继续运行只会增加成本

第一种是复核和返工时间已经接近纯人工完成的时间;第二种是连续两次运行,结果都没有进入最终交付;第三种是 Agent 一直修改同一个问题,却没有拿到新的数据或测试结果。

遇到这些情况,可以先缩小任务范围、补充资料,或者改回人工处理。继续增加 Token,通常只能得到更多相似答案。


我会用 4 个数字判断一条工作流要不要保留

以后复盘 Agent 任务,我会记录纯人工需要多久、AI 实际费用、人工介入时间和最终采用数量。这样可以算出成本节省率,也能知道每个有效结果到底花了多少钱。

Uber 的案例说明,使用率和产出量都可以快速上涨,成本也会跟着上来。只要费用与最终结果还没有对上,使用排行榜就只能说明大家用得多,无法说明这笔预算花得值。

你现在最想拿哪一项 Agent 任务算一次账?


来源

  • Uber 2026 年第一季度官方材料:支持 95% 工程师每月使用 AI 编程工具、超过 10% 生产代码由 AI Agent 自主完成等数据。

s23.q4cdn.com/407969754/files/doc_earnings/2026/q1/transcript/Uber-Q1-26-Prepared-Remarks.pdf

  • TechCrunch,2026-06-02:支持 4 个月用完年度 AI 工具预算、每人每种 Agent 工具每月 $1,500 上限等报道。

techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/

  • Tom's Hardware,2026-05-26:整理 Uber COO 关于 AI 使用量与消费者功能之间暂时难以直接对应的播客表态。

www.tomshardware.com/tech-industry/artificial-intelligence/uber-chief-warns-no-link-yet-between-ai-tokenmaxxing-and-shipping-successful-products-company-pumps-the-brakes-on-all-out-ai-spending