AI 让代码变便宜了，但工程变贵了

Banner

上周我让 Claude Code 重构一个模块，它 8 分钟交了份完美的 PR——类型对、测试过、命名规范。

我花了 45 分钟才敢合。

不是因为代码有问题。是因为我不确定它改动的三个文件会不会影响另外两个它没碰的文件。

这件事让我意识到一个正在发生的经济学翻转：代码变便宜了，但工程变贵了。## "代码免费"之后暴露了什么

Honeycomb 的 CTO Charity Majors 最近写了一篇文章，标题是《AI Demands More Engineering Discipline, Not Less》。她说：

代码行从被珍视、复用、精心维护和仔细打磨，到几乎一夜之间变成可随意丢弃、随时重新生成的东西。

当"写代码"不再是瓶颈，真正的瓶颈就暴露了。

普林斯顿的 Arvind Narayanan 研究了软件工程师为什么没被取代，他发现三个 AI 干不了的事：决定构建什么（需求定义、边界划定、方案选型）、验证交付物（确认它真的对了，而不是"看起来对了"）、以及对代码库和业务的深层理解。

AI 加速了中间那段"把想法变成代码"的过程，但两头没动。两头是最贵的。

哪些成本在飙升

决策成本

以前写一个功能要一周，错了就错了，反正也就浪费一周。现在 Agent 10 分钟给你三个方案，每个都能跑。选哪个？

代码越便宜，你做出错误决策的速度越快，积累的方向性错误越多。

验证成本

Narayanan 的研究里有个被忽略的发现：开发者花时间最多的两件事是"开会"和"调试"，不是写代码。AI 把写代码的时间压缩了，但调试时间反而可能增加——因为你在调别人写的代码，而这个"别人"每次上下文都不一样。

以前写一个 bug，你大概知道它藏在哪，因为代码是你亲手一行行敲的。现在 Agent 生成 500 行，出了问题你得从头读起——读一段你不熟悉的、风格可能跟上次不一样的代码。

测试全绿不等于你理解了它在做什么。理解这件事没法自动化。

一致性成本

Agent 每次会话都是无状态的。它不记得上次为什么这样设计，不知道你的命名规范在第三次 refactor 时改过。你让它改文件 A，它不知道文件 B 有个隐含依赖。

你以为配了 CLAUDE.md 它就会遵守。实际上——

关联 ≠ 加载 ≠ 读到 ≠ 遵守。

"我配了一个文件"和"这个文件真的影响了模型决策"之间隔着四道关卡，每道都可能悄悄漏掉。代码越多，保持系统一致性的成本越高。

基础设施成本

以前你一个人写代码，脑子就是最好的 CI。现在你管着一个 Agent 团队，7×24 帮你写。你需要测试套件、类型系统、明确的规范文档、可观测性——否则你既不知道它改坏了什么，也不知道生产环境什么时候炸。

llama.cpp 的作者 Georgi Gerganov 每天用本地模型干活，但他第一件事是搭 harness——系统提示词、约束文件、审查流程。不是因为模型不够强，是因为模型越强，没有护栏越危险。

独立开发者该怎么投资

时间有限，不可能什么都搭。按杠杆率排序：

测试最优先。不是为了"代码质量"这个抽象概念，是为了让你敢让 Agent 改代码。没有测试，Agent 每次改完你都要人肉 review 全量变更，比你自己写还慢。有了测试，改完跑一遍，绿了就合。

然后是规范文档。你写一次，Agent 每次会话都能读到。一次性投入、无限次复用。但写了不等于生效，你需要验证它确实被加载、被遵守。

再然后是类型系统和 Linter，让错误在编译期被拦住。Agent 写的代码量越大，静态检查的价值越高。

最后是可观测性。至少知道线上出了什么问题。当你的部署频率因为 Agent 而翻倍时，你需要一个比"用户来投诉"更快的反馈渠道。

代码免费了。决策、验证、一致性——这些"工程"的活儿，一分钱都没便宜。反而因为代码量暴增，变得更贵了。

所以我现在评估一个项目的健康度，不看它每周合多少 PR，看它合完之后有多少次要回滚。

别只会让 Codex 写文案：真正好用的是这些操作很多人第一次用 Codex，方式都差不多：打开，输入一句“帮我改这个 bug”，然后等它输出代码。这当然能用。但如果你只这样用 Codex，其实只用到了很浅的一层。真正拉开差距的，不是你会不会写更复杂的提示词，而是你有没有把 Codex 当成一个“可配置的工作系统”：让它记住项目规则、复用你的工作流程、接入外部工具、自动 review、定时巡检，甚至把复杂任务拆给多个 agent

AIJun 27

AI Agent 认知

我做了一个投研 Agent，才发现核心根本不是让 AI 选股。

我做了一个投研 Agent，才发现核心根本不是让 AI 选股。最近刷到用 [AI 跑纳指定投 26 年回测的文章]，很有感触。这也坚定了我做投研 Agent 的方向：核心不是让 AI 预测，而是把流程工程化过去我跟大多数散户一样，每天刷新闻、看大佬观点、研究别人为什么买、为什么卖。看多了就觉得自己越来越懂，但实际投资结果并不理想。问题不是信息太少，而是信息太多。每天都有新逻辑、新主线。今天觉得应该进攻，明天又觉得应该防守。决策慢

AIJun 27

AI生图 Prompt Engineering

战斗民族硬核风，害我战斗了2天

战斗民族硬核风，害我战斗了2天最近考古，被俄式构成主义深深吸引... 构成主义构成主义起源于20世纪初的俄国先锋艺术。它非常强调几何、秩序、方向、比例和视觉力量。圆形、三角形、斜线、大色块、粗体字，经常被用来制造运动感、工业感和强烈的社会传播效果。所以很多经典构成主义海报，第一眼都会让人觉得：大、硬、直接、有冲击力。但传统俄式构成主义也有一个很明显的特点：红、黑、米白用得特别多，工业感很强，形式也比较固定。如果直接照搬，今天再

AIJun 27

Loop Engineering Workflow

Loop Engineering是第四层塔——Loop 、 Prompt、Context、Harness不是四个时代，是同一个系统

Loop Engineering是第四层塔——Loop 、 Prompt、Context、Harness不是四个时代，是同一个系统这两周 Loop Engineering 刷屏，大致意思是《Prompt 已死，Loop 当立》。但细细读完这些文章，你会发现根本讲的不是替代——Loop Engineering、 Prompt、Context、Harness就是同一个系统的四层。真正发生的事不是替代，是这座塔盖到了第四层。 Prompt

AIJun 26

AI AI工具

失业、被迫转行、开一人公司，被AI追着杀的这一年

失业、被迫转行、开一人公司，被AI追着杀的这一年这一年最大的感受是：我不是主动拥抱AI的，我是被AI一路追着跑，追到最后，发现自己原来的工作方式已经被淘汰了。以前总觉得，职业危机无非是几件事：公司倒闭、行业下滑、客户减少、收入变低。后来我才发现，更可怕的危机不是你突然没活干了，而是你还在用旧世界的方法工作，新世界已经偷偷换了规则。而我，大概就是那个被规则换掉以后，才后知后觉的人。我是传统媒体出身的导演，过去很多年，我相信

AIJun 26

AI AI工具

你不需要时间管理，95%的人把它当作自己失败的安慰

你不需要时间管理，95%的人把它当作自己失败的安慰凌晨 1 点 17 分。我桌上摊着 3 件没收尾的事，手机里有 11 条没回的消息，日历上明天 8 点半第一个会。按理说这是我效率最高的时候。家里全部安静，孩子睡了，没人打扰，我同时在推 3 件事——一份明天要交的方案、一个谈了两周的合作、一篇答应朋友写的稿子。每一件，都在动。但我感觉糟透了。不是累。是一种说不清楚的空。明明每件事都在往前走，明明今晚效率比上周任何一天都高，但

AIJun 26

AI AI Coding

AI 都能写代码了，还要不要学技术

AI 都能写代码了，还要不要学技术 AI 会写代码了，还要不要学技术。这个问题这两年被问了无数遍，大部分答案不是"要"就是"不要"，吵来吵去。我觉得它们都没说到点子上，因为这个问题根本没有统一答案。要回答它，得先回答另一个问题：你想成为什么样的工程师。先说清楚，这篇我只聊计算机相关专业、或者真打算靠写软件吃饭的人。别的行业怎么用 AI 是另一回事，不在这篇里。先承认对面那半句是对的我不打算上来就反驳"不用学了"。因为这句话里有

AIJun 26

AI AI工具

美国政府开始逐个审批谁能用最强 AI：你租来的 AI，从来不是你的

美国政府开始逐个审批谁能用最强 AI：你租来的 AI，从来不是你的最近不到两周，围绕“谁能用上最强的 AI”，美国政府接连出手了三次。普通用户大概没太在意，但这三件事连起来，值得每个靠 AI 干活的人停下来想想。 6 月 12 日，Anthropic 刚上线 3 天的最强模型 Fable 5，被美国商务部一纸出口管制令强制下线。理由是国家安全。Anthropic 没办法在 API 上实时核验每个用户的国籍，干脆对全球所有人（包括美国本

AIJun 26

AI 让代码变便宜了，但工程变贵了

AI 让代码变便宜了，但工程变贵了

哪些成本在飙升

独立开发者该怎么投资

You May Also Like

CATALOG

AI 让代码变便宜了，但工程变贵了

哪些成本在飙升

独立开发者该怎么投资

You May Also Like

CATALOG

Related Posts