AI Coding 的下一阶段：从生成能力到治理能力

过去两年，关于 AI Coding 的讨论，几乎每隔几个月就会换一个重心。

最开始，大家讨论的是：AI 到底能不能写代码。后来，大家开始关心：它能不能真正参与开发。再后来，问题变成了：它能不能独立完成一个模块、一个项目，甚至一段完整的交付流程。

到了今天，这个问题其实已经有了阶段性答案。AI 不仅能写代码，而且已经能够在很多场景中写得很快、写得像样，甚至能把原型、骨架、测试和一些基础功能一并做出来。真正的分水岭，已经不再是“它会不会写”，而是“它写出来的东西，能不能被人和组织真正接住”。

这背后，意味着 AI Coding 正在进入一个新的阶段：竞争的重点，开始从生成能力，转向治理能力；从单点能力，转向系统能力；从“做出来”，转向“做得稳、接得住、放得进生产”。

这不仅是一个技术问题，也是一个组织问题，甚至还是一个个人问题。作者Fisher

一、AI Coding 的真正难点，不在生成端，而在接收端

在试点阶段，AI Coding 往往给人一种很强的兴奋感。

它写代码很快，搭架子很快，补测试也很快。很多过去需要半天、一天才能看到雏形的事情，现在半小时就能起出一个像样的原型。于是团队会自然得出一个判断：AI Coding 已经可用了。

但真正的问题，通常不是在这里暴露的。

问题往往出现在推广阶段。有人把 AI 生成的代码直接提交，跳过评审；有人发现 AI 改了不该改的接口，但变更已经合进去了；还有人虽然也用了 AI，但最后还是不得不手动重写一遍，因为 AI 的输出和团队的工程习惯、边界约束、交付要求对不上。

这时候大家才会意识到，试点阶段验证的，往往只是“AI 能不能写代码”；而没有验证的是，“AI 写出来的代码，如何被工程体系接纳”。

这两者不是一回事。

AI Coding 的瓶颈，从来不只在模型这一端。真正决定它能不能进入生产的，是代码生成之后的一整套问题：它是不是在边界内生成的？有没有跑偏？改动面是不是可控？结果是否经过验证？最后能不能通过评审、检查和放行体系？

这些问题，模型自己回答不了，只能由工程系统来回答。

所以，AI Coding 的下一阶段，不是继续追问“怎样让 AI 写更多代码”，而是要回答另一个更关键的问题：怎样让 AI 在工程体系中稳定完成交付。

二、从 Rule、Spec、Loop 到 Harness，本质上是在建设控制面

如果把 AI Coding 的演进过程拆开来看，可以发现它并不是一个单点突破的问题，而是一条逐层收紧的建设路径。

先是 Rule，再是 Spec，然后是 Loop，最后才是 Harness。

这四层看似是四个模块，实际上是一条递进关系。每一层都不是孤立存在的，而是在为下一层提供约束条件。它们共同解决的，不是“AI 怎么更聪明”，而是“AI 怎么不乱来、怎么不跑偏、怎么持续收敛、最后怎么被组织信任”。作者Fisher

Rule：先把“不要乱来”写成机器边界

很多团队一开始最关心的，是 AI 能做什么。但在真实项目里，最昂贵的错误，往往不是写得不漂亮，而是越过边界、误改契约、扩散变更面，或者在不该结束的时候宣布任务完成。

所以 Rule 必须排在第一层。

Rule 不是为了让 AI 更有背景知识，而是为了让它先学会不越界。它首先要写清楚的，不是“建议怎么做”，而是“绝对不要做什么”。先写 NEVER，再写 DO NOT；先约束高代价错误，再去讨论更优雅的实现。

更重要的是，规则文件不是装饰品。它如果只是上下文的一部分，那它就只是提醒；真正的护栏，必须由测试、lint、build、schema check、review policy 这些外部信号来接管。也就是说，Rule 的价值不在于“告诉 AI”，而在于“让系统有办法拦住 AI”。

Rule 解决的是一个最基础的问题：先别乱来。

Spec：再把“想做什么”压缩成一次可执行的变更

只有 Rule 还不够。因为边界清楚，不等于目标清楚。

很多 AI Coding 失控，不是模型没理解需求，而是需求本身没有被整理成一个范围明确、结果可验证、边界可审查的交付对象。于是 AI 很自然地扩写任务：修一个提示，顺手重构流程；补一个状态，顺手改掉契约；写一个 happy path，顺手把整个模块“整理”一遍。

这时候需要的就是 Spec。

Spec 不是更长的 prompt，也不是把背景写得更厚，而是把一次模糊的意图，收敛成一次可执行、可审查、可验证的变更。它至少要回答几件事：这次要解决什么，这次不解决什么，允许改哪些 surface，哪些 contract 不能动，怎样才算完成。

它真正的价值，是把范围钉住，把完成条件前置，把“顺手改一下”的冲动提前消灭掉。

如果说 Rule 解决的是“别乱来”，那么 Spec 解决的就是“别跑偏”。

Loop：把一次性生成，改造成可收敛的执行闭环

有了边界和目标，还不够。因为执行过程本身依然会出错。

真正决定 AI 能不能持续参与工程工作的，不是它某一次回答得多漂亮，而是有没有一个 Loop，把“读取上下文—做最小改动—运行外部验证—记录状态—进入下一轮”变成系统动作。

这一步非常关键，因为它改变了 AI Coding 的工作形态。它不再是一锤子买卖，而是一个持续逼近验收条件的过程。它要求每一轮改动足够小，小到能被验证器快速裁决；它要求状态外置到文件、日志、Git 历史、计划文档里，而不是寄希望于模型“记得住”；它也要求一旦检查失败，就必须停下来修，而不是带着失败继续往前滚。

没有 Loop，AI 就更像一次性生成器；有了 Loop，它才开始接近一个可持续协作的执行体。

Loop 优化的，不是生成质量，而是收敛效率。

Harness：最后把 AI 放回组织治理，而不是直接推向生产

当 Rule、Spec、Loop 三层建立起来之后，AI 已经不只是“会写代码”，而是在一个受控环境里推进任务了。但要真正进入企业生产环境，还差最后一层：Harness。

Harness 不是某一个具体工具，而是一整套把 AI 产出纳入验证、提交、评审、放行与追责体系的工程外骨骼。它负责守住共享边界，承接前面三层的约束结果，并把这些结果交给组织级的质量系统去裁决。

从这个意义上说，Harness 的核心任务，从来不是让 AI 更自由，而是让组织更放心。它要回答的，不是“AI 能不能写出代码”，而是“这次变更为什么值得被信任”。

所以，Harness Engineering 的价值，不在于增强 AI 的能力，而在于让 AI 的能力在企业环境中变得可控、可验证、可回滚、可审计、可接纳。

这也解释了为什么 AI Coding 的竞争，最终不会只是模型之争，而会逐渐变成工程体系之争。真正的壁垒，不在于谁能更快生成一段代码，而在于谁能更早把一套完整的交付系统建出来。

三、AI 改变的不只是工程系统，也在改变人本身

如果说前面的讨论更多是组织视角，那么 AI 的另一面，其实是个体体验的剧烈变化。

很多人最初想象 AI 时，带着一种很朴素的期待：它帮我做事，我就轻松了。它替我干活，我就有时间喝茶、散步、发呆，或者去做那些真正重要的事情。

但现实并不完全是这样。

AI 让开始一个项目的门槛变得极低。过去半天才能搭出来的原型，现在半小时就有雏形；过去觉得“先别做，太费劲了”的想法，现在会因为“反正 AI 很快”而被迅速启动。于是，人很容易进入一种新的状态：不舍得放弃任何一个想法，不断开新项目，不断并行推进，在多个窗口和多个任务之间来回切换。

AI 并没有自动带来自由，反而把人的欲望和执行冲动一起放大了。

这也是为什么，很多人在拥有 AI 之后，并没有更轻松，反而更快、更忙、更停不下来。问题不在 AI 本身，而在于当手里有了“锤子”，人就会拼命去找“钉子”。效率的提升，并不会自动带来秩序；如果没有新的节奏感和取舍能力，它甚至会把一个人拖进更深的碎片化和焦虑里。

从这个角度看，AI 不只是要求组织建立 Harness，也在要求个人建立某种属于自己的“内在 Harness”——也就是边界、节奏、取舍和完成意识。

因为 AI 降低的是“开始”的门槛，但没有降低“做完、做好、做成”的难度。真正困难的部分，往往还在后面：细节逻辑的补全、体验的打磨、产品的传播、用户的接受、市场的验证。这些事情，不会因为 AI 会写代码，就自动迎刃而解。

所以，AI 时代真正稀缺的能力，开始发生转移。仅仅会写代码已经不够了，甚至仅仅会调用 AI 也不够了。更重要的是：你能不能判断什么值得做，能不能控制节奏，能不能把一个想法推进到真正成立，能不能在无限可能性里保住自己的主线。

四、当“有用”越来越容易被生产，人的价值会重新回到表达

AI 的另一个重要影响，是它正在改变“表达”的结构。

过去，人们写博客、做播客、写公众号，很多时候强调的是“输出干货”“提供价值”“讲明白一个知识点”。但今天，AI 在生产“有用内容”这件事上，已经越来越专业、越来越全面、越来越结构化。它可以快速生成一篇逻辑完整、框架清晰、信息密度很高的文章。

这反而会逼着人重新思考：当“有用”越来越容易被机器生产，人还要表达什么？

答案也许恰恰是：表达自己。

不是为了博流量，不是为了证明自己很懂，不是为了拼谁的内容更完整，而是为了留下一个具体的人在具体时刻的感受、观察、挣扎和判断。那种带着个人气味的表达，那种“我是谁、我正在经历什么、我为什么会这样想”的表达，反而会在 AI 时代变得更珍贵。

同样的变化，也发生在内容媒介上。AIGC 不只是一个生产工具，它更像是一种新的表达媒介。它让普通人可以更低门槛地进入影像、漫剧、短片、叙事性创作，让很多过去只能停留在脑海里的东西，有机会被更完整地表达出来。

从这个意义上说，AI 不只是改变了软件的生产方式，也在改变创作的形式、表达的入口以及内容被看见的方式。旧的表达形式不会立刻消失，但新的表达形式，正在进入主流视野。对个人来说，这不只是一个工具升级的问题，而是一个“如何在新媒介中继续表达自己”的问题。

五、AI 时代的真正分水岭，不是谁更会用工具，而是谁更早建立秩序

把组织和个人这两条线放在一起看，会发现一个很有意思的结论。

AI 的核心问题，已经不再只是能力问题，而是秩序问题。

对组织来说，这个秩序体现在工程系统里。它表现为 Rule、Spec、Loop、Harness，表现为上下文工程、架构约束、检查点、人工介入、审计与回滚。它要解决的是：AI 如何在组织中被约束、被验证、被信任、被放行。

对个人来说，这个秩序体现在自我管理里。它表现为取舍、节奏、边界、表达和长期主线。它要解决的是：AI 如何不把人拖进无穷无尽的并行和焦虑，而是成为真正放大价值的工具。

所以，AI Coding 的下一阶段，拼的不会只是模型能力，也不会只是提示词技巧。真正拉开差距的，最终会是谁更早把经验转成系统，把约束变成默认，把流程变成闭环，把输出纳入治理，把高效率放回可控秩序里。

这就是为什么，未来的竞争重点，不会只是“谁的 Agent 更聪明”，而更可能是“谁的 Harness 更成熟”；不会只是“谁会让 AI 写代码”，而是“谁能让 AI 稳定完成交付”；不会只是“谁启动得更快”，而是“谁在快的同时没有失去方向”。

作者Fisher

结语

过去两年，AI 让很多曾经听起来像幻想的事情，迅速变成了现实。它让代码生成、产品原型、内容创作、跨领域尝试，都出现了前所未有的加速度。可也正因为如此，真正困难的问题才终于浮出水面。

我们真正要建设的，不是一个更会写代码的助手，而是一套能在边界内稳定工作的交付系统；我们真正要解决的，也不只是技术问题，而是人与组织如何在高智能、高速度的环境中重新建立秩序的问题。

从 Rule 到 Spec，从 Loop 到 Harness，这是一条工程系统逐步成熟的路径。从兴奋到焦虑，从并行到取舍，从“输出有用”到“表达自我”，这是一条个人在 AI 时代重新认识自己的路径。

AI 不会替我们完成这一切。但它正在逼着我们，更认真地回答这些问题。

作者Fisher

而这，也许正是 AI Coding 下一阶段真正的开始。