AI Coding 的下一阶段:从生成能力到治理能力

2 天前(已编辑)
/ ,
60

AI Coding 的下一阶段:从生成能力到治理能力

过去两年,关于 AI Coding 的讨论,几乎每隔几个月就会换一个重心。

最开始,大家讨论的是:AI 到底能不能写代码。后来,大家开始关心:它能不能真正参与开发。再后来,问题变成了:它能不能独立完成一个模块、一个项目,甚至一段完整的交付流程。

到了今天,这个问题其实已经有了阶段性答案。AI 不仅能写代码,而且已经能够在很多场景中写得很快、写得像样,甚至能把原型、骨架、测试和一些基础功能一并做出来。真正的分水岭,已经不再是“它会不会写”,而是“它写出来的东西,能不能被人和组织真正接住”。

这背后,意味着 AI Coding 正在进入一个新的阶段:竞争的重点,开始从生成能力,转向治理能力;从单点能力,转向系统能力;从“做出来”,转向“做得稳、接得住、放得进生产”。

这不仅是一个技术问题,也是一个组织问题,甚至还是一个个人问题。 作者Fisher

一、AI Coding 的真正难点,不在生成端,而在接收端

在试点阶段,AI Coding 往往给人一种很强的兴奋感。

它写代码很快,搭架子很快,补测试也很快。很多过去需要半天、一天才能看到雏形的事情,现在半小时就能起出一个像样的原型。于是团队会自然得出一个判断:AI Coding 已经可用了。

但真正的问题,通常不是在这里暴露的。

问题往往出现在推广阶段。有人把 AI 生成的代码直接提交,跳过评审;有人发现 AI 改了不该改的接口,但变更已经合进去了;还有人虽然也用了 AI,但最后还是不得不手动重写一遍,因为 AI 的输出和团队的工程习惯、边界约束、交付要求对不上。

这时候大家才会意识到,试点阶段验证的,往往只是“AI 能不能写代码”;而没有验证的是,“AI 写出来的代码,如何被工程体系接纳”。

这两者不是一回事。

AI Coding 的瓶颈,从来不只在模型这一端。真正决定它能不能进入生产的,是代码生成之后的一整套问题:它是不是在边界内生成的?有没有跑偏?改动面是不是可控?结果是否经过验证?最后能不能通过评审、检查和放行体系?

这些问题,模型自己回答不了,只能由工程系统来回答。

所以,AI Coding 的下一阶段,不是继续追问“怎样让 AI 写更多代码”,而是要回答另一个更关键的问题:怎样让 AI 在工程体系中稳定完成交付。

二、从 Rule、Spec、Loop 到 Harness,本质上是在建设控制面

如果把 AI Coding 的演进过程拆开来看,可以发现它并不是一个单点突破的问题,而是一条逐层收紧的建设路径。

先是 Rule,再是 Spec,然后是 Loop,最后才是 Harness。

这四层看似是四个模块,实际上是一条递进关系。每一层都不是孤立存在的,而是在为下一层提供约束条件。它们共同解决的,不是“AI 怎么更聪明”,而是“AI 怎么不乱来、怎么不跑偏、怎么持续收敛、最后怎么被组织信任”。 作者Fisher

Rule:先把“不要乱来”写成机器边界

很多团队一开始最关心的,是 AI 能做什么。但在真实项目里,最昂贵的错误,往往不是写得不漂亮,而是越过边界、误改契约、扩散变更面,或者在不该结束的时候宣布任务完成。

所以 Rule 必须排在第一层。

Rule 不是为了让 AI 更有背景知识,而是为了让它先学会不越界。它首先要写清楚的,不是“建议怎么做”,而是“绝对不要做什么”。先写 NEVER,再写 DO NOT;先约束高代价错误,再去讨论更优雅的实现。

更重要的是,规则文件不是装饰品。它如果只是上下文的一部分,那它就只是提醒;真正的护栏,必须由测试、lint、build、schema check、review policy 这些外部信号来接管。也就是说,Rule 的价值不在于“告诉 AI”,而在于“让系统有办法拦住 AI”。

Rule 解决的是一个最基础的问题:先别乱来。

Spec:再把“想做什么”压缩成一次可执行的变更

只有 Rule 还不够。因为边界清楚,不等于目标清楚。

很多 AI Coding 失控,不是模型没理解需求,而是需求本身没有被整理成一个范围明确、结果可验证、边界可审查的交付对象。于是 AI 很自然地扩写任务:修一个提示,顺手重构流程;补一个状态,顺手改掉契约;写一个 happy path,顺手把整个模块“整理”一遍。

这时候需要的就是 Spec。

Spec 不是更长的 prompt,也不是把背景写得更厚,而是把一次模糊的意图,收敛成一次可执行、可审查、可验证的变更。它至少要回答几件事:这次要解决什么,这次不解决什么,允许改哪些 surface,哪些 contract 不能动,怎样才算完成。

它真正的价值,是把范围钉住,把完成条件前置,把“顺手改一下”的冲动提前消灭掉。

如果说 Rule 解决的是“别乱来”,那么 Spec 解决的就是“别跑偏”。

Loop:把一次性生成,改造成可收敛的执行闭环

有了边界和目标,还不够。因为执行过程本身依然会出错。

真正决定 AI 能不能持续参与工程工作的,不是它某一次回答得多漂亮,而是有没有一个 Loop,把“读取上下文—做最小改动—运行外部验证—记录状态—进入下一轮”变成系统动作。

这一步非常关键,因为它改变了 AI Coding 的工作形态。它不再是一锤子买卖,而是一个持续逼近验收条件的过程。它要求每一轮改动足够小,小到能被验证器快速裁决;它要求状态外置到文件、日志、Git 历史、计划文档里,而不是寄希望于模型“记得住”;它也要求一旦检查失败,就必须停下来修,而不是带着失败继续往前滚。

没有 Loop,AI 就更像一次性生成器;有了 Loop,它才开始接近一个可持续协作的执行体。

Loop 优化的,不是生成质量,而是收敛效率。

Harness:最后把 AI 放回组织治理,而不是直接推向生产

当 Rule、Spec、Loop 三层建立起来之后,AI 已经不只是“会写代码”,而是在一个受控环境里推进任务了。但要真正进入企业生产环境,还差最后一层:Harness。

Harness 不是某一个具体工具,而是一整套把 AI 产出纳入验证、提交、评审、放行与追责体系的工程外骨骼。它负责守住共享边界,承接前面三层的约束结果,并把这些结果交给组织级的质量系统去裁决。

从这个意义上说,Harness 的核心任务,从来不是让 AI 更自由,而是让组织更放心。它要回答的,不是“AI 能不能写出代码”,而是“这次变更为什么值得被信任”。

所以,Harness Engineering 的价值,不在于增强 AI 的能力,而在于让 AI 的能力在企业环境中变得可控、可验证、可回滚、可审计、可接纳。

这也解释了为什么 AI Coding 的竞争,最终不会只是模型之争,而会逐渐变成工程体系之争。真正的壁垒,不在于谁能更快生成一段代码,而在于谁能更早把一套完整的交付系统建出来。

三、AI 改变的不只是工程系统,也在改变人本身

如果说前面的讨论更多是组织视角,那么 AI 的另一面,其实是个体体验的剧烈变化。

很多人最初想象 AI 时,带着一种很朴素的期待:它帮我做事,我就轻松了。它替我干活,我就有时间喝茶、散步、发呆,或者去做那些真正重要的事情。

但现实并不完全是这样。

AI 让开始一个项目的门槛变得极低。过去半天才能搭出来的原型,现在半小时就有雏形;过去觉得“先别做,太费劲了”的想法,现在会因为“反正 AI 很快”而被迅速启动。于是,人很容易进入一种新的状态:不舍得放弃任何一个想法,不断开新项目,不断并行推进,在多个窗口和多个任务之间来回切换。

AI 并没有自动带来自由,反而把人的欲望和执行冲动一起放大了。

这也是为什么,很多人在拥有 AI 之后,并没有更轻松,反而更快、更忙、更停不下来。问题不在 AI 本身,而在于当手里有了“锤子”,人就会拼命去找“钉子”。效率的提升,并不会自动带来秩序;如果没有新的节奏感和取舍能力,它甚至会把一个人拖进更深的碎片化和焦虑里。

从这个角度看,AI 不只是要求组织建立 Harness,也在要求个人建立某种属于自己的“内在 Harness”——也就是边界、节奏、取舍和完成意识。

因为 AI 降低的是“开始”的门槛,但没有降低“做完、做好、做成”的难度。真正困难的部分,往往还在后面:细节逻辑的补全、体验的打磨、产品的传播、用户的接受、市场的验证。这些事情,不会因为 AI 会写代码,就自动迎刃而解。

所以,AI 时代真正稀缺的能力,开始发生转移。仅仅会写代码已经不够了,甚至仅仅会调用 AI 也不够了。更重要的是:你能不能判断什么值得做,能不能控制节奏,能不能把一个想法推进到真正成立,能不能在无限可能性里保住自己的主线。

四、当“有用”越来越容易被生产,人的价值会重新回到表达

AI 的另一个重要影响,是它正在改变“表达”的结构。

过去,人们写博客、做播客、写公众号,很多时候强调的是“输出干货”“提供价值”“讲明白一个知识点”。但今天,AI 在生产“有用内容”这件事上,已经越来越专业、越来越全面、越来越结构化。它可以快速生成一篇逻辑完整、框架清晰、信息密度很高的文章。

这反而会逼着人重新思考:当“有用”越来越容易被机器生产,人还要表达什么?

答案也许恰恰是:表达自己。

不是为了博流量,不是为了证明自己很懂,不是为了拼谁的内容更完整,而是为了留下一个具体的人在具体时刻的感受、观察、挣扎和判断。那种带着个人气味的表达,那种“我是谁、我正在经历什么、我为什么会这样想”的表达,反而会在 AI 时代变得更珍贵。

同样的变化,也发生在内容媒介上。AIGC 不只是一个生产工具,它更像是一种新的表达媒介。它让普通人可以更低门槛地进入影像、漫剧、短片、叙事性创作,让很多过去只能停留在脑海里的东西,有机会被更完整地表达出来。

从这个意义上说,AI 不只是改变了软件的生产方式,也在改变创作的形式、表达的入口以及内容被看见的方式。旧的表达形式不会立刻消失,但新的表达形式,正在进入主流视野。对个人来说,这不只是一个工具升级的问题,而是一个“如何在新媒介中继续表达自己”的问题。

五、AI 时代的真正分水岭,不是谁更会用工具,而是谁更早建立秩序

把组织和个人这两条线放在一起看,会发现一个很有意思的结论。

AI 的核心问题,已经不再只是能力问题,而是秩序问题。

对组织来说,这个秩序体现在工程系统里。它表现为 Rule、Spec、Loop、Harness,表现为上下文工程、架构约束、检查点、人工介入、审计与回滚。它要解决的是:AI 如何在组织中被约束、被验证、被信任、被放行。

对个人来说,这个秩序体现在自我管理里。它表现为取舍、节奏、边界、表达和长期主线。它要解决的是:AI 如何不把人拖进无穷无尽的并行和焦虑,而是成为真正放大价值的工具。

所以,AI Coding 的下一阶段,拼的不会只是模型能力,也不会只是提示词技巧。真正拉开差距的,最终会是谁更早把经验转成系统,把约束变成默认,把流程变成闭环,把输出纳入治理,把高效率放回可控秩序里。

这就是为什么,未来的竞争重点,不会只是“谁的 Agent 更聪明”,而更可能是“谁的 Harness 更成熟”;不会只是“谁会让 AI 写代码”,而是“谁能让 AI 稳定完成交付”;不会只是“谁启动得更快”,而是“谁在快的同时没有失去方向”。

作者Fisher

结语

过去两年,AI 让很多曾经听起来像幻想的事情,迅速变成了现实。它让代码生成、产品原型、内容创作、跨领域尝试,都出现了前所未有的加速度。可也正因为如此,真正困难的问题才终于浮出水面。

我们真正要建设的,不是一个更会写代码的助手,而是一套能在边界内稳定工作的交付系统;我们真正要解决的,也不只是技术问题,而是人与组织如何在高智能、高速度的环境中重新建立秩序的问题。

从 Rule 到 Spec,从 Loop 到 Harness,这是一条工程系统逐步成熟的路径。 从兴奋到焦虑,从并行到取舍,从“输出有用”到“表达自我”,这是一条个人在 AI 时代重新认识自己的路径。

AI 不会替我们完成这一切。 但它正在逼着我们,更认真地回答这些问题。

作者Fisher

而这,也许正是 AI Coding 下一阶段真正的开始。

使用社交账号登录

  • Loading...
  • Loading...
  • Loading...
  • Loading...
  • Loading...