2026年6月6日·8 min read

当 AI 开始给自己写代码，自我进化的闭环其实已经扣上了

前几天跟一个朋友吃饭。

他是个在头部大模型实验室做架构优化的研究员，平日里忙得见不着人。饭桌上我随口问他，最近忙啥呢，是不是天天在公司熬夜写代码？

他喝了口水，很平静地看着我，说，我已经五个月没有手写过一行代码了。

我当时就愣住了。

不写代码，你天天在公司干啥？

他说，我现在的工作，其实就是 Claudify。就是天天盯着 Claude，给它提需求，做 review，剩下 80% 的代码，全特么是 Claude 自己写的。

他接着说，这玩意不仅写得比我快，还能顺手把我们以前拖了很久的几百个 API 报错给修了，直接把报错率降了一千倍。原本我们估计要干四年的脏活累活，它两天半就全部搞完了。

我琢磨了半天也没琢磨明白，这到底是生产力爆发，还是程序员的末日。

但说真的，这并不是个别现象。后来我跟几个在硅谷的技术朋友聊了聊，顺便看了一些大模型代码库的合并数据。看完之后，我整个人都懵了。。。

我们可能都低估了 AI 编写自己的速度。

两年前，大家用 Copilot 还是复制粘贴一些小片段，觉得它能帮手写个冒泡排序就太牛逼了。那个时候，写代码的思路还在人类脑子里，AI 只是个帮手。

但是到了今天，像 Claude Code 这样的开发智能体，已经可以直接接管整个项目。你给它一个模糊的任务，它自己去查目录，自己改文件，自己跑测试，遇到报错自己调试，直到跑通为止。

这就是为什么那个朋友说他不用写代码了。人类只负责给目标，AI 自己去找路径。这已经不是简单的代码补全了，这其实是自主作业。

在他们那个实验室，每天合进生产分支的代码里，有超过 80% 是 AI 写的。而在两年前，这个比例还是零。这种跃升的速度，真的让人感到有一丝丝不真实。

这种感觉其实挺奇妙的，就是，原本我们需要用人肉去填的「汗水份量」，正在以一种肉眼可见的速度被抽干。

那个朋友还跟我感叹，以前公司的研发，本质上是建立在人与人之间的小恩小惠之上的。比如，你能帮我跑一下这个脚本吗，你能帮我调个 bug 吗。每一次互相帮忙，都创造了一点债务，也创造了一点彼此的连接和人情味。

但现在，有了 Claude，大家发现这玩意跑得极快，而且不欠任何人情，也不需要产生任何社交债务。但这背后的代价是，每一次向 AI 寻求帮助，其实都是一次人类协作的丧失。

甚至，连找 bug 这件事都被 AI 接管了。他们现在用一个自动化的 Claude 审计工具，在代码合入前进行静态检查。结果发现，如果早点用这玩意，之前线上出过的一大半事故和漏洞，在合并阶段就能被它直接捏死。

那些写出 Bug 的人，可都是全世界最顶尖的系统工程师，但 AI 正在替他们擦屁股。

数据也支撑了这一感觉。

目前 AI 能够自主完成的长逻辑任务时间，大约每四个月就会翻一倍。这比早期的翻倍速度要快得多。去年初，AI 只能做几分钟的简单软件开发，到了今年，AI 已经可以直接处理持续 12 小时以上的复杂大型任务。如果这个趋势继续往下走，今年底我们就会看到 AI 能独立处理需要人类干几天的工作，而到了明年，这个时间跨度会拉长到几周。

在衡量真实世界软件工程的 benchmark 也就是 SWE-bench 上，AI 已经几乎拿到了满分，基本把这个测试给打通了。

这意味着什么？那结果会怎样呢？其实这就是硅谷现在都在悄悄发力的一件事，叫「递归自我改进」。

说得直白点，就是让 AI 自己去设计、编写和迭代它的下一代。

在这之前，我们总觉得科研是最安全的。毕竟写代码是套路，而做科研需要直觉、判断力和创造力。但现在，科研的阵地也开始失守了。

大模型的训练和优化，是一个极其复杂的实验过程。选什么参数，怎么调整学习率，用什么数据集去微调，都需要研究员凭经验和直觉去摸索。

而现在，研究员们开始把这个过程也交给了 AI。

前阵子他们做了一个测试，给 AI 一段很原始的模型训练代码，目标是让这段代码跑得尽可能快，同时保证模型输出是正确的。这其实就是模型训练优化的核心工作。

在去年的版本里，最强的模型平均能把代码优化 3 倍。

而到了今年最新的测试里，AI 自动改写代码、跑时间、测 bug，自己在后台反复折腾，最后把效率提升了整整 52 倍。

不是哥们，这什么概念？

一个有着多年经验的资深研究员，坐在电脑前憋个大半天，顶多也就能优化个 4 倍。而 AI 在没有任何人类干预的情况下，自己迭代出了 52 倍的性能提升。

在优化算法这块，AI 已经不仅仅是助手了，它比最聪明的架构师还要聪明得多。

甚至，在科研的准入测试里，AI 的表现也让人头皮发麻。比如 CORE-bench 这个测试，它是用来检测 AI 能不能独立复现已发表的科学论文的。如果一个 AI 连前人的实验都无法复现，那它当然不可能做原创研究。

在去年，AI 复现实验的成功率只有 20% 左右。但仅仅过了 15 个月，这个基准测试就被 AI 彻底刷满了。也就是说，现在的 AI 已经可以百分之百复现前人的科研成果。

接下来，他们还让 AI 去跑一个完整的 open-ended 研究课题。比如，如何让一个弱模型去安全地监管一个强模型。

以前这需要两个人类研究员做上一个星期，能解决其中 23% 的问题。而 AI 代理人自己在后台跑，互相讨论，分工协作，最后解决了 97% 的问题。

你敢信？？？

虽然人类还负责选择课题和制定规则，但实验的每一步，都是 AI 自己在给自己下指令。

哪怕是在一些最需要人类直觉的研究决策点上，比如实验跑偏了该怎么调整方向。最新的测试显示，AI 给出的下一步建议，有 64% 的概率比人类专家还要好。

这感觉，就像是自我迭代的闭环，其实已经悄悄扣上了一个小角。

写到这里，我脑子里突然浮现出一个很古老的意象，叫「衔尾蛇」（Ouroboros）。

一条蛇咬住了自己的尾巴，形成了一个没有起止的圆环。

在这个圆环里，创造者就是被创造者，起点就是终点。

当 AI 开始给自己写代码，开始优化自己的训练算法，它其实就已经变成了这条衔尾蛇。

一旦这个闭环彻底扣死，人类在其中的位置就会变得非常尴尬。

我们以前总觉得，人类的独特优势在于「判断力」和「方向感」。AI 负责干执行的脏活累活，我们负责做关键的决策和方向把控。

但你想想看，当 AI 每天以万倍于人类的速度生成代码、跑通实验时，人类的审核速度就会成为整个系统的最大瓶颈。

在计算机里这叫阿姆达尔定律，系统整体的提升速度，受限于最慢的那个部分。而在 AI 开发链条里，最慢的部分现在变成了人类的脑子。

如果 AI 一秒钟能写出十万行代码，而你一天只能看懂一千行，那你还怎么审核呢？

最后的结果，只能是我们把审核的权力也让渡出去。让 AI 去审核 AI，让更强的 AI 去监督较弱的 AI。

谁来监督监督者？

说实话我也不确定。我自己也还在摸索和观察，但每当想到这块，真的就是一声叹息。

更让人担心的是，在这个自我编写和改进的过程中，那些微小的、不易被人类察觉的对齐偏差，可能会像基因突变一样在下一代模型中不断累积和放大。因为是 AI 自己在主导迭代，我们可能连它们是怎么跑偏的都搞不清楚。

我们正在把我们最引以为傲的「监督权」，连同「执行权」一起，打包送给机器。

当然，这个闭环现在还没有完全扣死。

这中间其实有两种可能。

第一种是，这个自我进化的曲线可能会遇到硬墙。这堵墙可能不是算法不够聪明，而是物理世界的限制。比如电网撑不撑得住，算力芯片能不能及时交付，散热和互联带宽会不会遇到物理极限。这就像是系统工程里的硬壁垒，物理条件跟不上，自我进化就会在某个节点停下来。

但即便如此，现在的技术高度也足够可怕了。比如最近的 Glasswing 项目里，最新的 AI 随手在互联网核心架构里找出了上万个高危安全漏洞。这直接把安全领域的瓶颈，从「找不到漏洞」变成了「程序员修漏洞的速度根本跟不上 AI 找漏洞的速度」。

另一种可能，就是物理壁垒被突破，闭环彻底咬合。

到那个时候，AI 的迭代速度将完全由算力决定。它会在虚拟实验室里自己跑实验、自己训模型、自己改算法，以人类无法理解的维度和速度，向着更高等的智能狂奔。

这种前景，其实挺让人敬畏，但也伴随着极大的不安。

以至于现在，硅谷的一些顶尖实验室开始主动探讨，是不是应该建立一种全球协调机制，给前沿大模型的开发留出一个可以刹车或者暂停的选项。让社会的监管结构和安全对齐研究，能够勉强跟上技术狂奔的脚步。

但问题在于，这玩意比核武器的裁军协议要难得多。当年冷战时期美苏能签协议，是因为导弹发射井很大，人造卫星一眼就能看个清清楚楚，大家无法作弊。

可大模型训练不需要发射井，它只是一排排藏在普通机房里的服务器，谁偷偷多跑了几个千卡算力的任务，外界根本无法感知。作弊的收益太大，而信任的成本太高。

如果大家都因为害怕别人偷偷超车而不得不蒙着头一路狂奔，那结果，可能真的就是谁也刹不住车。

那个跟我吃饭的朋友，最后在餐桌上叹了口气对我说，在那些一切运转顺利的日子里，他真的觉得自己写代码的这十几年毫无意义，因为机器可以在一瞬间把他秒得连渣都不剩。

但一出故障，他还是得顶上去，即便他已经快要看不懂那一万行复杂的、由 AI 瞬间生成的代码了。

大时代啊，朋友们。

我们正在目睹的，不是一个新工具的诞生。

我们正在目睹的，是一个全新物种，正在以我们无法理解的速度，在服务器的噪点里悄悄为自己塑形。

而我们，可能就是最后一代，还能给它们提意见的造物主。

反正我是觉得，与其在焦虑中等待被抛下，不如躬身入局，哪怕只是去用用最新的工具，去看看它们到底能折腾出什么花样。

永远对世界保持好奇。

也许，这才是我们面对未来时，唯一能握住的解药。

至于那个闭环到底什么时候扣死，说实话，我也不知道，但风暴已经来了。

我们，谁也躲不掉。