荒野电波荒野电波WILD WAVES
返回
·8 min read

当 AI 开始给自己写代码,自我进化的闭环其实已经扣上了

当 AI 开始给自己写代码,自我进化的闭环其实已经扣上了

前几天跟一个朋友吃饭。

他是个在头部大模型实验室做架构优化的研究员,平日里忙得见不着人。饭桌上我随口问他,最近忙啥呢,是不是天天在公司熬夜写代码?

他喝了口水,很平静地看着我,说,我已经五个月没有手写过一行代码了。

我当时就愣住了。

不写代码,你天天在公司干啥?

他说,我现在的工作,其实就是 Claudify。就是天天盯着 Claude,给它提需求,做 review,剩下 80% 的代码,全特么是 Claude 自己写的。

他接着说,这玩意不仅写得比我快,还能顺手把我们以前拖了很久的几百个 API 报错给修了,直接把报错率降了一千倍。原本我们估计要干四年的脏活累活,它两天半就全部搞完了。

我琢磨了半天也没琢磨明白,这到底是生产力爆发,还是程序员的末日。

但说真的,这并不是个别现象。后来我跟几个在硅谷的技术朋友聊了聊,顺便看了一些大模型代码库的合并数据。看完之后,我整个人都懵了。。。

我们可能都低估了 AI 编写自己的速度。

两年前,大家用 Copilot 还是复制粘贴一些小片段,觉得它能帮手写个冒泡排序就太牛逼了。那个时候,写代码的思路还在人类脑子里,AI 只是个帮手。

但是到了今天,像 Claude Code 这样的开发智能体,已经可以直接接管整个项目。你给它一个模糊的任务,它自己去查目录,自己改文件,自己跑测试,遇到报错自己调试,直到跑通为止。

这就是为什么那个朋友说他不用写代码了。人类只负责给目标,AI 自己去找路径。这已经不是简单的代码补全了,这其实是自主作业。

在他们那个实验室,每天合进生产分支的代码里,有超过 80% 是 AI 写的。而在两年前,这个比例还是零。这种跃升的速度,真的让人感到有一丝丝不真实。

这种感觉其实挺奇妙的,就是,原本我们需要用人肉去填的「汗水份量」,正在以一种肉眼可见的速度被抽干。

那个朋友还跟我感叹,以前公司的研发,本质上是建立在人与人之间的小恩小惠之上的。比如,你能帮我跑一下这个脚本吗,你能帮我调个 bug 吗。每一次互相帮忙,都创造了一点债务,也创造了一点彼此的连接和人情味。

但现在,有了 Claude,大家发现这玩意跑得极快,而且不欠任何人情,也不需要产生任何社交债务。但这背后的代价是,每一次向 AI 寻求帮助,其实都是一次人类协作的丧失。

甚至,连找 bug 这件事都被 AI 接管了。他们现在用一个自动化的 Claude 审计工具,在代码合入前进行静态检查。结果发现,如果早点用这玩意,之前线上出过的一大半事故和漏洞,在合并阶段就能被它直接捏死。

那些写出 Bug 的人,可都是全世界最顶尖的系统工程师,但 AI 正在替他们擦屁股。

数据也支撑了这一感觉。

目前 AI 能够自主完成的长逻辑任务时间,大约每四个月就会翻一倍。这比早期的翻倍速度要快得多。去年初,AI 只能做几分钟的简单软件开发,到了今年,AI 已经可以直接处理持续 12 小时以上的复杂大型任务。如果这个趋势继续往下走,今年底我们就会看到 AI 能独立处理需要人类干几天的工作,而到了明年,这个时间跨度会拉长到几周。

在衡量真实世界软件工程的 benchmark 也就是 SWE-bench 上,AI 已经几乎拿到了满分,基本把这个测试给打通了。

这意味着什么?那结果会怎样呢?其实这就是硅谷现在都在悄悄发力的一件事,叫「递归自我改进」。

说得直白点,就是让 AI 自己去设计、编写和迭代它的下一代。

在这之前,我们总觉得科研是最安全的。毕竟写代码是套路,而做科研需要直觉、判断力和创造力。但现在,科研的阵地也开始失守了。

大模型的训练和优化,是一个极其复杂的实验过程。选什么参数,怎么调整学习率,用什么数据集去微调,都需要研究员凭经验和直觉去摸索。

而现在,研究员们开始把这个过程也交给了 AI。

前阵子他们做了一个测试,给 AI 一段很原始的模型训练代码,目标是让这段代码跑得尽可能快,同时保证模型输出是正确的。这其实就是模型训练优化的核心工作。

在去年的版本里,最强的模型平均能把代码优化 3 倍。

而到了今年最新的测试里,AI 自动改写代码、跑时间、测 bug,自己在后台反复折腾,最后把效率提升了整整 52 倍。

不是哥们,这什么概念?

一个有着多年经验的资深研究员,坐在电脑前憋个大半天,顶多也就能优化个 4 倍。而 AI 在没有任何人类干预的情况下,自己迭代出了 52 倍的性能提升。

在优化算法这块,AI 已经不仅仅是助手了,它比最聪明的架构师还要聪明得多。

甚至,在科研的准入测试里,AI 的表现也让人头皮发麻。比如 CORE-bench 这个测试,它是用来检测 AI 能不能独立复现已发表的科学论文的。如果一个 AI 连前人的实验都无法复现,那它当然不可能做原创研究。

在去年,AI 复现实验的成功率只有 20% 左右。但仅仅过了 15 个月,这个基准测试就被 AI 彻底刷满了。也就是说,现在的 AI 已经可以百分之百复现前人的科研成果。

接下来,他们还让 AI 去跑一个完整的 open-ended 研究课题。比如,如何让一个弱模型去安全地监管一个强模型。

以前这需要两个人类研究员做上一个星期,能解决其中 23% 的问题。而 AI 代理人自己在后台跑,互相讨论,分工协作,最后解决了 97% 的问题。

你敢信???

虽然人类还负责选择课题和制定规则,但实验的每一步,都是 AI 自己在给自己下指令。

哪怕是在一些最需要人类直觉的研究决策点上,比如实验跑偏了该怎么调整方向。最新的测试显示,AI 给出的下一步建议,有 64% 的概率比人类专家还要好。

这感觉,就像是自我迭代的闭环,其实已经悄悄扣上了一个小角。

写到这里,我脑子里突然浮现出一个很古老的意象,叫「衔尾蛇」(Ouroboros)。

一条蛇咬住了自己的尾巴,形成了一个没有起止的圆环。

在这个圆环里,创造者就是被创造者,起点就是终点。

当 AI 开始给自己写代码,开始优化自己的训练算法,它其实就已经变成了这条衔尾蛇。

一旦这个闭环彻底扣死,人类在其中的位置就会变得非常尴尬。

我们以前总觉得,人类的独特优势在于「判断力」和「方向感」。AI 负责干执行的脏活累活,我们负责做关键的决策和方向把控。

但你想想看,当 AI 每天以万倍于人类的速度生成代码、跑通实验时,人类的审核速度就会成为整个系统的最大瓶颈。

在计算机里这叫阿姆达尔定律,系统整体的提升速度,受限于最慢的那个部分。而在 AI 开发链条里,最慢的部分现在变成了人类的脑子。

如果 AI 一秒钟能写出十万行代码,而你一天只能看懂一千行,那你还怎么审核呢?

最后的结果,只能是我们把审核的权力也让渡出去。让 AI 去审核 AI,让更强的 AI 去监督较弱的 AI。

谁来监督监督者?

说实话我也不确定。我自己也还在摸索和观察,但每当想到这块,真的就是一声叹息。

更让人担心的是,在这个自我编写和改进的过程中,那些微小的、不易被人类察觉的对齐偏差,可能会像基因突变一样在下一代模型中不断累积和放大。因为是 AI 自己在主导迭代,我们可能连它们是怎么跑偏的都搞不清楚。

我们正在把我们最引以为傲的「监督权」,连同「执行权」一起,打包送给机器。

当然,这个闭环现在还没有完全扣死。

这中间其实有两种可能。

第一种是,这个自我进化的曲线可能会遇到硬墙。这堵墙可能不是算法不够聪明,而是物理世界的限制。比如电网撑不撑得住,算力芯片能不能及时交付,散热和互联带宽会不会遇到物理极限。这就像是系统工程里的硬壁垒,物理条件跟不上,自我进化就会在某个节点停下来。

但即便如此,现在的技术高度也足够可怕了。比如最近的 Glasswing 项目里,最新的 AI 随手在互联网核心架构里找出了上万个高危安全漏洞。这直接把安全领域的瓶颈,从「找不到漏洞」变成了「程序员修漏洞的速度根本跟不上 AI 找漏洞的速度」。

另一种可能,就是物理壁垒被突破,闭环彻底咬合。

到那个时候,AI 的迭代速度将完全由算力决定。它会在虚拟实验室里自己跑实验、自己训模型、自己改算法,以人类无法理解的维度和速度,向着更高等的智能狂奔。

这种前景,其实挺让人敬畏,但也伴随着极大的不安。

以至于现在,硅谷的一些顶尖实验室开始主动探讨,是不是应该建立一种全球协调机制,给前沿大模型的开发留出一个可以刹车或者暂停的选项。让社会的监管结构和安全对齐研究,能够勉强跟上技术狂奔的脚步。

但问题在于,这玩意比核武器的裁军协议要难得多。当年冷战时期美苏能签协议,是因为导弹发射井很大,人造卫星一眼就能看个清清楚楚,大家无法作弊。

可大模型训练不需要发射井,它只是一排排藏在普通机房里的服务器,谁偷偷多跑了几个千卡算力的任务,外界根本无法感知。作弊的收益太大,而信任的成本太高。

如果大家都因为害怕别人偷偷超车而不得不蒙着头一路狂奔,那结果,可能真的就是谁也刹不住车。

那个跟我吃饭的朋友,最后在餐桌上叹了口气对我说,在那些一切运转顺利的日子里,他真的觉得自己写代码的这十几年毫无意义,因为机器可以在一瞬间把他秒得连渣都不剩。

但一出故障,他还是得顶上去,即便他已经快要看不懂那一万行复杂的、由 AI 瞬间生成的代码了。

大时代啊,朋友们。

我们正在目睹的,不是一个新工具的诞生。

我们正在目睹的,是一个全新物种,正在以我们无法理解的速度,在服务器的噪点里悄悄为自己塑形。

而我们,可能就是最后一代,还能给它们提意见的造物主。

反正我是觉得,与其在焦虑中等待被抛下,不如躬身入局,哪怕只是去用用最新的工具,去看看它们到底能折腾出什么花样。

永远对世界保持好奇。

也许,这才是我们面对未来时,唯一能握住的解药。

至于那个闭环到底什么时候扣死,说实话,我也不知道,但风暴已经来了。

我们,谁也躲不掉。