AI编程演化三代，第四代要来了

上周试用 Cursor 3.7 的 SDK 功能，写了一个自定义工具让 Agent 直接调公司内部 API 生成接口文档。从注册函数到跑通第一个任务，花了不到一小时。

那种感觉很奇怪。不是"这个工具真好用"——而是"以后写代码的方式可能彻底变了"。

AI 编程工具的演进速度在 2026 年明显加速。用 MIT 那篇 NBER 论文的分代框架来看，三代工具在不到四年的时间里完成了迭代，每一代之间的跨越都不是线性的。

第一代自动补全，起点是 GitHub Copilot 的 2022 年 6 月发布。开发者敲键盘，模型预测下一行代码。本质上是一个概率引擎，基于上下文推荐最可能的代码片段。这一代产品改变了程序员在编辑器里的微观行为——从"写代码"变成了"从 AI 建议中选代码"。

第二代同步代理在 2025 年初崛起。Claude Code 和 Cursor 把代理能力嵌入 IDE，开发者用自然语言描述意图，Agent 自主导航代码库、跨文件编辑、运行测试、看报错后自我修正。交互模式从"每行都要看"变成了"看着 Agent 干活，关键节点把关"。

这里的核心技术变化是 Agent 获得了工具使用权。Claude Code 可以执行 Shell 命令、读文件、搜索代码库、操作 Git。Cursor 的 Agent 能运行终端命令、查看 Lint 错误、甚至操作浏览器。工具链越丰富，Agent 的自主边界越宽。

第三代异步代理在 2025 年 5 月登场。OpenAI Codex 和 GitHub Copilot Coding Agent 把 Agent 搬到了云端。开发者指派任务后可以关掉电脑，Agent 在虚拟机上独立工作，写完代码跑完 CI，自动提交 PR 等你回来审查。

这个跳跃的意义不亚于从同步调用切到异步消息队列。开发者的时间不再和 Agent 的执行时间绑定。你布置任务的那一刻，生产就开始了。

现在来看 2026 年 6 月这三家主力玩家的最新动向，能清晰看到第四代的雏形。

Cursor 3.6 的 Auto-review Run Mode 是一个关键信号。传统 Agent 每一步都需要人类确认，或者全部自动执行——两个极端。Auto-review 引入了一个三层信任体系。白名单操作（比如读文件、跑单元测试）直接执行。沙箱操作（比如执行外部脚本）在隔离环境运行。不确定的操作交给分类子 Agent 判断要不要问你。

这解决了 Agent 自主性和安全性之间最大的矛盾。工程师设定边界，Agent 在边界内自治。

3.7 版本把这种思路推得更远。Design Mode 不再是代码生成器，而是一个可以理解 UI 设计的 Agent。你选中页面上的几个元素，用语音描述想要的交互效果，Agent 一边改代码一边实时渲染。Canvas 支持全屏共享，意味着设计评审不再靠截图和标注——Agent 直接参与创作过程。

更底层的变化在 SDK 层。开发者可以把自己的函数注册到 local.customTools，Agent 能看到这些工具的描述和签名，在任务执行时自动判断要不要调用。可以指定存储后端（JSONL 或 SQLite），可以嵌套子 Agent 到任意深度。

这本质上是把 Agent 变成了一个可编程的执行环境。今天的 Cursor SDK 能做本地文件操作和 API 调用，明天呢？

Claude Code 这边也在快速演进。6 月 2 日发布的 v2.1.160 把动态工作流触发词从 workflow 改成 ultracode，用紫色高亮。这看起来只是个 UI 改动，但背后是 Claude Code 在强化"理解工作流上下文"的能力。一个关键词能触发一整套预定义的操作序列——拉代码、切分支、分析任务、生成方案、执行修改、运行测试、创建 PR。

更值得关注的是子 Agent 嵌套的深度。Cursor 3.7 的 SDK 允许嵌套子 Agent 到任意深度，这意味着一个顶层 Agent 可以把复杂任务拆解后分发给多个子 Agent，每个子 Agent 只负责一个局部目标。这跟人类团队的架构分工逻辑一模一样——架构师拆模块，模块负责人写代码，测试工程师跑验证。

工程师的价值正在从"自己做"转向"设计分工"。

一项在 2026 年 Q1 被广泛关注的数据来自 Anthropic 内部。Claude 在难度最高的开放式任务中，成功率在 6 个月内从 26% 跳到了 76%。它不需要人类指导就能自主找到解决方案的比例，已经逼近一个中级工程师的水平。

但这并不意味着人类可以放手。MIT 研究里那个替代弹性系数 0.25 始终在起作用——AI 的输出必须经过人类审查才能进入下一层生产环节。子 Agent 越多、嵌套越深，人类审查的复杂度越高。不是不想放手，是架构复杂性决定了人类必须在关键节点把关。

一个正在出现的实践模式是"分层信任"。低风险模块（工具函数、测试用例、文档生成）完全交给 AI 自主完成。中风险模块（业务逻辑、数据模型变更）由 AI 生成后人类审查。高风险模块（认证授权、支付流程、核心算法）由人类主导设计，AI 辅助执行。

这种分层不是技术限制，是工程判断力的体现。

Google 的 Gemini Code Assist 在 6 月迁入 Antigravity CLI，把战场从 IDE 延伸到了命令行。这个策略很聪明——当 Claude Code 在终端已经建立了强大的心智，Google 不需要重新教育市场，直接提供对标方案即可。

但真正的暗流在模型层。

Claude Fable 5 在 6 月 9 日发布。Anthropic 把它定位为"Mythos 级"模型，高于 Opus。定价也反映了定位——每百万 Token 输入 10 美元、输出 50 美元，比 Opus 贵了一倍。但 Pro 和 Max 用户免费用到 6 月 22 日，这明显是在培养用户习惯，先让你体验，再让你离不开。

Anthropic 内部数据显示，搭载 Mythos Preview 后，科研人员效率达到无 AI 辅助的 4 倍。Claude 能独立可靠完成的任务时长大约每四个月翻一番，此前是每七个月翻一番——加速了。

把这些碎片拼在一起，第四代 Agent 编程工具的轮廓已经出来了。它不是一个更好的代码补全器。它是一个能理解项目上下文、自主规划任务、调用任意工具、在人类设定的边界内长时间独立工作的执行层。

到了那一天，程序员和 AI 的关系会变成指挥官和编队的关系。你负责想清楚打哪里，AI 负责怎么打。

但有个问题还没解决。MIT 的研究说得很清楚，代码再多，不在工业流程里转化为产品，增益上限只有 26%。第四代工具能不能突破这个天花板，不取决于能写多少代码。

而取决于能不能把"理解需求"和"交付产品"之间的那堵流程墙，凿出一个洞来。

这个洞察指向一个更深层的变化。前三代工具的竞争焦点一直在"怎么写代码"，第四代的竞争焦点正在转向"怎么定义任务"。能不能把产品需求自动拆解成 Agent 可执行的子任务？能不能从代码变更里自动推导出测试用例？能不能在 CI 失败时自动判断是代码问题还是环境问题，然后自动修复？

谁先解决这些问题，谁就定义了下一代开发生命周期。

还有一个趋势值得关注——本地优先和隐私计算。Cursor 的本地 Agent 架构意味着代码不离开开发者的机器，这对金融、医疗、军工行业的合规要求至关重要。Claude Code 虽然模型在云端，但支持私有化部署。Codex 的云端虚拟机模式在效率上最强，但在数据主权上最弱。

企业选型的决策树正在从"哪个工具最好用"变成"哪个工具的部署方式符合我们的安全策略"。这跟 2022 年选 IDE 插件的逻辑完全不同。

对普通开发者来说，第四代工具的落地不会是一夜之间的事。但信号已经足够清晰。如果你现在用的还是第一代自动补全，两年后你可能在跟一群 AI Agent 抢同一个 PR。如果你已经在用 Cursor 的 Agent 模式和 Claude Code 的终端工作流，第四代的过渡对你来说只是工具升级。

差距不是从现在开始拉的。是从 2022 年 Copilot 发布那天开始拉的。三年前的每一个"再看看"，现在都变成了追赶的成本。

展开阅读全文

更新时间：2026-06-17

标签：科技代码工具人类开发者操作嵌套模块边界工作流自主

1 2 3 4 5

AI编程演化三代，第四代要来了

中央网信办举报中心开设“涉AI应用乱象举报专区”

SpaceX 万亿 IPO！火星殖民绑 AI，这场资本局藏着啥？

小米总部及省平台领导莅临南阳居然之家标杆门店调研走访

隔夜欧美·6月16日

美债利率破 5% 无风险！躺平收息反超炒股：普通人该如何应对？

白天大涨晚间遭立案！百亿资源股实控人一同被罚，7万股民踩中雷

再投10亿“翻新”熔盛重工！

基本面偏弱锰硅持续低位震荡

订单排至2032年！

高考结束，很多孩子涌进苹果店：不是虚荣，是压抑太久的“补偿”

章丘圣井碧桂园社区：先舞纱巾再越山丘

618囤孝敬父母选什么？高乳清蛋白驼奶粉无添加，好吸收放心选

“这不是新闻里才有的事吗，没想到发生在自己儿子身上！”三年级娃写400字作文，杭州妈妈忍不住了

当下孩子真正缺少的，不是玩具，也不是补课，而是撒野

吴文忻葬礼：2个女儿在灵堂内茫然失措，看妈妈遗照伤心落泪

凌晨落地不肯走？30 名德国游客被中国这波操作震碎三观

中金2026下半年展望 | 网下打新：硬科技IPO潮起，打新窗口

荣耀Robot Phone亮相上影节打破移动影像专业边界

356品牌抢滩智能眼镜隐私边界该如何守住？

原油暴跌，黄金大涨，科技股全线走强，纳指涨3%，美光科技涨11

iOS 27 Beta暗藏代码 iPhone Fold实锤将至

道指再创新高，美股科技股、芯片股全线爆发，西部数据狂飙

A股：云南锗业、麦格米特、岩山科技等五家公司重要公告！

DJI与Insta360专利大战全面爆发，创作者科技领域史上最

诺奖得主炮轰马斯克是“真人版庞氏骗局”：投资者深信其