Wilson Lin · 2026-02-05

自动驾驶代码库：多agent自主编码系统研究

摘要

本文记录了Cursor团队构建能够自主开发代码库的多agent系统的研究过程。研究从构建无JavaScript的浏览器引擎开始，逐步演进出包含递归规划器、工作者和动态协调角色的系统架构。该系统在单周内完成近1000万次工具调用，实现了近乎完全自动化的代码提交能力。研究过程中积累的经验表明，合理的系统设计、明确的意图传达和适度的容错机制是实现高效自主编码的关键。

内容框架与概述

文章首先介绍了研究的起源和背景，作者将构建浏览器引擎作为测试前沿AI模型能力的评测基准，并详细描述了从简单提示词到复杂agent编排的探索过程。研究初期尝试让单个agent完成整个浏览器引擎的构建，但很快暴露出任务过于庞大、agent缺乏整体视野等问题。

文章接着阐述了从单agent向多agent系统演进的关键阶段。研究者尝试过共享状态文件、显式锁机制等多种协调方案，但都遇到了资源争用和协作困难。最终通过引入结构化的角色分工——规划器、执行者和裁决者——解决了协作问题，并进一步发展为去除静态规划的连续执行器设计。

研究最终确立了递归规划器架构，由根规划器负责理解任务范围并生成具体工作项，子规划器递归拆分任务，worker独立完成任务并提交交接说明。这一设计在保持系统动态性的同时，确保了每个模块都有明确的所有者和责任归属。文章还讨论了实现高吞吐量所做出的权衡，包括接受一定错误率而非追求完美、允许偶发的合并冲突等。