Context Engineering & Coding Agents

Key Insight

上下文工程正在重新定义人机协作的边界

数据

4亿+

每日 Tab 请求处理量

实时

30分钟

模型强化学习反馈周期

Timeline

1960s 打孔卡时代

1980s GUI 图形界面

2023 Cursor Tab 发布

2024 自主编程智能体

核心概述

Cursor 团队成员 Lee 和 CEO Michael 系统回顾了从传统编程到 AI 智能体的发展历程，深度介绍了上下文工程和自主编程智能体的产品实践。

视频覆盖智能体工具体系、上下文检索优化、多智能体并行管理等关键技术，强调智能体正让编程变得更易用、强大和自动化，推动软件工程走向更高的自由度与创造性。

编程工具的进化史

从打孔卡到智能体

Lee 回顾了编程工具六十年演变：从 1960 年代的打孔卡和早期终端，到 1970 年代的 Apple II，1980 年代的 GUI 图形界面，再到 1990、2000 年代的专业 IDE 如 Visual Studio 和 Sublime Text。这一阶段编程逐步大众化，但界面和交互始终构成门槛。

AI 驱动的加速变革

随着 AI 技术发展，编程变得前所未有地易用和强大。从文本终端到图形界面、再到 AI 驱动的自动补全工具，这一进化史正在被加速重演。几十年的交互变革，如今几年内便能实现。每次新技术迭代，用户体验和交互界面在提升模型能力的同时，大幅推动更高目标任务的实现。

Cursor Tab 产品演化

Initial Release

2023 年首发

Tab 最早灵感取自 GitHub Copilot，起初只做预测下一个单词或下一行代码，后来进化到预测鼠标光标的下一步动作。

Scale

海量数据处理

Tab 每日处理 4 亿次请求，积累大量数据。团队由通用模型转向专为下一步行动预测训练的自定义模型。

Reinforcement Learning

实时在线强化学习

通过用户接受或拒绝建议的数据，对模型进行实时强化学习优化。接受的建议会强化，拒绝的建议反馈负面强化，约 30 分钟后模型即可更新用户反馈。团队关注补全速度与质量平衡：超过 200 毫秒影响流畅体验，最新版倾向于建议更少但准确率更高。

智能体架构与自主编码

自主编程智能体诞生

随着模型能力增强，Cursor 推出 coding agents。用户可直接与模型交互，让其生成或修改整块代码，而非仅靠补全。系统提供自主权控制，独立设定模型自动化程度。

Composer 多文件编辑

2023 年团队推出 Composer 功能，实现多文件编辑，提供会话式用户界面，方便管理复杂编程场景。

完全自主能力

2024 年添加完全自主编码智能体功能，支持模型工具调用、自助获取上下文信息。不再只是人工提供全部码基路径和语境，而是模型自我检索、构建上下文。

上下文工程核心技术

上下文工程是 Prompt Engineering 的升级版本

过去关注如何给模型设计输入，现在更重视怎样提供高质量上下文。团队发现随着上下文窗口变大，模型对信息的回忆和输出质量反而下降。目标是使用尽可能少且高质量的 token 编码单元。

语义检索优化

团队优化方式包括自动索引、创建代码库 embedding 嵌入向量，实现语义级检索。例如用户请求"更新顶部导航"，模型通过 embedding 可以关联 header.tsx 等具体文件。团队由通用 embedding 模型迁移到自定向训练 embedding，提高检索准确率，并通过 AB 测试不断验证性能。

计算优化策略

通过预先离线索引代码，将计算压力提前，实现线上运行时响应更快、更便宜。语义搜索不仅提升用户追问率，还能带来更高的 token 使用量。

人机协作与安全机制

Human-in-the-Loop

信任智能体写代码需保持人类在环。智能体运行命令时会请求用户许可，能设置允许列表自动运行，并支持团队协作限制某些 shell 命令。

自定义 Hooks

最新版加入自定义钩子，例如智能体完成任务后自动触发 shell 脚本，提升工作流自动化程度。

多智能体并行

本地并行运行需工具如 git work tree、数据库端口隔离等。探索模型间竞争，让不同能力的智能体相互比拼，使用户选出最佳结果。

自查与验证

智能体能自查代码、跑测试、验证运行结果，甚至开启浏览器检测网页 DOM 和网络请求，反馈页面设计。

编程智能体开发框架

以 Cursor 产品和团队经验为例，编码智能体的开发与应用可归结为七大关键步骤：

01. 需求分析与上下文收集

明确定义问题，系统收集所有相关代码上下文信息。强调最小但高质量的 token 输入，避免模型输入冗余。

02. 工具集成与语境检索

设计自动检索、索引和语义搜索流程，融合通用与定制 embedding，持续优化准确率。

03. 智能体自治与自主权管理

框架允许用户自定义模型自主权，系统支持自主规划、分阶段执行和任务管理。

04. 人机协作安全机制

设定人类在环机制，所有关键操作需用户授权。支持自动运行配置和团队协作防护。

05. 持续反馈与强化学习

通过用户接受或拒绝建议的数据，实施强化学习，模型实时迭代以提升采纳率和用户体验。

06. 多智能体竞赛与异步并行

系统支持多 agent 并发，允许模型间竞争，横向对比多模型结果，实现复杂协作。

07. 任务复盘与结果验证

智能体需支持自动测试、调试和自查，能展现完整操作日志、测试流程、调试信息，便于人类开发者快速掌握整体进程。

心智模型：以人为本、场景驱动、工具迭代

开发者既是创新发起者，也是最优实践的沉淀者。各类工作流、计划、记忆最终回归产品迭代，推动编程智能体从简单补全工具迈向高度自主、可控、可共享、可验证的复杂系统。

智能体时代的
编程革命