Ryan Lopopolo · 2026-02-13

零人工编码:OpenAI用Codex构建百万行代码产品的工程实践

摘要

OpenAI一支3至7人的工程团队,历时5个月,通过Codex代理完全自动生成了约百万行代码,构建并交付了一款真实的内部软件产品,实现了零人工编码。工程师的核心职责从编写代码转变为设计代理运行环境、拆解任务意图、建立反馈闭环。团队平均每人每天合并3.5个PR,估计比手写代码快约10倍。文章系统总结了在代理优先模式下管理仓库知识、提升应用可读性、高效利用人类注意力的关键工程经验。

内容框架与概述

文章首先以实验结论开篇:团队在约5个月内用Codex生成了近百万行代码,开发效率约为传统方式的10倍,全程无任何人工直接编写的代码。这一约束并非噱头,而是倒逼团队思考如何以数量级的方式提升工程产出速度。人类工程师的角色因此发生了根本性转变:从执行者变为系统设计者,核心工作是拆解目标、搭建脚手架、审查PR并修复代理能力盲区。

在应用可读性方面,团队让Codex能够直接感知应用状态。他们将应用配置为可按git工作树启动独立实例,并接入Chrome DevTools协议,使代理能直接操作截图、DOM快照和页面导航。同时为每个任务构建了隔离的可观测性环境,允许Codex通过LogQL和PromQL查询日志与指标,从而自主复现bug、验证修复效果,有时单次运行可连续工作6小时以上。

在知识管理上,团队放弃了单一庞大AGENTS.md文件的方式,转而构建结构化的docs/目录作为系统记录的唯一来源。AGENTS.md仅作目录索引,具体设计文档、架构说明、执行计划、技术债务等分门别类存储,并通过CI检查和专职文档维护代理保持知识库的新鲜与准确。这种渐进式披露策略显著降低了上下文噪声,让代理每次任务都能以最小但最精准的信息集启动工作。

核心概念及解读

代理优先工程(Agent-First Engineering):以AI代理为主要执行者、人类仅负责方向与审查的软件开发模式,彻底改变了工程师的日常工作内容与团队分工方式。

应用可读性(Application Legibility):将应用的UI状态、日志、指标等信息结构化地暴露给代理,使其能自主感知和推理系统行为,而无需人工介入信息传递。

仓库即系统记录(Repository as System of Record):将所有设计文档、架构说明、执行计划等知识以版本化方式存入代码仓库,确保代理在运行时能完整获取所需上下文,消除对外部平台的依赖。

渐进式披露(Progressive Disclosure):代理从简短的入口索引出发,按需深入读取具体文档,避免一次性加载海量指令导致注意力稀释和关键约束被忽略。

代理间审查循环(Agent-to-Agent Review Loop):由代理自动在本地和云端触发代码审查、响应反馈并迭代修改,直至所有审查者满意后再提交,将人工审查的需求降至最低。


原文信息

字段内容
原文Harness engineering:leveraging Codex in an agent-first world
作者Ryan Lopopolo
发表日期2026-02-13

此摘要卡片由 AI 自动生成