马具工程即控制论
摘要
文章通过三个历史案例揭示同一模式:瓦特调速器、Kubernetes控制器、OpenAI的马具工程。本质都是控制论,即通过传感器和执行器闭合反馈回路。LLM首次让代码库层面的架构决策实现自动化,但成功的前提是将工程师的判断标准外化为机器可读的规则。
内容框架与概述
作者从OpenAI的马具工程文章中认出一种反复出现的模式。瓦特调速器让工人从手动转阀变为设计调速器;Kubernetes让工程师从重启服务变为编写规格说明。如今OpenAI的工程师不再手写代码,而是设计环境、构建反馈循环、编码架构约束,由AI代理完成百万行代码。
这种模式出现的必要条件是构建足够强大的传感器和执行器来闭合该层的反馈回路。代码库长期是个例外:编译器、测试套件、linter只处理机械可检查的属性,架构层面的判断仍需人类。LLM改变了这一点,它能感知和操作人类独占的抽象层次。
基本反馈回路只是入门门槛。更难的是校准:将系统特有的知识外化。当代理不断犯错时,问题往往不是能力不足,而是所需的判断标准仍锁在工程师头脑中。必须将架构文档、自定义检查器、黄金原则等以机器可读形式编码进来。
这些实践——文档、自动化测试、架构决策编码、快速反馈——向来是正确的,只是忽略成本的代价是缓慢且隐性的。智能体工程让代价变得极端:跳过文档,代理就会以机器速度持续忽略约定;跳过测试,反馈回路根本无法闭合。生成比验证更难,因此不需要在实现上超越机器,而需要在评估上超越它:定义正确性标准并识别偏差。
核心概念及解读
马具工程(Harness Engineering):OpenAI提出的工程范式,工程师不再手写代码,而是设计环境、构建反馈循环和编码架构约束,让AI代理自动编写代码。
控制论(Cybernetics):诺伯特·维纳于1948年命名的学科,源于希腊语舵手,指通过传感器和执行器闭合反馈回路,从手动操作转向系统设计。
反馈回路校准(Calibrating the feedback loop):将工程师的判断标准外化为机器可读的形式,包括架构文档、自定义检查器和编码的原则,使代理能够理解并遵循系统规范。
生成验证不对称性(Generation-verification asymmetry):生成正确解比验证正确解更难,这源于P与NP问题的直觉,已被Cobbe等人在LLM上经验证实。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Harness Engineering Is Cybernetics |
| 作者 | George (@odysseus0z) |
| 发表日期 | 2026-03-08 |
此摘要卡片由 AI 自动生成