当前位置: 首页 > news >正文

零人工手写,5个月拼出百万行代码!深度拆解 OpenAI 颠覆性的 “Harness Engineering” 软件开发新范式

发布日期:2026-02-11

标签:#OpenAI #HarnessEngineering #Codex #AI_Agent #软件工程 #架构设计


一、 引言

"Agents aren't hard; the Harness is hard."(Agent 不难,难的是 Harness。)

这是 OpenAI 技术团队近期公开的一项震撼业界的实验报告。在过去 5 个月里,OpenAI 的一个研发小组在零人工手写代码的限制下,完全依靠 Codex 智能体构建并交付了一款拥有百万行代码的复杂软件产品(包含应用逻辑、测试、CI 配置、可观测性及内部工具),且该产品已投入内部 Beta 测试。

在这场实验中,人类工程师的角色发生了根本性转变:他们不再亲自动手写代码,而是转向了一门全新的学科——Harness Engineering(驾驭工程)

二、 什么是 Harness Engineering?

在控制论哲学中,Harness(环境/鞍具)指的是大模型之外的一切控制系统。OpenAI 提出了一个颠覆性的公式:

$$\text{Agent} = \text{Model} + \text{Harness}$$

人类工程师的任务从“实现状态”转变为“声明期望状态”,并为 AI 智能体设计一套具备明确约束与闭环反馈的运行系统(Harness)。

Harness Engineering的核心架构可以分为以下四个核心层次:

架构层级核心组件控制论机制核心功能
前馈控制层 (Guides)PRD 文档、架构说明书、代码规范Feedforward设定先验约束,指导 Agent 在动手前“想清楚”下一步,防止架构漂移。
反馈控制层 (Sensors)自动化 Linter、单元测试、沙箱环境Feedback观察 Agent 执行后的状态,通过错误日志引导其“自我修正(Self-Correction)”。
执行运行时 (Runtime)Codex App Server (JSON-RPC)Execution提供双向通信、线程生命周期管理及工具(如 GitHub CLI)的沙箱执行。
生命周期管理自动化清理与状态重置GC机制防止长周期任务中的 token 膨胀与上下文熵增。

三、 核心技术与工作流破局

1. 人类掌舵,智能体执行(The Ralph Wiggum Loop)

在 OpenAI 的设计中,人类与系统的交互几乎完全通过声明式的 Prompt 完成。工作流形成了一个强闭环:

  1. 人类声明意图:工程师描述一个任务,运行 Agent。

  2. 本地与云端协同评审:Codex 自动修改代码后,在本地运行测试,并调用 gh(GitHub CLI)工具自动打开 Pull Request。

  3. 自我修正直至通过:系统强制 Codex 在本地审查自己的修改,并请求多维度的 Agent 联合评审,反复迭代直到所有环境 Sensor 满意。

2. 将“计划”视为第一类资产 (Plans as First-Class Artifacts)

为了防止完全自主的智能体在高并发、长周期任务中迷失,OpenAI 将“计划”做成了机器可读的、版本化管理的实体:

  • 轻量级计划:用于处理修复 Bug 等小范围变更。

  • 执行计划 (Execution Plans):对于复杂需求,生成包含决策日志和进度追踪的复杂计划,并直接 Check-in 到 Git 仓库中。这让 Agent 可以实现“渐进式披露”,无需一开始就被海量上下文淹没。

3. 内核级通信:Codex App Server

为了让这种高频的交互流在各种 UI 和 CLI 之间保持弹性,OpenAI 构建了Codex App Server。它基于双向的 JSON-RPC 协议,并抽象出了两个核心原语:

  • Item(原子单元):带有明确生命周期(Started $\rightarrow$ Delta 流 $\rightarrow$ Completed)的打字数据,如代码 Diff、审批请求。

  • Turn(工作轮次):由用户输入触发、到 Agent 产生最终输出结束的完整工作周期。


四、 行业启示:工程师的明天在哪里?

OpenAI 的实验用数字证明了生产力的飞跃:构建百万行代码系统,仅消耗了传统人工编写约 1/10 的时间和注意力。

当“写代码”的成本趋近于零,软件工程的护城河将彻底重构。未来的核心竞争力不再是精通某种语言的语法,而是:

  1. 架构定义能力:如何 mechanically 约束代码库边界,防止 AI 产生代码漂移与模式复制。

  2. 控制系统设计:如何编写高精度的自动化评估器(Evals)和反馈流,让 AI 能在沙箱中快速自愈。


五、 总结与展望

Harness Engineering并不是在消灭工程师,而是在解放人类最稀缺的资源——时间和注意力。在智能体优先(Agent-First)的世界里,卓越的工程师将成为系统航向的掌控者和反馈回路的设计师。这场百万行代码的无人驾驶实验,仅仅是新时代的开端。


🔥 互动话题:

面对 OpenAI 的“零手写百万行代码”案例,你认为未来五年内,初级程序员这个岗位会彻底消失,还是演变成全新的“Harness 调试员”?欢迎在评论区留下你的硬核观点!


如果你想更直观地理解如何通过环境约束和反馈闭环来驾驭复杂的 AI 工作流,推荐观看 Harness Engineering 到底是什么?概念、实战与争议深度解析。该视频用通俗易懂的语言,一次性讲清了 OpenAI 和 Anthropic 在驾驭智能体方面的底层逻辑与前沿争议。

参考链接
https://edison-a-n.github.io/2026/03/14/harness-engineering-practical-guide/
https://openai.com/zh-Hans-CN/index/harness-engineering/

http://www.jsqmd.com/news/828349/

相关文章:

  • 企业信创即时通讯选型怎么选?适配龙芯鲲鹏、内网部署+业务集成才靠谱 - 小天互连即时通讯
  • MATLAB量化函数quantize的“隐藏关卡”:从单精度到自定义浮点的完整配置指南
  • 2026年5月担保纠纷律师权威榜:5位专业严谨靠谱维权 - 外贸老黄
  • 解锁大语言模型潜力:中文提示词库使用与设计指南
  • Poppins几何字体:免费开源的多语言设计终极解决方案
  • KKS-HF_Patch终极指南:Koikatsu Sunshine增强补丁完整教程
  • Gopeed下载403错误终极解决方案:从原理到实战的完整指南
  • Claude AI全栈开发框架:从流式响应到RAG集成的工程实践
  • WIN11虚拟内存迁移失败?BitLocker与注册表联手设限的真相与破解
  • KMS_VL_ALL_AIO:终极智能激活工具的完整使用指南
  • 树莓派替代方案:研扬UP 4000 x86开发板深度评测与实战指南
  • 2026年4月疏通服务公司口碑推荐,墙面测漏/疏通服务/打压测漏/地漏疏通服务/厨房测漏/漏水维修,疏通服务企业选哪家 - 品牌推荐师
  • 能源行业AI Agent实战:电网调度与能源优化的智能化转型
  • 开源软件目录构建指南:从数据模型到自动化运维
  • Steam库存管理终极指南:5分钟掌握批量操作核心技巧
  • 如何永久免费解锁Cursor Pro:终极破解工具完整指南
  • 常州名包闲置处置 十年鉴定师坐镇估价公道不套路 - 奢侈品回收测评
  • Windows 下为 VSCode 配置 MSVC 编译工具链:从零安装 Build Tools 到完整配置教程
  • CAD进阶实操——从零到一掌握多段线绘制与编辑(定半径、变方向、设宽度)
  • 深入PCIe协议层:ASPM L1状态切换的DLLP“握手”全流程解析
  • 论文AI率爆表?2026年必看保姆级降AI率指南,一分钟高效降低AIGC痕迹 - 降AI实验室
  • 2026两江新区老房翻新优选|业主好评高、施工靠谱的装修公司合集 - 大渝测评
  • 从滑竿到按钮:手把手教你用LVGL的‘部分’与‘状态’打造动态交互UI(ESP32/STM32通用)
  • 告别复制粘贴!STM32L4 LL库移植保姆级教程(基于STM32Cube_FW_LWIP_V1.3.0)
  • 2026年5月16日每日60秒读懂世界:工资数据、住房政策、科技突破与国际动态观察
  • Unity Trigger / Collision检测不到的常见原因
  • AI智能体协作框架agentset:从单体到多智能体编排的工程实践
  • 开源对话式AI助手Ruuh:私有化部署与深度定制开发指南
  • 2026 B端出海大变局:告别低效人海战术,Xpirory AI机器人员工如何重构增长逻辑?
  • 手把手教你用华为设备搭建IPv6实验环境:从零配置到互通测试