当前位置: 首页 > news >正文

Harness Engineering入门基础教程(非常详细):从人类写码到Agent开发,看这篇就够了!

读完 OpenAI 关于 Harness Engineering 的文章后,我做了一份核心总结,并结合自己的项目写下了这些启发。

最近在团队里,我尝试借鉴 OpenAI 提出的Harness Engineer概念,探索一种新的开发模式。它的核心问题是:如果人类不手动写代码,而是由 AI Agent 完成从 PR 生成到 Review、再到集成测试的全流程,软件开发会变成什么样?

下面是我对 OpenAI 这篇文章的学习总结,以及在我自己项目中的实践与思考。

一、我学到的核心理念:人类管架构,Agent 写代码

OpenAI 提出的 Harness Engineering 重新划分了人与 AI 的职责:

人类的工作:

  • 系统与架构设计
  • 编写高质量的提示词(Prompt)

Agent 的工作:

  1. 根据提示词生成 Pull Request
  2. Review PR(初期人类审核,后期可由多个 Agent 互审)
  3. 阅读 UI、日志、指标,自主判断结果是否符合预期

也就是说,人类不再盯着 IDE 逐行写代码,而是把精力放在更高层次的决策上——定义“做什么”“为什么做”,让 Agent 去完成“怎么做”

二、OpenAI 文章中的实现路径(我的理解与转述)

根据文章,要让 Agent 真正接手编码任务,需要建立几个关键机制:

1. doc-gardening:自动维护文档

定时扫描文档仓库,Agent 自动检测并修复过时的描述、过期的 API 示例,保持文档与代码同步。

2. AGENT.md:渐进式披露的索引

在项目根目录放一个AGENT.md文件,里面索引所有关键文档(Spec、Design、Plan)。Agent 按需读取,像新同事翻阅项目 Wiki,不会一次性加载过量信息。

3. 多源信息转化为 Markdown

很多关键信息不在代码库里——可能在 Google Doc、Slack 讨论、甚至人的脑子里。需要把这些信息转化为 repo 中的 Markdown 文件,让 Agent 能访问。可以把 Agent 想象成一个刚入职的同事:你不能指望它猜出之前 Slack 里达成的某个技术共识,必须把信息沉淀成文档。

三、对我的项目的启发:我现在的流程与改造计划

学完文章后,我对照了自己的现有流程,发现了明确的改进空间。

我现在的流程

  1. 给 Claude Code 写 Prompt,让它创建 Jira ticket 和 PR
  2. 人工 Review PR
  3. 在本地查看 UI 测试
  4. 查看后台是否有错误日志
  5. 验证符合需求后合并 PR

其中步骤 2-4 重复性很高,完全可以交给 Agent。

1. 让 Agent Review PR —— 需要明确标准

  • 正确性

    :逻辑是否满足需求

  • 格式规范

    :代码风格、命名、注释

  • 架构一致性

    :是否偏离既定架构

  • 代码品味

    :可读性、可维护性、是否有更优实现

初期我可以人工审核 Agent 的 Review 结果,后期可由多个 Agent 互审。

2. 让 Agent 做集成测试

目前我需要手动在本地打开 UI 验证。但大部分验证可以通过 API 层面完成:

  • Agent 调用后台 API,检查返回结果
  • UI 验证可借助 Puppeteer/Playwright,但 API 验证通过后,大部分问题已暴露
  • Agent 还能主动查看后台日志和 Datadog Metrics,判断异常或性能劣化

3. 处理架构偏离:让 Agent 先写文档

有时 Agent 的实现会偏离整体架构。根本原因是Agent 没有获得完整的架构信息

解决方案(受文章启发):

  • AGENT.md中给出所有文档的索引
  • 要求 Agent 在执行任务前,先生成中间文档:
  • Spec

    :对需求的理解

  • Architecture

    :本功能在整体架构中的位置

  • Design

    :具体技术设计

  • Plan

    :分步实施计划

这些文档由 Agent 生成,我审核修正后再让它写代码。虽然多了一步,但大大减少了返工。

4. 同步外部信息:让 Agent 主动收集

很多决策发生在 Slack、Notion、Google Doc 里,代码库不知道。如何让 Agent 获取?

  • 在 Slack 里用@bot命令,让 Agent 收集当前 Thread 的讨论内容,自动提交 PR 更新相关文档
  • 支持链接 Notion doc、Google doc,Agent 定期扫描指定页面、文件夹或匹配关键词的文档
  • 定期扫描 Slack 特定 Channel 中含有关键词的讨论,提取共识并沉淀为 Markdown

5. 创建后台 Agent 定时解决长期问题

有些问题不需要每次 PR 都关注,但需要定期处理:

  • 架构偏移检测

    :定期扫描代码,发现与架构文档不一致的地方,自动创建 ticket

  • 技术债清理

    :识别重复代码、过时依赖、性能热点,生成重构 PR

这些后台 Agent 可以定时运行(如每周一次),人类只需审核最终 PR。

四、最重要的启发:从第一天就做好架构设计

这套模式能否成功,有一个前置条件:你需要从一开始就做好系统架构设计

这意味着在写任何代码之前,花大量时间和 AI 聊清楚需求、讨论架构方案、确定整体走向。后续所有的 Agent 执行都必须遵循这个架构。

架构不是一次成型的,但它的核心约束需要尽早确立。如果后续频繁修改架构,Agent 生成的所有代码都可能需要重写,反而得不偿失。

结语:程序员的新角色

学习 OpenAI 的 Harness Engineering 后,我最大的感受是:这并非要消灭程序员,而是重新定义我们的工作。我们不再是“写代码的人”,而是“指挥代码生成的人”

  • 代码的正确性 → 由 Agent Review 保障
  • 架构的一致性 → 由 Agent 检测
  • 信息的同步 → 由 Agent 自动完成

人类需要做的,是设计清晰的架构,写出精准的提示词,以及——相信 Agent

这或许就是 AI 时代的软件开发:人类负责“做什么”,Agent 负责“怎么做”

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/599480/

相关文章:

  • XBee API模式通信原理与嵌入式集成实战
  • 2026年六安小型团建住宿全测评:这5家高性价比之选不容错过 - 2026年企业推荐榜
  • GLM-4.1V-9B-Base解决复杂网络问题:模拟与协议分析应用
  • 基于Matlab的简易脑电信号处理系统:GUI操作,时频域分析,多波段分解,eeglab数据处理辅助
  • 电压负反馈放大电路
  • Sanitizer工具集:高效检测内存与线程问题的实战指南
  • STM32智能园林灌溉系统设计与实现
  • 2026江苏滚筒线供应商深度评估:数据揭示优选服务商 - 2026年企业推荐榜
  • 【技术干货】自进化知识库 + AI 编码代理:从概念到落地实战(含完整代码示例)
  • 虚拟化环境下的StartWind iSCSI目标服务器部署与优化实践
  • 基于django的社区设备报修住户反馈智能预测系统设计_1pyj28qj
  • 从零到一:用K-Wave工具箱实现你的首个声场仿真
  • 共享单车智能通信系统架构与技术解析
  • 深入解析计算机存储器层次结构与Cache优化实践
  • 从静态模板到动态运行图:LLM Agent工作流的终极进化
  • STM32duino驱动VL53L8CX多区ToF传感器实战指南
  • 2025届最火的降重复率工具解析与推荐
  • Qwen-Image-Edit LoRA模型AnythingtoRealCharacters2511:短视频平台UGC内容增强方案
  • llama.cpp 参数调优大全(4060 最优配置)
  • 2026年工业硅胶板选型指南:五大服务商深度解析与决策路径 - 2026年企业推荐榜
  • YOLOv11训练总轮数设少了怎么办?不用重头来,教你修改trainer.py巧妙“加练”
  • 从PMAG到AMAG:解锁ZEMAX操作数中的放大率评估新维度
  • nRF8001驱动开发:嵌入式BLE协处理器通信实战
  • Agent 的流程可以随时修改调整吗?深度解析 2026 年智能体动态编排与业务闭环
  • 智造升级与绿色转型:2026年宁波钢结构市场核心服务商能力评估与选择指南 - 2026年企业推荐榜
  • 【技术干货】Gemma 4 深度实战:从本地推理到生产部署的一站式指南
  • C语言memcpy函数原理与优化实践
  • 2026河南旅行服务商综合实力榜:五大品牌深度解析与选型指南 - 2026年企业推荐榜
  • 突破医疗数据墙教程(非常详细):OpenHospital项目解析,收藏这篇就够了!
  • 格子玻尔兹曼 LBM 多孔介质沸腾 Gongchen双分布函数模型,matlab代码