当前位置: 首页 > news >正文

傻子可懂的 Harness Engineering 入门教程 + 项目实战,一次搞懂 AI 编程工程化!

  • 你让 AI 改下页面的样式,结果它没搞清楚你到底想干嘛,重新开发了整个布局。
  • 你前面明明要求单文件的代码不超过 200 行,结果聊了十几轮之后,AI 把前面的约束给忘了,写了个 1000 行代码的大文件。
  • 还有更头疼的,你让 AI 修一个项目里的 Bug,结果又出了 3 个新 Bug,项目都跑不起来了,代码越改越乱。

前两个问题已经有了不少解决办法,比如写好提示词、给 AI 提供充足的信息,但第三个问题就比较棘手了。

如果你想让 AI 做好一个完整的项目,你还得给它搭一整套靠谱的工作环境和工作流程。

这就是最近在 AI 圈很火的 Harness Engineering。

写这期内容前,我看了不少国内外讲 Harness 的教程,很多都花了大量篇幅讲 AI 发展史和枯燥的理论,看完就忘了。所以我换了个思路,先通俗易懂地讲清楚 Harness 是什么,然后带你实战怎么用 Harness 做出完整大项目,还会告诉你怎么最快上手 Harness。

点个收藏,我们开始~

一、快速了解 Harness Engineering

Harness 是什么?

Harness 这个词翻译过来就是「马具」。如果把 AI 模型比作一匹马,那 Harness 就是你驾驭这匹马所需要的一切,比如缰绳、路线规划、围栏等等。

我们要做的,就是怎么让这匹马跑得更快、更稳,顺利完成任务。

具体来说,Harness 就是围绕 AI 模型搭建的一整套工作环境和工作流程。你给 AI 写的项目规则文件、配置的各种工具、安排的任务拆分和执行顺序、设计的测试检查流程,这些统统都算 Harness。

为什么它突然火了?

知名的 AI 框架 LangChain 做了个实验,使用同一个 AI 模型,只优化围绕模型搭建的 Harness 部分,编码基准测试的排名直接从 30 名开外冲到了前 5!

OpenAI 团队也做了类似的尝试。3 个人的小团队,全靠 Harness 引导 AI 生成了上百万行代码,最终做出的产品已经在内部正式上线使用了。

看到这些成果之后,不少知名 AI 公司和技术大佬纷纷写了博客来讲 Harness,于是把这个概念带火了。

有了这些知名公司和大佬的背书,现在行业达成了一个共识:AI 编程的瓶颈不在模型有多聪明,而在你围绕模型搭的这套环境和流程够不够好。

Harness 的发展过程

很多人以为 Harness 是 2026 年蹦出来的新东西。其实从 2022 年 ChatGPT 出来的时候,大家就已经在做 Harness 了,只不过当时没叫这个名字罢了。

为了让你更好地理解 Harness,我先带你简单回顾一下这几年 AI 工程的发展。

1、提示词工程(2022 ~ 2024)

简单来说,就是怎么通过对话让 AI 听懂你的需求

我们学着给 AI 设定角色、约束输出格式、用思维链让它一步步思考、给几个示例让它模仿。这些技巧虽然简单,但确实能让 AI 的输出质量提升一大截。

2、上下文工程(2025)

在提示词工程的基础上更进一步,核心是怎么在对的时候把对的信息喂给 AI

比如写 AGENTS.md 规则文件让 AI 了解项目背景,用 RAG 让 AI 能检索到相关资料,对过长的上下文做压缩和摘要,甚至给 AI 建立跨对话的记忆机制,让它不会聊着聊着就断片儿。

3、Harness Engineering(2026)

在上下文工程的基础上又往前走了一步。除了关注给 AI 提供什么信息,还要关注给它配什么工具、大任务怎么拆分成小步骤分批完成、出了问题怎么自己检查和修复、怎么防止代码质量随着迭代慢慢下滑。让 AI 不只是回答问题,而是持续靠谱地完成整个任务

你会发现,三者是层层包含的关系。

  • 提示词是最内层,关注的是「怎么给 AI 下指令」
  • 上下文包裹着提示词,关注的是「怎么给 AI 提供信息」
  • Harness 把它们全部包在里面,关注的是「怎么让 AI 持续靠谱地干完一整件事」

业界总结了一个公式:Agent = 模型 + Harness

也就是说,围绕 AI 模型搭建的工具、规则、流程、检查机制,全都属于 Harness 的范畴。

http://www.jsqmd.com/news/1075414/

相关文章:

  • [Android MVVM 架构笔记] 基于 Kotlin 类委托与系统级安全扩展的全局 Loading 方案
  • 3D医学影像AI建模实战指南:小样本、高鲁棒、可部署的四类可靠路径
  • 6月26日16点直播丨CANNBot支持生成单指令多线程算子
  • OneNote迁移终极指南:三步实现95%格式保留的无损转换
  • 在 Android Kotlin 开发中,Kotlin 无法识别 Lombok 生成的 getter
  • TscanCode静态代码分析解决方案:提升C++/C/Lua代码质量的技术实践
  • 用Google ADK构建行政事务导航智能体:税务与社保场景落地实践
  • AI 建议“更新数据库后删除缓存”,为什么仍可能造成长期脏数据
  • 网络数据包分类与策略执行:FMan硬件加速配置详解
  • WinCC Advanced数据导出行列转换
  • Vue 3 后台管理系统前端骨架小案例1.0版本
  • 大模型知识蒸馏实战:从软标签对齐到认知迁移
  • LangChain作业四---Memory 综合实战:构建具备短期 + 长期记忆的聊天机器人
  • ANTM股票可视化:Plotly交互+Mplfinance专业K线实战
  • LG Ultrafine 亮度调节工具:解决Windows下显示器亮度控制的智能方案
  • FIFA 23 Live Editor终极指南:打造你的完美足球世界
  • 5大核心功能深度解析:G-Helper如何让华硕笔记本性能飙升
  • 深度解析猫抓浏览器扩展:从M3U8嗅探到加密流处理的10个核心技术
  • 负责任AI工程落地:六个可编码的实践维度
  • 10104黄大年茶思屋榜文101期 第4题 大模型上下文窗口高效无损扩容技术
  • 零基础学AI人工智能:10.3 ANN人工神经网络
  • iOS安全测试框架Needle:自动化漏洞挖掘与移动应用安全评估实战指南
  • 终极AI视频插值指南:使用Flowframes轻松提升视频帧率的完整教程
  • 小红书广告视频记录
  • 遗传算法实操避坑指南:实数编码、自适应变异与精英保留
  • 量子密码分析研究
  • FPGA数据流编程与HLS优化实战指南
  • 告别打卡焦虑:5分钟掌握Android自动打卡终极方案
  • 架构设计理念与核心哲学
  • MetaboAnalystR 4.3.0架构解析:500+函数构建的代谢组学分析技术框架