当前位置：首页 > news >正文

从提示词工程到Harness Engineering，3分钟彻底搞懂！

news 2026/6/4 10:57:11

本文深入探讨了AI Agent开发中的三大核心概念：提示词工程、上下文工程和Harness Engineering。提示词工程是基础，但存在局限；上下文工程通过管理上下文窗口提升能力，是真正的艺术与科学；Harness Engineering则为Coding Agents构建自我纠错的运行环境，包含系统提示、工具调用等六类组件。文章澄清了三者间的关系，指出上下文工程是上位概念，Harness Engineering是其在Coding Agent场景的实践，而非进化。对于使用Coding Agents的开发者，日常配置工作实质上即Harness Engineering。

提示词工程、上下文工程、Harness Engineering——一文说透，附四张原创图解

很多人搭 AI Agent，卡在同一个地方：

照着教程写了提示词，Agent 还是跑偏、忘事、乱执行。

问题不在提示词写得不够好——是你对整个概念体系的理解，停留在了第一层。

这篇文章，带你把三个容易混淆的概念——提示词工程、上下文工程、Harness Engineering——从起源到关系，彻底理清。

01 提示词工程：起点，但不是全部

提示词工程（Prompt Engineering）是大多数人接触 AI 的第一课。

核心动作就三件事：写任务描述、加 few-shot 示例、规定输出格式。

工作流极其简单：

[手工指令 + 示例 + 格式] → 大模型 → 文本输出

↑ 图1：提示词工程流程图

在简单的单轮对话场景下好用，但它有四个硬局限：单次对话、无记忆、无工具、无反馈循环。

一旦任务变成「帮我完成这个多步骤的项目」，就彻底力不从心了。

02 上下文工程：才是真正的艺术与科学

2025 年，Andrej Karpathy 和 Shopify CEO Tobi Lutke 先后为一个新概念背书：

上下文工程（Context Engineering）

Karpathy 原话：

“在每一个工业级 LLM 应用里，上下文工程是将恰当信息填满上下文窗口的微妙艺术与科学。”

核心转变：不是「写一段提示词」，而是管理整个上下文窗口里装什么。

上下文窗口能装的东西远不止提示词：RAG 检索结果、工具定义、Few-shot 示例、对话历史、状态信息、规则文件……

加上执行层的结果反馈写回，形成完整的 ReAct 循环。

↑ 图2：上下文工程流程图 — 六格上下文窗口 + ReAct 反馈闭环

关键结论：提示词工程 ⊂ 上下文工程。提示词只是上下文的一个子集。

03 Harness Engineering：AI Agent 的最终形态

2026 年，随着 Coding Agent 大规模落地，一个新术语出现了。

Harness Engineering，由开发者 Viv 提出，随后经 OpenAI 推广，文章标题是：

Harness engineering: leveraging Codex in an agent-first world

核心公式只有一句话：

Agent = 大模型 + Harness

Harness = 大模型之外的一切。

↑ 图3：Harness Engineering 架构图 — Agent = 大模型 + Harness，展开六个组件

具体包含六类组件：

System Prompt：全局角色与行为约束
Tools / MCP：工具调用能力
AGENTS.md 规则文件：针对特定代码库的规范
Sub-agents：子 Agent 协作处理复杂任务
验证 Sensors：观察执行结果并触发反馈
反压 Back-pressure：防止 Agent 跑偏的控制机制

Martin Fowler（ThoughtWorks）专文分析，将 Harness 的作用总结为两类控制：

Feedforward（前馈）：执行前告诉 Agent 怎么做，提高首次成功率
Feedback（反馈）：观察执行结果，让 Agent 自我纠正

重要限定：Harness Engineering 的核心场景是 Coding Agents（编程 Agent），不是泛指所有 AI Agent。

04 一个必须纠正的误解

很多文章（包括一些传播很广的图）把三者描述成进化链：

提示词工程 → 上下文工程 → Harness Engineering，越来越高级。

这个关系方向是错的。

↑ 图4：概念关系澄清图 — CE 大框包裹 PE 和 HE，底部红色纠错条

正确的关系是包含关系，Context Engineering 才是上位概念：

HumanLayer 博客：“Harness engineering is a subset of context engineering”
Martin Fowler：“Engineering a user harness for a coding agent is a specific form of context engineering”

一句话总结：PE ⊂ CE，HE ⊂ CE，HE 不是 CE 的升级版，而是 CE 在 Coding Agent 场景的落地实践。

写在最后

把三个概念提炼成三句话：

提示词工程：告诉模型该做什么（单次、静态）

上下文工程：管理模型在每一步能看到什么（动态、系统化）

Harness Engineering：给 Coding Agent 搭建能自我纠错的运行环境（可靠性工程）

如果你正在用 Claude Code、Cursor 或任何 Coding Agent——你每天在做的那些配置工作，其实就是 Harness Engineering：写 AGENTS.md、接 MCP、设置 hooks、拆分 sub-agent 任务。

只是以前没有一个好名字，现在有了。