当前位置: 首页 > news >正文

从Prompt到Context再到Harness:AI Agent的进化与未来趋势

文章指出AI行业经历了从Prompt Engineering到Context Engineering再到Harness Engineering的三次认知升级。Prompt Engineering关注如何与AI沟通,Context Engineering关注如何给AI提供知识,而Harness Engineering则关注如何让AI真正完成任务。文章强调Harness是包裹在模型外面的整套运行框架,负责任务管理、状态管理、工具协同和自动验证,是决定AI执行力的关键。OpenAI、Anthropic、Google等公司正在积极发展Harness技术,未来Agent的竞争将转向运行系统能力,而非单纯模型能力。对于智能座舱领域,Harness技术将推动座舱从语音助手向Goal驱动的Agent系统转变,形成新的系统形态Goal OS。


2023年,AI行业最热门的话题是 Prompt Engineering。

2024年,大家开始讨论 Context Engineering。

而到了2026年,一个新的词开始频繁出现在 OpenAI、Anthropic、Google 等公司的技术文章和 Agent 实践中:

Harness Engineering。

很多人第一次看到这个词时都会疑惑:

Prompt 我理解,Context 我也理解。

Harness 又是什么?

事实上,如果说 Prompt Engineering 解决的是“如何与 AI 沟通”,Context Engineering 解决的是“给 AI 什么信息”,那么 Harness Engineering 解决的则是:

如何让 AI 真正把事情做成。

这看似只是一个概念升级,但背后其实代表着 Agent 技术路线的一次重大转向。

Prompt 已经不再是核心问题

两年前,大模型刚刚爆发时,整个行业都在研究 Prompt。

那时大家相信:

只要 Prompt 写得足够好,AI 就能输出更好的结果。

于是出现了各种技巧:

Role Prompt

Chain of Thought

Few Shot

ReAct

Self Reflection

很多企业甚至专门招聘 Prompt Engineer。

但很快大家发现一个问题。

Prompt 再优秀,本质上仍然是在优化一次对话。

而现实世界中的任务并不是一次对话。

例如:

帮我规划一次日本亲子旅行。

这个任务涉及:

查询机票

比较酒店

规划路线

估算预算

推荐景点

根据儿童年龄调整行程

它可能持续数十分钟甚至数小时。

Prompt 无法解决这样的问题。

Context Engineering 的崛起

于是行业进入第二阶段。

大家意识到:

问题可能不是 Prompt。

而是模型不知道足够多的信息。

于是开始建设:

RAG

企业知识库

Memory

向量数据库

MCP

这就是 Context Engineering。

核心思想很简单:

不要只优化提问方式,而是给模型提供更多上下文。

如果说 Prompt Engineering 关注的是:

我要怎么说?

那么 Context Engineering 关注的是:

我要给模型什么信息?

这一阶段推动了企业 AI 应用的大规模落地。

但新的问题又出现了。

Agent 失败的原因,越来越不是模型能力

2026年的 GPT、Claude、Gemini 已经拥有非常强的能力。

但企业在落地 Agent 时发现:

Agent 经常会出现各种离谱的问题。

例如:

任务做到一半忘记目标;

工具调用错误;

多个 Agent 相互等待;

反复执行同一步骤;

甚至什么都没做就宣布任务完成。

这些问题有一个共同特点:

不是模型推理能力不足。

而是缺乏一个有效的运行系统。

Anthropic 在长任务实验中发现:

很多 Agent 失败,并不是因为不会做。

而是因为:

不知道自己做到哪里了。

OpenAI 在 Codex 的工程实践中也发现:

模型能力提升固然重要,但真正决定生产力的,是任务管理、状态管理、工具协同和自动验证机制。

于是行业开始逐渐形成一个共识:

Agent 的竞争重点,正在从模型能力转向运行系统能力。

这就是 Harness Engineering 诞生的背景。

什么是 Harness?

Harness 这个单词原本的意思是:

马具、控制系统。

在 AI 世界里,它更像是:

包裹在模型外面的整套运行框架。

我特别喜欢一个比喻。

如果把大模型看成发动机。

那么:

Prompt 是方向盘;

Context 是导航地图;

Harness 则是整辆汽车。

它负责:

导航系统

刹车系统

变速箱

传感器

仪表盘

没有这些系统,再强的发动机也无法完成一次长途驾驶。

同样的道理。

再强的大模型,如果缺少 Harness,也很难完成复杂任务。

一个完整 Harness 的五层架构

观察 OpenAI、Anthropic、Google 的实践后,可以把 Harness 理解为五个层次。

第一层:Goal Layer

目标管理层。

负责回答:

到底要完成什么事情?

例如用户说:

帮我安排一次三天的北京旅行。

对于人来说很简单。

但对于 Agent 来说,需要拆解为:

交通规划

酒店选择

景点安排

餐饮推荐

预算控制

Goal Layer 的作用就是持续维护最终目标。

避免 Agent 在执行过程中逐渐偏离方向。

第二层:Orchestration Layer

任务编排层。

这是 Agent 系统的大脑。

负责:

任务拆解

子任务分配

Agent 协同

流程控制

例如:

主Agent

├─ 酒店Agent

├─ 机票Agent

├─ 景点Agent

└─ 预算Agent

今天几乎所有先进 Agent 框架都在强化这一层。

因为未来竞争的重点已经不再是单 Agent。

而是 Agent 团队。

第三层:Memory Layer

记忆层。

这是当前 Agent 最大的瓶颈之一。

很多人以为大模型有记忆。

实际上并没有。

它只是拥有有限的上下文窗口。

一旦任务持续时间过长。

模型就会逐渐遗忘:

已完成什么

当前状态是什么

下一步要做什么

Anthropic 在 Claude Code 中专门引入了 Progress File 机制。

本质上就是:

让 Agent 学会写工作日志。

每完成一个阶段:

记录:

已完成事项

当前状态

后续计划

这样下一轮 Agent 就能接着工作。

这实际上与企业项目管理中的交接文档极其相似。

第四层:Tool Layer

工具层。

这是 Agent 的手和脚。

大模型本身只能思考。

真正执行任务需要工具。

例如:

搜索引擎

浏览器

数据库

文件系统

Shell

API

MCP

OpenAI 最新的 Agents SDK 已经把工具调用作为核心能力。

因为真正有价值的 Agent:

不是会聊天。

而是会做事。

第五层:Safety & Eval Layer

验证层。

这是很多团队最容易忽视的部分。

也是未来最重要的部分。

现实中最常见的问题是:

Agent 喜欢“自认为完成任务”。

例如:

明明没有完成测试。

却输出:

任务已完成。

因此先进 Agent 系统都会引入:

自动测试

自动验证

自动评估

自动回归检查

形成:

生成

→ 验证

→ 修复

→ 再验证

闭环。

Anthropic 将这种模式称为:

Generator-Evaluator。

OpenAI、Anthropic、Google 在做什么?

有趣的是。

全球最领先的 AI 公司,正在不约而同地强化 Harness。

OpenAI:把 Harness 做成 Agent OS

过去几年。

OpenAI 的重点是训练更强模型。

而最近两年。

重点已经开始转向 Agent Runtime。

新增能力包括:

Memory

MCP

Sandbox

Skills

File System

Agent Workflow

目标非常明确:

让 Agent 从聊天工具变成数字员工。

很多开发者发现:

GPT-5 的提升固然明显。

但生产力提升最大的部分,其实来自于运行系统的完善。

Anthropic:解决长任务问题

Anthropic 是 Harness 思想最坚定的推动者。

他们发现:

Agent 最大的问题不是不会写代码。

而是:

持续工作能力太差。

于是他们构建:

Initializer Agent

Coding Agent

Progress File

Evaluator Agent

让多个 Agent 接力完成任务。

这其实已经非常接近企业里的项目团队。

Google:打造企业级 Agent 基础设施

Google 的方向更加企业化。

重点建设:

Agent Registry

Agent Runtime

Agent Gateway

Agent Governance

核心目标是:

让企业可以同时管理成百上千个 Agent。

这已经不是聊天机器人。

而是数字劳动力管理系统。

对智能座舱意味着什么?

这一趋势对于汽车行业尤其值得关注。

过去几年。

智能座舱竞争的重点是:

语音助手。

比拼的是:

唤醒率

识别率

响应速度

但未来竞争重点将发生变化。

用户不会关心:

用了哪个模型。

用户只关心:

我说一句话,车能不能把事情办好。

例如:

“周末带孩子去露营。”

背后可能需要:

查询天气

推荐营地

规划路线

检查车辆续航

预约充电

准备儿童娱乐内容

这已经不是语音助手。

而是 Goal 驱动的 Agent 系统。

而支撑这一切的核心能力。

恰恰就是 Harness。

未来座舱的架构很可能演化为:

Goal

Chief Agent

导航Agent

娱乐Agent

车控Agent

生态Agent

服务Agent

而 Harness 负责:

用户画像

长期记忆

Agent编排

权限管理

任务验证

执行闭环

最终形成一种新的系统形态:

Goal OS。

结语

过去三年,AI 行业经历了三次认知升级。

第一阶段:

Prompt Engineering。

研究如何与 AI 对话。

第二阶段:

Context Engineering。

研究如何给 AI 提供知识。

第三阶段:

Harness Engineering。

研究如何让 AI 完成任务。

如果说大模型决定了 AI 的智商。

那么 Harness 决定了 AI 的执行力。

未来 Agent 的竞争,或许不再是谁拥有最大的模型。

而是谁拥有最优秀的 Harness。

因为真正有价值的 AI,从来不是会聊天的 AI。

而是能够把事情做成的 AI。

传统产品经理,正在成为下个被淘汰的“传统岗位”。

过去画原型、写 PRD、跟进度的“传统技能包”,在AI时代正迅速贬值。63% 的企业转型做 AI 产品!当下的问题不再是“要不要学 AI ”,而是“如何构建 AI 产品”。

前段时间还跟字节、腾讯的资深 AI 产品经理沟通,他们反馈:在大量招人,只要有 AI 相关的项目经验,基本都能拿到面试机会,而且领导很舍得给钱,涨薪 40-60% 很正常!

01

接下来的产品人,得卷AI能力了!

如今AI大火,行业极速发展的背后,懂AI 产品人才却严重稀缺。这不是要你转技术岗,而是要掌握构建 AI 产品的核心方法:

  • 如何将你的领域知识,转化为 AI 产品的核心竞争力?
  • 如何用 AI 技术实现你的产品需求?
  • 如何设计真正懂用户的 AI 交互体验?
  • ……

懂AI,就是产品经理的“救命稻草”!

风口之下,与其焦虑被行业淘汰

不如先人一步享受AI技术带来的红利!

我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

(不限年龄!不限岗位!没有代码基础也能学!)

🎁现在扫码,完课还送:

《AI产品面试题库》《AI大模型应用案例集》

02

掌握技术+实战,快速转型!

想成为一名卓越的AI大模型产品经理,需要从技术、到项目实战的全方位转型指南!

**1)**AI产品应用原理解析,产品经理也能听懂!

对于产品经理来说,如果你不懂技术,做不了业务和AI大模型技术衔接、定义不了数据需求,是没法完整的落地一个产品的!

本次课程,专门面向产品经理人群,解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理!解析AI产品应用技术,积累大模型能力!简单易懂,不需要会代码,小白也能掌握!

  • 大模型微调:掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。学习如何利用领域数据(如制造、医药、金融等)进行模型定制
  • AI Agent智能体搭建:学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手产品(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)

2)超全行业案例解析!

课程详细讲解现阶段,大模型在各个行业和领域的应用现状!包括:零售与电商、教育、医疗、泛娱乐、法律等等10大行业!

详细讲解案例的思路、应用场景,以及背后的技术原理、核心技术!揭秘各个行业、场景的真实现状,和未来产品的发展与机遇!

可以说,讲解完一个案例,就能积累一个AI产品实践的经验!

课程中所涉及到的实战项目,都可以直接在自己的工作中使用,让自己的产品/项目有可借鉴的成功案例!

3)AI产品经理求职专项辅导

课程中会系统的帮助大家拆解字节、腾讯、百度等大厂AI PM岗位JD关键词,掌握AI PM高频面试题型与回答框架;展示 AI 相关能力的关键技巧:Prompt设计、模型评估、A/B测试、成本意识、与算法/工程协作经验;

  • To B类AI产品经理:突出“行业理解 + 技术落地 + 商业闭环”能力的简历结构设计,展示项目成果;从客户需求洞察到技术方案设计,展现端到产品思维;如何评估To B AI产品的可行性、客户付费意愿与实施成本
  • To C类AI产品经理:拆解头部公司岗位JD,将过往尽力转化为AI产品叙事逻辑;从行业趋势、产品设计题、案例分析&数据分析题、技术理解边界等全流程辅导面试;避免无效海投、锁定最适合的AI产品岗位;

03

本次课程,全程直播讲解,能直接对话大佬和专业助教,不懂就问,超详细的案例,小白也能轻松get!

完课后,还赠送《AI产品经理面试题库》、《AI大模型应用案例集》!不断更新中……

适合人群:

  • 想转型AI产品经理、AI项目管理专家、AI产品解决方案等岗位
  • 想进行AI产品创业的创业者
  • 想成为制作AI产品的程序员
  • 想利用AI解决企业问题的管理岗
  • 想在AI方向寻找就业方向的毕业生
  • AI方向前景广阔、待遇好!

目前,很多产品人已经通过完整学习拿到大厂高薪offer,收入嗷嗷涨!

我把AI产品经理的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/1067394/

相关文章:

  • VulnHub 靶机实战:Infosec_Warrior1 从信息收集到 Root 提权全流程
  • Spring Boot + XXL-Job 实现考勤自动补账:缺卡生成、历史回算和幂等设计
  • 从“归档凭证“到“数据资产“——合同智能应用实战思考
  • 工业防潮柜揭秘:量子算力芯片VS传统算力芯片
  • 基于FME的高程点与等高线矛盾检查
  • 让Mac应用保持最新:Latest使用全攻略
  • 10 分钟搭好语音 AI Agent,LiveKit 凭什么成为 OpenAI 的基建选择
  • Emacs AI助手:3个理由让你在编辑器中体验大型语言模型的强大能力
  • DFIG双馈风机、低电压穿越LVRT+转子侧快速短接、网侧矢量补偿控制仿真(带参考文献)
  • PCB建议
  • 探索未来能源:离网光伏系统如何改变生活
  • AI工程师必抢的稀缺资源:SITS 2026官方Behavior Cloning Benchmark Kit(含6类真实机器人任务数据集+基线模型权重)
  • 技术实战 | 抗原-TCR亲和力优化:5步突破免疫治疗瓶颈
  • Ricon组态技术架构 - 企业级Web组态解决方案
  • 【无人机】基于MATLAB的航空探空无人机纵向稳定性和俯仰自动驾驶仪设计Simulink仿真
  • RAG 检索精度优化之道:数据清洗与预处理全流程深度解析
  • 承接定制AI智能控制会议医疗录播主机
  • 前后端分离德州酒吧小程序:存酒管理、扫码点单、在线组局逻辑代码拆解
  • Techwiz LCD 1D:宾主效应液晶模式
  • 快捷、网关支付选型指南
  • AI不是从天而降,它经历了七十年三起三落:通过图灵测试读懂AI
  • 【AI原生LoRA技术权威指南】:SITS 2026低秩适配全栈解析——覆盖训练、部署、量化3大实战瓶颈
  • LeetCode 189数组轮转问题详解:辅助数组法与三次翻转法
  • 10个WordPress故障排除场景下的高效诊断与修复方案
  • AI掘金头条新闻系统 (Toutiao News)-删除浏览历史
  • 当 SiC 遇上 3300V:一台国产仪器如何接住第三代半导体的“测试重担“
  • Reproxy:微服务时代边缘代理的终极解决方案
  • Means:基于 .NET 10 打造的开源自部署 S3 兼容对象存储服务
  • BLE 广播 rawBytes 解析说明
  • 二年级下册语文复习1-8单元:口语交际+写话训练(ppt课件)