当前位置: 首页 > news >正文

AI Agent 的三次进化

我们构建 AI 的方式在三年内改变了三次。大多数人还在追赶第二次转变。第三次转变已经到来了。

1、第一次转变:提示工程

当 ChatGPT 问世时,每个人都成了提示工程师。

游戏很简单:问更好的问题,得到更好的答案。给模型一个角色。把你的任务分解成步骤。添加示例。链式思考。你的提示越好,输出就越好。

这对一次性任务很有效。提问,接收,完成。

但当我们开始用 AI 构建产品时,情况发生了变化。不再是一次性查询,而是需要在步骤间推理、记住事情、在真实系统中采取真实行动的系统。单靠提示已经不够了。

2、第二次转变:上下文工程

到 2025 年中,Andrej Karpathy 明确指出:上下文工程比提示工程更重要。

洞察很简单但重要:模型只能对它能看到的东西进行推理。真正的问题不只是你问了什么,而是模型在推理时看到了什么

上下文工程是塑造模型输入窗口的一切:系统提示、对话历史、检索的文档、工具定义、记忆注入等。

如果提示工程是"右转"的命令,上下文工程给模型地图、路标和地形,让它真正理解在这种情况下右转意味着什么。

在 Salesforce,Agentforce 的很多基础设计就存在于这一层——在推理时用正确的 CRM 数据、客户上下文和业务规则来让 Agent 落地。正确的上下文是一个听起来有帮助的 Agent 和一个在你的特定业务场景中确实有帮助的 Agent 之间的分水岭。

但是一旦 Agent 开始在生产中自主运行,在真实企业系统的多个步骤中采取真实行动,一整套新问题就出现了。更好的上下文无法解决的问题。

3、第三次转变:Harness 工程

问题是这样的:即使有完美的提示和完美的上下文,一个自主 Agent 仍然会脱轨。

它可能违反你公司的数据访问策略。升级一个它应该解决的案例。触发 Salesforce 中一个无法回滚的操作。或者自信地完全完成了错误的任务。

这些不是上下文问题。它们是环境问题。

Harness 工程是设计 Agent 环境的学科:约束、反馈循环、脚手架和运营系统,使 Agent 保持正轨。

在企业世界中,当 Agent 触及客户记录、财务数据和合规工作流时,harness 必须做到所有这些,还要确保信任、安全和可审计性。风险更高,harness 必须更加精心设计。

4、Agent = 模型 + Harness

这是最简洁的心智模型:

如果你不是模型,你就是 harness。

围绕模型的一切——代码、配置、工具、记忆、执行逻辑、约束和反馈循环——都是 harness。原始模型不是 Agent。一个带有精心设计 harness 的模型才是一个工作引擎。

三个层次清晰地嵌套:

  • 提示工程问:我应该问什么?它优化指令。
  • 上下文工程问:模型应该看到什么?它优化输入窗口。
  • Harness 工程问:整个环境应该如何设计?它优化模型周围的系统。
    每一层解决不同类别的问题。随着 Agent 承担更多自主的、长期的工作,harness 层的重要性超过了其他两层之和。

5、Harness 里有什么?

从 Agent 需要在生产中完成真实工作倒推:

持久化状态。Agent 需要跨会话持久化工作并在轮次之间干净地交接。在 CRM 语境中,这意味着维护案例状态、对话历史和超出单次交互窗口的任务进度。

工具执行。与其为每个场景预先构建刚性操作,不如给 Agent 动态组合和执行工具的能力。在 Agent 中,工具和动作定义了 Agent 的行动空间。Harness 决定这些如何被调用、排序和约束。

安全执行和护栏。Agent 生成的动作不能在企业系统中不受检查地运行。Agentforce 中的 Einstein 信任层是 harness 层安全原语的具体例子:屏蔽 PII、阻止不安全输出、强制数据驻留。所有这些都发生在环境层,而不是模型层。

记忆和落地。模型只知道其权重和上下文窗口中的东西。在企业 Agent 中,这意味着在查询时连接到实时 CRM 数据、知识库和客户历史。Agentforce 中的 Data Cloud 落地就是这一层。

可观察性和反馈循环。在生产中,harness 包括你用来理解 Agent 在做什么的一切:追踪、评估、会话日志和将 Agent 行为反馈到 harness 改进的闭环机制。这是大多数企业团队投资不足的地方,而且往往是最具杠杆的起点。

6、从期望的 Agent 行为倒推到 Harness 工程

Harness 工程是关于引导 AI Agent 以我们期望的方式行为。它让人类添加结构、规则和上下文,使模型能更可靠地执行有用的任务。随着模型的改进,harness 也被用来扩展它们的能力和修复局限。

与其列出每一个 harness 功能,核心思想很简单:

从你期望的 Agent 行为开始,然后设计 harness 来实现该行为。


原文链接:AI Agent 的三次进化 - 汇智网

http://www.jsqmd.com/news/944880/

相关文章:

  • 性价比优先!盘点平价好用的国产 AI 写作网站,应届学生党收藏
  • 北京沙发翻新换皮换布2026年本地靠谱推荐——匠阁、御匠、锦修三大品牌详解,服务区域覆盖北京各区,专业沙发翻新换皮换布一站式解决方案 - 我叫一
  • WSL2图形化桌面避坑实录:解决Gnome仅Root可用、VcXsrv连接失败与CUDA驱动冲突
  • HS2-HF_Patch:Honey Select 2汉化优化补丁的终极解决方案
  • Luyten Java反编译工具:5分钟快速上手与核心功能详解
  • 给全自动评论系统添加 点赞 收藏 关注 功能
  • Qwen3.6-35B-A3B-APEX-MTP-GGUF新手入门:从下载到运行的5分钟快速教程
  • 企业无线网络配置不求人:手把手教你用神州数码DCWS-6028 AC搞定三层发现(附Option 43配置详解)
  • 基于视觉与图像的植物信息采集与处理技术解析【附代码】
  • HPLT BERT Base LV实战教程:从文本分类到问答系统的完整应用
  • 鸿蒙Flutter三级联动选择器技术详解:省市区级联选择实现方案
  • 终极解决方案:3分钟搞定Windows热键冲突检测
  • 如何快速地拥有一个帮你管理知识库的agent
  • 2026广州GEO优化公司怎么选?实测五家服务商,这份选型指南帮你避坑 - GEO优化
  • 技术模拟的“四诊仪”,为何永远无法触及中医的灵魂?
  • Mermaid在线编辑器终极指南:如何用代码思维重塑可视化工作流
  • PX4无人机飞控系统:从入门到实战的完整指南
  • 保姆级教程:在Windows 11上为LightningChart .NET 10.3.2配置WPF与WinForms双环境
  • ThinkPad风扇控制终极指南:用TPFanCtrl2释放你的笔记本潜能
  • 为什么提示词工程死了,而AI Agent才刚开始
  • 自动点赞成功
  • 如何将手机摄像头变成专业直播设备:DroidCam OBS插件完整教程
  • 塔机障碍物远距离超声测距方法与识别机理解析方案【附仿真】
  • 以“车路运能”聚势,千方科技干线物流自动驾驶业务稳步推进 - 外贸老黄
  • 终极指南:如何让老款Mac焕发新生?OpenCore Legacy Patcher完整使用教程
  • 2026最新英文论文降AI指南:实测5款高效辅助工具,专治Turnitin标蓝危机
  • 解锁免疫失衡核心密码,Luminex检测多因子全面解析Th细胞亚群调控,武汉云克隆多因子助力免疫疾病研究攻坚
  • 黄仁勋的AI工厂不是PPT了:Vera Rubin量产,推理5倍碾压前代 量产了,不是“即将“
  • semi-utils:重构摄影工作流的智能批量水印终极指南
  • LTX-2.3-nvfp4 vs 同类模型:为什么它是2025年最值得关注的音视频AI