当前位置: 首页 > news >正文

收藏必备!小白程序员必看:Agent如何越用越聪明?Hermes技能进化全解析

Hermes通过将任务中的可复用流程写回本地技能文件,实现了Agent的“进化”。这一过程并非模型参数学习,而是经验整理成操作手册。文章详细介绍了Hermes自动创建技能的路径,包括任务时的模型维护、任务后的复盘与技能写回,以及后台复盘机制。Hermes的技能进化依赖于系统提示、工具schema和后台复盘三重机制,并通过文件写回、校验和回滚确保安全性。这种工程化学习方法让经验以资产形式留存,便于审查、维护和协作,使Agent越用越聪明。

Agent 开发的几乎都绕不开一个念头:智能体能不能越用越聪明?具体来说,能不能做到:

把做过的事自己沉淀下来 用户下次不用再把同一套流程教一遍

Hermes 对这个问题的处理没有往玄学上飘,也没吹嘘自己在后台偷偷训练新模型。它做得很朴素,也很工程化:每当 Agent 在任务里摸索出一套可以复用的做法,就通过skill_manage把这套做法写回本地技能文件。下次遇到类似任务,再把它拿出来继续用、继续改。

Hermes 的技能进化,不是参数层面的学习,更不是凭空长出什么新能力。它更像是把一次任务里跑通的经验,整理成一份能随时查阅、修改、甚至回滚的操作手册。

下面顺着这条链路拆开看一看。

Hermes 里”自动创建技能”的真实路径

1

自动创建技能:本质是文件写回,不是训练

Hermes 所谓的自动生成技能,本质上是一套工具调用流程,而不是训练流程。

Agent 并不会把一次任务丢给某个学习器,然后在模型参数里“长”出新能力。它做的是:

  1. 任务进行时, 提醒模型尽量使用和维护技能;

  2. 任务结束后, 回头审视这次有没有值得复用的流程;

  3. 如果有, 就调用skill_manage()创建新技能,或者给旧技能打补丁;

  4. 把结果写回本地技能目录, 让后面的会话可以直接复用。

所以 Hermes 的“进化”,准确来说是文件层面的经验写回。

听起来当然没有“模型自我学习”那么高级,但好处很实在:它可控。

它学到了什么,你能打开文件直接看。 它写到了哪里,你能精确定位。 它有没有写坏,你可以审查、回滚、再改。 下一次为什么做得更顺,也都有迹可循。

2

为什么能进化?经验有地可写,且支持打补丁

很多 Agent 系统并不是发现不了经验,而是发现之后没地方存储处理。

这次调通了一套部署流程,下次还得重新琢磨;这次踩过一个环境坑,下次换个会话又踩一遍。问题不是在于“有没有经验”,如果用户没有主动把本次流程固化为Skills就等于是“经验有没有被系统接住”。

Hermes 把这件事做成了一条明确的写回路径,skill_manage()支持的操作包括:

create:创建一个新技能 patch:给已有技能打补丁 edit:重写 SKILL.md write_file:给技能增加附属文件 remove_file、delete:删除内容

最值得关注的是打补丁。

Hermes 不鼓励 Agent 一上来就重写整份技能文档,而是更偏向“补一小段”。这更接近真实的维护习惯:任务里发现了一个新坑、一个命令差异、一个验证步骤,就把它追加或修正到相应位置。

这样做有几个实际好处:token 消耗更小,修改范围更窄,更适合持续修补那些从真实任务里冒出来的细节。并且它的打补丁不是死板的字符串替换,底层用了模糊匹配,模型不需要精确记住原文里的每个空格,只要上下文能对上,就有机会把补丁打到正确位置。这就是它能“边用边修”的原因。

3

自动创建不靠开关,而是三层机制叠在一起

Hermes 的技能进化不是靠某个神秘按钮触发的,更像是三层提示和流程叠加出来的结果。

  1. 系统提示词持续提醒 系统提示会反复提醒模型两件事:复杂任务结束后,考虑要不要保存成技能;使用技能时,如果发现过时、缺漏或错误,及时打补丁。这会让模型不只盯着解决眼前问题,也会被引导去思考“有什么值得留下”。

  2. 工具的 schema 告诉它“怎么保存”skill_manage的 schema description 里有详细的操作规范:什么情况适合创建,什么情况更适合打补丁,什么样的技能才算质量过关,创建和删除前最好确认用户意图。Hermes 不仅告诉模型“你可以保存经验”,还告诉它“别乱写,尽量这样写”。

  3. 后台复盘把“想一想”变成固定流程 真正把这套机制推起来的,是run_agent.py里的后台复盘。Hermes 会维护一个技能计数器,当达到阈值,主任务完成后会启动一个后台复盘代理。这个代理不直接跟用户聊天,而是拿着当前会话快照加上复盘提示,专门判断“有没有值得沉淀成技能的非平凡工作流”。有就创建或更新,没有就安静退出。这就把“顺手记一笔”从模型自觉变成了系统级的固定动作。

后台复盘如何在主任务完成后异步沉淀技能

4

不是自治,不“裸写”:半自动背后的边界与安全

如果给这套机制一个准确的描述,就是:提示驱动、阈值触发、后台复盘、文件写回。它不是完全自治,主要有三个原因。

首先,是否值得保存仍然要靠模型判断,不会每次任务都产出新技能。其次,创建前确认用户意图更多是软约束,存在于提示和工具描述层,不是硬阻断。再者,它不是一个无限膨胀的知识工厂,重点是留下真正有复用价值的流程。

更能体现工程成熟度的,是它对写入环节的约束。只要允许 Agent 写文件,真正要关心的就不是“能不能写”,而是“写得稳不稳、边界够不够硬”。

Hermes 在skill_manage()的真实写入阶段做了大量校验:技能名称是否合法,分类是否合法,SKILL.mdfrontmatter 是否完整,内容大小是否超限,附属文件是否只写到允许的子目录,路径有没有穿越风险。写入后还会经过skills_guard安全扫描,不通过就回滚。尤其对 Agent 自己创建的技能,策略并不宽松,某些风险判定可能直接阻断。

技能写回不是直接落盘,而是带校验和回滚

5

复盘时机:后台一次,会话重置前再兜底一次

Hermes 没有在任务中途打断主流程,而是在主任务给出最终回复后,异步拉起一个轻量 Agent 做复盘。这个后台 Agent 复用当前模型和上下文快照,却不污染主会话,也不抢注意力。如果创建或更新了技能,前台只给一个很短的摘要提示。好处很直接:当前任务先完成,经验沉淀不干扰主推理,交付和复盘可以并行。

除了这种后台复盘,Hermes 还有另一道保险。当会话因为长时间不活跃或定时重置即将被清空,系统会再启动一轮清场复盘,用一个临时代理回顾整段对话,看看有没有遗漏的记忆或技能值得保存。很多复杂任务当下未必能立刻意识到是一套可复用流程,会话结束前再看一遍,等于给经验沉淀加了一层兜底。

因此,技能进化实际上有两个出口:主任务后的后台复盘和会话重置前的清场复盘。

6

为什么好用?工程化学习与可审计的闭环

一次复杂任务结束后,如果系统能把“什么时候该触发、先做什么后做什么、哪些命令有效、哪些坑已经踩过、最后怎么验证”这些信息留下来,下一次类似任务到来时,Agent 就不需要重新猜测,可以直接沿着上次真实跑通过的流程往前走。重复劳动少了,失败成本低了,而且因为技能是文件,人可以审查、补充、分发,团队协作也更容易。

所以我更愿意把 Hermes 的技能进化叫作“工程化学习”。它没有神秘感,但非常能落地。

归结成一句话:Hermes 让经验以工程资产的形式留下来,而不是散落在一次次对话里。 你也可以说“Hermes 自己长出技能了”,它长出的不是参数能力,而是一份份能打开查看、能继续维护、能打补丁、也能被安全扫描的技能文件。这背后是一条非常清晰的闭环:在任务中发现经验,在任务后判断价值,用工具写回,用安全机制限制风险,在未来会话中再次加载和修补。 它没有”自治超级智能”那么夸张,却很像真正能落地的软件工程——一个 Agent 变好用,不是因为它声称自己会成长,而是因为它知道经验应当放在哪里,下一次又该怎么拿出来用。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

http://www.jsqmd.com/news/809284/

相关文章:

  • 太赫兹视频SAR极坐标实时成像系统【附代码】
  • 从高德转战Leaflet:一个Vue项目的地图框架迁移实战与避坑指南
  • 北京海斯居科技:昌平正规的空气净化公司 - LYL仔仔
  • 终极指南:如何在Windows上轻松安装APK文件?告别笨重模拟器
  • 在Taotoken模型广场中根据任务需求挑选合适的大模型
  • AI助手如何通过MCP协议自动化操作飞书:feishu-inout工具实战指南
  • 中亚物流通道哪家稳定? - 中媒介
  • 3步免费实现Windows AirPlay 2接收器:打破苹果生态壁垒的终极指南
  • CTFshow密码学入门实战:从凯撒到RSA,手把手带你通关crypto0-13
  • 【23年算法】DBO-DNN多变量回归预测 基于蜣螂算法-深度神经网络多回归时序预测附Matlab代码
  • 众智商学院在行业内排名如何? - 众智商学院官方
  • 从手算到电路:深入剖析计算机中定点数与浮点数的运算实现【硬核解析】
  • 别急着格式化!DiskGenius恢复U盘/移动硬盘RAW格式数据的完整流程
  • 别光会打印星星了!用字符菱形为例,带你玩转C++的控制台‘像素画’
  • YOLOv7 Backbone源码逐层拆解:从CBS到ELAN的工程实现
  • ICC II 物理实现:从 Floorplan 到 Setup 的实战规划
  • 别再被Linux的free命令骗了!手把手教你读懂‘可用内存’和‘实际空闲内存’的区别
  • 承重强不易晃动的猫爬架推荐哪家 - 中媒介
  • 观澜墅二手房价格区间解析:住宅与别墅市场现状 - 品牌2026
  • 细节补充第一篇:RocketMQ 的使用
  • 手持式超声波流量计十大品牌:轻便与精准可否兼得? - 仪表人叶工
  • 一句话就能“劫持”你的AI?DZS 分层式自适应提示词注入攻击的防御机制框架 (HAA)来了!
  • Entroly:AI编程助手成本优化工具,让AI看见100%代码仅用5%token
  • SWD协议实战:从波形解析到寄存器读写全流程拆解
  • 2026 五家正规机构实测对比,上海包包回收哪家好? - 奢侈品回收测评
  • 2023B卷,荒岛求生
  • 观察使用Taotoken后月度账单明细与API调用成功率的变化
  • 如何深度优化PowerToys:专业中文界面的完整实战指南
  • 2026国内果酒TOP5!云南等地企业广受好评 - 十大品牌榜
  • 【SketchUp 2024】渲染前必调:六大样式设置详解,从边线优化到水印天空实战