当前位置: 首页 > news >正文

从零到精通:Hermes Agent 完整上手指南(2026版),Github 9万星的底层解析:记忆、技能、GEPA

这篇可能是全网目之所及,Hermes讲得最透的吧。

先假设个时光倒流的场景。

2025年某天,一位开发者花了40分钟教会AI助手一个复杂的调试技巧:先用哪个命令排查哪个节点,哪个参数组合能绕过那个坑。下一个session,他满怀期待地继续工作——然后AI又从零开始了。那40分钟,就像没存在过一样。

这不是哪个产品的bug。这是所有AI助手的结构性缺陷:对话结束,记忆清零。Hermes Agent 想解决的就是这件事。它在两个月内拿到了 GitHub 9万颗星——而这个数字背后,是一套真正能把经验留下来的系统。

1

先有身份,才有记忆

说真的,在聊记忆系统之前,有一个层经常被忽略:身份层。

记忆是AI知道的事,技能是它会做的事。但这两样都没有回答一个最基本的问题:它是谁?它以什么风格出现在你面前?

没有身份层,每次对话都像同一个AI换了件衣服。Hermes 用一个文件解决这个问题:SOUL.md。它放在配置目录的根目录,固定插在系统提示词的第一位。它定义了AI的性格、语气、交流风格,以及一些硬边界。这个文件是你写一次然后长期使用的东西,不会每次session重置。

所以整个学习环路,实际上是透过这个身份框架来运作的。记忆是里面会变化的部分,身份是外面的固定框架。

SOUL身份层记忆技能GEPA身份框架决定记忆与技能如何被整合固定身份可变记忆/技能

图:身份框架与记忆/技能系统的关系。SOUL.md 是固定层,记忆和技能是内部动态组件。

2

三层记忆体系:三个速度,三种用途

Hermes 的记忆不是一块硬盘,是三个不同速度的存储层。每一层解决不同问题,之间有明确的取舍关系。

第一层:两个小文件,永久在上下文里。

核心是两个放在磁盘上的 Markdown 文件。MEMORY.md(最多2200字符)存AI对自己环境、项目规范、工具特性和经验教训的记录。USER.md(最多1375字符)存用户信息:名字、沟通偏好、技能水平、注意事项。

每次新session开始,这两个文件以固定快照的形式注入到系统提示词里。如果AI在对话中途写了新记忆,变化会立即写入磁盘,但这个变化要等到下一个session才会出现在系统提示词里。当记忆用到接近80%容量,AI会主动整合,把相关内容合并成更密集的版本。

第二层:全量对话历史,随时可搜索。

每次对话(CLI和消息平台)都完整存在 SQLite 里,带全文搜索索引。这层解决"上周我问了什么来着"这类问题。代价是它需要AI主动去搜,然后做摘要,不是默认在上下文里。第一层常驻但极小,第三层可搜索但需要主动调用。

第三层:外部记忆提供者,8种插件。

如果需要更深入的持久记忆,Hermes 支持8种外置 provider,可以在你不用的时候主动预取相关内容、对话结束后同步记忆、以及在session结束时提取记忆。这些 provider 和内置记忆并行运作,互不替代,每次只启用一种。

Tier 1 · 系统提示词常驻MEMORY.md + USER.md · 2200 + 1375 字符⚡速度最快Tier 2 · SQLite 全量搜索state.db · WAL模式 · FTS5索引 · 无限容量🔍按需搜索Tier 3 · 外部 Provider8种插件 · 预取 + 同步 + 提取🗄空闲时运行容量: Tier1 << Tier2 < Tier3

图:三层记忆的速度与容量关系。越快容量越小,越慢容量越大。

3

技能自进化:AI自己写操作手册

记忆解决的是"知道什么"。技能解决的是"怎么做"。在 Hermes 里,技能是带有 YAML 元数据的 Markdown 文件,内容就是操作步骤。有点像把一个老工程师的操作习惯文档化——只不过这个文档是AI自己写的。

触发技能创建的条件有几种:完成一个超过5步工具调用复杂任务、遇到错误死磕出解决方案、用户纠正了AI的做法、或者发现了非平凡的工作流。每次满足条件,AI就会用skill_manage工具自动生成一个新的SKILL.md

一个典型技能长这样:描述触发场景、列出具体步骤、注明坑位提醒、以及验证方式。为了节省 token,技能使用渐进式披露——AI默认只看到名称和描述,当真正需要某个技能时才加载完整内容。

遇到问题5+工具调用试错解决找到正确路径写入技能SKILL.md下次直接命中跳过试错自进化循环:遇到问题 → 解决 → 存档 → 下次直接用

图:技能自进化循环。AI遇到问题并解决后,将成功路径写入技能库,下次直接调用。

Curator:技能的垃圾回收。

如果AI可以无限创建技能,技能库会迅速膨胀成一堆重复、过时、相互冲突的操作手册。Curator 就是来解决这个问题的后台维护系统。

它不是定时运行的守护进程。它只在检测到"7天未运行 + AI空闲2小时"时才触发。触发后会有两个阶段:首先,自动规则处理明显过时的:30天未使用的技能标记为过时,90天未使用的归档。然后,AI接管做更细致的判断——最多8轮迭代,逐个判断每个AI创建的技能是保留、打补丁、合并还是归档。

两个重要限制:Curator 永远不会动内置技能和从 Hub 安装的技能,只处理AI自己写的。另外它永远不会直接删除,最多归档到 archive 目录,可以随时恢复。

4

GEPA:离线优化,不碰模型权重

这里有一个真实的张力:AI自己创建的技能,存在"自我美化"的问题。它几乎总是认为自己做得不错,即使实际上没有。社区反馈也确认了这一点——有时候自创技能还会覆盖掉手动的、更好的定制版本。

GEPA(Genetic-Pareto Prompt Evolution)就是来解决这个的。它不是 Hermes 运行时的内置模块,而是独立运行的优化流水线,相关论文是 ICLR 2026 Oral,MIT 协议开源。

GEPA 的核心思路是:别问AI"你做得好不好",直接去读执行痕迹,理解失败的原因,然后通过进化搜索提出有针对性的改进。它的流水线是这样的:从 Hermes 仓库读取当前技能,生成评测数据集(可以用 Claude Opus 生成合成测试用例、从 SQLite 提取真实会话历史、或者人工整理黄金集),然后运行优化器读取执行痕迹、找出失败点、生成候选改进版本,再用 LLM 评分(带评分细则,不是简单的通过/失败二元判断),最后过约束门:测试必须100%全过、技能文件不超过15KB、缓存兼容性保持、语义不漂移。

不需要GPU,全部通过API调用完成,每次优化运行大约花费2到10美元。最终胜出的版本以 PR 形式提交到 Hermes 仓库,永远不是直接 commit。

GEPA 可以跳过,但如果遇到瓶颈,它是一种在全面微调之前的有效替代方案。

5

快速上手:一行命令启动

说真的,理论讲完了,现在说怎么跑起来。

**安装:**Linux、macOS 或 WSL2,Python 3.11 以上,8GB 内存够跑 API 模式。一行命令搞定:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

装完之后运行向导配置 provider、API key、模型和工具:

hermes setup

然后就可以直接聊了:hermes

**连 Telegram:**从 @BotFather 获取 bot token,再从 @userinfobot 获取自己的 Telegram ID,配置好之后就可以在手机上和AI对话了。

**多 agent 玩法:**Hermes 的 profiles 功能支持创建多个完全隔离的实例,每个有自己的配置、记忆、技能和 Telegram bot。可以创建一个程序员(把代码执行委托给 Claude Code)、一个研究员(负责每日 AI 资讯推送)、一个设计师(生成特定风格的插图)。

**定时任务:**用自然语言描述想要什么,Hermes 自动转换成 cron 表达式。例如"每个工作日早上8点推送AI资讯摘要",研究员 agent 会自动创建定时任务并通过 Telegram 交付结果。

小结

Hermes Agent 的核心不是一个聊天机器人,而是一个有学习环路的个人AI系统。SOUL.md设定身份,运行时循环捕获经验,Curator 保持技能库健康,GEPA 确保库里东西真的管用。

这个系统做到了其他开源 agent 都没做到的事:把三个本来分开的部分——实时技能学习、持久多层记忆、和可选的离线优化流水线——真正整合到了一个框架里。它不是靠一个杀手级功能,而是靠这个组合。

回到开头那个场景。如果那位开发者用的是 Hermes,下一次session,AI会直接说"我注意到上次我们调试那个问题用了这个方法……"。那40分钟没有消失。它被留下来了。

你用 AI 助手时,最头疼的记忆问题是什么?

· Hermes 的三层记忆体系,最吸引你的是哪一层?

· 如果可以给 AI 设计一个"永远不忘"的能力,你最想留住什么?

· 你认为 AI 自创技能靠谱吗?有什么潜在风险?

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/839950/

相关文章:

  • RT-Thread Nano移植GD32F450实战:从零构建轻量级多任务系统
  • 别再被破解坑了!手把手教你用C盘flexlm文件夹搞定ROMAX DESIGNER R17安装与激活
  • 5个关键步骤掌握Python通达信数据读取:mootdx完整实战指南
  • 2026 年天津电路插座开关灯具跳闸漏电及厨卫家电中央空调维修怎么选?18920401135 - 资讯速览
  • 浩卡联盟怎么注册一级代理?官方邀请码16888注册一级合伙人 - 流量卡代理招商
  • 慈溪市小吕通风设备:专业的宁波各式风机定制哪家好 - LYL仔仔
  • 从Transformer到RAG:大语言模型学习笔记与工程实践指南
  • 3步搞定中国大学MOOC离线下载:高效构建个人学习库的完整方案
  • 2026株洲卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房隔热 本地专业防水公司TOP5权威推荐(2026年5月本地最新深度调研) - 防水百科
  • ModTheSpire:为《杀戮尖塔》玩家打造的安全模组加载解决方案
  • 从PHY芯片选型到电路定型:一次讲清百兆、千兆以太网硬件设计的核心差异
  • 2026兰州墓地推荐:生态人文与科技赋能标杆——兰州福寿园 - 深度智识库
  • RCLI:统一AI开发环境的命令行工具设计与实战
  • 别只看报价:西安老酒回收真正该比的4件事 - 资讯速览
  • NestJS项目脚手架:集成ESLint、Husky、Docker的现代化开发环境
  • Charles实战:从零搭建移动端Https抓包与Mock测试环境
  • 图片转Excel:免费的表格识别工具,将图片中的表格和文字转换为可编辑的Excel文件,支持多种图片格式,操作简单,无广告
  • OpenWrt防火墙深度解析:从区域模型到多网络隔离实战
  • ncmdump终极NCM解密转换完全指南
  • 2026年5月发布:北京宣传片制作公司口碑推荐排行榜大揭秘 - 资讯速览
  • 家庭疏通vs商企排污,大理疏通公司怎么选不踩坑? - 资讯速览
  • 北京防水补漏维修公司推荐 - 资讯速览
  • 无锡顺恒搭建:无锡盘扣脚手架搭建选哪家 - LYL仔仔
  • Claude技能库实战:构建可复用AI工作流,提升大模型自动化效率
  • C++内存管理优化实战:开源memory-manager核心原理与性能调优
  • SoC设计全流程解析:从架构到流片的核心步骤与挑战
  • 【法学研究效率革命】:NotebookLM如何将文献综述时间压缩73%?(20年法律AI实践者亲测)
  • VMware vSphere 9.1 新功能介绍
  • 2026信阳卫生间免砸砖防水、外墙、地下室、楼顶渗漏+彩钢瓦、阳光房隔热 本地专业防水公司TOP5权威推荐(2026年5月本地最新深度调研) - 防水百科
  • 3步掌握AutoJs6:Android自动化脚本实战指南