当前位置: 首页 > news >正文

Hermes Agent 全景概览:会自己进化的 AI 助手

你用 ChatGPT 一年了。每次打开对话,它都像第一次见你——不知道你是做什么的、不知道你喜欢什么技术栈、不知道你上次纠正过它"不要用 var,用 const"。你每次都要从头交代背景。而 Hermes Agent 的设计目标就是消灭这个"每次重来"的体验——它不是你用完就丢的工具,而是一个会记住你、理解你、越用越像你的 AI。


Hermes Agent 是什么

一句话:Hermes Agent 是一个会自进化的 AI 助手。它由 Nous Research 团队开源(MIT 协议),用 Python 构建,核心理念只有一句——“The agent that grows with you”。

ChatGPT / Claude 的体验: 对话 1: "我是前端工程师,用 React + TypeScript" 对话 2: "我是前端工程师..." ← 又得重新说一遍 对话 3: "我是..." ← 没完没了 Hermes 的体验: 对话 1: "我是前端工程师,用 React + TypeScript" 对话 2: Hermes 自动用 TypeScript 风格回复,组件用 React 写法 ← 记住了 对话 3: 你纠正它 "接口类型命名用 I 前缀" → 记住了 第 2 周: 它自动生成了 code-style Skill,不需要你再说 ← 学会了 第 4 周: 你写需求时只说"加个用户列表",它自动按你的风格生成代码 ← 完全适配

几个关键事实:

维度详情
开源协议MIT(完全自由使用、修改、商用)
语言Python 3.12+
安装方式pip / Docker / 源码编译
支持的模型200+(Claude/GPT/Gemini/DeepSeek/本地 Ollama 等)
核心差异化自学习闭环、三层记忆系统、20+ 平台网关
谁出品Nous Research(开源 AI 社区,Hermes 系列模型作者)

核心差异化:自学习闭环

这是 Hermes 和所有其他 AI 工具最本质的区别。其他 AI 处理完任务就结束了——Hermes 每次完成任务后,会多走一步:复盘

自学习的五步循环

┌──────────────────────┐ │ ① 执行任务 │ │ Agent 完成用户请求 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ② 自我复盘 │ │ 分析:哪里做得好? │ │ 哪里做得不好? │ │ 下次怎么改进? │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ③ 提炼经验 │ │ 从复盘中提取可复用 │ │ 的规则或模式 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ④ 生成/更新 Skill │ │ 将规则写入 SKILL.md │ │ 下次自动加载 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ⑤ 应用到下次任务 │ │ 遇到同类任务时自动 │ │ 使用新 Skill │ └──────────┬───────────┘ │ └──────────→ 回到 ①

一个完整的学习案例

第 1 次(没有 Skill,全靠 System Prompt): 你:"写一个 API 接口,查询用户积分" Hermes 写完后 → 自己复盘: ✅ 功能正确,返回了积分余额 ❌ 没有做参数校验(user_id 为空怎么办?) ❌ 没有处理数据库连接失败的情况 ❌ 错误信息是英文的(你偏好中文错误信息) → 提取规则: 1. 所有 API 接口必须校验输入参数 2. 数据库操作必须有 try/except 3. 错误信息用中文 第 2 次(部分学习已应用): 你:"写一个积分扣减接口" Hermes → 自动加上了参数校验和 try/except ✅ → 但 try/except 的异常处理太宽泛(catch Exception 而不是具体异常) → 错误信息虽然用中文,但不够具体("操作失败" 而不是 "积分不足") 第 3 次(继续迭代): 你:"写一个积分过期处理接口" Hermes → 参数校验 ✅ try/except 精确异常类型 ✅ → 错误信息具体:"当前积分余额不足,需要 500 积分,实际 320 积分" ✅ → 你不需要再纠正了 → 它把这个模式自动写入了 code-style Skill 第 10 次: 你:"加一个优惠券兑换接口" Hermes → 自动按你的风格生成:参数校验 + 精确异常处理 + 中文错误信息 + 审计日志 不需要任何纠正。完全符合你的标准。

这就是自进化的核心:不是你在教 AI,是 AI 在观察你,然后自己学会你想要什么


三层记忆系统

自学习能运作的底层基础是记忆。Hermes 有三层独立且互相配合的记忆:

┌─────────────────────────────────────────────────────────┐ │ Hermes 三层记忆系统 │ ├──────────────┬──────────────┬──────────────────────────────┤ │ 会话记忆 │ 持久记忆 │ 技能记忆 │ │ (Session) │ (Persistent) │ (Skill) │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 当前对话上下文 │ 跨会话保留 │ 可执行的规则和模板 │ │ 生命周期: │ 生命周期: │ 生命周期: │ │ 直到 /clear │ 直到主动删除 │ 直到被新版本替代 │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 存储内容: │ 存储内容: │ 存储内容: │ │ - 你说过什么 │ - 你的身份 │ - 代码风格规则 │ │ - AI 回复什么 │ - 你的偏好 │ - 项目架构约定 │ │ - 读过的文件 │ - 项目信息 │ - 常用工作流模板 │ │ - 当前任务状态│ - 被纠正的历史 │ - 自动生成的 Checklist │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 存储后端: │ 存储后端: │ 存储后端: │ │ SQLite │ SQLite FTS5 │ 文件系统 (SKILL.md) │ │ sessions 表 │ memories 表 │ ~/.hermes/skills/ │ └──────────────┴──────────────┴──────────────────────────────┘

会话记忆 vs 持久记忆

会话记忆 = "刚才聊了什么" → 你说了需求 → AI 开始写代码 → 你纠正了一个 Bug → AI 修复 → 这些都在当前对话里。但关闭对话后就没了。 持久记忆 = "你是谁 + 你的世界是什么样的" → "Barry,全栈工程师,偏好 FastAPI + React + TypeScript" → "项目 my-app 的数据库用 PostgreSQL,API 用 RESTful 风格" → "代码注释用中文,变量命名用小驼峰" → 这些信息跨会话保留。下次新对话一开始就能用。

技能记忆 = 持久记忆的"可执行版本"

持久记忆:"用户偏爱函数式风格" ← 但不够具体 技能记忆(SKILL.md): """ 代码风格规则: 1. 优先使用 map/filter/reduce,避免 for 循环 2. 函数不超过 20 行,超过则拆分 3. 每个函数必须有类型标注 4. 错误处理用 Result 模式,不抛异常 """ ← 可被直接加载到 Agent 的 System Prompt 中,指导行为

技能记忆的关键在于它是自动生成的——不是你手动创建的,是 Hermes 观察你的纠正和反馈后自己提炼的。第 23-24 篇会深入拆解这个过程。


20+ 平台网关

Hermes 不只是一个终端工具——它可以接入你日常使用的所有通讯平台:

┌──────────────────────────────┐ │ Hermes Agent │ │ (同一个 Agent,统一人格) │ └──────────┬───────────────────┘ │ ┌────────────┼────────────┬──────────┬─────────┐ ▼ ▼ ▼ ▼ ▼ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌───────┐ ┌─────────┐ │Telegram │ │ 飞书 │ │ Discord │ │ Slack │ │WhatsApp │ └─────────┘ └─────────┘ └─────────┘ └───────┘ └─────────┘ ▼ ▼ ▼ ▼ ▼ 群聊/私聊 群聊/私聊 频道/私聊 频道/私聊 私聊

这意味着什么?

你不需要在不同平台维护不同的 AI 配置。你的 Hermes 只有一个"人格",但同时在 Telegram、飞书、Discord、Slack 上在线。你在飞书上纠正过它一次,它在 Telegram 上也会记住。

早上在飞书上: 你:@Hermes 今天的 Hacker News 头条帮我总结下 Hermes:回复 5 条今日头条摘要 下午在 Telegram 上: 你:@Hermes 帮我查下 PostgreSQL 连接池配置 Hermes:自动用中文回复,并且代码风格和你早上纠正的一致(还记得)

200+ 模型支持

Hermes 不绑定任何一家模型供应商。它支持 Anthropic、OpenAI、Google、Meta、DeepSeek 等几乎所有主流 API,也支持 Ollama 本地模型。

Provider │ 模型举例 │ 适用场景 ──────────────┼──────────────────────────┼───────────── Anthropic │ Claude Opus/Sonnet/Haiku │ 主力推理和编码 OpenAI │ GPT-5.5 / GPT-5.3 │ 代码生成 DeepSeek │ DeepSeek-V3 / R1 │ 省钱(成本 1/15) Google │ Gemini 2.5 Pro/Flash │ 长文本理解 Meta │ Llama 4 │ 本地部署 Ollama │ 任意本地模型 │ 零 API 费用

模型选择直接影响成本。重度使用 Hermes,用 DeepSeek 模型月均 $10-30;用 Claude Opus 可能到 $100-200。第 41 篇会详细拆解成本优化策略。


与 OpenClaw 的互补关系

这是很多人困惑的地方——两个工具看起来都能"让 AI 干活",到底怎么选?

OpenClaw = 广度:管理一群各有所长的 Agent → 像项目经理:拆任务、分任务、协调并行、汇总结果 → 每个 Worker 不需要了解你,只需要完成自己的子任务 → 核心能力在"分工协作" Hermes = 深度:培养一个真正懂你的 AI → 像私人助理:记住你的一切、学习你的习惯、预判你的需求 → 单个 Agent 随着时间积累对你的理解越来越深 → 核心能力在"长期记忆和自进化"

两者不是二选一,而是互补:

日常工作中: 用 Hermes 做你的个人助理 → 管理你的日程、记住你的偏好、跨平台回复 → 把 Hermes 接入飞书和 Telegram,随时可调用 用 OpenClaw 处理复杂工程任务 → 重构代码、多模块并行开发、自动化流水线 → 遇到需要"一个团队"完成的任务时调用 两者可以配合: Hermes 了解你的项目背景和偏好 → 把上下文传递给 OpenClaw 的 Orchestrator → Orchestrator 分配任务给 Worker → 结果返回给你和 Hermes → Hermes 学习这次的协作模式

什么时候该用 Hermes

✅ 适合用 Hermes 的场景: 1. 你需要在多个平台上和 AI 交互 → Telegram 上查资料、飞书上做摘要、手机上随时问问题 → 一个 Hermes 全部搞定,跨平台保持统一人格 2. 你有重复性的日常任务需要自动化 → 每日晨报、股票统计、周报生成、代码健康检查 → Hermes 的 Scheduler 定时执行(第 29 篇) 3. 你希望 AI 真的"懂你"而不是每次都重来 → 你的代码风格、你的项目架构、你的沟通偏好 → 自学习让 AI 越用越贴合你的习惯 4. 你关注隐私,希望数据留在本地 → 所有记忆存在本地 SQLite + 文件系统 → 用 Ollama 本地模型时,数据完全不离开你的机器 ❌ 不太适合的场景: 1. 复杂的多 Agent 并行任务 → Hermes 是单 Agent 设计,没有 Orchestrator/Worker 分工 → 这种场景用 OpenClaw 2. 需要高强度编码的生产级开发 → Hermes 擅长"理解你",不是"写大量高质量代码" → 编码场景用 Claude Code(或把 Claude Code 接入 Hermes)

这篇文章的要点

1. Hermes Agent 的核心差异化:自进化 → 不是用后即弃,而是越用越聪明 → 五步闭环:执行→复盘→提炼→生成 Skill→应用→再执行 2. 三层记忆系统是自进化的基础设施: → 会话记忆(当前对话)→ 持久记忆(跨会话)→ 技能记忆(可执行规则) → 每一层都有明确的生命周期和存储方式 3. 20+ 平台网关让你在任何地方用同一个 AI: → 飞书、Telegram、Discord、Slack、WhatsApp 同时在线 → 统一的记忆、统一的人格 4. Hermes 和 OpenClaw 是互补关系: → OpenClaw = 广度(管理 Agent 团队) → Hermes = 深度(培养懂你的 AI) → 两者可以而且应该一起用 5. 读完这篇文章,你应该能回答: → Hermes 和 ChatGPT 最本质的区别是什么? → 自学习闭环是怎么运作的? → 我应该用 Hermes 还是 OpenClaw,还是两个都用?

延伸阅读

  • Hermes Agent GitHub
  • Nous Research 官方博客
  • Hermes Agent 官方文档
http://www.jsqmd.com/news/1103742/

相关文章:

  • 如何为每个应用独立设置虚拟位置:FakeLocation完整使用指南
  • 抖音音频提取神器:3分钟学会免费下载抖音热门背景音乐
  • 猫抓浏览器扩展:5分钟掌握网页视频下载的终极技巧
  • RT-Thread / μC/OS-II / FreeRTOS 全栈开发专家指南
  • CCF-GESP计算机学会等级考试2026年6月四级C++T2 身高体重指数
  • Java代码审计实战:SSRF漏洞原理、挖掘与纵深防御体系构建
  • 力扣HOT100-7 无重复字符的最长子串(Java实现)
  • 亚马逊的“阳谋”:Alexa for Shopping全美上线,电商流量逻辑正在底层切换
  • 如何通过Bilivideoinfo破解B站数据分析的三大挑战?
  • paperxie 一站式论文智能写作,四步流程搞定全学段学术文稿创作
  • 3分钟免费解锁macOS优雅体验:Windows鼠标指针美化完全指南
  • 【JAVA毕设源码分享】基于springboot老年人膳食营养服务网站的设计与实现(程序+文档+代码讲解+一条龙定制)
  • 终极指南:让普通鼠标在macOS上超越苹果触控板的完整解决方案
  • Grok 4.3 使用实践:对话问答、推理分析与 Agent 工作流
  • 1908年6月30日:通古斯大爆炸——大自然上演的一场“高空无痕抹除”史诗级生产事故
  • 5分钟解锁网易云音乐NCM格式:ncmdump让你真正拥有音乐自由
  • 3分钟解锁网易云音乐NCM格式:ncmdump让你的音乐随处可播
  • novel-downloader:高效智能的小说离线下载解决方案
  • 成都企业选择大模型本地化部署的关键决策点
  • 头部玩家估值逼近宇树,机器人隐秘赛道的汹涌与暗流
  • paperxie 智能论文写作深度拆解:分步骤学术创作工具适配全学段论文撰写需求
  • 2026 研效前沿:年度最佳 AI 代码生成平台 Top 排行榜与工程治理选型指南
  • 如何在3分钟内免费为Windows系统换上macOS风格鼠标指针
  • 遗传算法工程化:从早熟收敛到生产可用的五大核心机制
  • 校车管理信息系统springboot + vue
  • 明日方舟智能辅助工具MAA:5分钟快速上手,彻底告别重复操作!
  • 2026年防腐无缝钢管现货定做 行业实战经验分享
  • 产品经理开会记笔记麻烦?2026年4款实时语音转文字 自动出纪要
  • 深入剖析QQ音乐加密格式:qmcdump技术实现与无损解密方案
  • 猫抓浏览器插件:轻松捕获网页视频音频资源的智能助手