当前位置：首页 > news >正文

Hermes Agent 全景概览：会自己进化的 AI 助手

news 2026/7/1 17:27:54

你用 ChatGPT 一年了。每次打开对话，它都像第一次见你——不知道你是做什么的、不知道你喜欢什么技术栈、不知道你上次纠正过它"不要用 var，用 const"。你每次都要从头交代背景。而 Hermes Agent 的设计目标就是消灭这个"每次重来"的体验——它不是你用完就丢的工具，而是一个会记住你、理解你、越用越像你的 AI。

Hermes Agent 是什么

一句话：Hermes Agent 是一个会自进化的 AI 助手。它由 Nous Research 团队开源（MIT 协议），用 Python 构建，核心理念只有一句——“The agent that grows with you”。

ChatGPT / Claude 的体验： 对话 1: "我是前端工程师，用 React + TypeScript" 对话 2: "我是前端工程师..." ← 又得重新说一遍 对话 3: "我是..." ← 没完没了 Hermes 的体验： 对话 1: "我是前端工程师，用 React + TypeScript" 对话 2: Hermes 自动用 TypeScript 风格回复，组件用 React 写法 ← 记住了 对话 3: 你纠正它 "接口类型命名用 I 前缀" → 记住了 第 2 周: 它自动生成了 code-style Skill，不需要你再说 ← 学会了 第 4 周: 你写需求时只说"加个用户列表"，它自动按你的风格生成代码 ← 完全适配

几个关键事实：

维度	详情
开源协议	MIT（完全自由使用、修改、商用）
语言	Python 3.12+
安装方式	pip / Docker / 源码编译
支持的模型	200+（Claude/GPT/Gemini/DeepSeek/本地 Ollama 等）
核心差异化	自学习闭环、三层记忆系统、20+ 平台网关
谁出品	Nous Research（开源 AI 社区，Hermes 系列模型作者）

核心差异化：自学习闭环

这是 Hermes 和所有其他 AI 工具最本质的区别。其他 AI 处理完任务就结束了——Hermes 每次完成任务后，会多走一步：复盘。

自学习的五步循环

┌──────────────────────┐ │ ① 执行任务 │ │ Agent 完成用户请求 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ② 自我复盘 │ │ 分析：哪里做得好？ │ │ 哪里做得不好？ │ │ 下次怎么改进？ │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ③ 提炼经验 │ │ 从复盘中提取可复用 │ │ 的规则或模式 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ④ 生成/更新 Skill │ │ 将规则写入 SKILL.md │ │ 下次自动加载 │ └──────────┬───────────┘ │ ▼ ┌──────────────────────┐ │ ⑤ 应用到下次任务 │ │ 遇到同类任务时自动 │ │ 使用新 Skill │ └──────────┬───────────┘ │ └──────────→ 回到 ①

一个完整的学习案例

第 1 次（没有 Skill，全靠 System Prompt）： 你："写一个 API 接口，查询用户积分" Hermes 写完后 → 自己复盘： ✅ 功能正确，返回了积分余额 ❌ 没有做参数校验（user_id 为空怎么办？） ❌ 没有处理数据库连接失败的情况 ❌ 错误信息是英文的（你偏好中文错误信息） → 提取规则： 1. 所有 API 接口必须校验输入参数 2. 数据库操作必须有 try/except 3. 错误信息用中文 第 2 次（部分学习已应用）： 你："写一个积分扣减接口" Hermes → 自动加上了参数校验和 try/except ✅ → 但 try/except 的异常处理太宽泛（catch Exception 而不是具体异常） → 错误信息虽然用中文，但不够具体（"操作失败" 而不是 "积分不足"） 第 3 次（继续迭代）： 你："写一个积分过期处理接口" Hermes → 参数校验 ✅ try/except 精确异常类型 ✅ → 错误信息具体："当前积分余额不足，需要 500 积分，实际 320 积分" ✅ → 你不需要再纠正了 → 它把这个模式自动写入了 code-style Skill 第 10 次： 你："加一个优惠券兑换接口" Hermes → 自动按你的风格生成：参数校验 + 精确异常处理 + 中文错误信息 + 审计日志 不需要任何纠正。完全符合你的标准。

这就是自进化的核心：不是你在教 AI，是 AI 在观察你，然后自己学会你想要什么。

三层记忆系统

自学习能运作的底层基础是记忆。Hermes 有三层独立且互相配合的记忆：

┌─────────────────────────────────────────────────────────┐ │ Hermes 三层记忆系统 │ ├──────────────┬──────────────┬──────────────────────────────┤ │ 会话记忆 │ 持久记忆 │ 技能记忆 │ │ (Session) │ (Persistent) │ (Skill) │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 当前对话上下文 │ 跨会话保留 │ 可执行的规则和模板 │ │ 生命周期： │ 生命周期： │ 生命周期： │ │ 直到 /clear │ 直到主动删除 │ 直到被新版本替代 │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 存储内容： │ 存储内容： │ 存储内容： │ │ - 你说过什么 │ - 你的身份 │ - 代码风格规则 │ │ - AI 回复什么 │ - 你的偏好 │ - 项目架构约定 │ │ - 读过的文件 │ - 项目信息 │ - 常用工作流模板 │ │ - 当前任务状态│ - 被纠正的历史 │ - 自动生成的 Checklist │ ├──────────────┼──────────────┼──────────────────────────────┤ │ 存储后端： │ 存储后端： │ 存储后端： │ │ SQLite │ SQLite FTS5 │ 文件系统 (SKILL.md) │ │ sessions 表 │ memories 表 │ ~/.hermes/skills/ │ └──────────────┴──────────────┴──────────────────────────────┘

会话记忆 vs 持久记忆

会话记忆 = "刚才聊了什么" → 你说了需求 → AI 开始写代码 → 你纠正了一个 Bug → AI 修复 → 这些都在当前对话里。但关闭对话后就没了。 持久记忆 = "你是谁 + 你的世界是什么样的" → "Barry，全栈工程师，偏好 FastAPI + React + TypeScript" → "项目 my-app 的数据库用 PostgreSQL，API 用 RESTful 风格" → "代码注释用中文，变量命名用小驼峰" → 这些信息跨会话保留。下次新对话一开始就能用。

技能记忆 = 持久记忆的"可执行版本"

持久记忆："用户偏爱函数式风格" ← 但不够具体 技能记忆（SKILL.md）： """ 代码风格规则： 1. 优先使用 map/filter/reduce，避免 for 循环 2. 函数不超过 20 行，超过则拆分 3. 每个函数必须有类型标注 4. 错误处理用 Result 模式，不抛异常 """ ← 可被直接加载到 Agent 的 System Prompt 中，指导行为

技能记忆的关键在于它是自动生成的——不是你手动创建的，是 Hermes 观察你的纠正和反馈后自己提炼的。第 23-24 篇会深入拆解这个过程。

20+ 平台网关

Hermes 不只是一个终端工具——它可以接入你日常使用的所有通讯平台：

┌──────────────────────────────┐ │ Hermes Agent │ │ (同一个 Agent，统一人格) │ └──────────┬───────────────────┘ │ ┌────────────┼────────────┬──────────┬─────────┐ ▼ ▼ ▼ ▼ ▼ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌───────┐ ┌─────────┐ │Telegram │ │ 飞书 │ │ Discord │ │ Slack │ │WhatsApp │ └─────────┘ └─────────┘ └─────────┘ └───────┘ └─────────┘ ▼ ▼ ▼ ▼ ▼ 群聊/私聊 群聊/私聊 频道/私聊 频道/私聊 私聊

这意味着什么？

你不需要在不同平台维护不同的 AI 配置。你的 Hermes 只有一个"人格"，但同时在 Telegram、飞书、Discord、Slack 上在线。你在飞书上纠正过它一次，它在 Telegram 上也会记住。

早上在飞书上： 你：@Hermes 今天的 Hacker News 头条帮我总结下 Hermes：回复 5 条今日头条摘要 下午在 Telegram 上： 你：@Hermes 帮我查下 PostgreSQL 连接池配置 Hermes：自动用中文回复，并且代码风格和你早上纠正的一致（还记得）

200+ 模型支持

Hermes 不绑定任何一家模型供应商。它支持 Anthropic、OpenAI、Google、Meta、DeepSeek 等几乎所有主流 API，也支持 Ollama 本地模型。

Provider │ 模型举例 │ 适用场景 ──────────────┼──────────────────────────┼───────────── Anthropic │ Claude Opus/Sonnet/Haiku │ 主力推理和编码 OpenAI │ GPT-5.5 / GPT-5.3 │ 代码生成 DeepSeek │ DeepSeek-V3 / R1 │ 省钱（成本 1/15） Google │ Gemini 2.5 Pro/Flash │ 长文本理解 Meta │ Llama 4 │ 本地部署 Ollama │ 任意本地模型 │ 零 API 费用

模型选择直接影响成本。重度使用 Hermes，用 DeepSeek 模型月均 $10-30；用 Claude Opus 可能到 $100-200。第 41 篇会详细拆解成本优化策略。

与 OpenClaw 的互补关系

这是很多人困惑的地方——两个工具看起来都能"让 AI 干活"，到底怎么选？

OpenClaw = 广度：管理一群各有所长的 Agent → 像项目经理：拆任务、分任务、协调并行、汇总结果 → 每个 Worker 不需要了解你，只需要完成自己的子任务 → 核心能力在"分工协作" Hermes = 深度：培养一个真正懂你的 AI → 像私人助理：记住你的一切、学习你的习惯、预判你的需求 → 单个 Agent 随着时间积累对你的理解越来越深 → 核心能力在"长期记忆和自进化"

两者不是二选一，而是互补：

日常工作中： 用 Hermes 做你的个人助理 → 管理你的日程、记住你的偏好、跨平台回复 → 把 Hermes 接入飞书和 Telegram，随时可调用 用 OpenClaw 处理复杂工程任务 → 重构代码、多模块并行开发、自动化流水线 → 遇到需要"一个团队"完成的任务时调用 两者可以配合： Hermes 了解你的项目背景和偏好 → 把上下文传递给 OpenClaw 的 Orchestrator → Orchestrator 分配任务给 Worker → 结果返回给你和 Hermes → Hermes 学习这次的协作模式

什么时候该用 Hermes

✅ 适合用 Hermes 的场景： 1. 你需要在多个平台上和 AI 交互 → Telegram 上查资料、飞书上做摘要、手机上随时问问题 → 一个 Hermes 全部搞定，跨平台保持统一人格 2. 你有重复性的日常任务需要自动化 → 每日晨报、股票统计、周报生成、代码健康检查 → Hermes 的 Scheduler 定时执行（第 29 篇） 3. 你希望 AI 真的"懂你"而不是每次都重来 → 你的代码风格、你的项目架构、你的沟通偏好 → 自学习让 AI 越用越贴合你的习惯 4. 你关注隐私，希望数据留在本地 → 所有记忆存在本地 SQLite + 文件系统 → 用 Ollama 本地模型时，数据完全不离开你的机器 ❌ 不太适合的场景： 1. 复杂的多 Agent 并行任务 → Hermes 是单 Agent 设计，没有 Orchestrator/Worker 分工 → 这种场景用 OpenClaw 2. 需要高强度编码的生产级开发 → Hermes 擅长"理解你"，不是"写大量高质量代码" → 编码场景用 Claude Code（或把 Claude Code 接入 Hermes）

这篇文章的要点

1. Hermes Agent 的核心差异化：自进化 → 不是用后即弃，而是越用越聪明 → 五步闭环：执行→复盘→提炼→生成 Skill→应用→再执行 2. 三层记忆系统是自进化的基础设施： → 会话记忆（当前对话）→ 持久记忆（跨会话）→ 技能记忆（可执行规则） → 每一层都有明确的生命周期和存储方式 3. 20+ 平台网关让你在任何地方用同一个 AI： → 飞书、Telegram、Discord、Slack、WhatsApp 同时在线 → 统一的记忆、统一的人格 4. Hermes 和 OpenClaw 是互补关系： → OpenClaw = 广度（管理 Agent 团队） → Hermes = 深度（培养懂你的 AI） → 两者可以而且应该一起用 5. 读完这篇文章，你应该能回答： → Hermes 和 ChatGPT 最本质的区别是什么？ → 自学习闭环是怎么运作的？ → 我应该用 Hermes 还是 OpenClaw，还是两个都用？