受够了openclaw的失忆,我本周爱上了Hermes agent
大多数人以为 Hermes 只是一个 AI 聊天框架。但它实际上是一个可长期运行、多角色协作、多入口接入的 Agent Runtime,已经非常接近真正意义上的 AI Operating System。
Hermes Agent 在不到三个月内突破 14 万 GitHub Star,并根据 OpenRouter 的数据成为目前全球使用量最大的 Agent。
在折腾了2个月,受够了openclaw的失忆后,我尝试用业界火热的爱马仕agent,效果居然出奇的好,因此写下这篇安利Hermes的文章。

关键词: #openclaw #Hermes
能力标签: 多Agent协作 · 长期记忆隔离 · 子代理并行 · 多用户隔离 · 任务编排 · Agent Runtime

为什么这么火?三个根本原因:
1. 解决了 Agent 领域最痛的问题——失忆
Hermes 要解决的正是这个问题,不是用 prompt 技巧,而是在架构层面内置了一个闭环学习机制——运行时间越长,它就越了解你。
2. 自我进化的技能系统
Hermes 有四个核心差异化能力,其中最突出的是"自进化技能"——它会自己编写并优化 skill 文档。 每当 Hermes 解决一个困难问题,它就会写下一份可复用的 skill 文档,之后永远不会忘记这个解法。这些 skill 可搜索、可共享,并兼容 agentskills.io 开放标准。
3. 真正开源、极低门槛、隐私友好
Hermes 由 Nous Research 开发,MIT 协议开源,支持 Linux / macOS / WSL2,一行 curl 命令自动完成所有安装,无需手动配置。所有数据留在本地,没有遥测,没有追踪,没有云锁定。
Hermes 火在时机对(大家都被"失忆 Agent"折磨够了)+ 架构真不同(持久记忆 + 自我进化)+ 开源免费好上手,三者叠加,引爆了社区。
理解 Hermes 的关键,在于它的多 Agent 能力并非简单的"多开几个窗口",而是由三个相互独立又可组合的层次构成的完整体系。
三层 Agent 体系
从长期状态管理到动态任务并行,再到多用户隔离,形成完整的 Runtime 能力栈。
| 层次 | 名称 | 核心能力 |
|---|---|---|
| 第一层 | 多 Profile 长期 Agent | 独立记忆、独立配置、独立工具状态 |
| 第二层 | 子代理并行(Subagents) | 任务拆解、并发执行、多模型协作 |
| 第三层 | 多用户 Session 隔离 | Per-user Context、会话状态独立 |

第一层:多个长期 Agent(Profile)
Profile 机制是 Hermes 最实用、上手成本最低的多 Agent 方式。你可以把它理解为:在同一台机器里运行多个真正隔离的长期 AI Worker,而不是简单地用不同 Prompt 扮演不同角色。
最大的区别在于:记忆是隔离的。coder 不会记住 research 的聊天历史,ops 不会污染 coder 的上下文。这是绝大多数 Agent 框架做不到的事情——它们所谓的"多 Agent",本质上只是同一个上下文池里的角色扮演。
三个典型 Agent 示例

coder
- 写代码 / PR Review
- 自动修 Bug
- MCP 开发工具链
- 代码库长期上下文
ops
- VPS / Docker 运维
- Kubernetes 管理
- 日志巡检 & 告警
- 定时任务编排
research
- 网页检索 & 摘要
- 市场研究
- 新闻追踪
- 报告生成
创建与切换
# 创建多个长期 Agent
hermes profile create coder
hermes profile create ops
hermes profile create research# 查看所有 Agent
hermes profile list# 切换到指定 Agent
hermes -p coder
hermes -p ops
第二层:子代理并行(Subagents)
这是 Hermes 开始真正像 Agent Runtime 的地方。在一次任务中,主 Agent 可以自动拆解目标,动态拉起多个隔离子 Agent 并发执行,最后统一汇总结果。
这不是简单的多线程,而是具备认知分工能力的并行——每个子代理有自己的工具调用权限和上下文,互不干扰。
并行任务示例
任务:"分析英伟达、AMD、台积电财报,给出 AI 算力产业链结论"
主 Agent(规划 · 汇总 · 结论)├── 子 Agent A:英伟达财报分析├── 子 Agent B:AMD 财报分析└── 子 Agent C:台积电产业链分析↓并发完成 · 统一汇总 · 输出最终报告
进阶:模型分层部署,大幅降低成本
子任务和最终决策可以使用不同量级的模型,在保证质量的同时显著降低成本。
| 层次 | 职责 | 推荐模型 |
|---|---|---|
| 子任务层(低成本) | 检索 / 摘要 / 分类 | GLM、Kimi、MiniMax |
| 决策层(高质量) | 推理 / 汇总 / 长链决策 | GPT-5、Claude、DeepSeek R1 |
第三层:多用户 Session 隔离
对于需要多人共用同一 Hermes 实例的场景,Session 隔离至关重要。只需一行配置:
# hermes.config.yaml
group_sessions_per_user: true
开启后,不同用户各自拥有独立的上下文、记忆和会话状态。这解决了共享 Agent 系统最常见的三个问题:
- 用户之间上下文串线
- 历史记忆污染
- 长期状态错乱
在团队协作或 SaaS 产品场景下,这一层的价值不可忽视。
三种推荐架构
选择的核心标准是:你更需要协作效率,还是隔离稳定性?
| 架构 | 结构 | 适合场景 | 隔离性 | 协作性 |
|---|---|---|---|---|
| 主 Agent + 多 Profile(推荐) | Router 分发给子 Profile | AI 团队协作、任务分工 | ✅ 高 | ✅ 高 |
| 完全独立多 Agent | 各 Profile 完全独立运行 | 权限严格隔离、稳定优先 | ✅ 极高 | ❌ 低 |
| Hermes + OpenClaw 共存 | OpenClaw 轻量 CLI + Hermes 长期运行 | 高级用户、生产环境 | ✅ 高 | ✅ 高 |
关于架构三:Hermes + OpenClaw 共存
OpenClaw 保持轻量,负责本地 CLI 快速执行;Hermes 负责长期在线、自动化任务和多 Agent 编排。两套系统定位不同,互不冲突,组合后覆盖从快速迭代到长期运行的全场景。
Hermes 最厉害的地方
不是"支持很多模型",也不是配置灵活——而是它已经具备了 AI 基础设施的雏形。当多 Agent、多入口、长期记忆、子代理、任务编排这些能力组合在一起,Hermes 已经不是一个聊天工具,而是一个正在成形的 AI Operating System。
核心差异总结
大多数框架的"多 Agent" = 同一个上下文池 + 不同 Prompt。
Hermes 的多 Agent = 真正隔离的长期状态 + 可编排的并发执行 + 多用户独立会话。
这是质的不同,不是量的差距。
