Hermes Agent 深度解析:从架构、安装、核心能力到与 OpenClaw 的区别
一、前言
近两年,AI Agent 项目越来越多。从早期的 AutoGPT,到面向开发者的 Claude Code、OpenAI Codex CLI,再到各种本地个人助手类项目,大家都在探索一个问题:
如何让大模型不只是“回答问题”,而是真正能调用工具、执行任务、积累经验,并长期为用户工作?
NousResearch 开源的Hermes Agent就是这类项目中的一个代表。它不是一个简单的聊天机器人,而是一个集成了模型调用、工具系统、长期记忆、技能系统、定时任务、多平台消息网关、子代理和研究数据生成能力的 AI Agent 框架。
同时,很多人也会把 Hermes Agent 和OpenClaw放在一起比较。两者都支持工具调用、消息平台接入、长期运行和个人自动化,但它们的设计目标并不完全相同。
本文将系统梳理:
- Hermes Agent 是什么;
- Hermes Agent 的核心能力;
- Hermes Agent 的架构设计;
- Hermes Agent 如何安装和使用;
- Hermes Agent 适合哪些场景;
- Hermes Agent 与 OpenClaw 的核心区别。
二、Hermes Agent 是什么?
Hermes Agent是 NousResearch 开源的一个自进化 AI Agent 框架。
它的核心目标不是做一个普通聊天工具,而是构建一个可以长期运行、能够调用工具、能够保存记忆、能够沉淀技能,并且可以在不同平台上工作的智能代理系统。
可以把 Hermes Agent 理解为:
Claude Code / Codex CLI 类工具 + 个人自动化机器人 + 多平台聊天网关 + 技能系统 + 长期记忆系统 + Agent 研究平台。
它既可以在本地终端里运行,也可以部署到 VPS、Docker、SSH 远程服务器、云端沙箱等环境中。用户既可以通过 CLI 和 TUI 与它交互,也可以通过 Telegram、Discord、Slack、WhatsApp 等消息平台远程调用它。
三、Hermes Agent 的核心能力
1. 多模型支持
Hermes Agent 不绑定某一个模型厂商,而是支持多种模型服务和自定义端点。
它可以接入:
- Nous Portal;
- OpenRouter;
- NVIDIA NIM;
- OpenAI;
- Hugging Face;
- Kimi / Moonshot;
- MiniMax;
- GLM / z.ai;
- 自定义 OpenAI-compatible endpoint。
用户可以通过命令切换模型,而不是修改代码。
这一点对 Agent 框架非常重要,因为 Agent 通常需要较强的工具调用能力和较大的上下文窗口。Hermes Agent 官方也建议使用至少 64K token 上下文窗口的模型,否则复杂任务体验会明显变差。
2. CLI、TUI 和多平台消息入口
Hermes Agent 提供多种交互入口。
最基础的是命令行:
hermes也可以启动新的 TUI 界面:
hermes--tui除此之外,Hermes Agent 还支持 Gateway 模式,可以把 Agent 接入各种消息平台,例如:
- Telegram;
- Discord;
- Slack;
- WhatsApp;
- Signal;
- Email;
- Matrix;
- Mattermost;
- Feishu / Lark;
- Microsoft Teams;
- Home Assistant。
这意味着用户可以把 Hermes Agent 部署在服务器上,然后通过手机上的 Telegram 或 Slack 给它下达任务。
例如:
帮我检查服务器日志,找出最近 1 小时内的错误,并总结原因。或者:
每天早上 9 点帮我检查 GitHub issues,并把摘要发到 Telegram。这让 Hermes Agent 不只是一个本地 CLI 工具,而更像一个长期在线的 AI 助手。
3. 强大的工具系统
Hermes Agent 的重点能力之一是工具调用。
它不仅能回答问题,还可以调用工具完成实际操作。常见工具包括:
| 工具类别 | 能力示例 |
|---|---|
| Web 工具 | 搜索网页、提取网页内容 |
| 文件工具 | 读取文件、修改文件、打补丁 |
| 终端工具 | 执行 shell 命令、运行脚本 |
| 浏览器工具 | 打开网页、浏览器自动化 |
| 图像工具 | 图像分析、图像生成 |
| 语音工具 | 文本转语音、语音消息处理 |
| 记忆工具 | 保存长期记忆、检索历史会话 |
| 自动化工具 | 创建定时任务、发送消息 |
| 子代理工具 | 把任务分派给多个子 Agent 并行执行 |
这些工具会被组织成不同的toolsets。不同场景下可以启用不同工具集。
例如:
- 本地开发时可以启用 terminal、file、browser;
- Telegram 远程控制时可以关闭高风险工具;
- 自动化任务中可以只启用 web、cron、messaging;
- 生产环境中可以把 shell 工具放进 Docker 或 SSH 隔离环境。
这种设计可以让 Hermes Agent 在能力和安全之间取得平衡。
4. Skills 技能系统
Hermes Agent 的一个重要特性是Skills。
Skills 可以理解为 Agent 的可复用经验包。每个 skill 通常包含一个SKILL.md文件,用来描述某个任务的流程、规则、注意事项和可用资源。
它的优势是:
- 不需要每次都在 prompt 里塞满所有知识;
- 只在需要时加载相关技能;
- 可以把重复任务沉淀成固定流程;
- Agent 可以在完成任务后总结经验,创建或改进 skill。
例如,针对 GitHub PR 工作流,可以做一个 skill:
