Hermes Agent 深度指南:一个会“自我进化“的 AI Agent,通俗易懂全解析
Hermes Agent 深度指南:一个会"自我进化"的 AI Agent,通俗易懂全解析
写在前面:如果你觉得现在的 AI 助手"只会聊天、不会干活",或者"每次对话都要从头教它",那Hermes Agent绝对值得你了解。它不仅能调用工具、执行任务,还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言,带你从零搞懂它。
一、Hermes Agent 是什么?一句话说清楚
Hermes Agent是由 Nous Research 开源的 AI 智能体(Agent),用一句话概括:
它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯,还能在 Telegram/Discord/Slack 等平台上随时为你服务。
你可以把它想象成一个有记忆的、能自我成长的 AI 员工:
- 🧠有记忆:它记得你是谁、你上次让它做了什么
- 📚会学习:完成复杂任务后,自动总结成"技能",下次直接复用
- 🔧能干活:40+ 内置工具,能操作文件、搜索网页、执行代码、管理服务器……
- 📱随处可用:终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
- 💰成本低:支持 200+ 种模型,可以在 $5 的 VPS 上运行,空闲时几乎不花钱
二、为什么说它是"自我进化"的 Agent?
市面上大部分 AI Agent 的工作流程是:
用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束(啥也没记住)Hermes Agent 不一样,它有一个闭环学习系统:
用户提问 → LLM 思考 → 调用工具 → 返回结果 ↓ 经验够丰富吗?── 是 ──→ 自动创建"技能" ↓ 下次遇到类似任务 → 直接用技能(更快更准) ↓ 技能使用中 → 发现可以改进?→ 自动优化技能 ↓ 定期"自省" → 把重要信息存入持久记忆 ↓ 跨会话搜索 → 能找到你几周前的对话上下文 ↓ 用户建模 → 越来越了解你的偏好和习惯2.1 五大"自我进化"能力详解
| 能力 | 通俗解释 | 举个例子 |
|---|---|---|
| 技能自动创建 | 完成复杂任务后,自动把步骤总结成可复用的"技能" | 你让它部署一个网站,它做完后自动生成一个"deploy-website"技能 |
| 技能自我改进 | 技能在使用过程中会被自动优化 | "deploy-website"技能用了三次后,它自己发现可以加个缓存步骤 |
| 定期自省 | Agent 会主动提醒自己把重要信息存下来 | 它会自动把"这个用户喜欢用pnpm而不是npm"记下来 |
| 跨会话搜索 | 能搜索过去的对话记录,用 LLM 总结上下文 | 你问"上次那个React项目的部署命令是啥",它能找到两周前的对话 |
| 用户建模 | 通过 Honcho 系统建立你的偏好画像 | 它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code |
三、核心特性一览
Hermes Agent 不是普通的聊天机器人,它有这些硬核能力:
3.1 真正的终端界面
不是简单的命令行一问一答,而是一个全功能 TUI(终端用户界面):
- ✅ 多行编辑
- ✅ 斜杠命令自动补全
- ✅ 对话历史浏览
- ✅ 中断并重定向(干到一半可以改需求)
- ✅ 工具输出实时流式显示
3.2 随处部署,不限平台
Hermes 的设计理念是:AI 不应该绑在你的电脑上。
┌─── Telegram ────┐ │ │ 用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务 │ │ (云端/本地) ├─── Slack ────────┤ │ │ ├─── WhatsApp ─────┤ │ │ ├─── Signal ───────┤ │ │ └─── CLI 终端 ─────┘你可以在Telegram 上发语音消息,它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题,完全没问题。
3.3 定时任务
内置 cron 调度器,可以用自然语言设置定时任务:
# 在对话中直接说:"每天早上9点给我发一份服务器状态报告""每周五下午5点备份数据库""每天凌晨2点检查网站是否正常"它会自动创建 cron 任务,结果推送到你指定的平台(Telegram/Discord/邮箱等)。
3.4 子代理 & 并行任务
可以派生子代理,让多个任务并行执行:
你:"帮我同时做三件事: 1. 搜索最新的 React 19 变化 2. 检查服务器的磁盘空间 3. 写一个 Python 脚本处理 CSV" Hermes:├── 子代理 A:搜索 React 19 变更 ├── 子代理 B:SSH 到服务器检查磁盘 └── 子代理 C:编写 Python 脚本 ↓ 全部完成后,汇总结果给你3.5 灵活的模型支持
不绑定任何一家模型供应商,想用哪个用哪个:
| 供应商 | 说明 |
|---|---|
| Nous Portal | Nous Research 自家平台 |
| OpenRouter | 200+ 种模型可选 |
| NovitaAI | AI 原生云平台 |
| NVIDIA NIM | Nemotron 等模型 |
| 小米 MiMo | 小米 AI 平台 |
| z.ai/GLM | 智谱 AI |
| Kimi/Moonshot | 月之暗面 |
| MiniMax | MiniMax |
| Hugging Face | 开源模型 |
| OpenAI | GPT 系列 |
| 自定义端点 | 你的私有模型 |
切换模型只需一行命令:
hermes model# 交互式选择模型四、安装教程(手把手教你)
4.1 Linux / macOS / WSL2(推荐)
一行命令搞定:
curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash安装完成后:
source~/.bashrc# 刷新环境变量(zsh 用户用 source ~/.zshrc)hermes# 启动!4.2 Windows 原生(PowerShell,早期 Beta)
iex(irmhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)⚠️Windows 原生支持还在早期测试阶段。如果遇到问题,推荐用 WSL2 方式安装(即用 Linux 那行命令)。
安装器会自动处理:Python 3.11、Node.js、ripgrep、ffmpeg,以及一个便携版 Git Bash(约 45MB,不需要管理员权限,不影响系统 Git)。
4.3 Android / Termux
参考官方文档中的 Termux 指南。
4.4 Docker 部署
Hermes 支持七种终端后端:
| 后端 | 适用场景 |
|---|---|
| Local | 本地开发 |
| Docker | 容器化部署 |
| SSH | 远程服务器 |
| Singularity | HPC 集群 |
| Modal | Serverless(按需计费) |
| Daytona | Serverless 开发环境 |
| Vercel Sandbox | 边缘计算 |
💡省钱技巧:用 Modal 或 Daytona 的 serverless 模式,空闲时几乎不花钱,有请求时自动唤醒。
五、快速上手(5 分钟从安装到对话)
5.1 基础设置
hermes setup# 运行完整设置向导(配置模型、工具等)hermes model# 选择 LLM 提供商和模型hermes tools# 配置启用的工具hermes configset# 设置单个配置项5.2 开始对话
hermes# 启动交互式终端进入后你会看到一个漂亮的 TUI 界面,直接打字就能聊天。
5.3 常用命令速查
| 命令 | 作用 | 通俗理解 |
|---|---|---|
/new或/reset | 开始新对话 | “把之前的上下文清空,重新开始” |
/model | 切换模型 | “换个大脑” |
/personality | 设置人格 | “让 AI 扮演某个角色” |
/retry | 重试上一轮 | “刚才的回答不满意,再来一次” |
/undo | 撤销上一轮 | “假装上一轮没发生” |
/compress | 压缩上下文 | “总结一下之前的对话,省点 token” |
/skills | 浏览技能 | “看看我学会了哪些技能” |
/stop | 中断当前任务 | “停下!我有新想法” |
/usage | 查看 token 用量 | “看看花了多少钱” |
六、技能系统:Hermes 的"肌肉记忆"
这是 Hermes Agent 最与众不同的特性,值得单独用一章讲。
6.1 什么是"技能"?
技能(Skill)就是 Agent 从经验中自动提取的可复用操作流程。
打个比方:
你第一次让 AI “部署一个 Node.js 应用到服务器”,它可能需要 10 步才能完成。
做完后,它会自动创建一个deploy-nodejs技能。
下次你说"部署 Node.js",它直接调用技能,3 步搞定。
6.2 技能的生命周期
初次使用 ──→ 任务完成 ──→ 经验足够? │ 是 ◄─────────┘ │ ▼ 自动创建技能文件 (保存到 ~/.hermes/skills/) │ ▼ 下次遇到类似任务 │ ▼ 直接调用技能(省去思考时间) │ ▼ 使用过程中发现改进点? │ 是 ▼ 自动优化技能内容6.3 技能市场(Skills Hub)
Hermes 还有一个开放的技能市场:agentskills.io
- 🔍 搜索别人分享的技能
- 📦 一键安装社区技能
- 🎁 分享你自己创建的技能
- 📋 兼容 agentskills.io 开放标准
七、记忆系统:Hermes 的"大脑"
7.1 持久记忆
Hermes 的记忆不是"聊完就忘",而是跨会话持久化的:
今天你告诉它:"我喜欢用 TypeScript" ↓ 明天你开新对话,它已经知道了 ↓ 一周后你让它写代码,它默认就用 TypeScript7.2 用户画像(Honcho)
Hermes 使用 Honcho 系统进行用户建模:
第 1 次对话:"我是做前端的" → 记录:用户职业 = 前端开发 第 5 次对话:"帮我用 React 写个组件" → 强化:前端 + React 第 20 次对话:"这个组件用 Tailwind 好看" → 补充:偏好 Tailwind CSS 结果:它已经完全了解你的技术栈和偏好了7.3 会话搜索
使用 FTS5(全文搜索引擎)+ LLM 摘要:
你:"两周前我让你分析的那个 Python 性能问题,结论是什么?"Hermes:→ 搜索历史会话 → 找到相关对话 → LLM 总结上下文 →"你当时那个 Flask 接口慢的原因是数据库查询没加索引……"八、消息网关:让 AI 活在你的聊天软件里
8.1 什么是消息网关?
消息网关(Messaging Gateway)让 Hermes 连接到你的聊天平台:
hermes gateway setup# 配置网关(绑定 Telegram Bot 等)hermes gateway start# 启动网关8.2 支持的平台
| 平台 | 特色功能 |
|---|---|
| Telegram | 语音消息转文字、跨平台连续对话 |
| Discord | 服务器管理、频道消息处理 |
| Slack | 工作空间集成 |
| 随时随地对话 | |
| Signal | 端到端加密 |
| 邮件收发 |
8.3 实际使用场景
场景 1:你在地铁上 → 打开 Telegram,发语音:"帮我看看服务器 CPU 使用率" → Hermes 在云端 VPS 上执行,把结果发回 Telegram 场景 2:你在开会 → Discord 上同事问了个技术问题 → @Hermes Bot,它直接回答 场景 3:你下班了 → Hermes 按计划执行定时任务 → 有问题自动给你发 Slack 通知九、MCP 集成:无限扩展
9.1 什么是 MCP?
MCP(Model Context Protocol)是一个让 AI Agent 连接外部工具和服务的标准协议。
你可以理解为:
MCP 就像是给 AI 装了一个"万能插头",什么工具都能接。
9.2 怎么用?
hermes tools# 在工具配置中添加 MCP 服务器比如你可以连接:
- 🖥️ computer-use-linux — 控制 Linux 桌面
- 🌐 浏览器自动化
- 🗄️ 数据库操作
- 📁 文件系统
- ……
十、安全机制:别担心,它很安全
10.1 命令审批
不是所有命令都能直接执行。Hermes 有命令审批机制:
Hermes 要执行:rm -rf /tmp/old-builds ↓ 在审批名单里?── 是 ──→ 直接执行 │ 否 ↓ 弹出确认:"Hermes 想执行 rm -rf /tmp/old-builds,允许吗?" ↓ 你确认后才执行10.2 其他安全特性
| 特性 | 说明 |
|---|---|
| DM 配对 | 只有你指定的用户才能和 Bot 对话 |
| 容器隔离 | 在 Docker 容器中执行,不影响宿主机 |
| 密钥安全 | API Key 独立存储,不混在对话中 |
十一、架构与项目结构
对于想深入了解或参与贡献的开发者,这里简单介绍 Hermes 的架构:
11.1 Agent Loop(核心循环)
用户输入 │ ▼ ┌─────────────────────────┐ │ 1. 理解意图 │ │ 2. 检查技能库 │ │ 3. 选择工具/技能 │ │ 4. 执行操作 │ │ 5. 观察结果 │ │ 6. 判断是否完成 │ │ ├── 完成 → 返回结果 │ │ └── 未完成 → 回到 3 │ │ 7. 评估是否值得记住 │ │ ├── 是 → 存入记忆 │ │ └── 否 → 继续 │ │ 8. 评估是否值得提取技能 │ │ ├── 是 → 创建技能 │ │ └── 否 → 继续 │ └─────────────────────────┘11.2 参与贡献
gitclone https://github.com/NousResearch/hermes-agent.gitcdhermes-agent ./setup-hermes.sh# 自动安装所有依赖./hermes# 启动开发版本十二、从 OpenClaw 迁移
如果你之前用的是 OpenClaw(OpenHands 的一个分支),Hermes 提供了一键迁移:
hermes claw migrate# 交互式迁移hermes claw migrate --dry-run# 先预览,看看会迁移什么hermes claw migrate--overwrite# 覆盖已有冲突会自动导入:
- ✅ 人格文件(SOUL.md)
- ✅ 记忆(MEMORY.md、USER.md)
- ✅ 技能
- ✅ 命令白名单
- ✅ 消息平台配置
- ✅ API 密钥
- ✅ TTS 资源
十三、Hermes Agent vs 其他 Agent 框架对比
| 对比维度 | Hermes Agent | AutoGPT | CrewAI | LangChain Agent |
|---|---|---|---|---|
| 自我学习 | ✅ 自动创建和改进技能 | ❌ | ❌ | ❌ |
| 用户建模 | ✅ Honcho 系统建立用户画像 | ❌ | ❌ | ❌ |
| 跨会话记忆 | ✅ FTS5 搜索 + LLM 摘要 | 有限 | ❌ | 需自己实现 |
| 消息平台 | ✅ Telegram/Discord/Slack/WhatsApp/Signal | ❌ | ❌ | ❌ |
| 定时任务 | ✅ 内置 cron | ❌ | ❌ | ❌ |
| 子代理并行 | ✅ 内置 | ❌ | ✅ | 需自己实现 |
| 模型绑定 | ❌ 支持 200+ 模型 | OpenAI | 任意 | 任意 |
| 安装难度 | ⭐ 一行命令 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐ |
| 运行成本 | $5 VPS 即可 | 需要 OpenAI | 取决于模型 | 取决于模型 |
| 开源协议 | MIT | MIT | MIT | MIT |
十四、实战:用 Hermes Agent 做几件酷事
14.1 场景一:自动日报
你:"每天早上9点,总结我的 GitHub 活动和服务器状态,发到 Telegram" Hermes: 1. 创建 cron 任务 2. 每天早上 9 点: - 查 GitHub API 获取昨日 commit/PR - SSH 到服务器获取 CPU/内存/磁盘数据 - 生成漂亮的结构化报告 - 推送到你的 Telegram14.2 场景二:代码审查助手
你在 Discord 频道发: "@hermes 帮我 review 一下 PR #42" Hermes: 1. 调用 GitHub API 获取 PR diff 2. 分析代码质量、安全风险、性能问题 3. 在 Discord 频道回复审查意见14.3 场景三:学习新技能
第一次: 你:"帮我用 Docker 部署一个 PostgreSQL 主从集群" Hermes:→ 查资料 → 写配置 → 测试 → 成功 → 自动创建 skill: "deploy-postgres-cluster" 第二次: 你:"帮我部署 PG 集群" Hermes:→ 直接调用技能 → 3秒搞定 ✅十五、常见问题 FAQ
Q1:Hermes Agent 免费吗?
✅完全开源免费(MIT 协议)。但你需要为使用的 LLM 模型付费(也可以用免费模型)。
Q2:我需要 GPU 吗?
❌不需要。Hermes 本身不跑模型,它调用外部 LLM API。只需要一台能上网的机器就行。
Q3:支持中文吗?
✅ 支持。取决于你选择的 LLM 模型是否支持中文(比如 GLM、Kimi 等国产模型原生支持)。
Q4:数据安全吗?
🔒 所有数据存在你自己的机器上(
~/.hermes/目录)。不会上传到任何第三方服务器。
Q5:可以在手机上用吗?
✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。
Q6:和 ChatGPT 有什么区别?
ChatGPT 是"聊天工具",Hermes 是"AI 员工"。ChatGPT 聊完就忘,Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。
Q7:怎么更新?
hermes update# 一键更新到最新版hermes doctor# 诊断问题
十六、总结
Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目:
| 优势 | 说明 |
|---|---|
| 🧠会学习 | 自动从经验中提取技能,越用越聪明 |
| 💾有记忆 | 跨会话记住你的偏好和上下文 |
| 📱随处可用 | 终端、Telegram、Discord、Slack……全平台覆盖 |
| 🔧能干活 | 40+ 工具,定时任务,并行子代理 |
| 💰成本低 | $5 VPS 即可运行,支持 200+ 模型 |
| 🔓完全开源 | MIT 协议,代码完全透明 |
GitHub 地址:https://github.com/NousResearch/hermes-agent
官方文档:https://hermes-agent.nousresearch.com/docs/
Discord 社区:https://discord.gg/NousResearch
如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。祝你早日拥有自己的 AI 员工!🤖
