当前位置：首页 > news >正文

Hermes Agent 深度指南：一个会“自我进化“的 AI Agent，通俗易懂全解析

news 2026/5/23 22:19:21

Hermes Agent 深度指南：一个会"自我进化"的 AI Agent，通俗易懂全解析

写在前面：如果你觉得现在的 AI 助手"只会聊天、不会干活"，或者"每次对话都要从头教它"，那Hermes Agent绝对值得你了解。它不仅能调用工具、执行任务，还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言，带你从零搞懂它。

一、Hermes Agent 是什么？一句话说清楚

Hermes Agent是由 Nous Research 开源的 AI 智能体（Agent），用一句话概括：

它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯，还能在 Telegram/Discord/Slack 等平台上随时为你服务。

你可以把它想象成一个有记忆的、能自我成长的 AI 员工：

🧠有记忆：它记得你是谁、你上次让它做了什么
📚会学习：完成复杂任务后，自动总结成"技能"，下次直接复用
🔧能干活：40+ 内置工具，能操作文件、搜索网页、执行代码、管理服务器……
📱随处可用：终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
💰成本低：支持 200+ 种模型，可以在 $5 的 VPS 上运行，空闲时几乎不花钱

二、为什么说它是"自我进化"的 Agent？

市面上大部分 AI Agent 的工作流程是：

用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束（啥也没记住）

Hermes Agent 不一样，它有一个闭环学习系统：

用户提问 → LLM 思考 → 调用工具 → 返回结果 ↓ 经验够丰富吗？── 是 ──→ 自动创建"技能" ↓ 下次遇到类似任务 → 直接用技能（更快更准） ↓ 技能使用中 → 发现可以改进？→ 自动优化技能 ↓ 定期"自省" → 把重要信息存入持久记忆 ↓ 跨会话搜索 → 能找到你几周前的对话上下文 ↓ 用户建模 → 越来越了解你的偏好和习惯

2.1 五大"自我进化"能力详解

能力	通俗解释	举个例子
技能自动创建	完成复杂任务后，自动把步骤总结成可复用的"技能"	你让它部署一个网站，它做完后自动生成一个"deploy-website"技能
技能自我改进	技能在使用过程中会被自动优化	"deploy-website"技能用了三次后，它自己发现可以加个缓存步骤
定期自省	Agent 会主动提醒自己把重要信息存下来	它会自动把"这个用户喜欢用pnpm而不是npm"记下来
跨会话搜索	能搜索过去的对话记录，用 LLM 总结上下文	你问"上次那个React项目的部署命令是啥"，它能找到两周前的对话
用户建模	通过 Honcho 系统建立你的偏好画像	它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code

三、核心特性一览

Hermes Agent 不是普通的聊天机器人，它有这些硬核能力：

3.1 真正的终端界面

不是简单的命令行一问一答，而是一个全功能 TUI（终端用户界面）：

✅ 多行编辑
✅ 斜杠命令自动补全
✅ 对话历史浏览
✅ 中断并重定向（干到一半可以改需求）
✅ 工具输出实时流式显示

3.2 随处部署，不限平台

Hermes 的设计理念是：AI 不应该绑在你的电脑上。

┌─── Telegram ────┐ │ │ 用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务 │ │ (云端/本地) ├─── Slack ────────┤ │ │ ├─── WhatsApp ─────┤ │ │ ├─── Signal ───────┤ │ │ └─── CLI 终端 ─────┘

你可以在Telegram 上发语音消息，它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题，完全没问题。

3.3 定时任务

内置 cron 调度器，可以用自然语言设置定时任务：

# 在对话中直接说："每天早上9点给我发一份服务器状态报告""每周五下午5点备份数据库""每天凌晨2点检查网站是否正常"

它会自动创建 cron 任务，结果推送到你指定的平台（Telegram/Discord/邮箱等）。

3.4 子代理 & 并行任务

可以派生子代理，让多个任务并行执行：

你："帮我同时做三件事： 1. 搜索最新的 React 19 变化 2. 检查服务器的磁盘空间 3. 写一个 Python 脚本处理 CSV" Hermes：├── 子代理 A：搜索 React 19 变更 ├── 子代理 B：SSH 到服务器检查磁盘 └── 子代理 C：编写 Python 脚本 ↓ 全部完成后，汇总结果给你

3.5 灵活的模型支持

不绑定任何一家模型供应商，想用哪个用哪个：

供应商	说明
Nous Portal	Nous Research 自家平台
OpenRouter	200+ 种模型可选
NovitaAI	AI 原生云平台
NVIDIA NIM	Nemotron 等模型
小米 MiMo	小米 AI 平台
z.ai/GLM	智谱 AI
Kimi/Moonshot	月之暗面
MiniMax	MiniMax
Hugging Face	开源模型
OpenAI	GPT 系列
自定义端点	你的私有模型

切换模型只需一行命令：

hermes model# 交互式选择模型

四、安装教程（手把手教你）

4.1 Linux / macOS / WSL2（推荐）

一行命令搞定：

curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash

安装完成后：

source~/.bashrc# 刷新环境变量（zsh 用户用 source ~/.zshrc）hermes# 启动！

4.2 Windows 原生（PowerShell，早期 Beta）

iex(irmhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

⚠️Windows 原生支持还在早期测试阶段。如果遇到问题，推荐用 WSL2 方式安装（即用 Linux 那行命令）。

安装器会自动处理：Python 3.11、Node.js、ripgrep、ffmpeg，以及一个便携版 Git Bash（约 45MB，不需要管理员权限，不影响系统 Git）。

4.3 Android / Termux

参考官方文档中的 Termux 指南。

4.4 Docker 部署

Hermes 支持七种终端后端：

后端	适用场景
Local	本地开发
Docker	容器化部署
SSH	远程服务器
Singularity	HPC 集群
Modal	Serverless（按需计费）
Daytona	Serverless 开发环境
Vercel Sandbox	边缘计算

💡省钱技巧：用 Modal 或 Daytona 的 serverless 模式，空闲时几乎不花钱，有请求时自动唤醒。

五、快速上手（5 分钟从安装到对话）

5.1 基础设置

hermes setup# 运行完整设置向导（配置模型、工具等）hermes model# 选择 LLM 提供商和模型hermes tools# 配置启用的工具hermes configset# 设置单个配置项

5.2 开始对话

hermes# 启动交互式终端

进入后你会看到一个漂亮的 TUI 界面，直接打字就能聊天。

5.3 常用命令速查

命令	作用	通俗理解
`/new`或`/reset`	开始新对话	“把之前的上下文清空，重新开始”
`/model`	切换模型	“换个大脑”
`/personality`	设置人格	“让 AI 扮演某个角色”
`/retry`	重试上一轮	“刚才的回答不满意，再来一次”
`/undo`	撤销上一轮	“假装上一轮没发生”
`/compress`	压缩上下文	“总结一下之前的对话，省点 token”
`/skills`	浏览技能	“看看我学会了哪些技能”
`/stop`	中断当前任务	“停下！我有新想法”
`/usage`	查看 token 用量	“看看花了多少钱”

六、技能系统：Hermes 的"肌肉记忆"

这是 Hermes Agent 最与众不同的特性，值得单独用一章讲。

6.1 什么是"技能"？

技能（Skill）就是 Agent 从经验中自动提取的可复用操作流程。

打个比方：

你第一次让 AI “部署一个 Node.js 应用到服务器”，它可能需要 10 步才能完成。
做完后，它会自动创建一个deploy-nodejs技能。
下次你说"部署 Node.js"，它直接调用技能，3 步搞定。

6.2 技能的生命周期

初次使用 ──→ 任务完成 ──→ 经验足够？ │ 是 ◄─────────┘ │ ▼ 自动创建技能文件 (保存到 ~/.hermes/skills/) │ ▼ 下次遇到类似任务 │ ▼ 直接调用技能（省去思考时间） │ ▼ 使用过程中发现改进点？ │ 是 ▼ 自动优化技能内容

6.3 技能市场（Skills Hub）

Hermes 还有一个开放的技能市场：agentskills.io

🔍 搜索别人分享的技能
📦 一键安装社区技能
🎁 分享你自己创建的技能
📋 兼容 agentskills.io 开放标准

七、记忆系统：Hermes 的"大脑"

7.1 持久记忆

Hermes 的记忆不是"聊完就忘"，而是跨会话持久化的：

今天你告诉它："我喜欢用 TypeScript" ↓ 明天你开新对话，它已经知道了 ↓ 一周后你让它写代码，它默认就用 TypeScript

7.2 用户画像（Honcho）

Hermes 使用 Honcho 系统进行用户建模：

第 1 次对话："我是做前端的" → 记录：用户职业 = 前端开发 第 5 次对话："帮我用 React 写个组件" → 强化：前端 + React 第 20 次对话："这个组件用 Tailwind 好看" → 补充：偏好 Tailwind CSS 结果：它已经完全了解你的技术栈和偏好了

7.3 会话搜索

使用 FTS5（全文搜索引擎）+ LLM 摘要：

你："两周前我让你分析的那个 Python 性能问题，结论是什么？"Hermes：→ 搜索历史会话 → 找到相关对话 → LLM 总结上下文 →"你当时那个 Flask 接口慢的原因是数据库查询没加索引……"

八、消息网关：让 AI 活在你的聊天软件里

8.1 什么是消息网关？

消息网关（Messaging Gateway）让 Hermes 连接到你的聊天平台：

hermes gateway setup# 配置网关（绑定 Telegram Bot 等）hermes gateway start# 启动网关

8.2 支持的平台

平台	特色功能
Telegram	语音消息转文字、跨平台连续对话
Discord	服务器管理、频道消息处理
Slack	工作空间集成
WhatsApp	随时随地对话
Signal	端到端加密
Email	邮件收发

8.3 实际使用场景

场景 1：你在地铁上 → 打开 Telegram，发语音："帮我看看服务器 CPU 使用率" → Hermes 在云端 VPS 上执行，把结果发回 Telegram 场景 2：你在开会 → Discord 上同事问了个技术问题 → @Hermes Bot，它直接回答 场景 3：你下班了 → Hermes 按计划执行定时任务 → 有问题自动给你发 Slack 通知

九、MCP 集成：无限扩展

9.1 什么是 MCP？

MCP（Model Context Protocol）是一个让 AI Agent 连接外部工具和服务的标准协议。

你可以理解为：

MCP 就像是给 AI 装了一个"万能插头"，什么工具都能接。

9.2 怎么用？

hermes tools# 在工具配置中添加 MCP 服务器

比如你可以连接：

🖥️ computer-use-linux — 控制 Linux 桌面
🌐 浏览器自动化
🗄️ 数据库操作
📁 文件系统
……

十、安全机制：别担心，它很安全

10.1 命令审批

不是所有命令都能直接执行。Hermes 有命令审批机制：

Hermes 要执行：rm -rf /tmp/old-builds ↓ 在审批名单里？── 是 ──→ 直接执行 │ 否 ↓ 弹出确认："Hermes 想执行 rm -rf /tmp/old-builds，允许吗？" ↓ 你确认后才执行

10.2 其他安全特性

特性	说明
DM 配对	只有你指定的用户才能和 Bot 对话
容器隔离	在 Docker 容器中执行，不影响宿主机
密钥安全	API Key 独立存储，不混在对话中

十一、架构与项目结构

对于想深入了解或参与贡献的开发者，这里简单介绍 Hermes 的架构：

11.1 Agent Loop（核心循环）

用户输入 │ ▼ ┌─────────────────────────┐ │ 1. 理解意图 │ │ 2. 检查技能库 │ │ 3. 选择工具/技能 │ │ 4. 执行操作 │ │ 5. 观察结果 │ │ 6. 判断是否完成 │ │ ├── 完成 → 返回结果 │ │ └── 未完成 → 回到 3 │ │ 7. 评估是否值得记住 │ │ ├── 是 → 存入记忆 │ │ └── 否 → 继续 │ │ 8. 评估是否值得提取技能 │ │ ├── 是 → 创建技能 │ │ └── 否 → 继续 │ └─────────────────────────┘

11.2 参与贡献

gitclone https://github.com/NousResearch/hermes-agent.gitcdhermes-agent ./setup-hermes.sh# 自动安装所有依赖./hermes# 启动开发版本

十二、从 OpenClaw 迁移

如果你之前用的是 OpenClaw（OpenHands 的一个分支），Hermes 提供了一键迁移：

hermes claw migrate# 交互式迁移hermes claw migrate --dry-run# 先预览，看看会迁移什么hermes claw migrate--overwrite# 覆盖已有冲突

会自动导入：

✅ 人格文件（SOUL.md）
✅ 记忆（MEMORY.md、USER.md）
✅ 技能
✅ 命令白名单
✅ 消息平台配置
✅ API 密钥
✅ TTS 资源

十三、Hermes Agent vs 其他 Agent 框架对比

对比维度	Hermes Agent	AutoGPT	CrewAI	LangChain Agent
自我学习	✅ 自动创建和改进技能	❌	❌	❌
用户建模	✅ Honcho 系统建立用户画像	❌	❌	❌
跨会话记忆	✅ FTS5 搜索 + LLM 摘要	有限	❌	需自己实现
消息平台	✅ Telegram/Discord/Slack/WhatsApp/Signal	❌	❌	❌
定时任务	✅ 内置 cron	❌	❌	❌
子代理并行	✅ 内置	❌	✅	需自己实现
模型绑定	❌ 支持 200+ 模型	OpenAI	任意	任意
安装难度	⭐ 一行命令	⭐⭐⭐	⭐⭐	⭐⭐⭐
运行成本	$5 VPS 即可	需要 OpenAI	取决于模型	取决于模型
开源协议	MIT	MIT	MIT	MIT

十四、实战：用 Hermes Agent 做几件酷事

14.1 场景一：自动日报

你："每天早上9点，总结我的 GitHub 活动和服务器状态，发到 Telegram" Hermes： 1. 创建 cron 任务 2. 每天早上 9 点： - 查 GitHub API 获取昨日 commit/PR - SSH 到服务器获取 CPU/内存/磁盘数据 - 生成漂亮的结构化报告 - 推送到你的 Telegram

14.2 场景二：代码审查助手

你在 Discord 频道发： "@hermes 帮我 review 一下 PR #42" Hermes： 1. 调用 GitHub API 获取 PR diff 2. 分析代码质量、安全风险、性能问题 3. 在 Discord 频道回复审查意见

14.3 场景三：学习新技能

第一次： 你："帮我用 Docker 部署一个 PostgreSQL 主从集群" Hermes：→ 查资料 → 写配置 → 测试 → 成功 → 自动创建 skill: "deploy-postgres-cluster" 第二次： 你："帮我部署 PG 集群" Hermes：→ 直接调用技能 → 3秒搞定 ✅

十五、常见问题 FAQ

Q1：Hermes Agent 免费吗？

✅完全开源免费（MIT 协议）。但你需要为使用的 LLM 模型付费（也可以用免费模型）。

Q2：我需要 GPU 吗？

❌不需要。Hermes 本身不跑模型，它调用外部 LLM API。只需要一台能上网的机器就行。

Q3：支持中文吗？

✅ 支持。取决于你选择的 LLM 模型是否支持中文（比如 GLM、Kimi 等国产模型原生支持）。

Q4：数据安全吗？

🔒 所有数据存在你自己的机器上（~/.hermes/目录）。不会上传到任何第三方服务器。

Q5：可以在手机上用吗？

✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。

Q6：和 ChatGPT 有什么区别？

ChatGPT 是"聊天工具"，Hermes 是"AI 员工"。ChatGPT 聊完就忘，Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。

Q7：怎么更新？

hermes update# 一键更新到最新版hermes doctor# 诊断问题

十六、总结

Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目：

优势	说明
🧠会学习	自动从经验中提取技能，越用越聪明
💾有记忆	跨会话记住你的偏好和上下文
📱随处可用	终端、Telegram、Discord、Slack……全平台覆盖
🔧能干活	40+ 工具，定时任务，并行子代理
💰成本低	$5 VPS 即可运行，支持 200+ 模型
🔓完全开源	MIT 协议，代码完全透明