当前位置: 首页 > news >正文

Hermes Agent 深度指南:一个会“自我进化“的 AI Agent,通俗易懂全解析

Hermes Agent 深度指南:一个会"自我进化"的 AI Agent,通俗易懂全解析

写在前面:如果你觉得现在的 AI 助手"只会聊天、不会干活",或者"每次对话都要从头教它",那Hermes Agent绝对值得你了解。它不仅能调用工具、执行任务,还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言,带你从零搞懂它。


一、Hermes Agent 是什么?一句话说清楚

Hermes Agent是由 Nous Research 开源的 AI 智能体(Agent),用一句话概括:

它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯,还能在 Telegram/Discord/Slack 等平台上随时为你服务。

你可以把它想象成一个有记忆的、能自我成长的 AI 员工

  • 🧠有记忆:它记得你是谁、你上次让它做了什么
  • 📚会学习:完成复杂任务后,自动总结成"技能",下次直接复用
  • 🔧能干活:40+ 内置工具,能操作文件、搜索网页、执行代码、管理服务器……
  • 📱随处可用:终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
  • 💰成本低:支持 200+ 种模型,可以在 $5 的 VPS 上运行,空闲时几乎不花钱

二、为什么说它是"自我进化"的 Agent?

市面上大部分 AI Agent 的工作流程是:

用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束(啥也没记住)

Hermes Agent 不一样,它有一个闭环学习系统

用户提问 → LLM 思考 → 调用工具 → 返回结果 ↓ 经验够丰富吗?── 是 ──→ 自动创建"技能" ↓ 下次遇到类似任务 → 直接用技能(更快更准) ↓ 技能使用中 → 发现可以改进?→ 自动优化技能 ↓ 定期"自省" → 把重要信息存入持久记忆 ↓ 跨会话搜索 → 能找到你几周前的对话上下文 ↓ 用户建模 → 越来越了解你的偏好和习惯

2.1 五大"自我进化"能力详解

能力通俗解释举个例子
技能自动创建完成复杂任务后,自动把步骤总结成可复用的"技能"你让它部署一个网站,它做完后自动生成一个"deploy-website"技能
技能自我改进技能在使用过程中会被自动优化"deploy-website"技能用了三次后,它自己发现可以加个缓存步骤
定期自省Agent 会主动提醒自己把重要信息存下来它会自动把"这个用户喜欢用pnpm而不是npm"记下来
跨会话搜索能搜索过去的对话记录,用 LLM 总结上下文你问"上次那个React项目的部署命令是啥",它能找到两周前的对话
用户建模通过 Honcho 系统建立你的偏好画像它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code

三、核心特性一览

Hermes Agent 不是普通的聊天机器人,它有这些硬核能力:

3.1 真正的终端界面

不是简单的命令行一问一答,而是一个全功能 TUI(终端用户界面)

  • ✅ 多行编辑
  • ✅ 斜杠命令自动补全
  • ✅ 对话历史浏览
  • ✅ 中断并重定向(干到一半可以改需求)
  • ✅ 工具输出实时流式显示

3.2 随处部署,不限平台

Hermes 的设计理念是:AI 不应该绑在你的电脑上

┌─── Telegram ────┐ │ │ 用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务 │ │ (云端/本地) ├─── Slack ────────┤ │ │ ├─── WhatsApp ─────┤ │ │ ├─── Signal ───────┤ │ │ └─── CLI 终端 ─────┘

你可以在Telegram 上发语音消息,它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题,完全没问题。

3.3 定时任务

内置 cron 调度器,可以用自然语言设置定时任务:

# 在对话中直接说:"每天早上9点给我发一份服务器状态报告""每周五下午5点备份数据库""每天凌晨2点检查网站是否正常"

它会自动创建 cron 任务,结果推送到你指定的平台(Telegram/Discord/邮箱等)。

3.4 子代理 & 并行任务

可以派生子代理,让多个任务并行执行:

你:"帮我同时做三件事: 1. 搜索最新的 React 19 变化 2. 检查服务器的磁盘空间 3. 写一个 Python 脚本处理 CSV" Hermes:├── 子代理 A:搜索 React 19 变更 ├── 子代理 B:SSH 到服务器检查磁盘 └── 子代理 C:编写 Python 脚本 ↓ 全部完成后,汇总结果给你

3.5 灵活的模型支持

不绑定任何一家模型供应商,想用哪个用哪个:

供应商说明
Nous PortalNous Research 自家平台
OpenRouter200+ 种模型可选
NovitaAIAI 原生云平台
NVIDIA NIMNemotron 等模型
小米 MiMo小米 AI 平台
z.ai/GLM智谱 AI
Kimi/Moonshot月之暗面
MiniMaxMiniMax
Hugging Face开源模型
OpenAIGPT 系列
自定义端点你的私有模型

切换模型只需一行命令:

hermes model# 交互式选择模型

四、安装教程(手把手教你)

4.1 Linux / macOS / WSL2(推荐)

一行命令搞定:

curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash

安装完成后:

source~/.bashrc# 刷新环境变量(zsh 用户用 source ~/.zshrc)hermes# 启动!

4.2 Windows 原生(PowerShell,早期 Beta)

iex(irmhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

⚠️Windows 原生支持还在早期测试阶段。如果遇到问题,推荐用 WSL2 方式安装(即用 Linux 那行命令)。

安装器会自动处理:Python 3.11、Node.js、ripgrep、ffmpeg,以及一个便携版 Git Bash(约 45MB,不需要管理员权限,不影响系统 Git)。

4.3 Android / Termux

参考官方文档中的 Termux 指南。

4.4 Docker 部署

Hermes 支持七种终端后端:

后端适用场景
Local本地开发
Docker容器化部署
SSH远程服务器
SingularityHPC 集群
ModalServerless(按需计费)
DaytonaServerless 开发环境
Vercel Sandbox边缘计算

💡省钱技巧:用 Modal 或 Daytona 的 serverless 模式,空闲时几乎不花钱,有请求时自动唤醒。


五、快速上手(5 分钟从安装到对话)

5.1 基础设置

hermes setup# 运行完整设置向导(配置模型、工具等)hermes model# 选择 LLM 提供商和模型hermes tools# 配置启用的工具hermes configset# 设置单个配置项

5.2 开始对话

hermes# 启动交互式终端

进入后你会看到一个漂亮的 TUI 界面,直接打字就能聊天。

5.3 常用命令速查

命令作用通俗理解
/new/reset开始新对话“把之前的上下文清空,重新开始”
/model切换模型“换个大脑”
/personality设置人格“让 AI 扮演某个角色”
/retry重试上一轮“刚才的回答不满意,再来一次”
/undo撤销上一轮“假装上一轮没发生”
/compress压缩上下文“总结一下之前的对话,省点 token”
/skills浏览技能“看看我学会了哪些技能”
/stop中断当前任务“停下!我有新想法”
/usage查看 token 用量“看看花了多少钱”

六、技能系统:Hermes 的"肌肉记忆"

这是 Hermes Agent 最与众不同的特性,值得单独用一章讲。

6.1 什么是"技能"?

技能(Skill)就是 Agent 从经验中自动提取的可复用操作流程

打个比方:

你第一次让 AI “部署一个 Node.js 应用到服务器”,它可能需要 10 步才能完成。
做完后,它会自动创建一个deploy-nodejs技能。
下次你说"部署 Node.js",它直接调用技能,3 步搞定。

6.2 技能的生命周期

初次使用 ──→ 任务完成 ──→ 经验足够? │ 是 ◄─────────┘ │ ▼ 自动创建技能文件 (保存到 ~/.hermes/skills/) │ ▼ 下次遇到类似任务 │ ▼ 直接调用技能(省去思考时间) │ ▼ 使用过程中发现改进点? │ 是 ▼ 自动优化技能内容

6.3 技能市场(Skills Hub)

Hermes 还有一个开放的技能市场:agentskills.io

  • 🔍 搜索别人分享的技能
  • 📦 一键安装社区技能
  • 🎁 分享你自己创建的技能
  • 📋 兼容 agentskills.io 开放标准

七、记忆系统:Hermes 的"大脑"

7.1 持久记忆

Hermes 的记忆不是"聊完就忘",而是跨会话持久化的:

今天你告诉它:"我喜欢用 TypeScript" ↓ 明天你开新对话,它已经知道了 ↓ 一周后你让它写代码,它默认就用 TypeScript

7.2 用户画像(Honcho)

Hermes 使用 Honcho 系统进行用户建模

第 1 次对话:"我是做前端的" → 记录:用户职业 = 前端开发 第 5 次对话:"帮我用 React 写个组件" → 强化:前端 + React 第 20 次对话:"这个组件用 Tailwind 好看" → 补充:偏好 Tailwind CSS 结果:它已经完全了解你的技术栈和偏好了

7.3 会话搜索

使用 FTS5(全文搜索引擎)+ LLM 摘要:

你:"两周前我让你分析的那个 Python 性能问题,结论是什么?"Hermes:→ 搜索历史会话 → 找到相关对话 → LLM 总结上下文 →"你当时那个 Flask 接口慢的原因是数据库查询没加索引……"

八、消息网关:让 AI 活在你的聊天软件里

8.1 什么是消息网关?

消息网关(Messaging Gateway)让 Hermes 连接到你的聊天平台:

hermes gateway setup# 配置网关(绑定 Telegram Bot 等)hermes gateway start# 启动网关

8.2 支持的平台

平台特色功能
Telegram语音消息转文字、跨平台连续对话
Discord服务器管理、频道消息处理
Slack工作空间集成
WhatsApp随时随地对话
Signal端到端加密
Email邮件收发

8.3 实际使用场景

场景 1:你在地铁上 → 打开 Telegram,发语音:"帮我看看服务器 CPU 使用率" → Hermes 在云端 VPS 上执行,把结果发回 Telegram 场景 2:你在开会 → Discord 上同事问了个技术问题 → @Hermes Bot,它直接回答 场景 3:你下班了 → Hermes 按计划执行定时任务 → 有问题自动给你发 Slack 通知

九、MCP 集成:无限扩展

9.1 什么是 MCP?

MCP(Model Context Protocol)是一个让 AI Agent 连接外部工具和服务的标准协议。

你可以理解为:

MCP 就像是给 AI 装了一个"万能插头",什么工具都能接。

9.2 怎么用?

hermes tools# 在工具配置中添加 MCP 服务器

比如你可以连接:

  • 🖥️ computer-use-linux — 控制 Linux 桌面
  • 🌐 浏览器自动化
  • 🗄️ 数据库操作
  • 📁 文件系统
  • ……

十、安全机制:别担心,它很安全

10.1 命令审批

不是所有命令都能直接执行。Hermes 有命令审批机制

Hermes 要执行:rm -rf /tmp/old-builds ↓ 在审批名单里?── 是 ──→ 直接执行 │ 否 ↓ 弹出确认:"Hermes 想执行 rm -rf /tmp/old-builds,允许吗?" ↓ 你确认后才执行

10.2 其他安全特性

特性说明
DM 配对只有你指定的用户才能和 Bot 对话
容器隔离在 Docker 容器中执行,不影响宿主机
密钥安全API Key 独立存储,不混在对话中

十一、架构与项目结构

对于想深入了解或参与贡献的开发者,这里简单介绍 Hermes 的架构:

11.1 Agent Loop(核心循环)

用户输入 │ ▼ ┌─────────────────────────┐ │ 1. 理解意图 │ │ 2. 检查技能库 │ │ 3. 选择工具/技能 │ │ 4. 执行操作 │ │ 5. 观察结果 │ │ 6. 判断是否完成 │ │ ├── 完成 → 返回结果 │ │ └── 未完成 → 回到 3 │ │ 7. 评估是否值得记住 │ │ ├── 是 → 存入记忆 │ │ └── 否 → 继续 │ │ 8. 评估是否值得提取技能 │ │ ├── 是 → 创建技能 │ │ └── 否 → 继续 │ └─────────────────────────┘

11.2 参与贡献

gitclone https://github.com/NousResearch/hermes-agent.gitcdhermes-agent ./setup-hermes.sh# 自动安装所有依赖./hermes# 启动开发版本

十二、从 OpenClaw 迁移

如果你之前用的是 OpenClaw(OpenHands 的一个分支),Hermes 提供了一键迁移:

hermes claw migrate# 交互式迁移hermes claw migrate --dry-run# 先预览,看看会迁移什么hermes claw migrate--overwrite# 覆盖已有冲突

会自动导入:

  • ✅ 人格文件(SOUL.md)
  • ✅ 记忆(MEMORY.md、USER.md)
  • ✅ 技能
  • ✅ 命令白名单
  • ✅ 消息平台配置
  • ✅ API 密钥
  • ✅ TTS 资源

十三、Hermes Agent vs 其他 Agent 框架对比

对比维度Hermes AgentAutoGPTCrewAILangChain Agent
自我学习✅ 自动创建和改进技能
用户建模✅ Honcho 系统建立用户画像
跨会话记忆✅ FTS5 搜索 + LLM 摘要有限需自己实现
消息平台✅ Telegram/Discord/Slack/WhatsApp/Signal
定时任务✅ 内置 cron
子代理并行✅ 内置需自己实现
模型绑定❌ 支持 200+ 模型OpenAI任意任意
安装难度⭐ 一行命令⭐⭐⭐⭐⭐⭐⭐⭐
运行成本$5 VPS 即可需要 OpenAI取决于模型取决于模型
开源协议MITMITMITMIT

十四、实战:用 Hermes Agent 做几件酷事

14.1 场景一:自动日报

你:"每天早上9点,总结我的 GitHub 活动和服务器状态,发到 Telegram" Hermes: 1. 创建 cron 任务 2. 每天早上 9 点: - 查 GitHub API 获取昨日 commit/PR - SSH 到服务器获取 CPU/内存/磁盘数据 - 生成漂亮的结构化报告 - 推送到你的 Telegram

14.2 场景二:代码审查助手

你在 Discord 频道发: "@hermes 帮我 review 一下 PR #42" Hermes: 1. 调用 GitHub API 获取 PR diff 2. 分析代码质量、安全风险、性能问题 3. 在 Discord 频道回复审查意见

14.3 场景三:学习新技能

第一次: 你:"帮我用 Docker 部署一个 PostgreSQL 主从集群" Hermes:→ 查资料 → 写配置 → 测试 → 成功 → 自动创建 skill: "deploy-postgres-cluster" 第二次: 你:"帮我部署 PG 集群" Hermes:→ 直接调用技能 → 3秒搞定 ✅

十五、常见问题 FAQ

Q1:Hermes Agent 免费吗?

完全开源免费(MIT 协议)。但你需要为使用的 LLM 模型付费(也可以用免费模型)。

Q2:我需要 GPU 吗?

不需要。Hermes 本身不跑模型,它调用外部 LLM API。只需要一台能上网的机器就行。

Q3:支持中文吗?

✅ 支持。取决于你选择的 LLM 模型是否支持中文(比如 GLM、Kimi 等国产模型原生支持)。

Q4:数据安全吗?

🔒 所有数据存在你自己的机器上(~/.hermes/目录)。不会上传到任何第三方服务器。

Q5:可以在手机上用吗?

✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。

Q6:和 ChatGPT 有什么区别?

ChatGPT 是"聊天工具",Hermes 是"AI 员工"。ChatGPT 聊完就忘,Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。

Q7:怎么更新?

hermes update# 一键更新到最新版hermes doctor# 诊断问题

十六、总结

Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目:

优势说明
🧠会学习自动从经验中提取技能,越用越聪明
💾有记忆跨会话记住你的偏好和上下文
📱随处可用终端、Telegram、Discord、Slack……全平台覆盖
🔧能干活40+ 工具,定时任务,并行子代理
💰成本低$5 VPS 即可运行,支持 200+ 模型
🔓完全开源MIT 协议,代码完全透明

GitHub 地址:https://github.com/NousResearch/hermes-agent

官方文档:https://hermes-agent.nousresearch.com/docs/

Discord 社区:https://discord.gg/NousResearch


如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。

祝你早日拥有自己的 AI 员工!🤖

http://www.jsqmd.com/news/855061/

相关文章:

  • Linux信号机制深度解析:从内核实现到多线程编程实践
  • 保姆级教程:在Ubuntu 18.04上搞定ZED2i相机驱动与ROS联动(含网络报错解决)
  • 图吧工具箱下载安装和使用保姆级教程(2026实测)
  • 从济南利客行,看固驰城市旗舰店如何真正落地
  • 【限时解密】Perplexity未公开的历史资料检索协议v2.3:仅开放给前500名深度用户的私有搜索语法手册
  • 2026年5月靠谱的湖北发电机出租联系方式哪家强厂家推荐榜,静音型/常规型/大型发电车租赁厂家选择指南 - 海棠依旧大
  • 拒绝盲从与踩坑:如何用“高性价比”工具撬动AI搜索的真实红利
  • 当 DAA 成为常态,如何用“数字摄像头”建设 Agent 可观测性
  • PangoDesign Suite 2020.3 联合 ModelSim 仿真,从编译库到波形查看的保姆级避坑指南
  • 北光恒电:安捷伦6812B/6813B电源不开机、输出不正常故障排查
  • PCB直流电阻精确估算:从基础公式到工程实践的全解析
  • 降AI率工具哪个好?2026年5月3款实测对比,AI率3%过审
  • 在CentOS 7.9上从零搭建Synopsys VCS 2018环境(含SCL、Verdi)保姆级避坑指南
  • 终极指南:使用Play Integrity API Checker保护你的Android应用安全
  • 2026年5月值得信赖的东营大型发电机出租电话找哪家厂家推荐榜,100-2000千瓦静音型/普通型/并机型发电机租赁厂家选择指南 - 海棠依旧大
  • 2026年5月20日银行间外汇市场人民币汇率中间价
  • Day1 搭建环境+理解编译过程+helloworld
  • 7分钟掌握中国行政区划数据:从零到实战的完整指南
  • 给 AI 写一份老厨师的菜谱:从传统文档到 Skill 知识体系
  • DeepSeek垂直搜索私有化部署全链路手册(含军工级脱敏配置模板与NLP权限沙箱实操)
  • 【限时解密】Perplexity写作辅助底层架构图首次公开:基于逆向分析的7大能力边界与替代方案评估
  • 车规级LGA封装RK3588开发板:硬件设计与车规应用实战解析
  • Java:猜数字游戏
  • 2026年积分兑换柜优质品牌推荐榜:智慧电子门牌/智能电子班牌/校园兑换柜/校园电子班牌/电子去向牌/礼品兑换柜/选择指南 - 优质品牌商家
  • 小程序第三方请求插件
  • 核心代码编程- 输出二叉树后序遍历结果-200分
  • Perplexity×艺术档案馆深度整合方案:打通Getty、MoMA、VA元数据的7种API级调用策略
  • 2026嵌入式核心模块定制指南,派普蓝电子如何赋能智能硬件
  • 一个人,一套协议,一场对技术文明的温柔反叛——关于徐玉生与 QiLink 的第三方观察
  • Claude API 流式输出(SSE)实战:从打字机效果到工具调用全流程