当前位置：首页 > news >正文

【AI】 HERMES Agent

news 2026/6/20 9:37:25

根据 2026 年 4 月的最新信息，HERMES Agent是由Nous Research开发的开源自主 AI Agent 框架，于 2026 年 2 月 25 日发布，是当前开源 Agent 领域最热门的项目之一。以下是核心要点：

核心定位

属性	详情
开发方	Nous Research（Hermes 系列模型背后的团队）
许可证	MIT（完全开源商用）
GitHub Stars	42,000+（截至 2026 年 4 月）
最新版本	v0.8.0（2026 年 4 月 8 日发布）
核心口号	“The agent that grows with you”（与你共同成长的 Agent）

差异化能力：运行时自进化

与 OpenClaw、AutoGPT 等框架相比，HERMES Agent 的核心突破是闭环学习机制：

阶段	功能	效果
执行 (Execute)	使用 40+ 内置工具完成任务	代码执行、浏览器自动化、Web 搜索等
评估 (Evaluate)	分析任务完成质量	显式反馈 + 隐式接受信号
抽象 (Abstract)	将成功经验转为 Skill 文档	Markdown 格式，存于`~/.hermes/skills/`
精炼 (Refine)	后续使用中持续优化 Skill	10-20 次相似任务后，执行速度提升2-3 倍

关键洞察：这不是简单的 RAG 检索，而是真正的技能进化——Agent 会自主重写工具定义，无需人工干预。

技术架构亮点

1. 四层记忆系统（非简单键值存储）

层级	功能	技术实现
工作记忆	当前会话上下文	128K Token 窗口
情景记忆	具体经验存储	向量数据库，带情绪标签
语义记忆	抽象知识蒸馏	每 6 小时自动压缩
用户建模	Honcho 辩证用户画像	跨会话偏好学习

2. 多平台消息网关

支持平台：Telegram、Discord、Slack、WhatsApp、Signal、飞书/钉钉、Matrix、Webhook
跨平台连续性：Telegram 发起任务，CLI 查看进度，Discord 接收结果

3. 六后端执行环境

后端	适用场景
Local	本机开发
Docker	隔离沙箱
SSH	远程服务器
Daytona/Modal	无服务器（闲置时几乎零成本）
Singularity	HPC 集群

4. MCP 原生支持 + 安全层（v0.8 新增）

MCP OAuth 2.1：安全接入第三方工具
恶意软件扫描：安装 MCP 插件时自动检测
凭证池轮换：多 API Key 负载均衡防限速

模型支持：完全开放

提供商	模型示例
Nous Portal	Hermes 3/4（原生优化）
OpenRouter	200+ 模型（Claude、GPT、Gemini 等）
国产模型	DeepSeek、Kimi、GLM、MiniMax、Xiaomi MiMo
本地部署	Ollama、vLLM、SGLang

一键切换：hermes model命令，无需代码修改。

与 OpenClaw 的对比

维度	HERMES Agent	OpenClaw
核心差异	运行时自进化（自动生成/优化 Skill）	23+ 平台覆盖 + Canvas 可视化
记忆系统	四层自动压缩记忆	基础持久化记忆
目标用户	AI 研究者 / MLOps 工程师	企业用户 / 非技术用户
MCP 支持	✅ OAuth 2.1 + 安全扫描	❌ 自有 ClawHub 生态
训练数据生成	✅ Atropos RL + ShareGPT 导出	❌
Stars	42K	354K（生态更大但功能传统）

典型应用场景

持久化研究助手：跨会话跟踪论文、代码、实验结果
MLOps 自动化：批量生成训练数据、运行 RL 实验、导出轨迹用于微调
运维自动化：夜间安全扫描、日志异常摘要、定时报告推送
多步骤任务委托：生成子 Agent 并行处理，RPC 调用零上下文成本

快速开始

# 一键安装（Linux/macOS/WSL2）curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash# 配置模型hermes setup hermes model# 选择 Nous Portal / OpenRouter / 本地等# 启动交互hermes# 部署消息网关（可选）hermes gateway setup# 配置 Telegram/Discord 等hermes gatewayinstall# 设为系统服务

关键意义

HERMES Agent 代表了 2026 年开源 Agent 的范式转移：

从"工具调用"到"经验学习"：不是执行预定义工作流，而是像人类专家一样积累经验
从"无状态"到"渐进成长"：每次交互都使 Agent 更懂用户、更擅长任务
从"框架"到"基础设施"：可部署在 $5/月的 VPS 上，7×24 小时自主运行

对于需要可进化、可审计、可私有化部署的 AI Agent 场景，HERMES 是当前开源市场中最完整的选择。

HERMES Agent 的技术架构代表了 2026 年开源 Agent 的最高工程水平——不是简单的 LLM 包装，而是完整的认知架构系统，涵盖记忆、学习、建模、进化四个维度。其核心创新在于将"使用"转化为"训练数据"，使每个用户都能拥有随时间个性化增强的专属 Agent。

ERMES Agent 的核心技术细节

实现可分为四大支柱：自进化学习闭环、四层记忆架构、Honcho 辩证用户建模、Atropos RL 训练基础设施。

一、自进化学习闭环（The Closed Learning Loop）

这是 HERMES 区别于其他 Agent 框架（如 AutoGPT、CrewAI）的决定性技术，实现从"执行工具"到"积累经验"的质变。

四阶段循环实现

# 概念架构（基于 LangGraph 参考实现）classSelfImprovingLoop:defexecute(self,task,context):# Stage 1: 任务执行（工具调用）result=self.agent_executor.invoke(task)# Stage 2: 结果评估（显式+隐式反馈）score=self.evaluate(result,user_feedback)# Stage 3: 技能抽象（成功模式提取）ifscore>SKILL_THRESHOLD:skill=self.abstract_skill(task,result)self.skill_store.save(skill)# Stage 4: 技能精炼（持续优化）similar_skills=self.skill_store.retrieve_similar(task)forskillinsimilar_skills:refined=self.refine_skill(skill,new_experience=result)self.skill_store.update(refined)

关键技术细节

阶段	技术实现	核心机制
执行	ReAct + 工具调用	40+ 内置工具，支持子 Agent RPC 调用
评估	双信号融合	显式反馈（用户评分）+ 隐式信号（是否接受/修改输出）
抽象	LLM 结构化提取	将成功轨迹转为 Markdown Skill（遵循 agentskills.io 标准）
精炼	对比学习	新经验 vs 旧 Skill，保留更优模式，10-20 次迭代后速度提升 2-3 倍

Skill 防爆炸机制

针对"技能无限增长"问题，HERMES 实现三层防护：

抽象化存储：存储通用逻辑（如"电商平台比价"）而非具体步骤（“京东查价”）
动态修剪：相似度 >0.9 的 Skill 自动合并，低使用频率 Skill 归档
语义检索：向量搜索确保仅加载相关 Skill，而非全量加载

二、四层记忆架构（Memory Hierarchy）

HERMES 的记忆系统不是简单的键值存储，而是分层信息管理体系，模拟人类大脑的工作记忆-长期记忆分离。

架构详解

层级	载体	容量	更新频率	技术实现
提示记忆	`MEMORY.md`+`USER.md`	~2,200 + ~1,375 字符	每次会话后	直接注入系统提示（Prompt Injection）
会话存档	SQLite + FTS5	无上限	实时写入	全文检索，LLM 摘要总结
技能记忆	`~/.hermes/skills/*.md`	动态管理	任务成功后	渐进式披露（Progressive Disclosure），按需加载
用户建模	Honcho API	无上限	异步后台	辩证推理（Dialectic Reasoning），跨会话累积

关键技术：有界热记忆（Bounded Hot Memory）

# MEMORY.md 示例（有界强制约束） § Environment: Ubuntu 22.04, Python 3.11, uses poetry not pip § Project: QCM6490 driver debug, kernel 5.15 § Preferences: concise answers, show commands first, explain on request § Quirks: I2C LPM issue workaround known, SPI DMA channel 2 preferred

设计原则：

强制压缩：字符限制迫使 Agent 优先高信噪比信息
增量更新：使用§分隔符，支持条目级增删改
冻结快照：会话期间系统提示不变，保证 Anthropic Prompt Caching 命中

会话检索技术

-- FTS5 全文检索实现CREATEVIRTUALTABLEsessionsUSINGfts5(content,conversation_id,timestamp,tokenize='porter'-- 词干提取);-- 语义搜索查询SELECThighlight(sessions,0,'<mark>','</mark>')FROMsessionsWHEREcontentMATCH'auth system implementation'ORDERBYrank;

三、Honcho 辩证用户建模（Dialectic User Modeling）

这是 HERMES 与 OpenClaw、AutoGPT 等框架的最大技术差异，实现深度个性化而非简单记忆。

核心机制：辩证推理（Dialectic Reasoning）

不同于传统 RAG 检索用户说过的话，Honcho 通过问答式推理推导用户画像：

# Honcho 推理流程（简化版）defdialectic_reasoning(conversation_history):questions=generate_questions(history)# 生成澄清问题answers=llm_answer(questions,history)# LLM 基于历史回答conclusions=derive_facts(answers)# 提取结构化结论returnconclusions# 如："用户偏好 TypeScript", "决策谨慎型"# 示例结论（非原始对话）{"preference":"prefers_typescript_over_javascript","confidence":0.92,"derived_from":["msg_47","msg_52"],# 溯源"last_updated":"2026-04-10"}

双 Peer 架构

Peer 类型	数据来源	建模内容
User Peer	用户消息	偏好、目标、沟通风格、领域专长
AI Peer	Agent 消息	Agent 的知识表示、工具使用习惯

技术实现：

异步处理：会话结束后后台推理，不阻塞实时交互
多 Agent 隔离：同一用户的不同 Agent 实例（如编程助手 vs 生活助手）拥有独立 Peer 档案，防止交叉污染
API 工具集：honcho_profile（快速检索）、honcho_search（语义搜索）、honcho_conclude（写入结论）

四、Atropos RL 训练基础设施（Research-Ready）

HERMES 不仅是产品，更是下一代工具调用模型的训练平台。

轨迹生成与压缩

# Atropos RL 环境（简化架构）classAtroposEnvironment:defcapture_trajectory(self,task_execution):# 记录完整轨迹：观察 → 思考 → 行动 → 结果trajectory={"observation":task_execution.context,"thought":task_execution.reasoning,"action":tool_call.to_dict(),"reward":task_execution.evaluation_score}returntrajectorydefcompress_trajectory(self,raw_trajectory):# 去除冗余思考链，保留关键决策点# 用于训练数据高效存储returncompressed

与标准 RLHF 的区别

维度	OpenAI RLHF / Claude CAI	Atropos RL
数据归属	用户数据训练共享模型	用户拥有自己轨迹数据
优化目标	通用对齐（Helpful/Harmless）	特定 Agent 行为优化
训练范围	基础模型全局更新	用户特定行为模式
适用模型	专有模型	Qwen 3.5、GLM、Gemma 等开源模型

研究工具链

命令	功能
`hermes research run`	批量生成训练轨迹
`hermes research --inspect`	预览捕获内容（不保存）
`hermes research compress`	轨迹压缩，用于模型微调

五、系统集成架构图

┌─────────────────────────────────────────────────────────────┐ │ User Interface Layer │ │ (Telegram/Discord/Slack/WhatsApp/Signal/CLI/Webhook) │ └──────────────────────┬──────────────────────────────────────┘ │ Gateway Process ┌──────────────────────▼──────────────────────────────────────┐ │ Core Agent Engine │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │ │ │ ReAct │ │ Skill │ │ Memory Manager │ │ │ │ Loop │◄─┤ Router │◄─┤ (MEMORY/USER.md) │ │ │ │ │ │ │ │ │ │ │ └──────┬──────┘ └──────┬──────┘ └─────────────────────┘ │ │ │ │ │ │ ▼ ▼ │ │ ┌────────────────────────────────────────────────────────┐ │ │ │ Tool Registry (40+ Tools) │ │ │ │ (bash/python/browser/search/code_edit/subagent_rpc) │ │ │ └────────────────────────────────────────────────────────┘ │ └──────────────────────┬──────────────────────────────────────┘ │ ┌──────────────┼──────────────┐ ▼ ▼ ▼ ┌──────────────┐ ┌────────────┐ ┌─────────────┐ │ SQLite │ │ Skill │ │ Honcho │ │ (FTS5) │ │ Store │ │ API │ │ Session Arch │ │ ~/.hermes/ │ │ User Model │ └──────────────┘ └────────────┘ └─────────────┘ │ │ │ └──────────────┴──────────────┘ │ ┌────────▼────────┐ │ Atropos RL │ │ Trajectory DB │ │ (Research) │ └─────────────────┘

六、关键技术选型对比

技术挑战	HERMES 方案	常见替代方案	优势
长记忆检索	FTS5 + LLM 摘要	纯向量搜索	精确匹配 + 语义理解结合
用户建模	Honcho 辩证推理	简单偏好存储	推导隐含模式，非显式声明
技能管理	自进化 Markdown	静态预设模板	零人工维护，持续优化
多平台	统一 Gateway	各平台独立 Bot	跨平台会话连续性
部署灵活性	6 种后端（含 Serverless）	仅本地/仅云	$5 VPS 到 GPU 集群弹性扩展
模型锁定	OpenRouter 200+ 模型	单一厂商	无 Vendor Lock-in