当前位置: 首页 > news >正文

【AI】 HERMES Agent

根据 2026 年 4 月的最新信息,HERMES Agent是由Nous Research开发的开源自主 AI Agent 框架,于 2026 年 2 月 25 日发布,是当前开源 Agent 领域最热门的项目之一。以下是核心要点:


核心定位

属性详情
开发方Nous Research(Hermes 系列模型背后的团队)
许可证MIT(完全开源商用)
GitHub Stars42,000+(截至 2026 年 4 月)
最新版本v0.8.0(2026 年 4 月 8 日发布)
核心口号“The agent that grows with you”(与你共同成长的 Agent)

差异化能力:运行时自进化

与 OpenClaw、AutoGPT 等框架相比,HERMES Agent 的核心突破是闭环学习机制

阶段功能效果
执行 (Execute)使用 40+ 内置工具完成任务代码执行、浏览器自动化、Web 搜索等
评估 (Evaluate)分析任务完成质量显式反馈 + 隐式接受信号
抽象 (Abstract)将成功经验转为 Skill 文档Markdown 格式,存于~/.hermes/skills/
精炼 (Refine)后续使用中持续优化 Skill10-20 次相似任务后,执行速度提升2-3 倍

关键洞察:这不是简单的 RAG 检索,而是真正的技能进化——Agent 会自主重写工具定义,无需人工干预。


技术架构亮点

1. 四层记忆系统(非简单键值存储)

层级功能技术实现
工作记忆当前会话上下文128K Token 窗口
情景记忆具体经验存储向量数据库,带情绪标签
语义记忆抽象知识蒸馏每 6 小时自动压缩
用户建模Honcho 辩证用户画像跨会话偏好学习

2. 多平台消息网关

  • 支持平台:Telegram、Discord、Slack、WhatsApp、Signal、飞书/钉钉、Matrix、Webhook
  • 跨平台连续性:Telegram 发起任务,CLI 查看进度,Discord 接收结果

3. 六后端执行环境

后端适用场景
Local本机开发
Docker隔离沙箱
SSH远程服务器
Daytona/Modal无服务器(闲置时几乎零成本)
SingularityHPC 集群

4. MCP 原生支持 + 安全层(v0.8 新增)

  • MCP OAuth 2.1:安全接入第三方工具
  • 恶意软件扫描:安装 MCP 插件时自动检测
  • 凭证池轮换:多 API Key 负载均衡防限速

模型支持:完全开放

提供商模型示例
Nous PortalHermes 3/4(原生优化)
OpenRouter200+ 模型(Claude、GPT、Gemini 等)
国产模型DeepSeek、Kimi、GLM、MiniMax、Xiaomi MiMo
本地部署Ollama、vLLM、SGLang

一键切换hermes model命令,无需代码修改。


与 OpenClaw 的对比

维度HERMES AgentOpenClaw
核心差异运行时自进化(自动生成/优化 Skill)23+ 平台覆盖 + Canvas 可视化
记忆系统四层自动压缩记忆基础持久化记忆
目标用户AI 研究者 / MLOps 工程师企业用户 / 非技术用户
MCP 支持✅ OAuth 2.1 + 安全扫描❌ 自有 ClawHub 生态
训练数据生成✅ Atropos RL + ShareGPT 导出
Stars42K354K(生态更大但功能传统)

典型应用场景

  1. 持久化研究助手:跨会话跟踪论文、代码、实验结果
  2. MLOps 自动化:批量生成训练数据、运行 RL 实验、导出轨迹用于微调
  3. 运维自动化:夜间安全扫描、日志异常摘要、定时报告推送
  4. 多步骤任务委托:生成子 Agent 并行处理,RPC 调用零上下文成本

快速开始

# 一键安装(Linux/macOS/WSL2)curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash# 配置模型hermes setup hermes model# 选择 Nous Portal / OpenRouter / 本地等# 启动交互hermes# 部署消息网关(可选)hermes gateway setup# 配置 Telegram/Discord 等hermes gatewayinstall# 设为系统服务

关键意义

HERMES Agent 代表了 2026 年开源 Agent 的范式转移

  • 从"工具调用"到"经验学习":不是执行预定义工作流,而是像人类专家一样积累经验
  • 从"无状态"到"渐进成长":每次交互都使 Agent 更懂用户、更擅长任务
  • 从"框架"到"基础设施":可部署在 $5/月的 VPS 上,7×24 小时自主运行

对于需要可进化、可审计、可私有化部署的 AI Agent 场景,HERMES 是当前开源市场中最完整的选择。


HERMES Agent 的技术架构代表了 2026 年开源 Agent 的最高工程水平——不是简单的 LLM 包装,而是完整的认知架构系统,涵盖记忆、学习、建模、进化四个维度。其核心创新在于将"使用"转化为"训练数据",使每个用户都能拥有随时间个性化增强的专属 Agent。

ERMES Agent 的核心技术细节

实现可分为 四大支柱:自进化学习闭环、四层记忆架构、Honcho 辩证用户建模、Atropos RL 训练基础设施。


一、自进化学习闭环(The Closed Learning Loop)

这是 HERMES 区别于其他 Agent 框架(如 AutoGPT、CrewAI)的决定性技术,实现从"执行工具"到"积累经验"的质变。

四阶段循环实现

# 概念架构(基于 LangGraph 参考实现)classSelfImprovingLoop:defexecute(self,task,context):# Stage 1: 任务执行(工具调用)result=self.agent_executor.invoke(task)# Stage 2: 结果评估(显式+隐式反馈)score=self.evaluate(result,user_feedback)# Stage 3: 技能抽象(成功模式提取)ifscore>SKILL_THRESHOLD:skill=self.abstract_skill(task,result)self.skill_store.save(skill)# Stage 4: 技能精炼(持续优化)similar_skills=self.skill_store.retrieve_similar(task)forskillinsimilar_skills:refined=self.refine_skill(skill,new_experience=result)self.skill_store.update(refined)

关键技术细节

阶段技术实现核心机制
执行ReAct + 工具调用40+ 内置工具,支持子 Agent RPC 调用
评估双信号融合显式反馈(用户评分)+ 隐式信号(是否接受/修改输出)
抽象LLM 结构化提取将成功轨迹转为 Markdown Skill(遵循 agentskills.io 标准)
精炼对比学习新经验 vs 旧 Skill,保留更优模式,10-20 次迭代后速度提升 2-3 倍

Skill 防爆炸机制

针对"技能无限增长"问题,HERMES 实现三层防护:

  1. 抽象化存储:存储通用逻辑(如"电商平台比价")而非具体步骤(“京东查价”)
  2. 动态修剪:相似度 >0.9 的 Skill 自动合并,低使用频率 Skill 归档
  3. 语义检索:向量搜索确保仅加载相关 Skill,而非全量加载

二、四层记忆架构(Memory Hierarchy)

HERMES 的记忆系统不是简单的键值存储,而是分层信息管理体系,模拟人类大脑的工作记忆-长期记忆分离。

架构详解

层级载体容量更新频率技术实现
提示记忆MEMORY.md+USER.md~2,200 + ~1,375 字符每次会话后直接注入系统提示(Prompt Injection)
会话存档SQLite + FTS5无上限实时写入全文检索,LLM 摘要总结
技能记忆~/.hermes/skills/*.md动态管理任务成功后渐进式披露(Progressive Disclosure),按需加载
用户建模Honcho API无上限异步后台辩证推理(Dialectic Reasoning),跨会话累积

关键技术:有界热记忆(Bounded Hot Memory)

# MEMORY.md 示例(有界强制约束) § Environment: Ubuntu 22.04, Python 3.11, uses poetry not pip § Project: QCM6490 driver debug, kernel 5.15 § Preferences: concise answers, show commands first, explain on request § Quirks: I2C LPM issue workaround known, SPI DMA channel 2 preferred

设计原则

  • 强制压缩:字符限制迫使 Agent 优先高信噪比信息
  • 增量更新:使用§分隔符,支持条目级增删改
  • 冻结快照:会话期间系统提示不变,保证 Anthropic Prompt Caching 命中

会话检索技术

-- FTS5 全文检索实现CREATEVIRTUALTABLEsessionsUSINGfts5(content,conversation_id,timestamp,tokenize='porter'-- 词干提取);-- 语义搜索查询SELECThighlight(sessions,0,'<mark>','</mark>')FROMsessionsWHEREcontentMATCH'auth system implementation'ORDERBYrank;

三、Honcho 辩证用户建模(Dialectic User Modeling)

这是 HERMES 与 OpenClaw、AutoGPT 等框架的最大技术差异,实现深度个性化而非简单记忆。

核心机制:辩证推理(Dialectic Reasoning)

不同于传统 RAG 检索用户说过的话,Honcho 通过问答式推理推导用户画像:

# Honcho 推理流程(简化版)defdialectic_reasoning(conversation_history):questions=generate_questions(history)# 生成澄清问题answers=llm_answer(questions,history)# LLM 基于历史回答conclusions=derive_facts(answers)# 提取结构化结论returnconclusions# 如:"用户偏好 TypeScript", "决策谨慎型"# 示例结论(非原始对话){"preference":"prefers_typescript_over_javascript","confidence":0.92,"derived_from":["msg_47","msg_52"],# 溯源"last_updated":"2026-04-10"}

双 Peer 架构

Peer 类型数据来源建模内容
User Peer用户消息偏好、目标、沟通风格、领域专长
AI PeerAgent 消息Agent 的知识表示、工具使用习惯

技术实现

  • 异步处理:会话结束后后台推理,不阻塞实时交互
  • 多 Agent 隔离:同一用户的不同 Agent 实例(如编程助手 vs 生活助手)拥有独立 Peer 档案,防止交叉污染
  • API 工具集honcho_profile(快速检索)、honcho_search(语义搜索)、honcho_conclude(写入结论)

四、Atropos RL 训练基础设施(Research-Ready)

HERMES 不仅是产品,更是下一代工具调用模型的训练平台

轨迹生成与压缩

# Atropos RL 环境(简化架构)classAtroposEnvironment:defcapture_trajectory(self,task_execution):# 记录完整轨迹:观察 → 思考 → 行动 → 结果trajectory={"observation":task_execution.context,"thought":task_execution.reasoning,"action":tool_call.to_dict(),"reward":task_execution.evaluation_score}returntrajectorydefcompress_trajectory(self,raw_trajectory):# 去除冗余思考链,保留关键决策点# 用于训练数据高效存储returncompressed

与标准 RLHF 的区别

维度OpenAI RLHF / Claude CAIAtropos RL
数据归属用户数据训练共享模型用户拥有自己轨迹数据
优化目标通用对齐(Helpful/Harmless)特定 Agent 行为优化
训练范围基础模型全局更新用户特定行为模式
适用模型专有模型Qwen 3.5、GLM、Gemma 等开源模型

研究工具链

命令功能
hermes research run批量生成训练轨迹
hermes research --inspect预览捕获内容(不保存)
hermes research compress轨迹压缩,用于模型微调

五、系统集成架构图

┌─────────────────────────────────────────────────────────────┐ │ User Interface Layer │ │ (Telegram/Discord/Slack/WhatsApp/Signal/CLI/Webhook) │ └──────────────────────┬──────────────────────────────────────┘ │ Gateway Process ┌──────────────────────▼──────────────────────────────────────┐ │ Core Agent Engine │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │ │ │ ReAct │ │ Skill │ │ Memory Manager │ │ │ │ Loop │◄─┤ Router │◄─┤ (MEMORY/USER.md) │ │ │ │ │ │ │ │ │ │ │ └──────┬──────┘ └──────┬──────┘ └─────────────────────┘ │ │ │ │ │ │ ▼ ▼ │ │ ┌────────────────────────────────────────────────────────┐ │ │ │ Tool Registry (40+ Tools) │ │ │ │ (bash/python/browser/search/code_edit/subagent_rpc) │ │ │ └────────────────────────────────────────────────────────┘ │ └──────────────────────┬──────────────────────────────────────┘ │ ┌──────────────┼──────────────┐ ▼ ▼ ▼ ┌──────────────┐ ┌────────────┐ ┌─────────────┐ │ SQLite │ │ Skill │ │ Honcho │ │ (FTS5) │ │ Store │ │ API │ │ Session Arch │ │ ~/.hermes/ │ │ User Model │ └──────────────┘ └────────────┘ └─────────────┘ │ │ │ └──────────────┴──────────────┘ │ ┌────────▼────────┐ │ Atropos RL │ │ Trajectory DB │ │ (Research) │ └─────────────────┘

六、关键技术选型对比

技术挑战HERMES 方案常见替代方案优势
长记忆检索FTS5 + LLM 摘要纯向量搜索精确匹配 + 语义理解结合
用户建模Honcho 辩证推理简单偏好存储推导隐含模式,非显式声明
技能管理自进化 Markdown静态预设模板零人工维护,持续优化
多平台统一 Gateway各平台独立 Bot跨平台会话连续性
部署灵活性6 种后端(含 Serverless)仅本地/仅云$5 VPS 到 GPU 集群弹性扩展
模型锁定OpenRouter 200+ 模型单一厂商无 Vendor Lock-in

七、实现限制与风险

根据社区分析,HERMES 的闭环学习存在结构性风险

  1. 数据质量无人验证:自生成训练数据缺乏外部校验,可能累积错误
  2. 无遗忘机制:技能只增不减,长期可能引入过时模式
  3. 评估主观性:隐式反馈(用户是否修改)可能误判成功

缓解措施:定期hermes skill audit人工审查,结合insights命令分析使用模式。


HERMES Agent 的技术架构代表了 2026 年开源 Agent 的最高工程水平——不是简单的 LLM 包装,而是完整的认知架构系统,涵盖记忆、学习、建模、进化四个维度。其核心创新在于将"使用"转化为"训练数据",使每个用户都能拥有随时间个性化增强的专属 Agent。

http://www.jsqmd.com/news/645442/

相关文章:

  • 避坑指南:StarRocks集群部署前必做的10项环境检查(附AVX2检测脚本)
  • 2026青海装修设计/家装/老房翻新/二手房改造:馨美居装饰领衔 - 深度智识库
  • AudioSeal Pixel Studio详细步骤:FFmpeg自动转码适配多音频格式全流程
  • 从P99延迟飙升到稳定<120ms,我们重写了负载均衡器:5个被大厂内部封禁的调度策略首次公开
  • Zotero插件市场:一站式文献管理插件管理解决方案
  • 上海阿里邮箱服务商哪家比较好?2026年企业选型与服务解析 - 品牌2025
  • 高精度交直流安培表技术解析与应用 —— 以 T24‑A 系列为例 - 品牌推荐大师1
  • Wan2.2-I2V-A14B效果展示:动态模糊/景深变化/镜头运动模拟效果
  • 三阶段解决方案:EdgeRemover深度卸载工具彻底移除Microsoft Edge浏览器残留文件
  • Zotero SciPDF插件终极指南:3步告别付费墙,免费获取学术文献PDF
  • LTSPICE新手避坑指南:从模拟开关仿真到理解电荷泵的基础(以ADG852为例)
  • 企业需要构建一级供应商关系才能真正落地AI战略
  • 微软VibeVoice功能详解:超低帧率分词器如何实现高效长音频合成
  • 5个ComfyUI-Crystools技巧让你告别AI绘图烦恼
  • Windows多语言兼容性终极解决方案:Locale Emulator完全指南
  • 如何在 Vuetify 中可靠捕获 Chip 关闭事件(包括键盘触发)
  • 为什么92%的多模态大模型在真实场景中失效?——基于17个跨域测试集的鲁棒性归因分析
  • FlipIt翻页时钟屏保:为Windows桌面带来优雅复古时间显示的完整解决方案
  • AI图像生成合规风暴来临(2026全球监管红线白皮书首发):版权、水印、溯源三重防御体系构建实录
  • 告别网盘下载等待:8大平台直链解析完整指南
  • FlyOOBE:让Windows 11安装体验焕然一新的全能助手
  • 告别“无痕模式”:用 Playwright 连接本地 Chrome,让自动化脚本在真实用户环境中运行
  • Foxglove Studio 保姆级安装配置指南:从下载到连接ROS 2全流程
  • Nano-Banana产品拆解引擎:无需3D建模,用照片快速制作产品爆炸图
  • 低代码开发,让企业应用搭建不再难
  • 时间管理利器:滴哦小精灵定时精灵功能全攻略
  • AI Agent 核心方法论深度解析:ReAct、Plan-and-Solve 与 Reflection
  • WinUtil:基于PowerShell WPF的Windows系统配置自动化平台架构解析
  • 3大核心功能解密:如何免费解锁Cursor Pro全部AI编程能力
  • 拒绝“适配难、品控难”!一文看懂如何选对石榴石供应商 - 深度智识库