当前位置: 首页 > news >正文

Hermes Agent 为什么突然火了?它和 Claude Code、Codex CLI、Gemini CLI 有什么区别?

关注 霍格沃兹测试学院公众号,回复「资料」, 领取人工智能测试开发技术合集

导读

最近 Hermes Agent 被频繁提起,不是因为它只是又多了一个 Agent CLI,而是因为它试图把很多原本分散的能力放进同一套运行时里:长期记忆、技能沉淀、子 Agent、定时任务、多平台消息入口、MCP、多种执行后端,以及开放的模型接入方式。Hermes 官方对自己的定位很直接,核心卖点不是“更会聊天”,而是built-in learning loop、persistent memory、auto-generated skills这一整套持续运行能力。

这也是 Hermes Agent 值得讨论的原因。 很多 AI Agent 仍然更像“在终端里工作的助手”,而 Hermes 想做的,是一个可以跨会话、跨平台、跨环境持续运行的 Agent 系统。这个差别,才是它最近热度上来的关键。


目录

  1. Hermes Agent 为什么突然被频繁讨论

  2. 它和主流 AI Agent 的差别,重点不在“谁功能更多”

  3. 一张表看清 5 类主流 Agent 的产品重心

  4. Hermes Agent 真正值得关注的三层能力

  5. 哪些场景适合用 Hermes Agent


一、Hermes Agent 为什么突然被频繁讨论

Hermes Agent 最近被反复提起,最重要的原因,是它把 AI Agent 的讨论从“单轮回答能力”往“长期运行能力”推了一步。官方文档里,它最强调的不是单次对话,而是学习闭环、跨会话记忆、技能自动生成、调度运行和多入口接入。换句话说,Hermes 的目标不是只在当前窗口里帮你完成一次任务,而是让 Agent 在后续任务里继续沿用之前积累下来的经验。

另一个原因,是它把“入口”和“执行环境”拆开了。 Hermes 不只跑在 CLI 里,它还有长期运行的 messaging gateway;同时它的终端执行环境支持 local、Docker、SSH、Modal、Daytona、Singularity 六类 backend。用户入口和任务执行不再强绑定在同一台机器、同一个终端会话里,这一点对自动化、后台任务和跨设备使用都很关键。

再往深一点看,Hermes 还带着比较明显的“研究系统”特征。它的官方文档里不仅有日常使用能力,也有 trajectory generation、RL environments 之类更偏训练与实验的数据闭环能力。这说明它不是单纯在做一个产品壳层,而是在尝试搭一套更完整的 Agent runtime。


二、它和主流 AI Agent 的差别,重点不在“谁功能更多”

写 Hermes Agent 这类文章,最容易写偏的地方,就是把它写成“全面碾压型选手”。这种写法不够稳,因为 Claude Code、Codex CLI、Gemini CLI、Goose 和 Hermes Agent,本来就不完全在解同一个问题。它们有交集,但产品重心并不一样。

Claude Code 的重心仍然非常明确:它是一套围绕代码工作流展开的 agentic coding tool,覆盖 terminal、IDE、desktop、browser,还支持 MCP、hooks、auto memory、agent teams,甚至 Terminal CLI 和 VS Code 也支持 third-party providers。它很强,但更偏研发协同和代码工作流。

Codex CLI 的边界也很清楚:它是 OpenAI 的本地终端 coding agent,强调在选定目录里读、改、跑代码,支持 MCP、subagents、sandbox、web search 和 cloud tasks。它的优势是本地代码任务执行链路很完整,但重点仍然是 coding workflow,而不是消息平台常驻和长期记忆系统。

Gemini CLI 也不能再按早期印象去写成“功能简化版”。官方 README 和命令文档已经明确给出 MCP、GEMINI.md 层级记忆、checkpointing、hooks、subagents、skills、IDE integration 等能力。它依旧是 terminal-first 路线,但已经不是一个只会聊天或只会跑几条命令的轻量工具了。

Goose 则更像开放型、本机优先的通用 agent。官方首页直接写了 Desktop、CLI、API、15+ providers、70+ MCP extensions、skills、recipes、subagents、安全控制等能力。严格说,Goose 才是 Hermes 在“开放生态通用 Agent”这条线上最值得正面对比的对象之一。

所以,Hermes Agent 真正特别的地方,不是“它会的别人都不会”,而是它把学习、记忆、调度、多入口、执行环境切换这些能力,压进了一套统一运行时里。这个设计取向,和“单纯做一个更强的代码助手”不是一回事。


三、一张表看清 5 类主流 Agent 的产品重心

产品

官方重心

典型能力

更偏向的场景

Hermes Agent

持续成长的通用 Agent runtime

learning loop、persistent memory、auto-generated skills、多平台消息入口、cron、6 类 backend、开放 provider

跨会话自动化、多入口常驻 Agent、长期运行任务

Claude Code

面向研发流程的 agentic coding tool

代码库理解、文件编辑、命令执行、MCP、hooks、auto memory、agent teams、Terminal/IDE/Desktop/Web

工程研发、代码协作、PR/CI/CD 相关流程

Codex CLI

本地终端 coding agent

本地读改跑代码、MCP、subagents、sandbox、web search、cloud tasks

本地代码任务、终端开发工作流

Gemini CLI

terminal-first 开发代理

MCP、GEMINI.md、hierarchical memory、checkpoints、hooks、subagents、skills、IDE integration

大上下文代码理解、终端项目自动化

Goose

本机优先的开放通用 Agent

Desktop/CLI/API、15+ providers、70+ MCP extensions、skills、recipes、subagents

通用自动化、本地代理、开放生态接入

这个表更适合帮助读者看清产品边界,而不是制造“谁输谁赢”的情绪。因为这几款工具虽然都在 AI Agent 赛道里,但真正竞争的层面并不完全重合。

四、Hermes Agent 真正值得关注的三层能力

1. 学习闭环被做成了运行时的一部分

Hermes 最有辨识度的一点,是它官方把 learning loop 放在最核心的位置。这里要注意一个技术表达:它的“成长”主要来自技能生成、技能优化、记忆写入、跨会话检索和用户建模,而不是在运行时直接改写底层模型权重。也就是说,它更像是在 runtime 层面形成经验积累,而不是在 model training 层面直接“自动升级”。

2. 多平台入口不是补充功能,而是一等公民

Hermes 的 messaging gateway 不是可有可无的插件层。开发者文档里明确提到,gateway 本身承担长期运行、session routing、cron ticking 和多平台适配等职责。它想解决的问题,不只是“在本机终端里发命令”,而是“人可以从不同消息入口给 Agent 派活,Agent 在后台持续执行”。这和很多只围绕 terminal 或 IDE 展开的工具,设计思路明显不同。

3. 模型和执行环境都被做成了可替换层

Hermes 的 provider 页面明确支持云端 provider、自定义 endpoint,以及 Ollama、vLLM 等自托管路径;FAQ 还提到了 llama.cpp、SGLang 和任何 OpenAI-compatible server。另一边,执行环境也支持 local、Docker、SSH、Modal、Daytona、Singularity。对工程团队来说,这意味着模型来源、算力位置、执行环境、隔离方式都可以独立设计,而不是被某一种产品形态写死。


五、哪些场景适合用 Hermes Agent

如果你的目标只是“在本地仓库里快速改代码”,那 Claude Code、Codex CLI、Gemini CLI 这种偏 coding workflow 的产品可能更直接。尤其是当你的核心诉求是 IDE 协同、diff 预览、代码审查、CI/CD 接入、终端执行链路,这几类产品已经非常成熟。

但如果你的目标变成下面这些,Hermes 的优势就会更明显:

它需要跨会话持续工作。 它需要从不同入口接收任务。 它需要定时跑任务。 它需要把执行环境从本机切到容器、远程机或云端。 它需要把技能、记忆和自动化流程长期积累下来。

还有一个实际落地时必须讲清楚的点:Hermes 官方 Quickstart 对上下文窗口有要求,建议至少 64K;Windows 用户通常也会碰到 WSL 相关部署习惯。这说明它更适合愿意把 Agent 当成系统来搭的人,而不是只想零配置打开就用的轻量用户。


本文部分内容参考了霍格沃兹测试开发学社整理的相关技术资料,主要涉及软件测试、自动化测试、测试开发及 AI 测试等内容,侧重测试实践、工具应用与工程经验整理。
http://www.jsqmd.com/news/685327/

相关文章:

  • A-RAG 解读:能做好混合检索策略的RAG,才是真 Agentic RAG
  • Postman上传文件接口调试避坑指南:为什么你的`List<MultipartFile>`接收不到多个文件?
  • .NET 11 + ONNX Runtime + CUDA 12.4 部署全流程:从VS2022项目初始化到TensorRT加速推理,5步完成生产就绪
  • 从打字机到Python代码:深入理解‘\r\n’和‘\n’如何影响你的文件读写与网络传输
  • 如何用一台电脑实现4人同屏游戏?Nucleus Co-Op分屏工具深度解析
  • 2026跨行业学数据分析的价值分析
  • 小白也能懂的中文NLP:bert-base-chinese预训练模型镜像使用全解
  • Spring Boot 4.0 Agent-Ready到底有多强?3大核心变革、5个必踩坑点、7天零改造接入实录
  • React 调度器优化:源码中对任务队列使用最小堆(Min-Heap)而不是排序数组的根本原因是什么?
  • 拆开Hermes Agent:企业怎么自建一套会“越用越强”的AI Agent系统
  • Qianfan-OCR开源模型教程:Apache 2.0协议下二次开发接入指南
  • 管理类岗位学数据分析的价值分析
  • 如何处理SQL查询中的逻辑非操作_使用NOT语法排除
  • epoll_event
  • 别再手动爬数据了!用GEE+ERA5-Land批量下载70年气象数据(含温度、降水)保姆级教程
  • 从FOC到你的无人机:深入浅出讲透Clark/Park变换在无刷电机控制中的核心作用
  • 深度学习在心电图分析中的高效架构设计与实践
  • OpenTelemetry 落地实战:我把跨服务超时定位从 90 分钟压到 8 分钟(附 trace 采样策略)
  • epoll_ctl
  • Go语言如何发GET请求_Go语言HTTP GET请求教程【总结】
  • LiquidAI LFM2-2.6B-GGUF部署教程:Supervisor服务自启配置详解
  • 2026年热门的单机除尘器/塔楼除尘器优质公司推荐 - 品牌宣传支持者
  • 3种Navicat无限试用解决方案:彻底告别14天限制困扰
  • 手把手教你用Python解析中科微/泰斗GNSS模块的NMEA数据(附完整代码)
  • 【深度解析】从“盯着 Agent 干活”到全自动编排执行:AI Coding Orchestrator 的工作流升级实践
  • 从NeRF到Instant-ngp:手把手教你用Python和CUDA在RTX 4090上跑通秒级三维重建
  • 3D IC热管理新突破:SAU-FNO架构解析与应用
  • PET成像运动校正技术CrowN@22解析与应用
  • ChemCrow化学智能工具终极指南:从零部署到实战应用
  • 【紧急预警】Docker 26.1+默认启用的quantum-scheduler特性正在 silently 破坏你的生产环境——3小时内必须执行的5项验证检查