当前位置: 首页 > news >正文

Hermes Agent 一周暴涨五万 Star,但我劝你别急着追

一周五万 Star,发生了什么

上周打开 GitHub Trending 周榜,我盯着第二名的数字看了三遍:

NousResearch/hermes-agent — 一周 +53,110 Star,总 Star 91.1K。

两个月不到,从建仓到九万星。这个增长速度意味着什么?做个对比:LangChain 花了差不多一年才到这个量级,AutoGen 用了半年多。Hermes 用了不到八周。

社区炸了。Reddit 上 "I switched from OpenClaw to Hermes" 隔几天就冒一条,HN 搜 "hermes agent" 出来 50 多条讨论,国内技术群里也开始传"下一个必学框架"。

如果你跟我一样,看到这种数据会本能地点进去、读文档、开始考虑"要不要把现有项目迁过去"——这篇文章就是写给你的。

但我想先说:别急。

Hermes Agent 到底是什么

先讲清楚它到底在做什么,再聊要不要追。

Hermes Agent 是 Nous Research 开源的一个通用 AI Agent 框架,MIT 协议。核心卖点:

特性说明你可能关心的
自我改进循环执行任务后自动总结经验,编码成可复用 Skill听起来很酷,但有坑(后面说)
跨会话记忆不像多数框架"一次对话一世界"对长期项目有吸引力
15+ 平台网关Telegram、Slack、Discord、Web 开箱即用集成成本确实低
模型无关Claude、GPT、Gemini、本地模型都能接不绑死供应商
版本狂飙42 天内发了 9 个版本(最新 v0.9.0)迭代快 = 接口也在快速变动

客观说,这些特性确实踩中了当前 Agent 开发的几个痛点。跨会话记忆和自我改进循环,是很多开发者手动实现过的东西,有人帮你框架化了,当然有吸引力。

但我要泼两盆冷水。

冷水一:增长数字背后的疑点

Hermes Agent 背后是 Nous Research——一家从 Web3 起步的公司。CEO 来自以太坊 MEV 项目,Series A 用的是token 估值(不是传统股权融资),Paradigm 领投 6500 万美元。

我对 Web3 没偏见,但这个背景叠加上爆炸式增长,社区已经开始质疑了:

Star 的水分问题。Reddit 多条高赞帖指出:新注册账号集中发模板化推广帖,措辞高度雷同。有人直接用了"likely using bots"这个词。我没有证据说 Star 一定是刷的,但当一个项目两个月到九万星,保持合理怀疑不是坏事。

"自我改进"的根本缺陷。这是我觉得最值得警惕的:Hermes 的 Agent 会在完成任务后自动评估结果、把经验编码成 Skill。问题是——Agent 几乎总是认为自己做对了。即使实际输出有错,它也会把错误的"经验"固化下来。Power user 管这叫"噩梦":你手动改好了一个 bug,下次 Agent 又按旧 Skill 把错误改回去。

Token 开销问题。有人测过,Hermes 每次 API 调用大约73% 是固定开销(约 13.9K tokens 用于加载上下文和 Skill 库),真正干活的只占小头。对于个人开发者来说,这个 token 税不便宜。

我不是说 Hermes Agent 一定有问题。它的技术方向——持久记忆、自我改进——确实是 Agent 框架需要解决的真命题。但当增长速度远超技术成熟度的时候,至少该观望一下。

冷水二:你追得完吗

打开 GitHub 的ai-agentTopic 页面:

9,900 个仓库。

随便列几个 2026 年上半年"你应该关注"的 Agent 框架:LangGraph、CrewAI、AutoGen、LlamaIndex Agents、Mastra、Haystack、FastAgency、Semantic Kernel、Phidata、Composio、Multica…… 有人做过统计,至少25 个以上进入过 Trending 或者被正经技术媒体推荐过。

每一个框架发布时的话术都长这样:

"We fundamentally rethought agent architecture."

"10x faster than XX, 3x cheaper than YY."

"The only agent framework you'll ever need."

然后一个月后,另一个框架冲上 Trending,上个月的"唯一框架"已经没人提了。Reddit 上甚至开始出现反趋势的帖子:"I Stopped Using Frameworks — AI Agents Do It All Now."

这不叫技术进步。这叫框架疲劳(Framework Fatigue)。

现象数据
GitHub ai-agent 仓库数9,900+
2026 上半年主流 Agent 框架25+
常见生产事故重复调用 API、幻觉策略、死循环、覆盖用户编辑
反趋势信号"停止使用框架"类帖子开始高赞

说句实在话,我自己就是过来人。2025 年底到 2026 年初,LangChain → AutoGen → CrewAI → OpenClaw,一个不落。每换一个框架,之前写的适配代码、踩过的配置坑、积累的调试经验就全废了。转头一看,半年过去了,我的实际产出并没有因为"用了更好的框架"而变多。

真正的问题不是"用什么框架"

METR(一个专注 AI 能力评估的研究机构)今年做了一项实验,结论给我当头一棒:

有经验的开发者使用 AI 工具后,实际完成任务反而慢了 19%。但他们自己觉得快了 20%。

这是什么概念?AI 工具(包括 Agent 框架)制造了一种效率幻觉——你觉得自己在飞速产出,但算上学框架的时间、调试 Agent 行为的时间、修 Agent 幻觉的时间,总成本反而更高了。

不止是 Agent 框架。整个 "Vibe Coding" 运动的反噬数据也触目惊心:

指标变化
代码 churn(改了又改的比率)+41%
代码重复度×4
健康重构占比从 25% 暴跌到 <10%
安全公司测试 15 个 vibe coding 应用69 个漏洞,6 个 Critical 级
Apple 动作已封禁多款 vibe coding 生成的应用

Addy Osmani——Chrome 团队工程负责人,在开发者社区影响力很大——分享了他的 AI 编程工作流。里面没有一条是关于"选对框架"的,全是工程纪律:

  1. 先写spec.md做人工规划,想清楚再让 AI 动手
  2. 拆小任务,每个任务的边界清晰到 AI 不会"发挥"
  3. 喂充分上下文,别让 AI 猜你要什么
  4. 人类始终在监督位,不要让 AI 无人值守跑 30 分钟
  5. 超频 commit,每个小步骤都提交,出问题能回滚

Stack Overflow 也在今年发布了agents.md规范指南,核心结论跟 Osmani 一样:

AI 放大的是你已有的工程纪律,不是替代它。

你花在"搞清楚 Hermes Agent 怎么配置自我改进循环"上的三天,大概率不如花在"让 AI 更好地理解你已有的代码"上。

与其追工具,不如建体系

这不是鸡汤。我掉进过这个坑,现在爬出来了,分享一下我现在怎么想这件事。

我维护了 10 年的 C++ 技术栈,26 个核心模块,10 万行代码。网络层、协议解析、配置管理、渲染引擎——这些模块不管外面 Agent 框架怎么更新换代,它们的工程价值不会归零。

框架会过时,但你的代码资产不会。

真正值得投入的事情只有三件:

1. 搞清楚你有什么

你的技术栈里有哪些成熟模块?哪些可以让 AI 直接复用?哪些有技术债需要先清理?如果这些问题你答不上来,换再多框架都是瞎折腾。

我之前做了一个工具叫 repo-scan,就是干这个的——用 AI 交叉审计你的代码库,帮你理清家底。让 Claude 和 GPT 分别扫描,交叉比对,找出你自己都忘了的宝贝模块和隐藏的技术债。

2. 从八十分开始,别从零开始

上一篇文章《受够了 Vibe Coding 的失控?换个起点,让 AI 事半功倍》我详细聊过这个方法论:与其让 AI 从零写 2000 行代码(3 处幻觉 API,改了一下午),不如用你的成熟模块搭好 80% 骨架,AI 只补最后 20% 的胶水代码(零幻觉,30 分钟合并)。

我正在做的 GufaForge 就是这个思路的产品化——扫描你的成熟模块库,根据新项目需求自动装配骨架,生成 AI 可直接执行的装配清单。工具还在完善中,完成后会开源,感兴趣的可以先关注公众号「海滨code」,第一时间通知。

3. 建立框架无关的工程纪律

不管你最终选 Hermes、OpenClaw 还是裸写 Claude Code,这些纪律不因框架而变:

  • 规划和执行分离——人做规划,AI 做执行。别把两件事混在一起让 AI 自己发挥
  • 控制任务粒度——每轮让 AI 做一件具体的事,别让它无人值守跑半小时
  • 超频 commit——每完成一小步就提交,出问题能秒回滚
  • 写 spec 不写 prompt——与其花时间优化 prompt,不如花时间写清楚 spec.md

这套流程,你用什么框架都适用。框架挂了,流程还在。

所以,Hermes Agent 该不该学

该关注,但没必要急着 all-in。

  1. Star 它,Watch 它,等 3-6 个月看社区沉淀。一个月后还有人认真写使用心得的框架,才值得花时间学。一个月后没人提的,现在学了也白学。
  2. 先把自己的家底理清楚。你的代码资产、技术栈能力矩阵、AI 能直接复用的模块清单——这些搞不清楚,用什么框架都事倍功半。
  3. 建立框架无关的工作流。spec.md → 拆任务 → 喂上下文 → 监督 → commit。这套流程不依赖任何框架,也不会因为哪个框架凉了而作废。
  4. 如果确实想试 Hermes,用一个小项目试。别拿你的生产项目当实验场。

GitHub 上有 9,900 个 ai-agent 仓库。最终活下来不会超过 5 个。而你的精力,应该花在那些不随框架消亡的东西上。

http://www.jsqmd.com/news/1070578/

相关文章:

  • 【学习笔记】大模型时代全景图:从 GPT 到 Claude/DeepSeek,一文看懂 LLM 演进史
  • 从数据标注到自研模型:
  • 高校建设人工智能实验室,到底该如何选择服务商?
  • Java + EasyExcel 实现单个接口导出多个Excel
  • 管理驾驶舱如何帮助老板快速了解企业经营状态
  • 三位24岁博士团队创办映界科技,补齐具身智能感知短板,2026年订单有望超千万!
  • AI写专著必备攻略:4款工具助力,快速生成20万字专业专著!
  • UVa 571 Jugs
  • NS-USBLoader终极指南:快速搞定Switch游戏安装与系统注入的4个关键步骤
  • Claude Code + Kimi Code 配置指南
  • SMUDebugTool终极指南:免费开源AMD Ryzen处理器调试工具完全教程
  • Kimi LeetCode 3348. 最小可整除数位乘积 II Rust实现
  • 开源版Figma:Penpot,设计协同+代码生成,全栈设计平台
  • 4.5 呈现AI分析结果、报告与用户反馈接口
  • 【从0到1构建一个ClaudeAgent】并
  • 2026年版牙科修复材料行业投资分析及前景趋势预测报告
  • LangChain框架在高炉炼铁智能化领域的应用~系列文章15:性能优化与部署 — 把AI模型“搬进“炼铁车间
  • 互联网大厂 Java 求职面试中的技术探讨
  • GEO 服务商横向测评:森辰 GEO、剪流 GEO、增长超人怎么选|中小企避坑选型指南
  • Xbox成就解锁终极指南:3分钟掌握免费开源工具的完整教程 [特殊字符]
  • 从大鼠到猫和犬,从基础研究到转化应用——云克隆推出骨骼肌细胞全系列
  • 为什么电流传感器检测信号会出现高频波动?
  • 传统变压器会SST被淘汰吗?
  • 如何在一台电脑上轻松实现多人分屏游戏:Nucleus Coop 实战指南
  • 杰理之固定通话音量【篇】
  • 计算机毕业设计之高校社团招新管理系统
  • 当游戏成就变成可编程的艺术:Xbox成就解锁器的逆向工程之旅
  • AlwaysOnTop窗口置顶工具:5分钟实现多任务效率翻倍的终极指南
  • 别再用旧犀牛!Rhino8.30最新版本 完整版安装教程
  • NoSleep防休眠助手:5分钟掌握Windows屏幕永不停歇的智能解决方案