当前位置: 首页 > news >正文

Hermes Agent:解锁本地 AI 能力,从零搭建你的高效科研智能体!

本文详细介绍了 Hermes Agent,一个能处理敏感内容的本地 AI 智能体。它支持自定义技能、内置 RAG 知识库,适合科研工作。文章从安装配置到实际应用,如文献 RAG 和技能使用,进行了全面流程分享,展示了其高效、安全的特点,特别适合需要长期科研任务和文献整理的用户。


最近一直在尝试AI工具,试了Hermes Agent。它不是简单的聊天大模型,而是一个真正能干活的本地AI智能体(Agent),支持自定义技能、内置RAG知识库,适合处理论文、实验数据、文献综述这种敏感内容。

今天把从零安装→配置→文献RAG→实际使用的完整流程分享出来,希望能有用。

一、Hermes Agent 到底是什么?

1、Hermes 核心定位

它不是大模型,是一套:

智能体调度框架 + 工具调用引擎 + 多子 Agent 协作 + 任务拆解系统

简单理解:

大模型 = 大脑

Hermes = 手脚、调度员、项目经理、执行系统

2、特点:

👉原生支持「多子Agent 分工协作」

一个复杂任务自动拆成多个小 Agent 分头干活:查资料、写代码、整理文档、纠错、复盘,这是普通对话 AI 没有的。

👉工具生态

终端执行、文件读写、代码运行、搜索、解析文档、RAG 联动、批量处理,开箱即用。

👉轻量化、Docker一键部署、跨模型兼容

不限定某一家模型:Ollama 本地、DeepSeek、Qwen、GPT、Claude 全都能无缝切换。

👉超长上下文、任务闭环能力强

适合:长期科研任务、材料文献整理、项目梳理、代码工程、多步骤复杂工作。

👉 Nous 团队专门为「Agent 协作」优化

它的指令格式、工具调用协议,就是为智能体设计的,比通用 AI 更会 “干活”。

3、技术底层原理(可跳过):

Hermes 这类 Agent 框架,多子体靠三点实现:

(1)独立 System Prompt角色隔离

给每一个子 Agent 单独设定身份:

你现在是专业文献分析师,只做摘要、提取实验数据…

你现在是工程代码工程师,只写脚本、排错…

(2)独立上下文窗口隔离

每个子 Agent 的聊天记录、任务缓存互相隔离,互不干扰。

(3)编排调度逻辑(框架自带)

Hermes 内置流程:

复杂任务自动拆解

串行 / 并行派发任务给各个子Agent

收集结果、校验、纠错、合并输出

4、具体工作流程示例:

(1)用户输入

帮我调研近3年锂电硅负极改性技术,做结构化综述

(2)Hermes 层

  • 自动匹配 → 触发相关Skill

  • 把Skill里的【调研步骤、交叉验证、输出规范】注入上下文

  • 带上:可用工具列表(联网搜索、网页精读、文件写入)

(3)大模型思考

模型判断:

这个问题需要外部实时资料,不能纯脑补

必须拆分:

① 检索近3年硅负极改性主流方案

② 精读高价值综述文献

③ 对比不同改性路线优劣

④ 整理结构化内容

⑤ 自动保存为md文档

模型主动输出工具调用指令,不直接写答案

(4)Hermes 接收指令 → 执行工具

  • 框架自动调用web\_search,检索指定关键词

  • 拿到搜索结果,自动筛选权威来源

(5)结果回传给大模型 → 第二轮思考

大模型收到搜索摘要,继续决策:

摘要信息不够深,需要精读2篇顶刊综述原文

→ 再次下发「网页精读」工具指令

(6)Hermes 再执行 → 反复循环

搜索→精读→对比→核验,自动多轮循环3~6轮

(7)信息齐全后

大模型按 Skill 规定的格式,统一整理:

机理→路线→优缺点→瓶颈→前沿→产业化

(8)最终下发「写入文件」指令

Hermes 自动生成硅负极改性综述.md保存本地

5、注意点:

在 Hermes 里选国内大模型API的时候,会有两种API, Chat Completions API(传统 / 旧)和Responses API(新 / Agent 专用)。

Chat Completions API(/v1/chat/completions):无状态、手动传完整 messages 数组,你自己管理上下文、自己处理工具调用循环、多轮对话要拼历史消息。

Responses API(/v1/responses):有状态、自动管理上下文、内置工具 / Agent 能力,传previous_response_id就能续对话,单请求完成多轮工具调用 / 子任务拆分,专门给 Agent 框架(比如 Hermes)设计。

我试了qwen-3.6plus,只支持chat completion API,效果应该不如responses API;国外大模型可以支持responses API.

二、Docker方式部署安装Agent:

这是我最近在用的方式,不污染系统,升级/删除都很方便。

第一步:确认 Docker 已启动

打开你的 Docker Desktop,确保它在运行。

第二步:打开 PowerShell(普通窗口就行)

  1. 拉取 Hermes 镜像

docker pull nousresearch/hermes-agent:latest

  1. 初始化配置

让 Docker 帮你启动Hermes 并完成【第一次初始化设置】(就是让你输入 API Key、选模型、配环境)

docker run -it --rm -v ${HOME}/.hermes:/opt/data nousresearch/hermes-agent:latest chat

3、选择你想调用的大模型或本地部署的模型

这一步如果不选择的话,后面没法运行,需要把模型的API等信息按照指令填进去。

如果你现在选择了一个,后面想做调整,可以输入这个指令,可以重新选择:

docker run -it --rm -v ${HOME}/.hermes:/opt/data nousresearch/hermes-agent:latest model

如果你选择本地部署模型,不想上传任何内容到云端,要走「Custom Endpoint / 自定义接口」,以用ollma为例:

第一步:先在你电脑上安装并启动 Ollama

下载安装:ollama.com(👉下载地址:https://ollama.com/download/windows)

第二步:打开 PowerShell,拉一个轻量本地模型(比如 llama3.2:3b,适合本地跑):

ollama pull llama3.2:3b

启动 Ollama 服务(默认会自动后台跑,端口 11434):

ollama serve

回到模型选择界面,在列表里找到并选择:Custom Endpoint / OpenAI Compatible

输入:

  • Provider:ollama
  • Base URL:http://host.docker.internal:11434/v1
  • Model Name:llama3.2:3b
  • API Key:随便填(比如 local,Ollama 本地不需要 Key)

4、选择信息功能(譬如微信、whatsapp等消息通道,我选了skip,暂时没有这个诉求)

→ (●) Set up messaging now (recommended)

(○) Skip — set up later with 'hermes setup gateway

然后就好了,出现下面的交互页面:

你就可以直接和它对话了,如上图所示,有28个available tools和 69个skills。

如果不清楚agent的命令,可以输入/help,就会给你显示:

三、核心功能:

1、Skill(技能)

skills是 Hermes Agent 的核心扩展单元 —— 把复杂任务、工作流程、专业方法,封装成可复用、可按需加载的结构化知识文档(SKILL.md),让 Agent 学会 “怎么做事”,而不只是 “回答问题”。本质是Agent 的程序性记忆 / 方法库,区别于 Memory(事实记忆):Skill 存 “怎么做”,Memory 存 “是什么”。

核心作用(为什么要有 Skill)

复用复杂流程:把多步骤、多工具调用的任务(如代码开发、文献调研、部署、数据分析)写成标准步骤,下次直接调用,不用重新推理

按需加载、省 Token:三级渐进披露,只在需要时加载完整内容,不占满上下文窗口

标准化输出、提升一致性:强制按规范步骤执行、按格式输出,避免随机、混乱、错误

Agent 自我进化:完成复杂任务后,Hermes可自动把成功流程提炼成新 Skill,持续积累能力

扩展能力边界:安装社区 / 官方Skill,快速获得专业领域能力(科研、开发、运维、写作)

Hermes 最像“智能体”的地方,就是可以写Skill, 写法非常简单,可以不需要代码,纯文字描述规则即可。

我自己写了一个skill叫做material-basic,存在skill文件夹中,可以指定agent使用该skill,如下图对话框所示:

2、本地文献RAG

这是我用Hermes的一个主要理由:不用上传文献到平台,本地直接RAG检索问答。

让它读你本地的文献(譬如D:\Literature),只多加一段挂载:

docker run -it --rm -v ${HOME}/.hermes:/opt/data -v D:\Literature:/papers nousresearch/hermes-agent:latest chat

进入Hermes后,执行导入:

rag import /papers

直接开始提问

  • “总结这些文献的研究方法”

  • “提取所有离子电导率数据”

  • “对比三篇论文的结论差异”

  • “只根据文献回答,不要编造”

还可以调用外部材料数据库,写到skill文件夹中,给出相关指令就可以。

譬如:我写了一个skill调用materials project的数据(https://materialsproject.org/),在skill里面写清楚调用API的接口以及调用的流程和要求即可。真是万能的skill文件夹。

四、实际使用感受:优点 & 小不足

优点(挺好用)

✅全本地离线,科研数据安全

✅命令简洁,启动就用

✅文献导入一次,永久保存

✅支持长期记忆,越用越顺手

可能觉得不适应的地方

  • 命令行形式,有些人不喜欢,我觉得还可以

  • 费钱、费钱、费钱

我试了agent调用qwen的费用,同样的一个科研问题,qwen大模型自己耗费0.06元token费用,hermes agent调用同样的qwen大模型耗费0.15元token费用,可能源于多次反复API接口,但是我个人感觉比qwen的回答更让我满意。

如果你也在找:

安全、本地、免费、能读文献、技能越用越强的的AI工具,推荐试试 Hermes Agent。

说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。

结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”

我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!

这绝非空谈。数据说话

2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。

与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程
  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)
  • ✅大模型书籍与技术文档PDF
  • ✅各大厂大模型面试题目详解
  • ✅640套AI大模型报告合集
  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.jsqmd.com/news/905615/

相关文章:

  • 别再只用LogLoss了!手把手教你为XGBoost实现Focal Loss,搞定样本不平衡难题
  • GPU资源调度优化:MQFQ-Sticky算法在FaaS中的应用
  • 2026年国产在线悬浮物浓度计十大品牌深度测评:技术、性能与口碑全方位对比 - 仪表品牌排行榜
  • 2026 年 6 月企业在线考试系统踩坑多?专业横评测优 - 讲清楚了
  • 2026 年 6 月在线培训系统怎么选?避坑选型攻略 - 讲清楚了
  • 论文省心了!2026最新AI论文写作软件测评:这几款知网都认可
  • 舒适的无知:当“能用就行”成为技术最危险的陷阱
  • 2026互联网大厂薪资全景:AI方向到底有多香?
  • 从“记忆”到“突破”:禁忌搜索(Tabu Search)在物流路径规划中的实战调参指南
  • 用STM32F103C8T6和LD3320语音模块做个声控小台灯(附完整代码和接线图)
  • P2466 [SDOI2008] Sue 的小球
  • 2026 年 6 月企业培训平台怎么选?避开选型大坑 - 讲清楚了
  • Anaconda遇到CondaVerificationError别急着重装,先试试这个修复损坏包的方法
  • 英语阅读_Here are four of the most famous
  • [引]深港澳金融科技师
  • 微信社群机器人开发:从0到1构建智能社群运营系统
  • 2026 年 6 月企业在线考试系统难选?避坑实测攻略 - 讲清楚了
  • 基于Arduino与步进电机的智能窗帘DIY:从硬件选型到软件编程全解析
  • 告别L6234发热!手把手教你为DIY机械臂设计分立MOSFET的FOC驱动器(附PCB文件)
  • 基于Arduino与PIR传感器的互动鮟鱇鱼灯制作全解析
  • AWS AI Practitioner认证:云工程师转型AI实践的五大职业路径
  • 告别CNN依赖:用Python手把手实现基于K-SVD的医学图像降噪(附完整代码与避坑指南)
  • 【大模型】提示词工程
  • AI记忆系统:从明星背书到代码真相,如何构建可靠检索增强生成(RAG)应用
  • 实用指南:如何用DroneSecurity快速检测和解析无人机通信信号
  • STM32H743驱动W25Q128JV踩坑实录:从正点原子例程到芯片手册的完整调试指南
  • 2026年变压器与高低压柜厂家推荐排行榜:配电柜/箱变/并网柜/光伏低压变/施耐德品牌实力深度解析 - 品牌企业推荐师(官方)
  • 从“裸板”到“成品”:Altium Designer Variant实战,教你为不同项目定制专属装配图与BOM
  • 如何用Hourglass倒计时器精准掌控你的Windows时间管理
  • MSP430比较器B避坑指南:DriverLib配置电阻测量与触摸按键的5个常见问题