当前位置：首页 > news >正文

Hermes Agent：解锁本地 AI 能力，从零搭建你的高效科研智能体！

news 2026/7/28 8:45:03

本文详细介绍了 Hermes Agent，一个能处理敏感内容的本地 AI 智能体。它支持自定义技能、内置 RAG 知识库，适合科研工作。文章从安装配置到实际应用，如文献 RAG 和技能使用，进行了全面流程分享，展示了其高效、安全的特点，特别适合需要长期科研任务和文献整理的用户。

最近一直在尝试AI工具，试了Hermes Agent。它不是简单的聊天大模型，而是一个真正能干活的本地AI智能体（Agent），支持自定义技能、内置RAG知识库，适合处理论文、实验数据、文献综述这种敏感内容。

今天把从零安装→配置→文献RAG→实际使用的完整流程分享出来，希望能有用。

一、Hermes Agent 到底是什么？

1、Hermes 核心定位

它不是大模型，是一套：

智能体调度框架 + 工具调用引擎 + 多子 Agent 协作 + 任务拆解系统

简单理解：

大模型 = 大脑

Hermes = 手脚、调度员、项目经理、执行系统

2、特点：

👉原生支持「多子Agent 分工协作」

一个复杂任务自动拆成多个小 Agent 分头干活：查资料、写代码、整理文档、纠错、复盘，这是普通对话 AI 没有的。

👉工具生态

终端执行、文件读写、代码运行、搜索、解析文档、RAG 联动、批量处理，开箱即用。

👉轻量化、Docker一键部署、跨模型兼容

不限定某一家模型：Ollama 本地、DeepSeek、Qwen、GPT、Claude 全都能无缝切换。

👉超长上下文、任务闭环能力强

适合：长期科研任务、材料文献整理、项目梳理、代码工程、多步骤复杂工作。

👉 Nous 团队专门为「Agent 协作」优化

它的指令格式、工具调用协议，就是为智能体设计的，比通用 AI 更会 “干活”。

3、技术底层原理（可跳过）：

Hermes 这类 Agent 框架，多子体靠三点实现：

（1）独立 System Prompt角色隔离

给每一个子 Agent 单独设定身份：

你现在是专业文献分析师，只做摘要、提取实验数据…

你现在是工程代码工程师，只写脚本、排错…

（2）独立上下文窗口隔离

每个子 Agent 的聊天记录、任务缓存互相隔离，互不干扰。

（3）编排调度逻辑（框架自带）

Hermes 内置流程：

复杂任务自动拆解

串行 / 并行派发任务给各个子Agent

收集结果、校验、纠错、合并输出

4、具体工作流程示例：

（1）用户输入

帮我调研近3年锂电硅负极改性技术，做结构化综述

（2）Hermes 层

自动匹配 → 触发相关Skill
把Skill里的【调研步骤、交叉验证、输出规范】注入上下文
带上：可用工具列表（联网搜索、网页精读、文件写入）

（3）大模型思考

模型判断：

这个问题需要外部实时资料，不能纯脑补

必须拆分：

① 检索近3年硅负极改性主流方案

② 精读高价值综述文献

③ 对比不同改性路线优劣

④ 整理结构化内容

⑤ 自动保存为md文档

模型主动输出工具调用指令，不直接写答案

（4）Hermes 接收指令 → 执行工具

框架自动调用web\_search，检索指定关键词
拿到搜索结果，自动筛选权威来源

（5）结果回传给大模型 → 第二轮思考

大模型收到搜索摘要，继续决策：

摘要信息不够深，需要精读2篇顶刊综述原文

→ 再次下发「网页精读」工具指令

（6）Hermes 再执行 → 反复循环

搜索→精读→对比→核验，自动多轮循环3~6轮

（7）信息齐全后

大模型按 Skill 规定的格式，统一整理：

机理→路线→优缺点→瓶颈→前沿→产业化

（8）最终下发「写入文件」指令

Hermes 自动生成硅负极改性综述.md保存本地

5、注意点：

在 Hermes 里选国内大模型API的时候，会有两种API， Chat Completions API（传统 / 旧）和Responses API（新 / Agent 专用）。

Chat Completions API（/v1/chat/completions）：无状态、手动传完整 messages 数组，你自己管理上下文、自己处理工具调用循环、多轮对话要拼历史消息。

Responses API（/v1/responses）：有状态、自动管理上下文、内置工具 / Agent 能力，传previous_response_id就能续对话，单请求完成多轮工具调用 / 子任务拆分，专门给 Agent 框架（比如 Hermes）设计。

我试了qwen-3.6plus，只支持chat completion API，效果应该不如responses API；国外大模型可以支持responses API.

二、Docker方式部署安装Agent：

这是我最近在用的方式，不污染系统，升级/删除都很方便。

第一步：确认 Docker 已启动

打开你的 Docker Desktop，确保它在运行。

第二步：打开 PowerShell（普通窗口就行）

拉取 Hermes 镜像

docker pull nousresearch/hermes-agent:latest

初始化配置

让 Docker 帮你启动Hermes 并完成【第一次初始化设置】（就是让你输入 API Key、选模型、配环境）

docker run -it --rm -v ${HOME}/.hermes:/opt/data nousresearch/hermes-agent:latest chat

3、选择你想调用的大模型或本地部署的模型

这一步如果不选择的话，后面没法运行，需要把模型的API等信息按照指令填进去。

如果你现在选择了一个，后面想做调整，可以输入这个指令，可以重新选择：

docker run -it --rm -v ${HOME}/.hermes:/opt/data nousresearch/hermes-agent:latest model

如果你选择本地部署模型，不想上传任何内容到云端，要走「Custom Endpoint / 自定义接口」，以用ollma为例：

第一步：先在你电脑上安装并启动 Ollama

下载安装：ollama.com（👉下载地址：https://ollama.com/download/windows）

第二步：打开 PowerShell，拉一个轻量本地模型（比如 llama3.2:3b，适合本地跑）：

ollama pull llama3.2:3b

启动 Ollama 服务（默认会自动后台跑，端口 11434）：

ollama serve

回到模型选择界面，在列表里找到并选择：Custom Endpoint / OpenAI Compatible

输入：

Provider：ollama
Base URL：http://host.docker.internal:11434/v1
Model Name：llama3.2:3b
API Key：随便填（比如 local，Ollama 本地不需要 Key）

4、选择信息功能（譬如微信、whatsapp等消息通道，我选了skip，暂时没有这个诉求）

→ (●) Set up messaging now (recommended)

(○) Skip — set up later with 'hermes setup gateway

然后就好了，出现下面的交互页面：

你就可以直接和它对话了，如上图所示，有28个available tools和 69个skills。

如果不清楚agent的命令，可以输入/help，就会给你显示：

三、核心功能：

1、Skill（技能）

skills是 Hermes Agent 的核心扩展单元 —— 把复杂任务、工作流程、专业方法，封装成可复用、可按需加载的结构化知识文档（SKILL.md），让 Agent 学会 “怎么做事”，而不只是 “回答问题”。本质是Agent 的程序性记忆 / 方法库，区别于 Memory（事实记忆）：Skill 存 “怎么做”，Memory 存 “是什么”。

核心作用（为什么要有 Skill）

复用复杂流程：把多步骤、多工具调用的任务（如代码开发、文献调研、部署、数据分析）写成标准步骤，下次直接调用，不用重新推理

按需加载、省 Token：三级渐进披露，只在需要时加载完整内容，不占满上下文窗口

标准化输出、提升一致性：强制按规范步骤执行、按格式输出，避免随机、混乱、错误

Agent 自我进化：完成复杂任务后，Hermes可自动把成功流程提炼成新 Skill，持续积累能力

扩展能力边界：安装社区 / 官方Skill，快速获得专业领域能力（科研、开发、运维、写作）

Hermes 最像“智能体”的地方，就是可以写Skill, 写法非常简单，可以不需要代码，纯文字描述规则即可。

我自己写了一个skill叫做material-basic，存在skill文件夹中，可以指定agent使用该skill，如下图对话框所示：

2、本地文献RAG

这是我用Hermes的一个主要理由：不用上传文献到平台，本地直接RAG检索问答。

让它读你本地的文献（譬如D:\Literature），只多加一段挂载：

docker run -it --rm -v ${HOME}/.hermes:/opt/data -v D:\Literature:/papers nousresearch/hermes-agent:latest chat